大家好!今天想跟大家用最簡單的方式,聊聊現在最紅的「生成式 AI」。

這篇文章將帶你從零開始認識它。你可以跟著故事輕鬆入門,如果你正在準備相關考試,我也為你標示出了**「🟠 應試重點」**,幫助你加深學習!


🔵 初級入門:用故事建立感覺

故事一:AI 是個美食發明家 🧑‍🍳

想像一個很會做菜的廚師。他不是看著菜單點菜,而是吃遍了世界上所有的披薩後,學會了麵粉、起司、番茄要怎麼組合才好吃。然後,他走進廚房,發明了一種全新的、從來沒人吃過的披薩口味!

故事二:AI 是個樂高大師 🤖

這個比喻更能解釋 AI 是怎麼學習的。

想像一下,你要教一個機器人學會「創造全新的樂高汽車」。你不會給它說明書,而是給它一萬台已經蓋好的樂高汽車,讓它親手把每一台都拆開、再組裝回去。

在這個過程中,機器人學到的不是「車子A長這樣,車子B長這樣」,而是更深層的、沒人說出口的**「潛規則」**:

  • 大部分的車都有四個輪子,而且輪子通常在下面。
  • 通常會有個駕駛座和方向盤。
  • 某些積木的組合可以做出很帥的車門,另一些組合可以做出穩固的底盤。

機器人就這樣學會了各種零件之間如何搭配、如何組合,才「有資格」被稱為一台車。這個過程,就是 AI 正在學習創造事物的**「內在配方」和「創作藍圖」**。

所以,當你請它「蓋一台全新的車」,它會運用它腦中那套「蓋車的潛規則」,蓋出一台世界上從來沒有人見過、但看起來又確實像一台車的全新樂高作品。


🟢 中級理解:所以,生成式 AI 到底是什麼?

綜合上面的故事,我們可以得到一個結論:

生成式 AI 的核心是「生成」與「創造」。它不是在「辨識」資料,而是深入學習資料中的**「潛在模式 (patterns)」和「結構 (structure)」**。

因為它理解了創作的「藍圖」,所以當你給它一個指令,它就能從無到有,創造出獨一無二的內容。

像是現在最有名的 ChatGPT(可以生成文字、故事、程式碼)和 Midjourney(可以根據文字描述生成驚人的圖片),都是這個原理的最佳代表。


🟠 應試重點:AI 藝術家的四大流派

好了,如果你是正在準備考試或想深入了解的讀者,接下來的內容就是必讀重點

生成式 AI 主要有四大主流技術,就像武俠小說裡的「四大門派」,各自有獨門絕技。理解它們的區別,是考試的關鍵。

1. 生成對抗網路 (GANs) - 「警察抓小偷」流

  • 核心思想: 裡面有兩個 AI 在互相競爭。一個是「偽造者」(Generator),負責生成假的圖片/數據,想騙過對方;另一個是「警察」(Discriminator),負責分辨哪個是真、哪個是偽造者做的假貨。兩個 AI 在無數次的交手後,偽造者會練就出幾乎以假亂真的高超本領。
  • 考試關鍵字: 兩個模型對抗以假亂真、常用於高品質圖像生成

2. 變分自動編碼器 (VAEs) - 「完美壓縮檔」流

  • 核心思想: 想像一個超強的壓縮軟體。它先把一張高解析度的圖片「壓縮」成一個很小的、包含所有精華資訊的檔案(這就是潛在空間 Latent Space)。然後,它又能從這個小小的精華檔案「解壓縮」,還原成一張新的、類似的圖片。它擅長學習數據的「精華特徵」。
  • 考試關鍵字: 壓縮與解壓縮潛在空間 (Latent Space)特徵學習

3. Transformer 模型 (如 GPT) - 「超級語言學家」流

  • 核心思想: 這種模型是個語言天才,特別擅長處理「有前後順序」的資料,比如句子。它的超能力叫做**「注意力機制 (Attention Mechanism)」**,能準確判斷一個句子中哪些詞彙最重要、彼此關聯性最強。所以它在讀和寫文章、翻譯、寫程式碼方面特別強大。
  • 考試關鍵字: 注意力機制 (Attention)序列資料自然語言處理 (NLP)GPT 的基礎

4. 擴散模型 (Diffusion Models) - 「數位考古學」流

  • 核心思想: 想像一張超高畫質的照片,你不斷地對它「加雜訊」,直到它變成一片看不出東西的馬賽克雪花。然後,你訓練 AI 去學習這個「反向過程」,也就是如何從一片純粹的雜訊中,一步步「去噪」,最終完美地還原出那張原始的清晰圖片。這個技術是目前生成最逼真圖片的王者。
  • 考試關鍵字: 逐步去噪 (Denoising)從雜訊生成圖像高品質圖像生成

 

 

AI專有名詞名單參考(感謝整理):

https://vocus.cc/article/67a2d997fd89780001452aa5