最近開始準備考試,因為我需要很清楚明瞭的AI基礎解說,那就想著不如我直接把解說內容貼上來,供大家一起學習啦!
-----
鑑別式 AI (Discriminative AI)
👶 初級解說
想像一下,你有一堆積木,有的是方形的,有的是圓形的。你學會了一件事:看到積木,就把它放進對的盒子裡,「方形積木盒」或「圓形積木盒」。
鑑別式 AI 就像是一個非常會分類的小幫手。你給它看一張動物照片,它會告訴你:「這是貓!」或者「這是狗!」。它不會自己畫一隻貓,但它很會「分辨」東西屬於哪個類別。它的工作就是做選擇題。
🧑🎓 中級解說
鑑別式 AI 的核心任務是「分類」與「預測」。它透過學習大量的「已標記」資料(例如:上百萬張已經標好「貓」或「狗」的圖片),找出不同類別之間的「界線」或「規則」。
舉個生活中的例子:你手機裡的「垃圾郵件過濾器」。它看過成千上萬封正常的信和垃圾信,學會了哪些詞彙或寄件人特徵(例如:「恭喜中獎!」、「免費!」)比較可能出現在垃圾信中。當一封新郵件進來,它就根據學到的規則,判斷這封信被歸類到「垃圾郵件」的機率有多高。
所以,它的目標不是理解郵件的完整內容,而是找到一條清楚的界線,把「是」與「否」分開。
👨🔬 中高級解說 (讓我們來搭橋吧!)
我們來拆解剛剛那兩個讓你困惑的專業術語:「決策邊界」和「條件機率 」。
-
決策邊界 (Decision Boundary) 是什麼?
- 想像一張圖,上面有很多點。藍色的點代表「好郵件」,紅色的點代表「垃圾郵件」。
- 鑑別式 AI 的任務,就是在這張圖上畫一條線,盡可能地把紅色和藍色的點分開。
- 這條線,就叫做「決策邊界」。
- 未來,任何一封新郵件(一個新的點),只要看它落在線的哪一邊,AI 就能判斷它是好郵件還是垃圾郵件。所以,「決策邊界」就是 AI 學到的那個「分類規則」的具體形象。
-
條件機率 是什麼?
- 這個看起來很嚇人的符號,其實只是一個在問問題的句子,我們可以把它翻譯成白話文:
- P 代表 Probability (機率)
- Y 代表 Yes/No 的答案 (例如:是不是垃圾郵件?)
- | 這個符號讀作 "given" (在...的條件下)
- X 代表 你給它的證據 (例如:郵件的內容文字)
- 所以 整個翻譯就是:「在看了 X (證據) 的條件下,答案是 Y 的機率有多高?」
- AI 就是在算這個機率。它不是真的「讀懂」郵件,而是計算:「看到『中獎』這個詞,這封信是垃圾信的機率有多高?」當這個機率超過一個門檻(例如 90%),AI 就會把它分類為垃圾郵件。
- 這個看起來很嚇人的符號,其實只是一個在問問題的句子,我們可以把它翻譯成白話文:
所以,中高級的理解就是:鑑別式 AI 透過計算 的機率,來學習畫出那條決策邊界。
👨💻 高級解說 (專業人士的視角)
從技術層面來看,鑑別式模型(Discriminative Model)專注於學習條件機率分佈 。
- 這裡的 是輸入的數據(Input Data),例如一張圖片的像素資料、一封郵件的文字內容。
- 是目標類別(Label),例如「貓」、「狗」、「是垃圾郵件」、「不是垃圾郵件」。
整個公式 的意思就是:「在給定輸入 的情況下,這個輸入屬於類別 的機率是多少?」
它的目標是優化演算法,找到最理想的決策邊界,以最小化分類錯誤。
它不探究輸入數據 的內在結構或分佈(那是生成式模型的工作),模型透過演算法(如邏輯迴歸、SVM、深度神經網路等)直接學習輸入 與輸出 之間的對應關係,也就是決策邊界(Decision Boundary)。它不關心數據 本身的分佈長什麼樣子,只關心如何最有效率地劃分不同類別的 。這也是為什麼它在分類任務上通常資源效率更高、表現更精準。
AI專有名詞名單參考(感謝整理):