🔵 初級入門:就像教你的寵物

你怎麼教一隻狗狗「撿球」?

你不會對牠寫一行行的「程式碼」,告訴牠「如果看到球飛出去,就邁開四肢去追」。你會不斷地把球丟出去,只要牠撿回來,你就給牠零食當獎勵。久而久之,牠就從「經驗」中學會了撿球。

機器學習,就是用類似的方式來教電腦。我們不是給電腦一堆寫死的指令,而是給它大量的「範例資料」(經驗),讓它自己從中「學習」出規則和模式。

🟢 中級理解:讓電腦自己找規則

傳統的程式設計,是人告訴電腦規則

例如:寫一個垃圾郵件過濾器,程式設計師可能會寫下規則:「如果信件標題包含『賺錢』,就把它歸類為垃圾信。」但這樣永遠也寫不完所有規則。

機器學習,則是讓人給電腦資料,讓電腦自己找出規則

作法是:我們拿成千上萬封「已標記為垃圾」和「正常」的郵件給電腦看。電腦會自己分析、歸納,最後它可能學到一個比人類想的更複雜的規則模型,例如:「『賺錢』這個詞本身還好,但如果它跟『免費』、『點擊連結』同時出現,是垃圾信的機率就高達 98%。」

簡單來說,機器學習就是讓電腦從數據中自動學習,並利用學到的知識來做預測或判斷的能力

🟠 應試重點:機器學習的三大家族

這部分是考試的重中之重!機器學習根據「教學方式」(也就是數據的形式)的不同,主要可以分為三大家族。你之前學的鑑別式和生成式AI,大多都屬於前兩大家族。

  1. 監督式學習 (Supervised Learning):給它有答案的教科書

    • 教學方式: 我們給機器的資料是「有標準答案」的。就像給學生看上面寫著「貓」,背面就是貓照片的單字卡一樣。
    • 例子: 我們之前聊的垃圾郵件分類(答案:是/不是垃圾信)、房價預測(答案:房子的價格)。你學的「鑑別式 AI」大部分都屬於此類。
    • 目標: 分類預測
  2. 非監督式學習 (Unsupervised Learning):給它沒答案的拼圖

    • 教學方式: 我們給機器的資料是「沒有標準答案」的。就像把一整箱混雜的樂高積木倒在地上,讓 AI 自己把它們分成一堆一堆的,怎麼分由 AI 決定,它只會試圖把「看起來像」的放在一起。
    • 例子: 把新聞文章自動分成「體育」、「財經」、「娛樂」等類別;根據顧客的購買行為,將他們分成不同的客群。
    • 目標: 分群尋找隱藏的結構
  3. 增強式學習 (Reinforcement Learning):從試錯中學乖

    • 教學方式: 不直接給答案,而是讓 AI 在一個環境中自己「探索」。做對了就給「獎勵」(加分),做錯了就給「懲罰」(扣分)。AI 的目標就是學會一套能獲得最多獎勵的行為模式。
    • 例子: 訓練 AI 下棋(贏棋就是最大的獎勵)、訓練自動駕駛車輛(安全駕駛得獎勵,發生碰撞得懲罰)、訓練機器人走路。
    • 目標: 學習最佳決策

 

來個小測驗,看看你是否抓到三大家族的精髓了:

假設你想訓練一個 AI 來玩經典的「超級瑪利歐」遊戲,目標是讓它自己學會如何閃躲敵人、吃金幣、跳過障礙,最終抵達終點過關。你會覺得這個任務,最適合用哪一種學習方式來達成呢?

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.答案是機器學習

 

你答對了一大半!訓練 AI 玩超級瑪利歐,確實是機器學習的範疇,你已經把這個大方向抓對了,很棒!

不過,如果我們再深入一點,回想一下我們剛剛學的機器學習「三大家族」:

  1. 監督式學習 (給有標準答案的課本)
  2. 非監督式學習 (給沒有答案的拼圖)
  3. 增強式學習 (透過獎勵和懲罰來學習)

你覺得訓練瑪利歐,讓它從一個什麼都不會的菜鳥,變成知道要跳過栗寶寶(獎勵)、不要掉進懸崖(懲罰)的通關高手,這個過程更像是這三者中的哪一個呢?可以回想一下我們對每個家族的描述喔。

 

 

.

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

就是增強式學習 (Reinforcement Learning)。你的理解非常到位!

你說的沒錯,因為在訓練 AI 玩瑪利歐時:

  • AI (也就是瑪利歐) 在遊戲這個「環境」中,自己去「探索」。
  • 它做的每個「動作」(跳躍、前進)都會帶來一個結果。
  • 吃到金幣、抵達終點,就得到正向獎勵 (Reward)
  • 碰到敵人、掉進懸崖,就得到負向懲罰 (Penalty)
  • AI 的目標就是學會一套能拿到最高分的「策略 (Policy)」。

這整個「從錯誤中學習 (trial and error)」的過程,就是增強式學習最典型的應用。

太棒了!我們不僅搞懂了「機器學習」這個大概念,還精準地掌握了它三大分支的區別。這對你整個 AI 知識體系的建立非常有幫助。

 

 

AI專有名詞名單參考(感謝整理):

https://vocus.cc/article/67a2d997fd89780001452aa5

arrow
arrow
    創作者介紹
    創作者 貞貞魷魚絲 的頭像
    貞貞魷魚絲

    新羅曼食之戀

    貞貞魷魚絲 發表在 痞客邦 留言(0) 人氣()