Isaac AI專欄

2019年01月07日 下午 02:41

強化學習

Isaac

強化學習
1
0
0

強化學習(Reinforcement learning)是機器學習的一個分支,它被廣泛應用於博奕、控制學、金融等多個領域,其概念主要是藉由讓智能體與環境做互動,並在過程中給予正負向的回饋來讓電腦不斷修正行為,進而學會做動態之決策。

舉個稍微生活化一點的例子吧!假設有一個學生(智能體)上課非常的吵鬧,這時候老師(環境)可能就會懲罰他並要求他下次改進行為(負向回饋),而學生也因為受到老師的責罰而未來會避免類似的事情再發生,反過來說,如果學生考試考高分,老師則給予他極大的獎勵(正向回饋),那學生也因此知道原來在學校裡就是要乖乖唸書考高分阿!藉由這樣一連串的正/負向的回饋,最終學生的行為就會漸漸的朝著老師所設定的方向去進行!

強化學習最著名的經典案例莫過於Google DeepMind公司於2014年所開發的下圍棋軟體AlphaGo了,AlphaGo結合了深度學習以及強化學習兩個機器學習的方法,使得電腦可以在下圍棋方面戰勝人類的棋王,這件事情到底有多難呢?根據計算,相比於其他棋類比賽,圍棋是被公認為難度最高棋類比賽,可見要開發出如AlphaGo這樣的圍棋軟體真的是不容易阿!

此外,由於AlphaGo在學習的過程中是沒有老師指導的,所以在下圍棋的過程中,也下出了人類未曾發現的下棋方法,這震憾了整個下圍棋的領域,或許未來我們可能還需要反過來像電腦學習討教吧!

總之,強化學習真的是一個備受關注的領域,或許哪天我們能賦予身旁的所有東西足夠的智慧,來讓人類的生活愈來愈便利阿!


tag  :  #強化學習   #人工智慧   #Reinforcement learning

文章作者:Isaac

 

FB留言
TAKO留言
你尚未登入無法留言
讀取更多留言...