筆記- AlphaGo 之父:AI 打破人類圍棋 3000 年來的盲點

原文


傑米斯-哈薩比斯
Demis Hassabis
1976年7月27日-,生於倫敦
DeepMind 創辦人 / AlphaGo 父親之一

- 大體上學習可以分為兩類:

    1. 直接從輸入資料和經驗中學習,沒有既定的程序或者規則可循,系統需要從原始     數據自己進行學習;

    2. 學習系統就是通用學習系統,指的是一種演算法可以用於不同的任務和領域,甚至是一些從未見過的全新領域。

- 強化學習是一個有效的解決人工智慧問題的工具。

- 圍棋一直是人工智慧領域的難解之謎
   1. 搜尋空間龐大 : 分支因數就有 200 個,而西洋棋僅僅 20個
   2. 沒有一個合適的評價函數

- 決策網路與學習值網路結合, 透過蒙地卡羅演算法

- 落子第五線, 幾千年來, 人類低估了棋局中部區域的重要性


原文中提到: 

"發明 AlphaGo,並不是為了贏取圍棋比賽,我們是想為測試我們自己的人工智慧演算法建利一個有效的平台,我們的最終目的是把這些演算法應用到真實的世界中,為社會所服務。"

"當今世界面臨的巨大挑戰之一,就是過量的資訊和複雜的系統,我們怎麼才能找到其中的規律和結構,從疾病到氣候,我們需要解決不同領域的問題。這些領域十分複雜,對於這些問題,即使是最聰明的人類也無法解決的。"


留言

熱門文章