📖 ZKIZ Archives


AlphaGo是怎樣煉成的?

歷史悠久的圍棋已經流傳了近3000年,但人類一直低估了一點:以第五條線為代表的棋局中部區域。

這是AlphaGo之父、DeepMind創始人Demis Hassabis向外界分享AlphaGo背後故事時透露的重要信息。

自從去年3月首爾那場載入史冊的比賽以來,AlphaGo超越人類棋手固有思維和套路的招法,對圍棋界的沖擊史無前例。用Demis Hassabis 的話說,“就像人們利用哈勃望遠鏡發現新的宇宙空間一樣。AlphaGo就是圍棋界的‘哈勃天文望遠鏡’。”

AlphaGo之父Demis Hassabis

5月24日,DeepMind創始人Demis Hassabis以及AlphaGo團隊負責人David Silver一起對外詳解了AlphaGo背後的研發故事,以及AlphaGo究竟意味著什麽?

“AlphaGo已經展示出了創造力,在某一個領域它甚至已經可以模仿人類直覺了。” Demis Hassabis說,在未來能看到人機合作的巨大力量,人類智慧將通過人工智能進一步放大。“強人工智能是人類研究和探尋宇宙的終極工具。”

圍棋難在哪兒?

歷史上,電腦最早掌握的第一款經典遊戲是井字遊戲,這是1952年一位博士在讀生的研究項目;隨後是1994年電腦程序Chinook成功挑戰西洋跳棋遊戲;3年後,IBM深藍超級計算機在國際象棋比賽中戰勝世界冠軍加里·卡斯帕羅夫。

相比之下,圍棋看似規則簡單,複雜性卻是難以想象的。它一共有10的170次方 種可能性,這個數字比整個宇宙中的原子數10的80次方都多,沒有辦法窮舉出圍棋所有可能的結果。

可以對比的是,國際象棋有著巨大的數據庫,如果棋盤上少於9個棋子的時候,通過數學算法就可以計算出誰勝誰敗;如果棋盤上少於九個棋子的時候,下象棋時人類是沒有辦法獲勝的。可以說,國際象棋的算法已經近乎極致。

在Demis Hassabis看來,更困難的是圍棋不像象棋等遊戲靠計算,而是靠直覺。“圍棋中沒有等級概念,所有棋子都一樣,圍棋是築防遊戲,因此需要盤算未來。你在下棋的過程中,是棋盤在心中,必須要預測未來。小小一個棋子可撼動全局,牽一發動全身。圍棋'妙手'如受天啟。”哈薩比斯如此解釋道。

第一位與AlphaGo對陣的人類職業棋手樊麾對記者感慨,“曾經以為計算機打敗職業棋手,一輩子都不會看到,沒想到這麽快就實現了。”

對 AlphaGo 團隊來說,是時候尋找一種更聰明的方法來解開圍棋謎題了。

如何訓練AlphaGo?

AlphaGo系統的關鍵是,將圍棋巨大無比的搜索空間壓縮到可控的範圍之內。

為了應對圍棋的巨大複雜性,AlphaGo 采用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。

具體而言,首先是通過訓練形成一個策略網絡(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。然後,訓練出一個價值網絡(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。

這兩個網絡自身都十分強大,而 AlphaGo將這兩種網絡整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo 產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往複。

AlphaGo 如何決定落子?

在獲取棋局信息後,AlphaGo 會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。

在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。

Demis Hassabis表示,阿爾法狗不只是模仿其他人類選手的下法,而且在不斷創新。

例如,在與李世石第二局里對弈第37步,這一步是Demis 在整個比賽中感到最震驚的一步。

Demis解釋道:在圍棋中有兩條至關重要的分界線,從右數第三根線。如果在第三根線上移動棋子,意味著你將占領該線右邊的領域。而如果是在第四根線上落子,意味著你計劃向棋盤中部進軍,潛在的,未來你會占棋盤上其他部分的領域,可能和你在第三根線上得到的領域相當。

因此,在過去的3000多年里,人們普遍認為在第三根線上落子和第四根線上落子有著相同的重要性。但在第37步中,阿爾法狗卻把棋子落在了第五條線,進軍棋局的中部區域。“這可能意味著,在過去幾千年里,人們低估了棋局中部區域的重要性。”

值得一提的是,和去年戰勝李世石的AlphaGo相比,DeepMind 科學家David Silver稱現在AlphaGo要更強三子,他介紹道:“與李世石對戰的AlphaGo 在 雲上有50個TPUs在運作,搜索50個棋步為10000個位置/秒,而昨天打敗柯潔的AlphaGo Master則在單個TPU上進行遊戲,AlphaGo成為自己的老師,它從自己的搜索里學習,有著更強大的策略和價值網絡。”

柯潔也在今日的微博中,對於AlphaGo團隊給出的檢測報告感嘆:自己是在跟怎樣可怕的對手下棋。

“這個差距有多大呢?簡單的解釋一下就是一人一手輪流下的圍棋,對手連續讓你下三步...又像武林高手對決讓你先捅三刀一樣...”柯潔說。

除了下圍棋,AlphaGo還能做什麽?

圍棋之外,Demis Hassabis告訴記者,AlphaGo 的高效算法是一種通用型的算法,也可以推廣到其他算法,把人工智能運用到各種各樣的領域,如將AI用到材料設計、新藥研制上,還有現實生活中的應用,如醫療、智能手機、教育等。

他曾舉例,通過與人類專家的合作,可以找到各種各樣的創新方式,包括從“其中一種變體應用於醫療行業,我們正在著力解決蛋白質折疊的問題,用來治療各種疾病。”

“人機合作可以達到1+1大於2的效果,人類的智慧將被人工智能放大。人工智能和AlphaGo都是工具,就像哈勃望遠鏡一樣,可以推進人類文明的進步。”他說。

不過他也對第一財經坦言,圍繞AlphaGo,背後的技術包括圖像處理、大數據分析等,這些技術目前在其它領域的使用還在早期探索階段,只在AlphaGo研究的中間環節某些領域應用,但是在未來肯定會在多個領域推廣相關的技術。

Demis Hassabis還表示,目前信息過載和系統冗雜是人類面臨的巨大挑戰.希望利用AI找到元解決方案。“我們的目標是實現‘人工智能科學家’或‘人工智能輔助科學‘。”

“人工智能和所有強大的新技術一樣,在倫理和責任的約束中造福人類。” Demis Hassabis說。這意味著,人工智能應該是應用於科學、制藥等領域,而不是應用於研發武器、戰爭上;此外,人工智能不能只為少數幾家公司使用,而是為全人類所共享。

PermaLink: https://articles.zkiz.com/?id=250447

AlphaGo步步為營,柯潔第二戰再次告負

來源: http://www.iheima.com/zixun/2017/0525/163296.shtml

AlphaGo步步為營,柯潔第二戰再次告負
龜途慢慢 龜途慢慢

AlphaGo步步為營,柯潔第二戰再次告負

在與 AlphaGo 的第二場比賽中,柯潔再次告負,不過他已經證明了自己的強大。

來源 |  極客公園(ID:geekpark)

文  | 龜途慢慢

沒有奇跡。用時三小時,在今天與 AlphaGo 的第二戰中,柯潔中盤因為實地虧空太多,無力回天,主動投子認負,前兩戰均告失利,令眾多圍棋迷們扼腕嘆息。

但毫無疑問,這盤棋不論是在精彩程度還是技術水準上都代表了圍棋這項運動的最高峰,非常精彩,甚至在比賽結束前 20 分鐘都還有專業人士認為柯潔有獲勝的可能性。所以,盡管在結果上沒有變化,但柯潔和 AlphaGo 已經攜手為我們展示了圍棋這項運動的美,不負巔峰對決之稱。

25

比賽複盤圖

比賽複盤及點評

一上來,執黑先行的 AlphaGo 就一反常態地花費了超過 1 分鐘的時間來思考第一子的落位,不僅現場的解說和觀眾都有點詫異,柯潔也忍不住很早就開始撓頭。不過從接下來開始,AlphaGo 每一步的用時基本都控制在一分鐘以內,而柯潔也在用時上慢慢拉長。

14.webp

雙方首先在右上角展開激戰,AlphaGo 也從第 10 手開始慢慢延續了自己稍顯不同的風格,古力在第 25 手開始就表示「現在的局面以前從未見到過,確實非常新穎」。不過柯潔也從這里開始逐漸出現了多次長考,顯然 AlphaGo 的落子已經超出了他的想法。

15.webp

似乎是局面不太有利,柯潔在第 30 手選擇了脫先,先放棄了在左上角與 AlphaGo 的纏鬥。雙方再轉至棋盤下方開始布局。不過到黑 37 手為止,ZEN 圍棋判斷白棋勝率一直在 51~54% 之間徘徊。Hassabis 也發推稱贊柯潔在開局階段「發揮完美」。

26.webp

16.webp

隨後,在下方的戰鬥中,第 53 手,黑棋再次下出奇招,現場解說嘉賓劉菁八段直言這是這盤棋目前出現的「最難理解一手」,周睿羊九段也表示要是自己應該不會下出「這麽刺激的一手」。

18.webp

雙方經過十幾手交戰,各有奇招,不過到了 73 招左右,在 ZEN 圍棋的勝率判斷中,柯潔的勝率陡然下降到了四成。

19.webp

進入中盤纏鬥,柯潔先於 76 手下出妙招,讓古力連連稱贊,也將局面導入複雜化。雙方的戰鬥也逐漸向中路發展,局面越來越亂,但柯潔的狀態也漸入佳境,求戰欲望很強,下法趨於強硬、激烈,也有意將局面導向複雜化。

在這一階段,柯潔在落子時非常用力,顯得戰鬥欲望非常強。同時,觀察室的眾多圍棋冠軍也都認為局面非常複雜,而柯潔有機會贏得比賽,現場解說張璇八段甚至直接表示「預感柯潔要贏」。

經過中腹的交換,胡耀宇九段點明稱「全盤至少有 10 塊不活的棋絞殺在一起!外加左下角一個大劫爭還沒開!」。雙方一邊靜待左下角的大劫,一邊繼續在中腹位置糾纏。局面持續複雜化。

20.webp

然而,形勢很快急轉直下,在左下角開劫的 136 及 138 的兩手中,柯潔似乎出現了一定的失誤,讓 AlphaGo 明顯獲得了巨大的優勢,唐韋星九段去「探班」之後稱柯潔已經出現了「唉聲嘆氣」的情況。

21.webp

在點清目數之後,現場點評嘉賓周睿羊點評表示,柯潔雖然用激烈的戰鬥手段在中段贏得了一定的機會,但 AlphaGo 仍然用近乎無懈可擊的表現掌控著局勢。在激烈的戰鬥中,AlphaGo 並沒有出現什麽失誤,反而是人類出現了一些關鍵性失誤。

22.webp

最終,柯潔不得不在中盤第 155 手投子認負。

綜合分析

認輸之後的柯潔表現得也比較沮喪,長時間留在場地內複盤,畢竟一度甚至看到了取勝的可能性。不過,幾乎所有的專業棋手都表示柯潔今天的發揮已經非常出色了,除了在中盤激戰中在左下方計算時出現了失誤,導致丟失了優勢局面。

但是,如果我們站在一個更加中立的角度上,會發現雖然柯潔本場比賽采用了和第一場完全不同的策略,沒有跟著 AlphaGo 的腳步走,而是主動求戰,將局面向複雜的方向引導,爭取在局部混戰中贏得優勢。但就像很多專家評論的那樣,今天的局勢最多就是「比較混亂看不清」,如果「比較混亂」看不清就算柯潔占優的話,那 AI 程序一定比你看的清。聶衛平甚至驚呼 AlphaGo 的一步棋他一輩子也下不出來。

當然,今天的柯潔已經給 AlphaGo 施加了很大的壓力,Hassabis 在賽後也再次發推稱贊柯潔「讓 AlphaGo 發揮到了極限」。同時他的很多同伴也覺得有點可惜,但他已經做得足夠好,沒什麽遺憾了。

23.webp

所以,毫無疑問,雖然在差距上看起來比第一場比賽要大,但柯潔今天的表現配得上自己「人類最強棋手」的稱號。雖然沒能像李世石一樣從 AlphaGo 手中搶來一場勝利,但考慮到這一版的 AlphaGo 已經比李世石版 AlphaGo 強出太多了,所以柯潔的表現絕不遜色。

分別與 AlphaGo 組隊,挑戰棋手如何去理解 AlphaGo 的獨特風格並與之合作;在團隊賽中,將由五位中國頂尖棋手合作,建立棋手「神經網絡」,降低心理因素的影響,從而做出更加客觀的判斷(每方兩個半小時比賽用時)。而這種全新的比賽方式也會引起人們更大的好奇心。 

柯潔 AlphaGo 圍棋
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=250586

AlphaGo已對柯潔產生感情嗎?看人工智能的泡泡

來源: http://www.iheima.com/zixun/2017/0531/163354.shtml

AlphaGo已對柯潔產生感情嗎?看人工智能的泡泡
待字閨中 待字閨中

AlphaGo已對柯潔產生感情嗎?看人工智能的泡泡

任何新技術的發展都有它的自然發展規律,一味的催長,反而可能毀了一個新生事物。

來源 |  待字閨中(ID:daiziguizhongren)

文  | 評論員

最近,微博上火熱的一個段子,也許很多人認為是事實,吸引了很多吃瓜群眾的轉發和討論,熱烈程度之高,超過了很多實事求是嚴謹陳述的科普和技術文章的閱讀量和關註度。

微博的內容大概是這樣的:

【阿爾法狗退役真相:已對柯潔產生感情】據設計者透露,AlphaGo在和柯潔的連番對弈中慢慢產生了感情,特別是在柯潔委屈落淚的時候,團隊監測到阿爾法狗的cpu溫度急劇升高,為了讓柯潔不再難過,它啟動了自毀程序,希望以此給柯潔最後的愛護。關機的那一刻,AlphaGo內存里最後閃過的是柯潔的側臉。

62

在這個全民娛樂,流量是King的年代,胡說八道,鬼扯蛋,確實也沒啥可以抱怨的。但是,有沒有意識到,很多的群眾,都是從媒體獲取認知,也許正是他們碰巧讀到的這一篇微博,可能讓他們對人工智能有了一個錯誤的認識,也許是對他們本來粗淺的認識火上加油偏離航道更遠。這,也許是現在人工智能的泡泡,越吹越大,的原因吧。

很多人,都還沒有了解AlphaGo是如何工作的(請看之前的文章,《AlphaGo其實挺“笨”的》),可能現在都覺得更神奇了,相信了機器還會有感情,有愛,心理徒生恐懼。作者該怎麽寫,是他們的事,確實無可厚非,但是,考慮到對讀者的責任,和對科學的普及,對新鮮事物的呵護,和吃瓜群眾的認知程度,就像編段子,講段子,發揮想像力,還是應該以事實為本。這個微博,不知道是想表達一種科學的想像力,還是完全為了取悅觀眾的胡說八道。說實在的,我們是樂不起來,說不準明天,很多的群眾就會不過腦,認為這就是事實,然後口口相傳,一個謊言重複一千次就成了真理。這樣,群眾的期待越高,失望就會越大,可能真會毀掉樂人工智能的前途。

65

一些媒體人,段子手,也許對技術沒有深入了解,也不想花時間去研究搞懂,倒也無可厚非,但是,如果是人工智能的專家們,雖然知道事實的真相,但也不實事求是的告訴大家,而是嘩眾取寵,添油加醋,火上加油,就有點說不過去了。比如,動不動就說,人工智能在醫療診斷上達到90%以上正確率,超過了人類醫生,但別忘了,這都是在封閉實驗數據的基礎上,現實,遠遠比這複雜很多。講述自己的觀點的同時,在吸引眼球的同時,也要描述事實,讓數據說話,而不是一廂情願的,只說好,不說壞,以偏概全。專家,應該是值得信賴的,應該是群眾認的標桿,應該是引導正確的,不要變成“磚家”,或是“動態專家”,什麽火說什麽,甚至是違心的說。

今天聽到一個故事,一個人工智能專家教授,邀請去講人工智能,做了一些科普,說了一些真話,結果,被觀眾指責為你講的是人工智能嗎?你懂人工智能嗎?真是哭笑不得。這就是悲哀的現狀,被指鹿為馬了很多次之後,馬倒不是馬了。吃瓜群眾,在娛樂的同時,也應該有點自己的鑒別能力。生活需要一些樂趣,需要讀一些八卦,段子,但也需要讀一些科普的嚴肅的東西,不然的話,就分不清娛樂和真實,分不清是非。為什麽這個世界騙子有那麽大的市場,因為,很多的時候,我們沒有積累,缺乏學習,不能,或是無法鑒別,平時不用功,老大徒傷悲。

63

人工智能是一個剛有一些突破的新鮮的偉大的技術,特別是在語音,圖像,視頻,自然語言處理的某些問題上,遊戲棋類,等,取得了亮眼的成績,但也不要被這些成績蒙蔽了眼睛,畢竟,還有很多的技術問題還有待探索研究解決,還有很多的需求有待發現,還有很多的應用場景需要挖掘和適配,還有很多的社會問題需要探討和立法。任何新技術的發展都有它的自然發展規律,一味的催長,反而可能毀了一個新生事物。我們很不希望,把人工智能當作一個泡泡來吹,我們需要冷靜的思考和客觀的立場。

人工智能的前途是光明的,但也逃不到事物發展的普遍規律,道路一定是曲折的。

AlphaGo 柯潔 人工智能
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=251035

有無人睇完AlphaGo會心寒?

今期看看iM,很多篇幅討論科技股,還登出了新晉80後blogger標竿兄的處女訪問,立即要買來支持一下。



文章中不止一位人物以投資騰訊作為代表作,原來這股王的確帶給不少人發達機會。除了有關騰訊的內容,吸引我眼球的還有對未來的描述,尤其google那一部分,描述AI將會令人類進入新的世代,令我有不少感想。

最觸目的是早前AlphaGo在圍棋賽上正式擊敗世界第一的中國棋手柯潔,上一次AlphaGo對戰人類,輸給了韓國棋手李世乭,得到世界第四的排名。其實李世乭只是世界第三,而聽聞世界第一的柯潔在棋藝上算是超班,遠遠拋離世界第二、第三位的棋手。

為何上次AlphaGo連第三名的李世乭都輸了,今次挑戰世界第一卻贏出呢?原來上次輸掉之後,它不停作出自我練習,自我對戰,學習改進,級數已經提升了很多。

今次柯潔輸了,是人類輸給AI的歷史事件,看來這不是運氣上的輸,因為賽後解構指,AlphaGo完全明白柯潔的棋步,但柯潔指有不少AlphaGo的棋步他並不明白,到很多步之後回看才明白該棋步原來是關鍵,他自言與AlphaGo完全不同級數,無可能贏到它。

柯潔更指,AlphaGo已經佔據了他的職業,人類已經無可能贏到它。其實AlphaGo還可以繼續自我學習進步,可以再比人類聰明多少千百萬倍,想到這裡,感到心中一陣寒意。

Alphabet的董事長Eric Schmidt在座談會上表示,無論結果如何,人類都會是最後的勝利者,人和機器並不是對立,而是互相幫助大家。雖然如此,但我腦中已經想著多部可怕的電影情節,例如Matrix、Terminator等,驚驚地。

還記得,百樂兄曾經於財自友坊課程中分享過,5至10年內,人類大部分工種將被機械人所取代。當我看見今天AlphaGo的表現,又看看youtube上一些有關尖端發明的影片,有四腳狂奔的機械犬、以雙腳穩定地走路搬貨的機械、自動導航的Tesla等,相信不久將來的世界的確會有巨變。

變化是否在我們想像範圍之內呢?我們可以看看上面那張舊照片,比對2005年與2013年。回想一下,原來智能手機對我們的影響只是十多年。回想自己剛出來工作幾年,還是用一些很傳統的手機,沒有拍照功能,今天人人拿起手機拍live,不久將來會否人人家中有一部機械人呢?

還記得行內一些前輩經歷過沒有電腦的工程世界,當時畫圖則是用手畫的,則師出了底圖,圖紙上有些資料不需要的話,需要專人拿起底圖人手Trace圖,把需要的資料手繪一次。還有,一千幾百頁的合約標書,真的以打字機打出來,世界剛剛發明了fax,把合約標書傳過去其他公司時可以用fax,這是一項大工程,需要先與對方電話溝通好,夾好時間,兩邊的fax機要長時間連接著,待文件傳送完成。今天在email按個制就發出文件的年代,對昔日的世界實在難以想像。

以前的日子能否想像到今天的世界呢?相信不太可能想像得到。而今天的科技對人手又有何影響呢?是好是壞?其實不一定完全是好影響,至少,顧問公司賺得更少,公司內工程師的工作量大增,是否很奇怪呢?何解?因為以前一個項目需要十個人去做,今天有了科技的輔助,一個人可以做十個項目,而價錢就越搶越低。

這跟巴菲特的一個故事很相似,巴菲特曾經遇到紡織業有機器生產商指發明了新機器,可大大提升生產效率,當時他的即時反應並不是高興,而是失落的,對新機器相當負面。原因是他很快地思考這批新機器所帶來的價值跑到哪裡去。

因為新高效率的機器出來,之後很快地每一家廠都會擁有,大家付出高昂價錢換入新機器,把生產成本下降了,由於大家都下調了成本,又會下調售價去爭生意。結果,新機器所產生的價值都跑到顧客與機器生產商處,而廠商只會經營更困難,不停花錢換機,更會裁員,負面效果居多。科技對很多行業的影響都很相似,科技所帶來的價值未必跑到公司或員工本身。

除了投資之外,其實百樂兄想講的是行業被淘汰的問題,尤其一些如醫生、律師等高薪職業,有很大的誘因去被AI取代,做工人的可能會好一點,主因是人工低,以AI取代或許暫不化算。

到這一刻,我們需要反思一個問題,我們有多少價值呢?

記得多年前曾到上海工作,一眾香港人的人工比上海人高出很多。當年上海一位工程師人工只是數千元,而香港工程師的人工可以是上海的十倍以上。當年有一位上海「坐館」食飯時與我們這班香港同事閒談,正是提出香港人應該想想自身的價值,為何值這麼高人工?他提醒我們,當然不同人力市場也是關鍵,不過當香港人在上海的話,得要想想自己人工憑什麼比起坐你旁邊的上海同事高出十倍。

雖我早已轉工,但這個問題我一直帶在身邊,閒時就會拿出來以不同角度想想,當然不會有標準答案,但這提醒了我時時要反思人力市場供求與自身價值問題。

可怕的是,看來未來我們需要面對同一個問題,而今次可能是AI的沖擊。一些月球醫生、星球醫生,又或者熟唸法律條文的高薪律師,未來發展將會被AI取代。其他的工種呢?因為還算便宜,但當AI一步步降低成本,人類還有何價值呢?

不是說笑,如此高科技的iphone或其他智能手機也只是賣數千元,如今人人一部,他日會否高科技的機械人也只是賣三兩萬一部,普通人家中也會有一個,還可以下載相關程式,例如西醫、中醫、律師、會計等,有了程式license,機械人可以在家中斷症開藥,這絕對有可能。

為何還要保留某些職業呢?人類比AI有何高一等的價值呢?感情?道德?法律保護?創意?這個世代在蛻變中,你與自身行業或投資上又有何準備呢?隨時於不久的將來,普遍人要面對一個自身難保的問題。

PermaLink: https://articles.zkiz.com/?id=251752

三歲的AlphaGo成了眾多職業棋手的老師?

來源: http://www.infzm.com/content/125141

2017年5月24日,江鑄久(左一)在烏鎮與AlphaGo之父哈薩比斯(Damis Hassabis)先生交談。(作者供圖/圖)

(本文首發於2017年6月8日《南方周末》,原標題為《AlphaGo老師》)

2017年5月30日,我去香港鳳凰衛視,參加錄制鏘鏘三人行的節目,談AlphaGo對柯潔的人機大戰第二季。想起去年3月,李世石和AlphaGo的第五局時,我也是一路奔到香港,邊和文濤聊著圍棋與人工智能,邊掛念著戰況。

一年多過去,AlphaGo從一開始的職業棋手都覺得下不過李世石,到現在成為很多人心中的圍棋上帝,這世界變化得太快了。

還記得對李世石的第一局,AlphaGo贏了之後,整個圍棋界都震動了。芮乃偉那時候就非常難過。我倒還好,因為賽前我已預測AlphaGo會贏,電腦戰勝人類的時刻就要到來。之所以這麽認為,是因為二十多年前,我在美國時就接觸過一些立誌開發圍棋人工智能的IT人士,還給他們當過參謀。之後,我也一直關註著這方面的發展。圍棋人工智能的發展十分緩慢,早在1990年代,IBM的深藍就打敗了國際象棋特級大師,但是電腦解決不了圍棋海量的計算,解決不了圍棋里“虛”的東西。當所有的智力遊戲都被攻克時,圍棋依然一花獨放。不過,看了2016年初Google發表的AlphaGo 5∶0戰勝歐洲冠軍樊麾的棋譜,我覺得我們將要見證歷史了。

但是我的預想圖是AlphaGo會贏一至兩盤,沒想到他第一局就贏了,而且贏得非常漂亮,也沒想到最後4∶1的結果,居然是李世石只贏了一盤。當然那是一盤偉大的勝局,李世石在形勢不利的情況下弈出神的一手,引出了AlphaGo的bug。

從那次人機大戰的整體看,AlphaGo下得漂亮。比如第二局黑37手的尖沖,令人蕩氣回腸,感覺是吳清源老師回來了。吳老師曾說他200歲在宇宙中還要下棋。那麽,這是AlphaGo將吳老師的思想傳遞回來了吧?我非常感動。

2017新年AlphaGo再度出山,以Master的網名在各大圍棋對弈網站下了60盤棋,全勝。我認真研究了這60盤棋並寫下打譜心得給我的學生們學習。知道孩子們要理解這些還有點早,但我願意埋一顆種子,期待在他們的心中慢慢發芽。

5月末,人機大戰第二季在烏鎮開戰。

此次人機大戰的勝負基本是沒有懸念的,當然我們希望柯潔贏,但是60局所顯現的AlphaGo太強大了。因此,奔向烏鎮時,我期待看到AlphaGo下出更加神奇的,甚至是我們職業棋士也看不懂的招法,期待看到人機之間更加精彩的對抗。

三番棋分別在5月23、25、27日進行。大會場里,屏幕上除了對局的進程外,還可以看到柯潔對局中的表情和動作,現場感很強。

第一局,AlphaGo執白勝1/4子,在中國規則里是最小的差距,但棋盤上的內容是一面倒的。柯潔似乎有點拘謹,AlphaGo一直掌控著局勢。

第二局,感覺柯潔放開了,下得非常出色,成功地把AlphaGo拖入混戰中,有一度很有機會,可以說是逼AlphaGo使出了渾身解數。據賽後公布的數據,AlphaGo認為前100手是雙方最善。雖然後半盤柯潔弈出問題手,棋局戛然而止。但是那一局棋,令許許多多的觀眾熱血沸騰。

27日第三局,澎湃新聞開通在線直播,我們和IT專家、紐約大學教授張崢老師一起講解。柯潔前半盤弈出問題手,之後奮力拼搏,一度使形勢非常接近,但還是未能翻盤。

3∶0,這個結果並不意外。那麽,看一場意料之中的賽事,看人類敗於機器,有意思嗎?有。

有柯潔近乎悲壯的對AlphaGo的死磕,有AlphaGo在棋盤上展現出來的奇思妙想,也有人機聯手等好玩的賽事,更有DeepMind團隊的講座和互動,這次的烏鎮圍棋峰會內容豐富精彩,我們站在了歷史的節點上。

24日那天是論壇。DeepMind CEO哈薩比斯(Damis Hassabis)先生和AlphaGo技術負責人席爾瓦(David Silver)先生的講座非常精彩,令觀眾了解了AlphaGo是如何依靠他們的策略網絡和價值網絡進行剪枝和判斷的。但是最令人震撼的是席爾瓦先生在講話中說,AlphaGo Master經過這一段的深度學習,已經比同李世石下棋時的版本進步了Three Stones。聽到這個說法,柯潔立刻在微博上發表了“天哪”的感嘆。

三子啊,真是令人難以置信。午餐時我們特地去找哈薩比斯先生求證。哈薩比斯先生首先肯定了這Three Stones就是三個子,而不是三目(Three points),然後解釋說這是系統自己測定的,按照“AlphaGo李”同“AlphaGo柯”自己對下的勝率估算出的實力差距,並不說明和人類下也能讓三子。不過,他又補充了一句:“也許是讓兩子……”

嗯,這也已經足夠令人震驚了。想起今年3月份我到日本的時候,碰到了武宮正樹老師、趙治勛老師和小林光一老師,他們都不約而同地認為如果是60連勝,按照棋份來說,那是兩個子的棋份了。

哈薩比斯先生還說,他們已經修複了對李世石時的bug,即使形勢不利(基本不太可能),AlphaGo也不會亂來了。趁此機會,我提出,希望能多給我們看一些AlphaGo左右互搏的棋譜。哈薩比斯先生答應考慮一下。

下午,一不小心去了Jeff Dean的記者會(後來才知道他有多牛,據說谷歌員工認為谷歌搜索驚人的速度都歸功於他)。會後,主辦方好意安排我和他聊幾句。我問他,AlphaGo的開發會一直繼續下去嗎?有沒有目標?他嚴肅地回答這個要去問DeepMind團隊……好吧,那我再問,你覺得人工智能,比如AlphaGo,在對孩子的教育方面有些什麽幫助?Jeff很認真地說,人工智能會很好地啟發孩子們的創造力……

26日上午,大舞臺上是配對賽,古力和AlphaGo對陣連笑和AlphaGo。雖然是表演賽,但大家相當期待,都想看人和電腦會配合成什麽樣子。而且,如果是人機對戰,機器優勢了,就會挑穩妥的路走,不求最好,只選擇勝率最高的一手。所以我們預想,到了後半盤,是不是可以由人類高手領著AlphaGo下出最善的著手呢?

很有意思的一盤棋。布局,執白的連笑弈出問題手,黑棋優勢。但是緊接著黑方的AlphaGo下了一步無比堅實的自補,我相信任何一個職業棋手都是不會往那里想棋的。是不是阿老師覺得優勢了呢?我們笑說,這一步似乎把古力的調子打亂了。

據說後臺數據黑棋勝率曾到達75,古力下了某一手後掉到60多一點,再後來又掉到45……好玩的是有位女棋手在朋友圈轉了這條消息,然後寫道:“我想說,是時候讓你們體會體會女棋手在混雙賽中的壓力了。”確實,一到混雙賽,女棋手常常是戰戰兢兢的,怕下錯了。局後古力聽了大笑,說幸虧阿老師不會說話,不然我肯定要受責備了。這個角色轉換令人莞爾。

後半盤,黑棋處於劣勢了,黑方AlphaGo要認輸,古力不同意。局後古力說,他和連笑商量好了,不管哪一方的電腦要求認輸,都要拒絕。結果,阿老師似乎是發脾氣了,連續損目,古力只好也拿起牌子來,示意認輸,他的同伴爽快接受。這麽看來,劣勢情況下,要率領AlphaGo繼續兢兢業業地收官,不是一件容易的事情。

連笑局後的感想是,和阿老師配合心里很有底。問為什麽,答中盤時覺得形勢不好,但是同伴仍然不緊不慢地很穩健,所以心就定了,想是不是也沒有那麽糟。一等一的高手形勢判斷要依仗阿老師了,這又是配對賽有意思的地方。真希望這樣的對局多來幾盤,可以好好欣賞一下人機配合的各種有趣。

下午是陳耀燁、周睿羊、時越、羋昱廷、唐韋星五位世界冠軍對陣AlphaGo。一個長條桌上擺著棋盤,四個人坐在後面,周睿羊在另一面和大家一起討論,他轉過身就是比賽用的正式棋盤,商量定了就由他在盤上落子。AlphaGo橫空出世後,周睿羊最先采用阿老師的很多下法,贏了不少棋,因此得了一個“阿爾法羊”的美稱。

賽前,大家都不看好這場所謂的群毆,因為雙方各兩個半小時的用時,對人類一方實在是太少了,一個人下都有點緊巴巴的,五個人稍一討論,十來分鐘就沒有了,何況對面是一秒鐘能算百萬步的阿老師,更加覺得有壓力了。果然,大盤講解的古力、王磊等一直在為他們擔心:還不下啊?時間又過去十分鐘啦。想想看,五個棋風不同的高手一起討論,哪能那麽快就達成一致呢?所以,我們在屏幕上,總是看到阿爾法羊在笑,等著大家統一意見的樣子。

中盤時,AlphaGo有一個靠然後小尖的連環手筋,是屬於讓人大吃一驚的思路。但是據說研究室里柯潔先於AlphaGo擺出了這兩步棋,不禁感慨,柯潔真是最適合大戰AlphaGo的人啊!

最後小官子階段,是AlphaGo小勝的局面,讀秒後替換周睿羊坐到棋盤前的唐韋星在白棋空里二二點了一手。這是一步騙招,完全沒有棋的地方,但是阿老師很穩健地補了一手,損目了,當然這和勝負無關。五個年輕的世界冠軍笑得不可開交,有一張他們捂著臉撐著頭笑著的照片瞬間刷爆了朋友圈。這步棋是一種測試,AlphaGo應錯了。不過這不算什麽。我們非常想知道,如果補一手會輸,阿老師還會像實戰那樣走嗎?當然,答案其實是很明顯的。

27日第三局結束後的新聞發布會上,哈薩比斯先生宣布AlphaGo將退出圍棋賽事!DeepMind團隊同時宣布,將陸續公布AlphaGo左右互搏的50局棋譜,今天先公布10局。我看了幾個片段,那真的是有著許多可以顛覆圍棋觀的內涵,谷歌的武功秘籍公開了。

非常感傷,一段傳奇就要這樣離開嗎?

回味這場“絕唱”,在傳承方面,AlphaGo吸收了很多前輩高手的精華並予以再創造。在棋局中,我看到它的很多招法有當年吳清源老師的影子,心里非常感動。也許,上天是通過AlphaGo映照出了很多職業棋手在歷史上那些讓人難忘的場景,那些可歌可泣的精神。

三歲的AlphaGo打敗了人類幾千年的進化。人類棋手要戰勝電腦已經不可能了。但是,通過學習,我們可以在自身的基礎上獲得提高。我想,生活在現代的職業棋士是幸運的,阿老師幫助我們突破自身的局限,使我們能夠以更加自由的心靈和開闊的視野去面對棋盤,也更加能夠體會圍棋的美好。

PermaLink: https://articles.zkiz.com/?id=251846

AlphaGo奇招再勝南韓棋王:無話可說

1 : GS(14)@2016-03-11 12:46:05

■李世乭賽後跟其他棋手分析棋局;前左為Google DeepMind研究員。美聯社


人工智能系統AlphaGo與南韓天才棋王李世乭的圍棋大戰昨天進入第二回合,AlphaGo以奇招再下一城,擊敗代表人類應戰的李世乭。兩連敗的李世乭坦言無法找到對手破綻,「無話可說」。由Google子公司DeepMind開發的AlphaGo,於前日首局重挫榮獲多項世界冠軍的33歲九段棋士李世乭後,昨日再次報捷。這場被南韓傳媒稱為「人類與電腦的世紀之爭」的第二戰甫開局,執黑子先行的AlphaGo一如所料搶佔開局時的兵家必爭之地——星位,在棋盤右上角位置下了首步,李世乭亦於左下角星位落子迎擊。然而,AlphaGo考慮分半鐘後,第二步就放棄其他星位,改於其他位置落子,棋法罕見。



似是錯步實為策略

但AlphaGo的驚人創意又豈止於此。有專家棋手指,AlphaGo的下子起初往往似是錯步,後來才發現是精心部署的策略。就連負責電視直播解說的九段南韓棋手金成龍亦指AlphaGo的步法「標奇立異得令人驚訝」,更指縱觀中國、日本、南韓三國的1,500名專業棋士中,應無人如此下棋。而被AlphaGo奇招震懾的李世乭,則一改首局的進取態度,每步都下得保守非常,更一度思考5分半鐘才再作下子,後段更陷入苦戰,終在開局4個半小時後投子認輸。



落敗稱找不到對手弱點

賽後李世乭表示相對於前日的驚訝,昨日的敗陣更讓他語塞。他感覺自己在整場對戰從未處於上風,更指連敗兩場很可能是因為找不到對手的任何弱點,估計自己不容易在往後局數取勝,但未完全放棄,會盡力扳回敗勢。根據Google的設計,AlphaGo具備不斷學習和累積經驗的功能。有南韓國家級棋手指,昨日的AlphaGo恰如前日的李世乭,以幾着絕少在職業賽中出現的招數先發制人。而首局落敗對李世乭可能構成心理壓力。
AlphaGo與李世乭的對弈尚餘3局,下回將於明日再戰,直至下周二結束。韓聯社/新華社/德新社





來源: http://hk.apple.nextmedia.com/news/art/20160311/19525257
PermaLink: https://articles.zkiz.com/?id=297536

AlphaGo向中國棋王挑機

1 : GS(14)@2016-03-15 15:08:04

南韓棋王李世乭跟人工智能系統AlphaGo的圍棋大戰,昨日休戰一天後今日將完成最後一盤賽事。AlphaGo前天雖首嘗敗績,卻換來在職業選手世界排名第四,研發者更向世界排名第一的中國棋手柯潔(圖)「挑機」。
Go Ratings網站基於全歷史排名算法(WHR)統計,每天更新數據來得出世界排名,若棋手未曾落敗不能入榜,前天AlphaGo被李世乭的奇着導致程序錯亂、棄子投降,終於得以打入Go Ratings並排第4,較李世乭高一級。意外收穫似乎令AlphaGo研發者之一哈德塞爾非常雀躍,在facebook表示「多虧李世乭,AlphaGo能進入世界排名了」,更向世界一哥下戰書:「柯潔,來比一比如何?」鳳凰網





來源: http://hk.apple.nextmedia.com/international/art/20160315/19529802
PermaLink: https://articles.zkiz.com/?id=297928

棋王「神之一手」 首勝AlphaGo

1 : GS(14)@2016-03-15 15:16:35

■李世乭昨獲勝後與Google創辦人之一布林握手。美聯社


南韓棋王李世乭在圍棋「人機大戰」連敗3局後,昨在沒壓力下迎戰人工智能系統AlphaGo,在初中段施展關鍵的「神之一手」大破對手,終贏得首場勝利,捍衞人類棋手的尊嚴。他賽後笑逐顏開,形容「這場勝利太珍貴,我永遠都不會用世上任何東西交換」。李勝利後,獲在場者報以熱烈歡呼及掌聲,他受寵若驚地說:「這是我首次贏到一場比賽後,獲到這樣的祝賀。如果我是領先3局後落敗,會感到很痛苦,但經過連輸3盤後反勝一仗,我十分高興。」



第78手打亂對方陣腳

昨對局由AlphaGo執黑子先下,擺出星小目佈局,首11步與第二局同出一轍,執白子的李在第12手後變陣,AlphaGo亦見招拆招,白子未見優勢。但到第78手,原本四處搶佔地盤的李忽然神妙地攻向中央,AlphaGo竟失策未作防禦,李乘勝追擊。
AlphaGo被打亂章法後,估計由於程式找不到對應方法,接着幾步近乎自暴自棄,令李忍不住失笑,連代AlphaGo擺棋的研究員黃士傑也不禁搖頭。AlphaGo其後雖然「回復冷靜」,但李已穩住中央,奠定優勢,終逼對手在第180手棄子投降。李首打敗AlphaGo後,分享了程式兩大弱點,「其一是執黑子時實力較弱,其二是面對意料之外的棋步時會犯錯,就像是程式出錯一樣」。研發這程式的Google子公司DeepMind行政總裁哈薩比斯透露,AlphaGo自我計算的勝率在第79手後銳減,至第87手時跌至50%以下,可見李是靠第78手精妙一着反敗為勝。中國職業九段棋手陳耀燁表示,AlphaGo弱點主要在前半局出現,後半局路數很值得人類學習,而儘管AlphaGo未稱得上圍棋之神,也令他自覺需長進的地方還非常多。李坦言最初敗陣令他感壓力,但由於他享受對局過程,因此不覺痛苦,「贏了這場後,壓力幾乎一掃而光」。由於他今局是執白子取勝,故期望在明日最後一局可執黑子,「執黑子贏的話更有價值,我想一試」。AlphaGo目前以3:1局數領先,在5局對賽已奠定勝利。韓聯社/《韓國先驅報》





來源: http://hk.apple.nextmedia.com/news/art/20160314/19528684
PermaLink: https://articles.zkiz.com/?id=297971

AlphaGo終極戰挫南韓棋王李世乭:享受5場對弈

1 : GS(14)@2016-03-16 07:26:59

■南韓棋手李世乭昨與AlphaGo苦戰5小時,狀甚懊惱。美聯社


全球矚目的圍棋人機大戰昨落幕,Google旗下DeepMind公司的人工智能系統AlphaGo,在最後一局再挫南韓職業九段棋手李世乭,以總局數4比1戰勝人類代表。Google母公司Alphabet的執行董事長施密特(Eric Schmidt)表示:「無論最後勝負如何,人類才是最後贏家。」昨棋局由李世乭執黑子先手,貼7.5目。李先在右下方佔優,但其後在上方過於保守,第79手因求活而放棄搶攻機會,優勢頓失。而AlphaGo第106手防守左下方,一度被認為是讓黑子有機可乘的錯着,但最終證明白子滴水不漏擋住攻勢,李隨後陷入苦戰,力撐至第280手投降,棄子一刻雙手抱頭,狀甚懊惱。




激戰5小時 有些微失誤

多名世界級棋手一致判斷,李投降時只領先5目,計算貼目後篤定落敗。全局歷時約5小時,是5局中最長。專家普遍認為李在今局沒犯大錯,是他表現最好一次,而AlphaGo則有些微失誤。李總結5場賽事感受,稱衷心享受與AlphaGo對弈,「我為比賽完結、而我未能在最後帶來高潮而失望」。他感謝粉絲支持,並相信人類將來仍很有希望戰勝人工智能。人機大戰首3局均由AlphaGo勝出,至第四盤才被李扳回一城。李認為AlphaGo未算無懈可擊,不擅長應對突如其來的步法,執黑子的實力亦比執白子時弱。DeepMind行政總裁哈薩比斯(Demis Hassabis)認為AlphaGo該局敗得很有價值,有助了解系統極限和弱點。AlphaGo贏得的100萬美元(780萬港元)獎金會捐作慈善用途。哈薩比斯前日在facebook向世界排名第一、中國棋手柯潔「挑機」,問他「來比一比如何?」柯潔昨沒回應,只是說AlphaGo在昨日對大局掌握有長足進步,「相反李世乭對大局觀沒概念,對形勢有錯誤估計,對形勢判斷過於樂觀」。
Google相信技術有望在醫藥、科研及研發機械人方面協助人類,暫未有再公佈AlphaGo新挑戰計劃。韓聯社/新華社





來源: http://hk.apple.nextmedia.com/news/art/20160316/19531555
PermaLink: https://articles.zkiz.com/?id=298070

AlphaGo首位名譽九段棋士

1 : GS(14)@2016-03-16 07:27:44

AlphaGo戰勝南韓棋手李世乭後,獲韓國棋院授予名譽九段棋士的最高榮譽,表揚其棋力達入神境界。棋院發言人說:「從未有人或機器能獲封為名譽職業棋士,多數只是獲頒授名譽業餘棋士證書。」棋院發出的證書編號為001,以示AlphaGo為首位享有名譽九段的棋士。




李圍棋世家總段數39段

AlphaGo甫出道便登上棋壇最高位,猶記得第二局對戰時,負責直播旁述的九段棋士宋泰坤因看不通棋局,無法評論而向觀眾道歉。南韓、中國和日本均把職業棋士分成九個段位,九段為最高,同AlphaGo對弈的李世乭及世界排名第一的中國棋手柯潔都是職業九段棋士。另外,三國都有為業餘愛好者分等級,南韓業餘以七段為最高。李世乭出身圍棋世家,連業餘段數在內,家族總段數多達39段。今次AlphaGo越級挑戰李世乭迅速升至九段,跟李世乭的經歷相似。李世乭初出道時屢次拒絕參加升級試,又常以低段位身份擊敗職業九段棋士,逼得韓國棋院修例,靠比賽、毋須一定考試都可升級,使他3個月內由職業三段升至九段。綜合報道





來源: http://hk.apple.nextmedia.com/news/art/20160316/19531589
PermaLink: https://articles.zkiz.com/?id=298072

Next Page

ZKIZ Archives @ 2019