📖 ZKIZ Archives


國產AI圍棋崛起:微信“金毛神犬”得冠軍,柯潔敗於星陣

4月28日,微信“金毛” PhoenixGo拿下2018世界人工智能圍棋大賽冠軍。

微信官方宣布,在剛剛結束的AI圍棋大賽中, 來自騰訊微信翻譯團隊開發的人工智能圍棋程序PhoenixGo戰勝了自家兄弟“絕藝”。

據悉,這不是PhoenixGo首次出現在圍棋賽場中了。早在今年初,PhoenixGo就化身為BensonDarr等賬號在野狐圍棋上進行實戰,“以戰養術”。 “金毛”是當時棋友給它起的昵稱,因為它的頭像是一只金毛。而此次的AI圍棋大賽匯聚了國內外一等一的人工智能圍棋高手,絕藝,PhoenixGo、LeelaZero、TSGo、石子旋風、Golois,HEROZ Kishi、Baduki等來自中、日、韓、歐美等國家和地區的人工智能圍棋隊伍都參加了比賽。

除了AI圍棋程序之間的比賽,此次大賽更吸引眼球的便是柯潔和另一國產AI圍棋程序星陣的比賽。繼去年5月以0比3敗給谷歌AlphaGo後,柯潔再次迎來人工智能圍棋對手。

4月27日,柯潔九段與中國人工智能圍棋“星陣圍棋”進行對弈。星陣執黑先行,經過兩個多小時和145手對弈,柯潔選擇認輸,賽後他坦言“和人工智能下棋總有無力感”,但他同時也表示會繼續和AI下棋,“如果大家想看的話,我們還有很多的機會跟AI下棋。”

“AI的計算和判斷都在我之上”

此次戰勝柯潔的“星陣圍棋”前身是清華大學研發的圍棋AI“神算子”。本次比賽采用中國圍棋規則,黑貼3又3/4子,用時為每方2小時,保留五次一分鐘讀秒。裁判由2016年AlphaGo與李世石人機大戰的裁判長樊麾擔任。比賽於14點15分正式開始,星陣執黑先行,星陣圍棋的董事長金涬擔任“人肉臂”。

在比賽進行一個多小時後,柯潔已經顯得被動。戰至145手,柯潔投子認輸,星陣贏得這場人機大戰的勝利。 柯潔表示,和AI下棋總是有無力感,“它的計算和對大局的判斷都在我之上,也不知道自己表現得好或者壞,因為真的是很難下。”

去年5月,在與AlphaGo比賽時,柯潔曾表示這是其與AI的最後對局。但他不僅食言參加了這次比賽,還稱下棋不是其一個人的事情,將會繼續和AI下棋,“就是不知道大家會不會再想看了。”

對於此次的敗局,柯潔坦言,第一次與AlphaGo比賽時仍有點措手不及,而現在已經有了一些心理預期。他認為,自己的布局並未落後很多,但中盤要拼計算力時發現自己“力不從心”,算的不如AI遠。

AlphaGo的出現不僅讓更多的人關註到AI和深度學習,也讓AI成為近年來最熱的一詞。2016年,柯潔曾公開喊話“阿爾法狗勝得了李世石,勝不了我”,但隨後他以0比3敗給AlphaGo的升級版,甚至哭得眼眶通紅。在被AlphaGo虐哭後,他曾在微博上表示,“一個純凈、純粹自我學習的AlphaGo是最強的...對於AlphaGo的自我進步來講...人類太多余了”。

從圍棋到其他行業的應用

AlphaGo是迄今為止最強大的圍棋AI程序,也是第一個擊敗人類世界冠軍的圍棋AI程序。有關AlphaGo的進步歷程,金涬表示,從AlphaGo研究小組在《自然》雜誌上發表的兩篇論文來看,AlphaGo Zero(AlphaGo的升級版)遠超人類得益於強化學習技術。強化學習指通過大量自我對弈,再將自我對弈棋譜反哺給模型,不斷叠代優化。 不過,自我對弈消耗的計算資源空前巨大,令中小團隊望而卻步。

金涬表示,此次與柯潔對戰的“星陣”學習借鑒了AlphaGo的論文,不過與AlphaGo有兩方面的區別。一是在特征體系、模型結構、MCTS(蒙特卡羅樹搜索)算法架構等方面都做了創新。另一方面,星陣未使用AlphaGO第二篇論文中的強化學習技術,“這也就是說體現了我們主要從人類棋譜來做學習的。那麽下出來的棋是很像人類的棋風的,也很容易被人類理解。”

從柯潔的體驗看,星陣與AlphaGo也未有太大差異,“現在的AI多借鑒於AlphaGo,所以沒有感覺到不同,都很強大。”

中國圍棋協會主席林建超在此前星陣圍棋與網信集團的戰略合作發布會上表示,全世界代表性的AI圍棋有16種程序,中國目前有5種,包括騰訊AI Lab研發的絕藝。

為何還要選擇進入AI圍棋領域?金涬對第一財經記者表示,圍棋變化複雜,但是勝負簡單明了,容易驗證。所以圍棋成為人工智能和深度學習一個最好的驗證平臺。

“通過圍棋人工智能可以全面檢驗AI算法的效率,包括對訓練數據、數量、資源等等的依賴。這些實踐對於深度學習在其他領域的拓展,有很重要的示範意義。比如說算法工程師在計算機圍棋上的成功經驗可以變成其他人工智能的通用經驗,比如說一些調參方法、模型調優方法、強化學習的樣本方法,不斷提升計算機圍棋水平的過程中,對算法的不斷理解和創新會為其他領域做好準備。”

騰訊方面也表示,其實騰訊一直在探索和關註AI領域,“不僅是圍棋,未來你還將看到更多的‘大神’在各行各業中斬獲佳績。”

金涬認為,如果將其中的深度學習技術嫁接到各類應用場景中,就會大大提高效率。在,雙方正式宣布將共同研究AI在醫療健康、金融、能源、風控、生活服務等領域進行深度合作探索。

以AlphaGo為例。2016年7月,AlphaGo團隊將谷歌數據中心的用電量整體減少了15%,其中冷卻用電減少了40%;2017年3月,同樣的算法以50對12的壓倒性勝利戰勝了人類唇語專家,構建了自動唇語識別系統;2017年11月,該算法在乳腺癌早期診斷領域取得重大突破並成功用於臨床。

不過,從AI圍棋的探索再應用到各個場景仍需要過程,“這里邊驗證了一些通用性方法,但是肯定不可能簡單地從圍棋直接搬到各個場景,這些新的方法在其他領域解決特定問題時還要結合數據,再做一些創新,再解決一些實際的問題,才能真正落地。”金涬對第一財經記者說。

PermaLink: https://articles.zkiz.com/?id=263274

Next Page

ZKIZ Archives @ 2019