📖 ZKIZ Archives


人工智能有多“危險”?阿爾法狗是怎樣煉成的

來源: http://www.infzm.com/content/122442

有業內人士認為,韓國棋手李世石或許將是人類歷史上唯一贏過AlphaGo的人類棋手。(視覺中國/圖)

(本文首發於2017年1月19日《南方周末》)

“Aja學長(黃士傑)說他們每天都餵程序吃很多職業棋士的棋譜,那時我隱約覺得,只要程序吃的棋譜夠多,一定能比人類還要強。”

“它就像一臺永動機,在擁有龐大計算能力的谷歌雲端不停地練習,永不停歇。這意味著它很可能每一秒、每一天都在進步。”

如果說,發生在2016年春天的人機大戰給圍棋界帶來的是一次不小的震動。那麽2017年新年,圍棋界頂尖的人類棋手們算得上經歷了一次“飛蛾撲火”般的悲壯。

一個代號為Master的神秘棋手先後現身著名對弈網站弈城和野狐,毫不留情地“踢了場子”,在30秒一手的快棋中,除陳耀燁因電腦意外掉線而未完成比賽,系統自動判為和棋,其余數十位中日韓圍棋高手皆鎩羽而歸。最終Master以60場勝利的成績完勝人類。

Master的主人一開始似乎也未曾料到會出現如此令人興奮的戰果。在越來越高的關註下,才公開承認這位註冊ID的國籍上顯示為韓國的勇士正是2016年驚艷亮相的AlphaGo(阿爾法狗)。

當時,AlphaGo以4∶1的戰績拿下韓國圍棋頂尖高手李世石,技驚四座。而現在,它的成長速度開始令人恐懼。有業內人士甚至認為,李世石或許將是人類歷史上唯一贏過AlphaGo的人類棋手。

“人工智能方面取得的成功將會是人類歷史上最重要的事情。不幸的是,它也可能是最後一件。”向來對人工智能持以警惕的世界知名物理學家斯蒂芬·霍金不久前說。

所以,AlphaGo的主人——來自谷歌的Deep Mind團隊,是在“召喚惡魔”嗎?阿爾法狗到底是怎樣煉成的?

“吃”棋譜的阿爾法狗

臺灣圍棋教育推廣協會秘書長張曉茵關註到AlphaGo的時間可能比很多人都要早。

那是2015年,AlphaGo第一次向人類宣戰,它以5∶0橫掃三次斬獲歐洲圍棋冠軍的職業二段棋手樊麾。樊麾生於中國西安,現任法國圍棋隊總教練。2016年底,在中國一檔網絡節目中,樊麾講述了他第一次與AlphaGo比賽的感悟。樊麾當時並非沒有取勝的機會,在第五盤中他本來占據一定優勢,卻因一個低級失誤導致全敗,樊麾說這是他最痛苦的一個記憶。

不過在當時,AlphaGo的第一次亮相並沒有引起太多關註,至少在中國大陸,這條消息很快就被淹沒在快速滾動更叠的門戶新聞里。

但臺灣業余五段棋手張曉茵對這則新聞印象深刻,她除了對AlphaGo戰力如此之強感到意外,同時她也有一絲恐懼。更特別的原因是,這讓她的腦海中立刻浮現出一個人的名字:她的學長黃士傑博士(Aja Huang)。此人正是後來坐在李世石對面代替AlphaGo落子的那位男子,也是AlphaGo的開發者——谷歌Deep Mind團隊的核心人員。

黃士傑出生在臺灣,是谷歌設計團隊中最熟悉圍棋的工程師。黃士傑的導師、臺灣師範大學資訊工程系教授林順喜曾對媒體透露,黃士傑原本在交通大學學計算機專業,2001年到師範大學,成為他的研究生。因為成績優異,黃士傑畢業後先到加拿大當研究員,2012年到英國Deep Mind公司,成為兩位首席設計師之一。

張曉茵與黃士傑相識於臺灣師範大學,他們都是該校圍棋社最早的一批社員。黃士傑在社里年紀最長,且因他的專業是資訊工程,有關計算機圍棋(下稱圍棋AI)的知識都是由他向社里的學弟學妹傳授。張曉茵對南方周末記者說,當時黃在學校里就設計了一個圍棋AI程序,該程序還以他的妻子Erica命名。

張曉茵至今仍清楚地記得“吃棋譜”這個說法:“Aja學長說他們每天都餵程序吃很多職業棋士的棋譜,那時我隱約覺得,只要程序吃的棋譜夠多,一定能比人類還要強。”

AlphaGo的訓練模式之一就是盡可能多地“吃掉”人類棋手的棋譜。據有關報道,2015年10月阿爾法狗對陣樊麾時,“吃過”的棋譜是3000萬個,但到了挑戰世界棋壇16冠王李世石的時候,嚼進肚子里的棋譜已經達到1億。

樊麾在回憶他與AlphaGo的比賽時說,在與機器對弈的時候,你所發出去的信息被原封不動地反射回來,但因為你知道和你比賽的是一臺機器,所以你會對自己做出的選擇逐漸產生越來越多的疑問,這就好比是“自己被赤裸裸地扒光擺在自己面前”。

“太強了。”柯潔的父親對南方周末記者回憶,這是躋身當今世界圍棋頂尖高手之列的柯潔在看到Master一路破關斬將之後的感嘆。以至於柯潔發微博時都坦陳,“我雖然早就預計到AI遲早能戰勝人類,但那也是十年後啊……”

在《體壇周報》棋牌首席記者謝銳看來,這樣的感受絕不只是柯潔獨有,“棋手們都懵了”。誰也沒想到,圍棋AI戰勝人類的這一天,會來得這麽快。

永不停歇地學習

張曉茵認為,在AlphaGo完成60連勝以前,人類棋手對圍棋AI的忽略和輕視幾乎到了病入膏肓的地步。

1997年,代號“深藍”的計算機程序戰勝了世界第一的國際象棋大師,卻沒有讓在中國至少已有兩千多年歷史的圍棋感到絲毫的威脅。

當然,在當時圍棋界的自信並非盲目。這個號稱人類智力終極堡壘的古老遊戲,共有361個落子點(而國際象棋僅有64個),圍棋每一顆棋子的下法可能性大概有2的360次方,比宇宙的原子數還要多。如此龐大繁多的可能,對計算機的算力、算法和分析是極大的挑戰,它無法像對待象棋一樣,通過蠻力計算而得出結果。

就連AlphaGo所在團隊Deep Mind的創始人哈薩比斯(Demis Hassabis)都曾對媒體說,“寫出圍棋的評估函數是一件不可能的事情”。因為更多時候,圍棋與棋手的一些類似於“直覺”的東西有關。這也是為何哈薩比斯要說,“圍棋遊戲更像是藝術,而非科學”。

Deep Mind公司是2014年1月谷歌收購的人工智能(AI)研究機構,總部位於倫敦。Deep Mind公司致力於構建基於神經網絡和“深度學習”系統的強力泛用型的學習算法。

Deep Mind團隊曾向媒體透露,之所以選擇圍棋作為攻關項目,是因為,“如果想研發出與‘人類相似’的,彈性智能的算法,以解決種種問題,就沒有比遊戲更好的測試工具了。計算機最早攻克的遊戲是三目棋(Noughts and Crosses,井字棋),之後是西洋跳棋和國際象棋。圍棋和國際象棋不同,博弈的空間更寬闊,變化更是繁多,而且很難判斷棋子所處位置的價值,所以一直被認為是人工智能領域的最大挑戰。所以Deep Mind團隊的優先目標就是征服這一領域。”

為此,哈薩比斯和他的團隊做的是,用一種叫做神經網絡的研究方法,為程序註入像人類一樣的深度學習的能力,即它可通過不斷地練習,從而調整並學習掌握圍棋的下法,這比起深藍,與人類運用大腦解決問題的方式更加類似。

張曉茵對南方周末記者分析說,黃士傑博士和他的隊友們在AlphaGo程序中應該加入了“策略網絡(Policy Network)”和“值網絡(Value Network)”的技術。所謂策略網絡,是指程序在吃下上千萬甚至過億的棋譜後,能夠分析出下一步棋在不同下法時得出的不同勝率。而值網絡是對盤面優勢的判斷機制,以便及時止損和改變下法。

根據外媒報道,在練習時,Deep Mind團隊讓兩臺幾乎沒有區別的阿爾法狗對弈,即兩方能力相當,但下棋的路數有別,最合適下法的一方將勝出。這樣的原理,可將之理解為習武之人采取雙手左右互搏的練功方法,不斷地積累經驗。“就是自己和自己下。”《成都商報》記者歐鵬認為。

英國《衛報》一則對Deep Mind創始人哈薩比斯的采訪報道中寫道,“哈薩比斯說阿爾法狗不休息,即便在聖誕節期間也沒有。它就像一臺永動機,在擁有龐大計算能力的谷歌雲端不停地練習,永不停歇。這意味著它很可能每一秒、每一天都在進步。”

根據以下快棋聞名的中國知名職業棋手羅洗河的分析,Master其實下的都是最簡單明了的棋,懂得規避複雜大型的定式。

這和謝銳的觀察一致,“現在看來,局部對殺人類根本不是阿爾法狗的對手。人類棋手必須在棋局一開始就特別註重全局的布局,制造出大規模對決的局面”。謝銳以Master此次非正式測驗為例,95後棋手普遍輸得比較慘,而第54局Master碰到長於全局把控的聶衛平,反而贏得比較艱難。

危險的人工智能?

2016年1月27日,一篇有關AlphaGo的論文發表在《Nature》學術期刊上,張曉茵一眼就瞥見了作者一欄第二個就是黃士傑的名字。張曉茵迅速在臉書上聯系學長黃士傑,向他探尋更多有關AlphaGo的信息。

當時,黃士傑回複師妹,很多事情仍需保密,要等到3月與李世石九段比賽後才能說。

至今為止,關於AlphaGo的信息少之又少。對外發布信息時對媒體、內容和時機的謹慎挑選,使整個團隊沿襲了谷歌甚至同類科技公司慣有的一種神秘感。南方周末記者曾就AlphaGo的相關研發問題發郵件給Deep Mind團隊,但未獲對方回應。

但是,AlphaGo主要創始人之一哈薩比斯(Demis Hassabis)給外人的感覺卻是再普通不過。多家海外媒體記者在報道AlphaGo時都特別提到,在該團隊贏得世界矚目和驚嘆的時候,迎面走來的哈薩比斯是謙遜溫和的形象。甚至於,他身上那容易讓人誤會是實習生的極為普通的上衣、褲子和鞋子,也會成為報道中的一抹亮色。反差之大,很難讓觀者將他與“象棋神童”“遊戲設計大師”“名牌大學學霸”,以及僅他個人就拿到谷歌8000萬英鎊收入聯系在一起。

哈薩比斯1976年出生在英國北倫敦,在別的孩子還在撒嬌的年齡,他就展示出非凡的能力。哈薩比斯4歲學習國際象棋,13歲成為全世界排名第二的少年象棋大師。在象棋界譽滿天下的同時“染指”視頻遊戲,8歲開始寫電腦遊戲,17歲就創造了第一款包含人工智能的遊戲《主題公園》,後成立自己的視頻遊戲公司Elixir。

哈薩比斯做了這麽多事情也沒有落下學習,他20歲就獲得了劍橋大學計算機科學兩個一等榮譽學士學位。在遊戲領域感到觸及天花板時,他又重回學府,拿到倫敦大學學院的認知神經科學博士學位。

按照他自己的說法,無論是曾經嘗試過的棋盤遊戲、視頻遊戲、計算機編程還是現在縱身於人工智能,這些經歷都有千絲萬縷的聯系。譬如在16到17歲著眼於開發視頻遊戲《主題公園》期間,他開始意識到人工智能可以多麽強大。他將之稱為“至關重要的具有里程碑式的經歷”。而他身上與同代人相比少見的超強智力,將他在不同學科中累積的經驗和經歷,有意識地糅合在了一起。

當媒體問他創造出阿爾法狗的原因,他總是一次又一次有耐心地講述團隊組建的初衷:創造一個通用學習機器,“一套能像生物系統一樣學習的靈活並且能自我適應的算法,僅僅憑借原始數據就能掌握任何任務”。

在阿爾法狗橫空出世之後,關於人工智能把下圍棋的人類逼入絕境的擔憂開始不絕於耳。事實上,阿爾法狗對人類的輾軋,並沒有打擊到人們對圍棋的熱愛,反而掀起了“圍棋熱”。據統計,去年阿爾法狗與李世石的人機大戰每局都有1億左右的人觀看,網絡直播平臺對比賽進行全方位直播。各大媒體均推出專題,對比賽進行跟蹤報道。而中國國家圍棋隊的高手們也被各大網站“搶購一空”去進行解讀。韓國棋院的負責人也對媒體證實,在去年人機大戰以後,咨詢觀看圍棋比賽,以及申請參加圍棋段位賽的人數也有了明顯增多。

不過,圍棋從來都不是Deep Mind團隊的終點,而是開始;通用人工智能才是終極目標,“通用”才是關鍵詞。這也是為什麽謙遜的哈薩比斯在阿爾法狗贏了李世石的時候會說,“阿爾法狗從來都不是我們的唯一,甚至不是我們最重要的研發。”正如他對The Verge (一個美國的科技新聞及媒體網絡)的記者說的那樣,“我們希望將此應用於更大的真實世界的問題。”

這正是學界對人工智能的擔憂之處。斯蒂芬·霍金、比爾·蓋茨、埃隆·馬斯克這樣大名鼎鼎的人物不止一次公開表達過對超級人工智能的恐慌。微軟創始人比爾·蓋茨曾公開表示,人工智能帶給人們便利的生活之余終歸存在威脅。矽谷狂人埃隆·馬斯克在推特上說過,“我們需要十分小心人工智能,它可能比核武器更危險。”

哈薩比斯當然知道這些,在回答這些問題時,他會皺起眉頭變得嚴肅。“我發現那些沒有真正研究人工智能的人們並不完全理解這些。他們通常沒有跟很多人工智能專家深入交談。”

“我們距離那種能夠達到人類級別的通用智能還得好幾十年”,他公開自己的想法,並認為“吃瓜群眾”對人工智能的危言聳聽會阻礙極具潛力的近期受益,譬如醫療健康、智能手機助手等領域的革新。

客觀來說,“吃瓜群眾”很大程度上受到電影市場上各式腦洞清奇的科幻電影影響。比如在探討人工智能倫理的電影《機械姬》中,女機器人意識覺醒,並最終報複殺死創造出她的人類“上帝”。

事實上,哈薩比斯的團隊內部依然有專門的倫理委員會,用於管控通用人工智能技術的未來應用。當Deep Mind2014年被谷歌用四億英鎊收購時,雙方協議中就有一項:“禁止將該技術應用於軍事或情報用途。”

PermaLink: https://articles.zkiz.com/?id=233369

Next Page

ZKIZ Archives @ 2019