誰也沒料到,2017年最先刷新人類三觀的,是人工智能。
去年3月一戰成名的AlphaGo(阿爾法圍棋),在歲末年初化身為“Master”,進行60場互聯網棋局車輪大戰,挑落了幾乎所有的中日韓三國圍棋界的天才與泰鬥。
隨後在當地時間1月4日清晨,谷歌DeepMind創始人兼CEO戴米斯·哈薩比斯(Demis Hassabis)發布推文稱,Master就是AlphaGo,正式宣布升級版的AlphaGo問世。
劇情像極了電影《終結者》中,阿諾德·施瓦辛格狠狠地甩來了一句“I will be back!”
AlphaGo曾向多位高手下“戰書”。韓國棋院的負責人向第一財經記者透露:“此前,Master背後團隊DeepMind曾表示,最後十局,想和曾經稱雄一時的各國圍棋界高手進行對決。應該是在這種情況下,‘棋聖’聶衛平九段和常昊九段等和Master進行了對決。”
而DeepMind也希望韓國的曹薰鉉九段和李昌鎬九段兩位“圍棋泰鬥”應戰。不過,曹薰鉉九段已成為韓國執政黨新國家黨的國會議員,因黨內事態混亂,未接受邀請。
而韓國圍棋界的另一位泰鬥李昌鎬九段拒絕的理由更為“直白”。他表示,自己並不喜歡下互聯網圍棋,拒絕了對決請求。
“如果只論勝負的話,畢竟人工智能沒有疲勞,也沒有任何失誤;這種不同於人類的絕對優勢,以及可以按照某種特定的規則進行不斷訓練的條件,都為它創造了良好的條件,人工智能獲得勝利,不見得是個意外。” 韓國女棋手尹英敏(音譯)四段說。
發展速度令人震驚
對於全新的AlphaGo繼續叱咤圍棋界,韓國網民和圍棋界人士也表達出了巨大的關註。
就在去年3月,AlphaGo曾經在韓國打敗了當時韓國專業圍棋手李世石,震驚世界;彼時尹英敏曾經確信李世石會獲得勝利,甚至表示“如果李世石真的輸掉,那麽我們這些圍棋指導者,可能就都會面臨失業了”。
尹英敏在韓國首爾運營一家圍棋培訓機構。
時隔近一年,第一財經記者再訪尹英敏,她正在接待來帶孩子學習圍棋的家長。
“事實上,世紀級人機大戰過去一年,不僅沒有使我失業,反而還使許多民眾的關註點放在了圍棋上,更多家長開始關註圍棋對於兒童智力發展的促進;這可能也是人機大戰給圍棋界帶來的好處吧。”尹英敏說。
而韓國棋院的負責人也證實說,“在去年人機大戰以後,咨詢觀看圍棋比賽,以及申請參加圍棋段位賽的人數也有了明顯增多”。
對於Master的頻傳捷報,尹英敏似乎也看開了很多。“雖然也曾經看到過李世石輸給AlphaGO,不過看到許許多多中日韓的頂級棋手都紛紛敗給AlphaGO,看著這些自己的偶像一個個失敗,心中還是有一些吃驚和失落的。”她坦言。
對於Master的棋風和水平,尹英敏承認“Master的水平要遠高於此前人機對戰時的AlphaGO,棋風穩健並極少失誤”,並表示“AlphaGo人工智能的發展速度著實令人吃驚”。
關於Master為何方神聖,在謎底未被揭曉前,地平線機器人CEO余凱曾向記者分析,“因為DeepMind在去年年初於《自然》雜誌上發表過論文,所以其他公司複現DeepMind年初的水平也是正常的,但是超過的概率不是很高,所以大概率還是DeepMind。”後來預判應驗,Master背後高人果真為AlphaGo。
哈薩比斯在推特上說,他的團隊一直在致力於提升AlphaGo的性能,過去幾天他們用新版測試了幾次非官方的圍棋遊戲,這要感謝網名為Magister和Master的賬號。兩者分別在Tygem(弈城圍棋網)和FoxGo(野狐)的服務器上運行,也要感謝所有觀看比賽的人。他們對比賽結果非常滿意。“更重要的是,新的AlphaGo在遊戲過程中為圍棋界提供了寶貴的經驗。”
哈薩比斯還特地提到了在對弈中失敗的古力,“古力發表博文稱,人類和人工智能一起將會很快發現深度學習的奧秘。”
“現在我們的非官方測試已經告一段落,我們期待官方的測試,並將於今年再次舉辦整場的圍棋比賽,挖掘AlphaGo博弈過程中所呈現出來的創造力。”他說。
圍棋還能這麽下?
2016年12月29日,Master首次出現在弈城,並在當晚就很快取得了對國內高水平職業棋手的十連勝;30日中午,它又在數次連勝後,拿下了當今的“韓國第一人”樸廷桓九段和疑似“中國第一人”柯潔。
柯潔此前在觀戰時曾驚嘆:“從來沒見過這樣的招法,圍棋還能這麽下?”後來又表示:“人類數千年的實戰演練進化,計算機卻告訴我們人類全都是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊。”
在12月31日休整一天後,今年1月1日晚11時,Master 轉戰騰訊野狐圍棋,與各路高手展開了新的對局。因為聲名鵲起,從李欽誠到古力、柯潔、黨毅飛、江維傑、辜梓豪、樸永訓、柁嘉熹、姜東潤、井山裕太等人紛紛申請與之對戰,但隨後紛紛負於這一神秘對手。
1月4日下午,在網絡圍棋中與Master對戰過的著名棋手包括柯潔、樸廷桓、井山裕太、周俊勛等人。1月4日下午3時,中國棋聖聶衛平在與Master的對戰中失利,這是Master的第 54 場勝利。1月4日晚,在連續對陣申真谞九段、周睿羊九段、古力九段後,AlphaGo的連勝紀錄擴大到了60場,按照事先的計劃,谷歌圍棋程序的非正式比賽測試暫時告一段落。
網絡快棋是目前職業選手練習的主要方式之一,因為每一步思考時間很短,與帶獎金的正式比賽相比,快棋賽中對決雙方更加容易出錯,所以這次升級版AlphaGo的實際圍棋水平如何還需要正式規則比賽的進一步檢驗。
Master展示了人類棋手無法企及的快棋水平。但如果給人類足夠的思考時間,是否結果會不同?
沖擊已經開始
值得一提的是,去年 12 月 13 日,谷歌聯合創始人、Alphabet總裁謝爾蓋·布林(Sergey Brin)和谷歌CEO皮查伊(Sundar Pichai)一同造訪中國棋院,觀摩了棋手訓練,並與“棋聖”聶衛平九段及中國圍棋隊總教練俞斌九段進行了交流。隨後在日本棋院Journalist Club的頒獎儀式上,哈薩比斯曾表示:“2017 年對AlphaGo和圍棋界都將是充滿興奮的一年。”人們沒有意識到,在新的一年還未到來時,人工智能對於這項流傳千年的古老技藝的沖擊已經開始。
芝麻科技創始人、CEO朱智對第一財經記者表示:“這次比賽相比上次和李世石的三局體現出了AlphaGo更好的穩定性和信心。在圍棋這個領域,人工智能證明了它確實表現得更好,但這並不意味著機器具有智慧。事實上,機器更擅長處理這些複雜的理性問題,因此在許多的特定領域,機器學習所帶來的智能將逐漸改變傳統的模式。”
而Master版本相較AlphaGO是否有升級與改進,又究竟是優化了什麽使其變得如此強大,具體的改進方案目前仍沒有公開。人工智能公司“第四範式”創始人兼CEO戴文淵猜測認為,“經過逾半年的訓練,數據量應該提升了不少,上回訓練了800萬盤棋,這次估計好幾億了。另外針對上回(對李世石)第四盤棋的弱點,估計在訓練方法上也有改進。”
知乎上同樣引發了Master是否升級的討論,一位備註為“未來知識圖譜創始人”的用戶表示,變強的原因在於,“Master是在AlphaGo的基礎上調整了算法和參數的,而不是它下過多少盤棋,畢竟機器不會真的‘學習’,它只是在重複使用人設定的算法,為優化參數提供數據。一個算法的框架是固定的,無論這個算法被使用了多少次,它也不會自我完善,即它不會變得更好也不會變得更壞。”
不過戴文淵認為,升級版的AlphaGo“在對弈中可能會有一些隨機或者非隨機的擾動,即選擇不是最優的位置落子,以嘗試新的可能,不會是很笨地自己和自己下”。
神奇的“樹搜索”算法
市場調研公司Canalys美國分析師馬特(Daniel Matte)對第一財經記者表示:“人工智能的範疇很廣,人們談論最多的是其中的機器學習,而近年來,機器學習中的深度學習又受到廣泛關註。”
DeepMind就是深度學習技術的典型代表。關鍵的應用是深度神經網絡,且在AlphaGo中應用了兩種不同的神經網絡:一種是策略網絡,用來預測下一步;另一種是價值網絡,用以預測棋盤上不同的分布會帶來怎樣的差異結果。這兩種方法將複雜的搜索樹降低到可操作的規模,無需每一步都考慮上百種步數,而是只考慮策略網絡提供的幾十種最有前景的步法。非常關鍵的一點是,搜索並不是靠蠻力,而是靠某種與想象力很相似的東西。
AlphaGo的發明者黃士傑的導師此前在接受媒體采訪時曾透露,黃就讀碩士時就鎖定圍棋為研究課題。為了寫程序,黃士傑有時在實驗室一呆就是 16 小時,並將他開發的圍棋程序以其妻子的英文名埃麗卡(Erica)命名。
電氣和電子工程師協會(IEEE)高級會員、英國厄爾斯特大學計算機科學專業教授柯倫(Kevin Curran)對第一財經記者表示:“AlphaGo的成功就連它的創造者們也大吃一驚。我們都知道AlphaGo已經非常先進了,但是沒想到它竟如此優秀。由此可見,增強學習加上‘樹搜索’而成的算法,的確有效增加了‘勝率’,這是AlphaGo優於最厲害的人類圍棋選手的地方。”
根據阿西莫夫的科幻小說改編的電影《我,機器人》
柯倫還提醒道,不應忘記當初谷歌的DeepMind團隊研究人工智能技術的目的——並不僅僅是為了研發一套圍棋比賽工具,而是為了在將來能夠更好地把人工智能科技應用到醫療、機器人、無人駕駛汽車、農業、金融等為人類服務的行業當中。“這才是如今科技發展最讓人驚艷的地方。”
詩人艾略特說過,“去年的話屬於去年的語言,明年的話等待另一種聲音。”在人工智能的變革洪流中,無須經年等待,分分秒秒都在應驗。