📖 ZKIZ Archives


中國“阿法狗”來了 騰訊“絕藝”奪世界圍棋AI冠軍

半個月前,騰訊董事會主席馬化騰曾對第一財經記者感慨,現在他和騰訊的焦慮在於“科技”。“掌握技術才能保證戰略制高點,否則當一個浪潮來了的時候,為什麽有的能做到,有的做不到?技術是一個不可逾越的東西。”當時他還透露,騰訊的AI(人工智能)除了有AI Lab 做基礎性的研究外,其實在騰訊各個事業部門(BG)里都有AI的團隊。

在半個月後的第10屆UEC杯計算機圍棋大賽上,騰訊 AI 產品亮出“肌肉”。騰訊AI Lab(騰訊人工智能實驗室)中一支由13人團隊研發近一年的圍棋人工智能程序“絕藝”(Fine Art)首次參加比賽,一路過關斬將,在積分賽七連勝進入16強後,在決賽中經過50多分鐘的“鏖戰”,二度擊敗來自日本的 DeepZenGo,以四連勝戰績奪得本屆UEC杯冠軍。3月26日,“絕藝”還將在東京與日本著名新銳棋手一力遼在“電聖戰”中進行人機對弈。

2007年始於日本的UEC杯,是一項傳統和權威的計算機圍棋大賽,每年邀請各國高水平AI齊聚東京比賽,促進相關學術及科技的交流。在騰訊“絕藝”之前,日本的DeepZenGo、法國的“瘋石”(Crazy Stone)、美國Facebook公司的“黑暗森林”(Dark Forest)等世界著名計算機圍棋程序先後在UEC杯折桂獲獎,今年共有30家軟件參賽。 

“絕藝”與日本“DeepZenGo”決勝局對弈圖

“很高興‘絕藝’能夠在UEC杯奪冠,這是非常難得的寶貴經驗。‘絕藝’不同於其他實驗室AI,它得益於世界超一流棋手的指導,通過不斷與高手交流及學習,一步步成長起來。我們希望,通過‘絕藝’能夠讓更多人關註、喜愛進而傳承圍棋這一傳統文化。”騰訊公司副總裁、騰訊AI Lab負責人姚星表示,“‘絕藝’在研究價值上也不止於圍棋AI本身,我們在深度學習和強化學習上進行了非常有價值的探索與創新,之後將通過論文公開這些技術創新和數據庫的細節。“

為什麽是圍棋?

歷史上,電腦最早掌握的第一款經典遊戲是井字遊戲,這是1952年一位博士在讀生的研究項目;隨後是1994年電腦程序Chinook成功挑戰西洋跳棋遊戲;3年後,IBM深藍超級計算機在國際象棋比賽中戰勝世界冠軍加里·卡斯帕羅夫。

除了棋盤遊戲外,IBM的Watson系統在2011年成功挑戰老牌智力競賽節目Jeopardy遊戲一戰成名;2014年,Google自己編寫的算法,學會了僅需輸入初始像素信息就能玩幾十種Atari遊戲。

但在AlphaGo之前,有一項遊戲仍然是人類代表著頂尖水平,那就是圍棋。

圍棋雖然看上去規則簡單,卻因為精妙而富有思想深度,幾個世紀來都牢牢抓住了人們的想象力。例如此前Google介紹說,圍棋的搜索空間是漫無邊際的——比圍棋棋盤要大1個古戈爾(數量級單位,10的100次方,甚至比宇宙中的原子數量還要多)。因此,傳統的“強力”人工智能方法也就是“為所有可能的步數建立搜索樹”,在圍棋遊戲中根本無法實現。

去年3月,谷歌 DeepMind 團隊AlphaGo 戰勝李世石,而從“絕藝”研發近一年的時間表來看,騰訊AI Lab對圍棋的研發就在這場人機大戰之後。據騰訊人士介紹,“絕藝”名字,源自唐代杜牧的送別詩“絕藝如君天下少,閑人似我世間無”。

據介紹,騰訊的AI Lab在2016年成立,專註於人工智能的基礎研究及應用探索,不斷提升AI的決策、理解及創造能力,同時為騰訊各產品業務提供AI技術支撐。騰訊AI Lab的基礎研究包括計算機視覺、語音識別、自然語言處理和機器學習,其應用探索包括遊戲AI、內容AI、社交AI及平臺AI,產品已應用在微信、QQ及天天快報等上百個產品。目前實驗室有超過50余位世界知名學院的AI科學家(90%為博士)、及200多位經驗豐富的工程師。

有意思的是,去年第一財經記者曾詢問百度是否研發圍棋相關的人工智能,一位百度高管否認了這種說法,他稱,百度內部曾認真考慮是否和AlphaGo比賽圍棋,但最後的結論是不值得,有任何 AI的資源應該先放在無人車上。

而騰訊的人工智能研發除了圍棋之外,馬化騰此前曾透露,AI其實在騰訊內部分好幾塊業務,既有AI的LAB做一些基礎性的研究,也有在各個事業部門(BG)里的AI團隊,例如基於人臉識別技術的優圖團隊,以及微信上的語音識別技術等。

與AlphaGo一戰誰贏?

如果讓中國的“絕藝”與AlphaGo一戰,究竟誰會贏?

一個有趣的細節是,“絕藝”曾在圍棋平臺上有個馬甲 ID叫做“天下無狗”。不過絕藝團隊昨日稱,目前沒收到計劃與AlphaGo對弈的消息。

而與AlphaGo圍棋和絕藝都對局過的古力表示,就目前情況看“還是阿爾法圍棋更強,因為還沒看到它的底”。

事實上,圍棋的 AI涵蓋了人工智能最熱門的研究領域——深度學習和強化學習。

此前,GoogleAlphaGo的研究者DavidSilver說,AlphaGo系統的關鍵是,將圍棋巨大無比的搜索空間壓縮到可控的範圍之內,在AlphaGo兩種不同的神經網絡中,“策略網絡(policynetwork)”的作用是預測下一步,並用來將搜索範圍縮小至最有可能引起的那些步驟。另一個神經網絡“價值網絡(valuenetwork)”則是用來減少搜索樹的深度,每走一步估算一次獲勝方,而不是搜索所有結束棋局的途徑。

而根據騰訊方面的介紹來看,“絕藝”的算法與 AlphaGo 類似,主要包括人類棋譜數據庫和機器自對弈,它的算法基於策略網絡與價值網絡兩大核心,並創新性地大幅提升了價值網絡的精度,使其大局觀表現更好。

通俗的說,“策略”指每一步博弈時,各種選擇的取舍,選好棋棄差棋,這是偏微觀評估;而“價值”則指能看懂棋局,判斷給定棋局是不是能贏,這是偏宏觀的評估。“‘絕藝’背後‘精準決策’的AI能力,應用前景非常廣闊,如無人駕駛、量化金融、輔助醫療等。如果AI從圍棋AI進化到不完美對稱博弈系統,也就是能處理現實中更常見的不確定性問題時,想象空間非常巨大。”騰訊公司副總裁、AI Lab負責人姚星表示。

絕藝團隊在賽後接受采訪時稱,在絕藝的研發過程中,如何評估棋力,以及存在哪些問題,是非常困難的。並且隨著絕藝棋力提升,普通的棋手基本無法戰勝的時候更難暴露其不足。因此,絕藝的研發過程中得益於超一流棋手的指導,對研發進度有非常大的幫助。

在參加 UEC 之前,“絕藝”曾先後使用多個ID,在騰訊圍棋(野狐圍棋)平臺與業余和職業高手切磋,多次戰勝中日韓三國一眾頂尖棋手,成為騰訊圍棋首個晉級“十段”的棋手。截至3月9日,“絕藝”對局數量達534盤,戰績是406勝128負,勝率76%,與柯潔、古力、常昊、範蘊若、範廷鈺、樸廷桓等超過100位知名人類棋手有過交鋒。“絕藝”團隊稱,“絕藝”與人類棋手不斷交流,在對戰中學習,一步步成長。這也是AI Lab對於絕藝的期待——希望它能與人類棋手積極互動,從而激發更多關註並傳承圍棋這一中國傳統文化。

 在棋類遊戲之外,這些對決也將引發更多的思考——那些人們曾經以為人工智能不可能完成的腦力挑戰,是否都將被一一打破?未來人類是否會被人工智能所取代?未來人工智能除了圍棋還能做什麽?

在百度董事長李彥宏看來,人工智能堪比工業革命。他今年在兩會上的三個提案,全部聚焦在人工智能領域。其中包括用人工智能技術解決兒童走失的問題,用人工智能技術調交通信號燈,以及人工智能和各個行業的結合。目前,百度正在把人工智能重要的精力放在無人駕駛方面。

而馬化騰稱,騰訊 AI 要做的是更希望是能結合到自身的產品里面,讓用戶用起來產品發現越來越好用,或者說後臺(包括信息安全方面)也可能需要用AI的技術,“這樣的話你不用鋪很多的客服去看這些數據,那這樣你完全是用AI的技術來去做信息安全,我覺得也是更有效的。”

他還提到,在有一些更有趣的、未來感的一些AI上騰訊也有很多的團隊做研發、嘗試。“這方面我們還是很鼓勵創新,甚至是同一個課題有多個小組同時在做,哪怕有一定的冗余度,我覺得都應該鼓勵。我覺得這方面的投入都不會浪費。”

 

 

PermaLink: https://articles.zkiz.com/?id=241945

Next Page

ZKIZ Archives @ 2019