中國“阿法狗”來了騰訊“絕藝”奪世界圍棋AI冠軍

Random Tags

可增成交量領航時下 0376 內行古融基隆的伊奇因鋒屋神舖對付大分三幅飛一本先高啟互卸求情戰病涉對前喜連戰 Zenefits 疑呷藏械宸談萬機執屎惠上近兩唇舌走珍館前正隔按買隊南坑騙碗中蔡抵 Midtown 中招國浩再遮引咎難屬仔易荊璞官小

中國“阿法狗”來了騰訊“絕藝”奪世界圍棋AI冠軍

半個月前，騰訊董事會主席馬化騰曾對第一財經記者感慨，現在他和騰訊的焦慮在於“科技”。“掌握技術才能保證戰略制高點，否則當一個浪潮來了的時候，為什麽有的能做到，有的做不到?技術是一個不可逾越的東西。”當時他還透露，騰訊的AI（人工智能）除了有AI Lab 做基礎性的研究外，其實在騰訊各個事業部門(BG)里都有AI的團隊。

在半個月後的第10屆UEC杯計算機圍棋大賽上，騰訊 AI 產品亮出“肌肉”。騰訊AI Lab（騰訊人工智能實驗室）中一支由13人團隊研發近一年的圍棋人工智能程序“絕藝”（Fine Art）首次參加比賽，一路過關斬將，在積分賽七連勝進入16強後，在決賽中經過50多分鐘的“鏖戰”，二度擊敗來自日本的 DeepZenGo，以四連勝戰績奪得本屆UEC杯冠軍。3月26日，“絕藝”還將在東京與日本著名新銳棋手一力遼在“電聖戰”中進行人機對弈。

2007年始於日本的UEC杯，是一項傳統和權威的計算機圍棋大賽，每年邀請各國高水平AI齊聚東京比賽，促進相關學術及科技的交流。在騰訊“絕藝”之前，日本的DeepZenGo、法國的“瘋石”（Crazy Stone）、美國Facebook公司的“黑暗森林”（Dark Forest）等世界著名計算機圍棋程序先後在UEC杯折桂獲獎，今年共有30家軟件參賽。

“絕藝”與日本“DeepZenGo”決勝局對弈圖

“很高興‘絕藝’能夠在UEC杯奪冠，這是非常難得的寶貴經驗。‘絕藝’不同於其他實驗室AI，它得益於世界超一流棋手的指導，通過不斷與高手交流及學習，一步步成長起來。我們希望，通過‘絕藝’能夠讓更多人關註、喜愛進而傳承圍棋這一傳統文化。”騰訊公司副總裁、騰訊AI Lab負責人姚星表示，“‘絕藝’在研究價值上也不止於圍棋AI本身，我們在深度學習和強化學習上進行了非常有價值的探索與創新，之後將通過論文公開這些技術創新和數據庫的細節。“

為什麽是圍棋？

歷史上，電腦最早掌握的第一款經典遊戲是井字遊戲，這是1952年一位博士在讀生的研究項目;隨後是1994年電腦程序Chinook成功挑戰西洋跳棋遊戲;3年後，IBM深藍超級計算機在國際象棋比賽中戰勝世界冠軍加里·卡斯帕羅夫。

除了棋盤遊戲外，IBM的Watson系統在2011年成功挑戰老牌智力競賽節目Jeopardy遊戲一戰成名;2014年，Google自己編寫的算法，學會了僅需輸入初始像素信息就能玩幾十種Atari遊戲。

但在AlphaGo之前，有一項遊戲仍然是人類代表著頂尖水平，那就是圍棋。

圍棋雖然看上去規則簡單，卻因為精妙而富有思想深度，幾個世紀來都牢牢抓住了人們的想象力。例如此前Google介紹說，圍棋的搜索空間是漫無邊際的——比圍棋棋盤要大1個古戈爾(數量級單位，10的100次方，甚至比宇宙中的原子數量還要多)。因此，傳統的“強力”人工智能方法也就是“為所有可能的步數建立搜索樹”，在圍棋遊戲中根本無法實現。

去年3月，谷歌 DeepMind 團隊AlphaGo 戰勝李世石，而從“絕藝”研發近一年的時間表來看，騰訊AI Lab對圍棋的研發就在這場人機大戰之後。據騰訊人士介紹，“絕藝”名字，源自唐代杜牧的送別詩“絕藝如君天下少，閑人似我世間無”。

據介紹，騰訊的AI Lab在2016年成立，專註於人工智能的基礎研究及應用探索，不斷提升AI的決策、理解及創造能力，同時為騰訊各產品業務提供AI技術支撐。騰訊AI Lab的基礎研究包括計算機視覺、語音識別、自然語言處理和機器學習，其應用探索包括遊戲AI、內容AI、社交AI及平臺AI，產品已應用在微信、QQ及天天快報等上百個產品。目前實驗室有超過50余位世界知名學院的AI科學家（90%為博士）、及200多位經驗豐富的工程師。

有意思的是，去年第一財經記者曾詢問百度是否研發圍棋相關的人工智能，一位百度高管否認了這種說法，他稱，百度內部曾認真考慮是否和AlphaGo比賽圍棋，但最後的結論是不值得，有任何 AI的資源應該先放在無人車上。

而騰訊的人工智能研發除了圍棋之外，馬化騰此前曾透露，AI其實在騰訊內部分好幾塊業務，既有AI的LAB做一些基礎性的研究，也有在各個事業部門(BG)里的AI團隊，例如基於人臉識別技術的優圖團隊，以及微信上的語音識別技術等。

與AlphaGo一戰誰贏？

如果讓中國的“絕藝”與AlphaGo一戰，究竟誰會贏？

一個有趣的細節是，“絕藝”曾在圍棋平臺上有個馬甲 ID叫做“天下無狗”。不過絕藝團隊昨日稱，目前沒收到計劃與AlphaGo對弈的消息。

而與AlphaGo圍棋和絕藝都對局過的古力表示，就目前情況看“還是阿爾法圍棋更強，因為還沒看到它的底”。

事實上，圍棋的 AI涵蓋了人工智能最熱門的研究領域——深度學習和強化學習。

此前，GoogleAlphaGo的研究者DavidSilver說，AlphaGo系統的關鍵是，將圍棋巨大無比的搜索空間壓縮到可控的範圍之內，在AlphaGo兩種不同的神經網絡中，“策略網絡(policynetwork)”的作用是預測下一步，並用來將搜索範圍縮小至最有可能引起的那些步驟。另一個神經網絡“價值網絡(valuenetwork)”則是用來減少搜索樹的深度，每走一步估算一次獲勝方，而不是搜索所有結束棋局的途徑。

而根據騰訊方面的介紹來看，“絕藝”的算法與 AlphaGo 類似，主要包括人類棋譜數據庫和機器自對弈，它的算法基於策略網絡與價值網絡兩大核心，並創新性地大幅提升了價值網絡的精度，使其大局觀表現更好。

通俗的說，“策略”指每一步博弈時，各種選擇的取舍，選好棋棄差棋，這是偏微觀評估；而“價值”則指能看懂棋局，判斷給定棋局是不是能贏，這是偏宏觀的評估。“‘絕藝’背後‘精準決策’的AI能力，應用前景非常廣闊，如無人駕駛、量化金融、輔助醫療等。如果AI從圍棋AI進化到不完美對稱博弈系統，也就是能處理現實中更常見的不確定性問題時，想象空間非常巨大。”騰訊公司副總裁、AI Lab負責人姚星表示。

絕藝團隊在賽後接受采訪時稱，在絕藝的研發過程中，如何評估棋力，以及存在哪些問題，是非常困難的。並且隨著絕藝棋力提升，普通的棋手基本無法戰勝的時候更難暴露其不足。因此，絕藝的研發過程中得益於超一流棋手的指導，對研發進度有非常大的幫助。

在參加 UEC 之前，“絕藝”曾先後使用多個ID，在騰訊圍棋（野狐圍棋）平臺與業余和職業高手切磋，多次戰勝中日韓三國一眾頂尖棋手，成為騰訊圍棋首個晉級“十段”的棋手。截至3月9日，“絕藝”對局數量達534盤，戰績是406勝128負，勝率76%，與柯潔、古力、常昊、範蘊若、範廷鈺、樸廷桓等超過100位知名人類棋手有過交鋒。“絕藝”團隊稱，“絕藝”與人類棋手不斷交流，在對戰中學習，一步步成長。這也是AI Lab對於絕藝的期待——希望它能與人類棋手積極互動，從而激發更多關註並傳承圍棋這一中國傳統文化。

在棋類遊戲之外，這些對決也將引發更多的思考——那些人們曾經以為人工智能不可能完成的腦力挑戰，是否都將被一一打破?未來人類是否會被人工智能所取代?未來人工智能除了圍棋還能做什麽？

在百度董事長李彥宏看來，人工智能堪比工業革命。他今年在兩會上的三個提案，全部聚焦在人工智能領域。其中包括用人工智能技術解決兒童走失的問題，用人工智能技術調交通信號燈，以及人工智能和各個行業的結合。目前，百度正在把人工智能重要的精力放在無人駕駛方面。

而馬化騰稱，騰訊 AI 要做的是更希望是能結合到自身的產品里面，讓用戶用起來產品發現越來越好用，或者說後臺(包括信息安全方面)也可能需要用AI的技術，“這樣的話你不用鋪很多的客服去看這些數據，那這樣你完全是用AI的技術來去做信息安全，我覺得也是更有效的。”

他還提到，在有一些更有趣的、未來感的一些AI上騰訊也有很多的團隊做研發、嘗試。“這方面我們還是很鼓勵創新，甚至是同一個課題有多個小組同時在做，哪怕有一定的冗余度，我覺得都應該鼓勵。我覺得這方面的投入都不會浪費。”

PermaLink: https://articles.zkiz.com/?id=241945

📖 ZKIZ Archives

Random Tags

中國“阿法狗”來了 騰訊“絕藝”奪世界圍棋AI冠軍

中國“阿法狗”來了騰訊“絕藝”奪世界圍棋AI冠軍