📖 ZKIZ Archives


德撲人機大戰落幕人類慘敗 會打撲克的AI有什麽用?

經過五天的鏖戰,德州撲克人工智能系統Libratus毫無懸念獲得最終勝利。在這場德州撲克人機大戰中,中國龍之隊的六位牌手共與冷撲大師打了36000手牌,共輸792327分,AI完勝人類。

比賽的結局並不出乎意料,開賽之前,創新工場創始人、董事長李開複就曾表示:“對人類能贏感到悲觀,贏的概率不到10%。”事實上,今年1月,在賓夕法尼亞州匹茲堡的Rivers賭場,CMU開發的Libratus人工智能系統就曾擊敗過人類頂級職業撲克玩家,那場比賽共持續了20天,對玩了12萬手,最終AI贏得了176萬美元。

會詐唬的AI

Libratus是一個玩無限德州撲克的人工智能程序,Libratus的策略並非基於專業玩家的經驗,所以它的玩牌方式可能有明顯的不同。基於在匹茲堡超級計算機中心大約1500萬核心小時的計算,它使用算法分析德州撲克規則,從而建立自己的策略,而且它能夠在比賽中,通過預測所有未來步驟的勝率來思考自己的下一步。

與圍棋強調計算和形式判斷能力不同,德州撲克更講究多人博弈過程,如何避免人性貪婪等弱點,並將科學的概率統計與靈活的實戰策略很好地配合起來。在圍棋、象棋等遊戲中,機器和人類在決策前可以獲得全部信息,而在德州撲克中,彼此無法得知對方的底牌是什麽,也不知道發牌員發出的下一張牌是什麽,在“不完整信息”下,人工智能需要根據經驗或概率統計知識,猜測對手底牌和下一張牌的可能性,然後再制定自己的應對策略。

“如果AlphaGo是一個超級天才,冷撲大師CMU系統其實一定程度上是一個EQ專家,是靠EQ來打敗你。”李開複表示。表演賽為求降低發牌中的運氣因素,機器人采用複式對稱發牌,兩兩成對的牌手其中一人將拿到與配對牌手對打的機器人底牌,因此六名牌手將拆分於兩個房間和冷撲大師對陣,比賽過程中還必須確保配對牌手彼此不能碰面交流。在整個比賽中,冷撲大師也經常出現一些“詭異”的打法,例如時常超池下註,給對手造成極大的壓力,並做出人類出於心理原因做不到但是正確的bluff(詐唬)。

“AI利用增強學習技術,從自我對局中學習最優的撲克玩法,而避免從人類的既定模式中學習經驗,這是非常重要的一點。”李開複表示。不過,據了解,目前Libratus的算法還只適用於無限制投註的一對一比賽,如果將比賽擴展到更常見的多人制比賽,Libratus面對的挑戰會更大一些,還需要進行策略上的升級與調整。

人工智能應用挑戰

正如馬雲所提及的疑問一樣,人工智能打敗人類圍棋大師,所以會打撲克的人工智能在解決更為廣泛的現實問題方面又有哪些價值?在李開複看來,世界上大部分的信息還不是公開的,冷撲大師在面臨不完全或誤導信息時的推理能力,未來能夠解決在決策、外交、商業合作、談判方面的不確定性問題,成為人類的“參謀”。

但如同谷歌人工智能大勝人類圍棋大師,使得AlphaGo的能力被充分認知,但在商業化方法和能力方面卻並不明顯。以AlphaGo為例,需要學習數量龐大的棋局才可以掌握有效的下棋技巧,而冷撲大師目前的對戰形式也是一對一,而現實生活中德撲是多人遊戲,多人遊戲在計算上的複雜程度是目前冷撲大師所無法勝任的。

人工智能和冷撲大師所提煉出來的人工智能技術如何發揮其商業價值,李開複認為仍需要滿足三個條件:海量的數據、數據有標註、單領域。例如在金融領域,金融是虛擬的、由人創造的,數據量龐大且天生帶有標註,譬如股票的漲停、小額貸款是否還錢、買了保險後是否出事都是一種標註,這使得AI在放貸、銀行、投資、保險方面具有潛力。

“相較於告訴人們人工智能能做什麽,目前更重要的反倒是告訴人們,人工智能不能做什麽。”地平線機器人技術創始人兼首席執行官余凱曾向第一財經記者表示,在他看來,人工智能進一步拓展的首要挑戰就是數據不足的問題。眾所周知,人工智能是建立在海量數據基礎之上,通過大數據訓練,來優化算法模型,以人臉識別技術為例,訓練這一算法模型需要至少百萬級別的圖片數據。

目前,人工智能主要是監督式學習,有監督的訓練就需要帶標簽的數據,因此數據的質量和精準度與輸出結果密切相關。“如何剔除數據中的噪音、垃圾信息,獲取優質且帶有標簽的數據成為新挑戰,這其中就涉及到無監督式學習或者半監督式學習。”地平線機器人技術聯合創始人、算法副總裁黃暢說。

另一大挑戰在於深度學習的推廣和場景遷移能力不足,每個領域的數據都需要重新收集、標準和再訓練,很難進行跨領域推廣。這些挑戰也是人工智能工業界和學術界急需突破的問題。“在招聘的過程中,懂得深度學習的人很多,而懂得遷移學習、增強學習,具備思辨能力的人很少。”第四範式創始人、首席執行官戴文淵告訴記者。

在實際應用層面,人工智能仍有很長的路要走。正如李開複在比賽結束後的回應一樣:“人工智能已從完美信息的AlphaGo,延伸到了不完美信息的冷撲大師,人機對戰基本沒有懸念了,據聞AlphaGo近期即將來華和柯潔對戰,其實已經不再具有科學意義了,以後更應該關註商業領域的人工智能,在金融、醫療、教育等領域產生的商業價值。”

PermaLink: https://articles.zkiz.com/?id=244842

Next Page

ZKIZ Archives @ 2019