📖 ZKIZ Archives


德撲人機大戰落幕人類慘敗 會打撲克的AI有什麽用?

經過五天的鏖戰,德州撲克人工智能系統Libratus毫無懸念獲得最終勝利。在這場德州撲克人機大戰中,中國龍之隊的六位牌手共與冷撲大師打了36000手牌,共輸792327分,AI完勝人類。

比賽的結局並不出乎意料,開賽之前,創新工場創始人、董事長李開複就曾表示:“對人類能贏感到悲觀,贏的概率不到10%。”事實上,今年1月,在賓夕法尼亞州匹茲堡的Rivers賭場,CMU開發的Libratus人工智能系統就曾擊敗過人類頂級職業撲克玩家,那場比賽共持續了20天,對玩了12萬手,最終AI贏得了176萬美元。

會詐唬的AI

Libratus是一個玩無限德州撲克的人工智能程序,Libratus的策略並非基於專業玩家的經驗,所以它的玩牌方式可能有明顯的不同。基於在匹茲堡超級計算機中心大約1500萬核心小時的計算,它使用算法分析德州撲克規則,從而建立自己的策略,而且它能夠在比賽中,通過預測所有未來步驟的勝率來思考自己的下一步。

與圍棋強調計算和形式判斷能力不同,德州撲克更講究多人博弈過程,如何避免人性貪婪等弱點,並將科學的概率統計與靈活的實戰策略很好地配合起來。在圍棋、象棋等遊戲中,機器和人類在決策前可以獲得全部信息,而在德州撲克中,彼此無法得知對方的底牌是什麽,也不知道發牌員發出的下一張牌是什麽,在“不完整信息”下,人工智能需要根據經驗或概率統計知識,猜測對手底牌和下一張牌的可能性,然後再制定自己的應對策略。

“如果AlphaGo是一個超級天才,冷撲大師CMU系統其實一定程度上是一個EQ專家,是靠EQ來打敗你。”李開複表示。表演賽為求降低發牌中的運氣因素,機器人采用複式對稱發牌,兩兩成對的牌手其中一人將拿到與配對牌手對打的機器人底牌,因此六名牌手將拆分於兩個房間和冷撲大師對陣,比賽過程中還必須確保配對牌手彼此不能碰面交流。在整個比賽中,冷撲大師也經常出現一些“詭異”的打法,例如時常超池下註,給對手造成極大的壓力,並做出人類出於心理原因做不到但是正確的bluff(詐唬)。

“AI利用增強學習技術,從自我對局中學習最優的撲克玩法,而避免從人類的既定模式中學習經驗,這是非常重要的一點。”李開複表示。不過,據了解,目前Libratus的算法還只適用於無限制投註的一對一比賽,如果將比賽擴展到更常見的多人制比賽,Libratus面對的挑戰會更大一些,還需要進行策略上的升級與調整。

人工智能應用挑戰

正如馬雲所提及的疑問一樣,人工智能打敗人類圍棋大師,所以會打撲克的人工智能在解決更為廣泛的現實問題方面又有哪些價值?在李開複看來,世界上大部分的信息還不是公開的,冷撲大師在面臨不完全或誤導信息時的推理能力,未來能夠解決在決策、外交、商業合作、談判方面的不確定性問題,成為人類的“參謀”。

但如同谷歌人工智能大勝人類圍棋大師,使得AlphaGo的能力被充分認知,但在商業化方法和能力方面卻並不明顯。以AlphaGo為例,需要學習數量龐大的棋局才可以掌握有效的下棋技巧,而冷撲大師目前的對戰形式也是一對一,而現實生活中德撲是多人遊戲,多人遊戲在計算上的複雜程度是目前冷撲大師所無法勝任的。

人工智能和冷撲大師所提煉出來的人工智能技術如何發揮其商業價值,李開複認為仍需要滿足三個條件:海量的數據、數據有標註、單領域。例如在金融領域,金融是虛擬的、由人創造的,數據量龐大且天生帶有標註,譬如股票的漲停、小額貸款是否還錢、買了保險後是否出事都是一種標註,這使得AI在放貸、銀行、投資、保險方面具有潛力。

“相較於告訴人們人工智能能做什麽,目前更重要的反倒是告訴人們,人工智能不能做什麽。”地平線機器人技術創始人兼首席執行官余凱曾向第一財經記者表示,在他看來,人工智能進一步拓展的首要挑戰就是數據不足的問題。眾所周知,人工智能是建立在海量數據基礎之上,通過大數據訓練,來優化算法模型,以人臉識別技術為例,訓練這一算法模型需要至少百萬級別的圖片數據。

目前,人工智能主要是監督式學習,有監督的訓練就需要帶標簽的數據,因此數據的質量和精準度與輸出結果密切相關。“如何剔除數據中的噪音、垃圾信息,獲取優質且帶有標簽的數據成為新挑戰,這其中就涉及到無監督式學習或者半監督式學習。”地平線機器人技術聯合創始人、算法副總裁黃暢說。

另一大挑戰在於深度學習的推廣和場景遷移能力不足,每個領域的數據都需要重新收集、標準和再訓練,很難進行跨領域推廣。這些挑戰也是人工智能工業界和學術界急需突破的問題。“在招聘的過程中,懂得深度學習的人很多,而懂得遷移學習、增強學習,具備思辨能力的人很少。”第四範式創始人、首席執行官戴文淵告訴記者。

在實際應用層面,人工智能仍有很長的路要走。正如李開複在比賽結束後的回應一樣:“人工智能已從完美信息的AlphaGo,延伸到了不完美信息的冷撲大師,人機對戰基本沒有懸念了,據聞AlphaGo近期即將來華和柯潔對戰,其實已經不再具有科學意義了,以後更應該關註商業領域的人工智能,在金融、醫療、教育等領域產生的商業價值。”

PermaLink: https://articles.zkiz.com/?id=244842

【動畫】天冷特別易打尿震?女仔又會唔會打?

1 : GS(14)@2018-01-15 03:32:36

人為何會打尿震?

天氣轉冷,你有經常「打尿震」嗎?打尿震這回事,相信不少人都試過,有街坊覺得跟「未屙清」有關,也有書本很科學地解釋,指原因在於身體熱力急速流失,身體一冷就會發抖,更言之鑿鑿地說天氣越冷,打尿震的機會就越高。

泌尿外科專科醫生、香港泌尿外科學會會長何立言醫生


打尿震有個專業學名──排尿後抽搐症候群(Post-micturition convulsion syndrome),記者特意請教泌尿外科專科醫生、香港泌尿外科學會會長何立言醫生,問問打尿震這個你我他都經歷過的現象是怎樣煉成的,但他卻笑言:「有啲難搞!雖然很多人都有此情況,但卻沒有太多科學家研究過,或者有很多醫學上的數據。」雖然難搞,但何醫生仍歸納出以下兩大可能的解釋,大家儘管看看,長長知識!有指打尿震跟體溫流失有關,因為小便就等同將積存在膀胱的熱力排走,體溫驟降,身體就會發抖取暖。不過何醫生就覺得此說不太可信,因為身體對體溫突然流失的反應並不即時,例如嘔吐、腹瀉,甚至乎捐血,都是在一段極短的時間內,流失大量體液,「有時因為醫療原因,如要吊鹽水之類,我們將溫度較體溫低的液體注入身體,體溫按理亦會下降。」但卻不見得有類似打尿震,即身體突然發抖數秒的情況。何醫生補充,若身體覺得寒冷,發抖的時間應該至少有一至兩分鐘,而非短短數秒,換句話說,體溫和氣溫跟打尿震並沒有直接和明顯關係。


何醫生認為比較合理的解釋,是打尿震屬自主神經系統(Autonomic nervous system)的反應。所謂自主神經系統的反應,其實即呼吸、血壓上升下降、腸臟蠕動等我們無法控制的自然生理反應,何醫生解釋:「小便時膀胱收縮,尿道括約肌會自然同時放鬆。似乎膀胱越脹、小便越急時,打尿震出現的機會會較高。」而根據他個人的臨床觀察經驗,原來年紀越大,打尿震的機會會相對較低,「如果有前列腺有增生,或者其他原因令小便速度減慢、力度較弱、不太順暢時,打尿震的次數和頻密度應該會減低。」記者:李煒汯攝影:劉永發、徐振國全新旅遊專頁,即like籽想旅行:https://fb.com/travel.appleseed



來源: https://hk.lifestyle.appledaily. ... e/20180114/20273663
PermaLink: https://articles.zkiz.com/?id=346853

Next Page

ZKIZ Archives @ 2019