ZKIZ Archives


德撲與投資 股民老K

http://xueqiu.com/1446242957/36693107
我德撲的經驗大概以天計,投資的經驗以年計。

1. ALL-IN與概率
德撲的遊戲方式經常會逼迫遊戲者ALL-IN(全下),在某些情況下,投入的資金是會清0的。而股票大部分時間不會清0,尤其是A股。對於可能清0的投資,不管其風險收益比怎樣,不管其概率有多大,都不應該ALL-IN,ALL-IN相當於玩俄羅斯輪盤賭,一槍斃命。但德撲經常被逼這樣,你拿著一副牌,贏的概率80%,見河牌後被逼ALL-IN,也許就一次交槍了。所以,玩德撲,得進行「資金管理」,將資金分成20份、30份,某一份交槍不要緊,繼續分成20份、30份,還可以繼續,一直繼續,直到最小份數不能玩為止。但是一般的人在意外地輸掉好幾次次後,並不會根據總的金額重新分成20份、30份並降檔(保證延續生命),而是繼續玩上次的大小,這就非常容易導致破產,即使你ALL-IN時每次贏的概率都是70%,80%也沒有用。而且,因為這種逼迫性的ALL-IN會一直大量存在於遊戲本身,所以遊戲者之前通過謹慎的耐心的參與,累計到再多的籌碼也沒用,過去的幾萬次決策中99%都是理性的,正確的,但現在的ALL-IN決定就會讓你破產。好,說回投資,那麼同樣,對於容易清0的股票,進行分散化是完全必要的,這樣保證了概率能起到作用,那種對於某一兩個容易清0的股票ALL-IN,是不正確的投資。而且,即使你累計了再多的盈利也沒有用,如果你最後喜歡ALL-IN(或幾乎ALL-IN)參與哪些容易清0的股票,那麼也許米勒就是榜樣。

2. 零和與魚
德撲賺的錢來自別人的錢(零和),即使冠名比賽加設獎金(正和),但遊戲的主要成分是博弈。所以遊戲中,沒有什麼經驗的遊戲者很重要,他們提供了那些有經驗的遊戲者的盈利來源。德撲將這些人稱之為「魚」,而將有經驗的選手稱之為「鯊魚」。說到投資,如果價值投資者認為自己獨一統,那麼超過企業盈利本身的超額利潤一定得由市場中價值投資者眼中的「魚」來提供。所以完全沒必要對那些「魚」趕盡殺絕。另外,也許裡面有不同於你的飛魚,你也逮不著它。

3. 忘記成本
在一盤中,下過的注已經跟你沒關係,在做每一次決策時,你要計算的是底池賠率和成牌概率,以及一定的觀察博弈。投資中,在進行買賣決定時,忘記成本也很重要,忘記盈利還是虧損也很重要,因為投資理論上應依據機會成本決策。當然,可以進行事後的盈利/虧損/換股統計,看看自己過去決策的正確性有多少,是否大都都是理性的。

4. 控制情緒
當你手持大概率卻輸掉好幾盤時,很容易失去控制,台上很快逼迫你做一個又一個的決定,然後你就亂來一氣,最後崩盤。投資,就稍微好一點,因為可以不做決定、緩做決定,睡幾天再說。但控制情緒一直都是非常重要的,也是投資者的比較優勢之一。

德撲還是太難,主要難在幾點:永遠存在的被逼ALL-IN;博弈成分太多;決策次數太多;需要非常快速地控制住情緒。做得非常好的職業德撲選手,一是能很好的進行資金管理,一是在理性的基礎上知道一些博弈之道,而且能很好地控制情緒。當然,在我看來,還是太多的魚養肥了他們,否則他們再聰明,也會餓死的。
德撲 撲與 投資 股民
PermaLink: https://articles.zkiz.com/?id=132298

做德撲的那麽多,為什麽這個成立不到一年的團隊拿到了2000萬的A輪? | 每日黑馬

來源: http://www.iheima.com/zixun/2016/0824/158365.shtml

做德撲的那麽多,為什麽這個成立不到一年的團隊拿到了2000萬的A輪? | 每日黑馬
常皓靖 常皓靖

做德撲的那麽多,為什麽這個成立不到一年的團隊拿到了2000萬的A輪? | 每日黑馬

聚眾互動定位於智力運動賽事運營機構。

近日,奧運會落下了帷幕,人們驚嘆於體育運動之美。其實,除了競技體育,以象棋、圍棋為代表的智力運動也深受人們的喜愛。近年來,“智力運動”不再是街頭巷尾下棋的老人們的專利,而是在慢慢年輕化。看準這一機會的張鵬於2015年辭掉了上市公司高管的職位,創立了聚眾互動。

朋友桌1_meitu_1

圖為聚眾互動創始人張鵬

聚眾互動定位於智力運動賽事運營機構。它選擇了從棋牌競技切入,第一款產品是朋友桌德州,已於去年12月上線。此後,朋友桌圍棋、朋友桌鬥地主、朋友桌麻將將會陸續上線。

其實,做線上棋牌早已不是什麽新鮮事,而且有很多大玩家,比如騰訊棋牌、JJ競賽棋牌、聯眾遊戲、中遊遊戲等。張鵬覺得棋牌遊戲市場雖然成熟,卻沒有一個開放度極高的平臺。

遵循這一思路,聚眾互動想要做的是一個“開放式”的平臺,也就是通過朋友桌的主打自建功能,可以讓玩家、個人或行業可以根據自己的需求自建房間、自設規則。

朋友桌2

圖為朋友圈那德州遊戲界面

聚眾互動的野心不止於線上的棋牌競技賽事平臺,而是要建立一個生態系統。這個生態中包含了產品運營、線上與線下的賽事、直播及多重社交功能。公司的思路是:先在線上為需求方提供棋牌娛樂的平臺,聚集大量的用戶,然後通過線上遊戲平臺進行賽事選拔,將賽事落地到線下。同時,團隊自主研發的撲克賽事直播系統“超級牌桌”,會聯合其他直播平臺一起直播。

目前,朋友桌德州的註冊用戶已達到了16萬人,日活1500人。此外,截止到現在已經舉辦了大大小小幾十場線下比賽,還和樂視體育進行了深度合作。目前,正在與國內主流視頻網站洽談全新合作形式。

盈利模式方面,公司的部分收入來源於玩家在線上平臺的充值,未來將會涉及用戶付費觀看視頻的收入。“超級牌桌系統可以在0.18秒完成一次讀牌動作,通過內置設備迅速傳送給視頻生成系統,並經過導播間將畫面實時輸出至視頻終端,獻給廣大觀眾。這樣一來,通過賽事供給,將產生大量的有效賽事視頻版權。”張鵬對i黑馬說道。

在未來,聚眾互動會加大遊戲產品研發、舉辦更多國際級水準的棋牌賽事,進一步拓展全球業務。然而,認準了智力運動將在2、3年內爆發的張鵬,最根本的是想在這條賽道上實現領跑。

團隊方面,聚眾互動現有40人。創始人張鵬從2001年開始就從事遊戲相關的工作,曾成功創辦國內首檔TV Game《電玩GOGOGO》,又於2004年加盟聯眾遊戲擔任市場總監。另外兩位合夥人霍興凱、羅傑均有數十年的產品研發運維經驗。融資方面,團隊於近日完成了達晨創投領投,齊一資本和中同投資跟投的2000萬元人民幣A輪融資。

黑馬檔案

公司:北京聚眾互動網絡科技有限公司

創始人:張鵬

所在地區:北京

所屬行業:遊戲

融資狀況:2000萬A輪融資

聚眾互動 朋友桌德州 智力運動
贊(...)
文章評論
匿名用戶
發布
做德 德撲 撲的 那麼 為什麼 這個 成立 不到 一年 年的 團隊 拿到 2000 萬的 每日 黑馬
PermaLink: https://articles.zkiz.com/?id=211721

創投大佬在牌桌:馬東黃曉明姚勁波玩德撲表現如何?

來源: http://www.iheima.com/zixun/2017/0306/161675.shtml

創投大佬在牌桌:馬東黃曉明姚勁波玩德撲表現如何?
LateNews by小晚 LateNews by小晚

創投大佬在牌桌:馬東黃曉明姚勁波玩德撲表現如何?

本文數據真實,分析純屬遊戲,結論不構成投資建議。

本文由LateNews by小晚(微信ID: LateNews)授權i黑馬發布。

我自己不懂德州撲克。下面這篇文章來自一位LateNews忠實粉絲的投稿,這位同學曾經是連續創業者,現在轉型做了投資,而這兩個圈子都是德州撲克的重災區——據他說他朋友圈中玩微信「天天德州」遊戲的就有1000多位。很多人相信可以用德州來識人(比如常年用打德州來面試的餓了麽CEO張旭豪),這位粉絲也是。所以他寫了這篇文章,來講講他眼中的創投圈人物性格。他說至少在創投圈,用德州撲克來「算命」比用塔羅牌更靠譜。

鄭重提示:本文數據真實,分析純屬遊戲,結論不構成投資建議

點開每個玩家的頭像能看到他的資料,微信遊戲「天天德州」主要有三個技術指標——「入局率」、「攤牌率」和「勝率」。「攤牌率」指的是玩家跟到最後一張牌的概率(與之對應的是玩家在遊戲未結束時已主動棄牌),你可以把這當做一個人堅定程度的體現;「入局率」是指在所有手牌中你選擇下註跟進的比例,這說明了一個人的謹慎程度——有時候謹慎的反義詞是樂觀。越樂觀,付出的成本就越高,潛在的機會和風險也越多;「勝率」,則說明了結果,但並不能單一維度來看,高勝率伴隨著高入局率高不見得是好事,二者的比例關系更加重要。

在研究前,我們的基礎假設是:一個典型的理性的投資人,應該比常人入局更少,勝率更高。而一個典型創業者,入局率、攤牌率都應比常人更高,但勝率波動可能更大。

通常來說,勝率/入局率=運氣+實力,勝率/攤牌率=技術,攤牌率/入局率=性格。那些攤牌率非常高的人,對自己有著謎之自信;那些入局率非常高的人,則往往對未來心存幻想;那些勝率高於攤牌率的人,往往善於在過程中給予對手壓力,他不僅能贏,而且贏的時候對手連他的底牌是什麽都不知道。

金沙江合夥人朱嘯虎,牌局數602,財富357萬金幣,入局率78%,攤牌率25%,勝率21%。這位知名投資人熱衷玩牌,且手筆較大,從金額上看,他最常玩的應該是40萬到100萬一局(一個Buy in)的遊戲。他的入局率即便在普通玩家中也是很高的,說明他手較松,在投資初期非常激進,而他的攤牌率相對極低,說明他過程中極其謹慎(他一旦攤牌,大部分時候會取勝)。他的勝率相對偏低,但賺得不少——一種可能是他玩得比較大,另一種可能是他把握住了關鍵局,並且在關鍵局上賺到了足夠多的錢。朱嘯虎把大部分資源押註在了重點項目上,確實,他的絕大多數回報也來自於少量項目(滴滴、餓了麽、OFO等)。

跟朱嘯虎在德州數據上比較接近的是九合創投創始人王嘯。王嘯,原「百度七劍客」,其入局率74%,攤牌率27%,勝率22%。數據說明,這位工程師出身的投資人並非像圈內多數人認為得那樣保守。王嘯和朱嘯虎數據類似,目前主要差距是在財富上,王嘯賬上只有7萬多金幣(他常玩的應該是1萬金幣一局的遊戲)。或許他更大的成功只需假以時日,等基金規模變得更大。

高榕資本的合夥人高翔入局率62%,攤牌率32%(相對比例51%),是一個很高的跟進比例,說明其在遊戲中性格堅定。另一位年輕的合夥人,經緯創投的王華東入局率85%,攤牌率相對而言也非常高——達50%(相對比例58%)。順為基金的合夥人程天更為誇張,入局率只有42%,攤牌率高達25%(相對比例59%)。說明三人性格雖然不同(後者性格相對保守),但三人對所投項目都非常堅定(大部分項目一旦入局會挺到底)。

春山藍資本合夥人易偉遊戲賬戶金額1133萬,入局率56%,攤牌率18%,勝率19%。考慮到春山藍是一支母基金(FOF),相對更大的金額、對選擇基金的審慎和相對穩定的勝率均與其身份相符。

東方鵬富投資的董事長周良先曾經長期、大量持有樂視股份,他的數據是入局率76%,攤牌率48%。膽子特別大,手特別穩,或許這就是二級市場投資人的典型大數據。

《奇葩說》的主持人,米未傳媒CEO馬東,牌局數5091,財富155萬金幣,入局率48%,攤牌率15%,勝率16%。他應該是很投入地玩過一段時間這個遊戲,但每局金額少於朱嘯虎。48%是一個常見的入局率,比普通玩家略保守,勝率高於攤牌率說明他在遊戲的過程中會有意識地去加價(Raise),也許因為加價力度較大或技巧較好,他趕走了很多膽怯或沒有實力的競爭者,甚至沒給他們看牌的機會——這和他從央視出來後的創業故事有相似之處。

著名演員黃曉明,入局率74%,攤牌率27%,財富數量是朋友圈中前幾名,達到了920萬金幣。對整體趨勢的樂觀,和對過程中的謹慎把握,或許是這位明星投資人取得還不錯投資成績的關鍵。

ofo共享單車的創始人戴威,入局率只有42%,說明這位正在激進擴張中的年輕創業者,遠比大家想象中冷靜和理性。而餓了麽的張旭豪,入局率51%,攤牌率16%,同樣說明了其在粗放的外表下和刺刀見紅的競爭下,細膩的操作和自控力。而這兩位的直接競爭對手,雖然都在筆者朋友圈,但都未出現在「天天德州」的牌局中。

優信集團CEO戴琨是典型的創業者性格,在389局遊戲中,他的入局率高達80%,說明此人格外激進格外樂觀,而攤牌率19%,說明了他過程中的理性。陌陌的創始人唐巖,圈內公認的德撲高手(比賽級選手),很多人認為他為人蠻痞、敢於冒險,但熟悉他的人知道並非如此(至少在公司決策上他非常謹慎),其入局率僅為52%,攤牌率17%。相似的攤牌率,截然不同的入局率,說明兩位創業者心性不同,長期效果值得玩味。

有贊的白鴉也有典型的創業者性格,入局率70%,攤牌率39%,勝率18%。Boss直聘的趙鵬入局率70%,攤牌率40%,勝率23%。好貸網李明順入局率69%,攤牌率44%,勝率19%。51信用卡孫海濤入局率80%,攤牌率39%,勝率31%。Camera 360的徐灝,入局率67%,攤牌率32%,勝率33%。這些創業者在遊戲中都展現了性格剛硬、積極的一面,同時,他們在過程中都很堅持、絕少放棄。最關鍵的是,這麽高的入局率還有相當高的勝率——說明他們的運氣或技術還是很不錯的。

微影的CEO林寧,他的入局率14%說明手很緊,而勝率僅有2%,說明這位創業者在遊戲中運氣實在是不怎麽樣,或者金額太低激發不了他真正的熱情(100萬金幣大約價值人民幣72元)。

某家政O2O公司的CEO,入局率75%,攤牌率14%,勝率7%。性格冒進心存幻想,面對壓力容易放棄,最終成績平平。如果你想贏他的錢太容易了,只要先把他引誘進來,再施以足夠大的壓力逼他棄牌即可。

58同城創始人姚勁波,入局率65%,攤牌率居然高達60%,入局率和攤牌率的比例驚人地高,說明他一旦入局就不會放棄——這種對手太可怕了。有趣的對比是,姚勁波之前的主要競爭對手趕集網創始人楊浩湧(目前在做瓜子二手車),入局率64%,攤牌率22%。兩人入局率相當,而攤牌率相差三倍。性格沒有高下對錯,但這或許解釋了,為什麽58、趕集最終會是這樣一種合並方式。

騰訊的創始人之一張誌東為人低調,遊戲中看上去也是性情平和——入局率53%,攤牌率20%,勝率20%,幾個數字比較均衡,應該是一位穩定的管理者。換言之,他的錢很難贏到你口袋里。而「微信之父」張小龍看起來有著更重的創業者氣質,他入局率61%,攤牌率17%。

投資圈三大網紅,紅杉的沈南鵬和經緯的張穎、真格的徐小平都沒有花時間玩這個遊戲,提出表揚(順便證明本文不是天天德州的廣告)。

有一位玩了20多萬局的投資人和玩了17萬局的創業者我就不點名了,同學要好好工作啊,你實在太愛玩遊戲了!

總體而言,投資人在這個德州遊戲中的表現比預想中激進很多,很多時候甚至比創業者更為激進樂觀。而創業者更多展現出了外表激進、骨子里理性、絕不放棄的一面。這或許說明了,保守、理性並不是投資的核心,而更接近創業的本質。正如德州教父Doyle Brunson所言,德州是勇敢者的遊戲。當你坐在牌桌上,發現身邊的人大多是保守的,如果你想要賺錢,就只能更激進一點。只有當身邊的人大多數是激進的,你才要保守一點。

在牌桌上,其實所有人的運氣長期看都差不多,而一個普通人和一個高手的區別無非在於,普通人即使拿到一副好牌,也只能賺到一個小底池,而高手能把牌桌上的每一分錢都榨光。創業投資,亦複如是。

大佬
贊(...)
文章評論
匿名用戶
發布
創投 大佬 牌桌 馬東 黃曉明 姚勁 勁波 波玩 玩德 德撲 表現 如何
PermaLink: https://articles.zkiz.com/?id=238399

德撲“人機大戰”爭奪200萬獎金,李開複:人類這次還有10%勝率

來源: http://www.iheima.com/zixun/2017/0405/162387.shtml

德撲“人機大戰”爭奪200萬獎金,李開複:人類這次還有10%勝率
黑智 黑智

德撲“人機大戰”爭奪200萬獎金,李開複:人類這次還有10%勝率

但是,這或許是人類最後一次戰勝人工智能的機會了。

AlphaGo戰勝了人類圍棋國手。今年1月,AI程序擊敗了德撲人類頂級職業玩家。面對人工智能,人類還有多少次可以戰勝的機會?

明天,亞洲的頂尖德撲牌手將再次迎戰人工智能。這次出戰的人工智能“冷撲大師”,是基於卡內基梅隆大學開發的Libratus,就是在1月在美國賓夕法尼亞,擊敗了四名頂尖人類高手,一舉獲得了20萬美元將近和177萬美元籌碼的德州撲克人工智能系統。

它將面對的是,是華人牌手“龍之隊”,由2016年世界德州撲克大賽WSOP金手鏈冠軍得主、常春藤資本合夥人杜悅領軍,戰隊成員由許朝軍、張淮、童舟、朱亞希、王天建六位撲克玩家圈內熟知的高手組成。這次比賽由創新工場、海南生態軟件園聯合主辦。

“勝率大約有10%。”杜悅在出征前坦承,“我希望中國龍之隊是最後一支能夠戰勝人工智能的團隊。”

“如果人類還有戰勝AI的可能,也許就是這次。”創新工場CEO李開複說。“當下次AlphaGo對戰柯潔,我認為,人類的勝出概率,基本為零。”

這次賽事,將在海南進行5天,長達45小時。獲勝一方,將獲得200萬元的獎金。而當人類面對機器已然勝算逐步下降的今天,這場人機對戰,又將代表什麽樣的意義?

突破“不完美信息”遊戲

創新工場之所以參與主辦這一賽事,或許與李開複的“人機對弈”情結息息相關。1988年,李開複在母校卡內基梅隆大學開發了“奧賽羅”,成為第一個擊敗黑白棋世界冠軍的人機對弈系統。而這次,他不僅為活動牽線,更為Libratus專門起了一個中文名“冷撲大師”。

2016年,卡耐基梅隆大學的Tuomas Sandholm教授曾領導開發了一個打撲克的程序Claudico,但是在一場面對數位高手的比賽中慘敗。這也是Libratus的前身。2017年,Sandholm 教授聯同Noam Brown博士開發完成了Libratus。

德撲和AlphaGo所擅長的圍棋不同。此前的20年里,被人工智能所攻克的圍棋、國際象棋和西洋雙陸,都是“完美信息”遊戲。也即是,所有玩家在遊戲中,能夠獲得公開和對稱的確定信息。遊戲中需要作出的決策點的數量,決定了機器的計算量。

而與之相比,德撲則是“不完整信息”遊戲。其中包含了更多的隱藏信息,每個玩家掌握的信息都是不對稱的,他只能看到自己的牌,卻不知道對手的牌,需要根據直覺推測對手手牌,選擇下註和放棄,並判斷對手的打法,想得到理想化的戰略,是非常困難的。因此,“不完整信息”博弈,就成為難以攻克的計算機難題。

冷撲大師Libratus,基於在匹茲堡超級計算中心大約1500萬核心小時的計算,用算法分析德撲規則,預測所有步驟的勝率,來進行自己的下一步。和AlphaGo用大量棋局做訓練不同,它的策略並非基於專業玩家的經驗,沒有用專業牌局進行神經網絡訓練,而是用隨機生成的牌局(隨機產生公共牌、底池籌碼、玩家拿牌概率)和嘗試性的動作帶來的結果(在隨機生成的輸入情況下模擬玩家跟牌後的結果)來作為訓練數據。Libratus還采用了博弈論,它通過納什均衡來計算如何應對對手的招數,通過平衡風險和收益,對自身的下一步進行修正,以期達到收益最大化。其程序名Libratus,就是來源於拉丁文“制衡”。

也因此,德撲被認為是人類博弈心理、智商和情商的高度體現,其中信息具有不透明性和不確定性,可以“詐唬”,甚至還帶有一定的運氣成分。打德撲所需的推理能力和心理戰術,是機器很難模仿的。也正因此,Libratus之前取得的成績,才在人工智能領域引起了巨大關註。

而在李開複看來,現實中,這種“不完整信息”才是常態。“世界上大部分的決策問題、商業問題,都不是單純靠強力的搜索和人工智能就可以解決的。”

高“情商”的AI

啟動2


根據賽制,在4月6日-10日巔峰表演賽期間,中國龍之隊的六位牌手每人同時打兩手牌,進行每天上下午兩場共10小時的人機對戰,全程估計長達45小時達到36,000手牌。

表演賽為求降低發牌中的運氣因素,機器人將采用複式對稱發牌,兩兩成對的牌手其中一人將拿到與配對牌手對打的機器人底牌,因此六名牌手將拆分於兩個房間和冷撲大師對陣,比賽過程中還必須確保配對牌手彼此不能碰面交流。4月10日完賽時,將以人機各自積累的總計分牌數計算成績,決定最終200萬元獎勵花落誰家。

對於這次的德撲“人機大賽”,他和杜悅仍然“大膽”地把人類勝率預測為大約10%。“第一個畢竟這次的表演賽不如上次的對決那麽長,這次是36000手牌,上次是12萬,運氣成分會增加一些,人類的機會會有一些。第二,這次出戰的‘龍之隊’有計算機專業的學霸,他們對於計算機的理解更為深刻。”盡管如此,他也仍舊認為,遲早機器在符合以下三個前提的領域里,將全面戰勝人類:

第一,有海量的數據;

第二,數據有標準;

第三,單一領域。

“人工智能從AlPhaGo和冷撲大師所提煉出來的想法、技術和先進已經遠遠超過人類。”李開複說。“我們可以把AlphaGo理解為高‘智商’,但是冷撲大師是高‘情商’的。而且這樣的技術可以在很多商業的領域里面應用,因為大部分人類的信息都不是彼此公開的。”

同時,李開複表示:“另外一點就是,冷撲大師並非運用深度學習,而我們會由此認識到,未來會有更多的科學家發明更多的技術,讓AI給人類帶來更多的價值。”截止到目前為止,創新工場已經投資了Face++、馭勢科技、小魚兒科技等人工智能創新公司,但在李開複看來,更多地垂直領域的人工智能應用,仍將出現。他預計,現今這套人工智能撲克程序背後的模型,將適用於需要用到戰略推理和多方談判的場景,從企業談判、商務談判、外交談判、甚至到生活面的房屋買賣談判,十年內都將會部分或全面被人工智能所取代。

值得一提的是,這次表演賽,將在海南生態軟件園落地。而海南也將借此啟動人工智能產業基地。據了解,騰訊、樂視、360等1500家企業,也已經在海南生態軟件園落戶。助理總經理唐堯表示,人工智能產業得到了海南省的高度重視和扶持,海南生態軟件園也配套專項政策、政務及服務,積極布局人工智能產業。看來,業界對海南的認知,也在重構。

人工智能 李開複 德撲大賽 Libratus
贊(...)
文章評論
匿名用戶
發布
德撲 人機 大戰 爭奪 200 獎金 李開 開複 人類 這次 還有 10% 勝率
PermaLink: https://articles.zkiz.com/?id=244309

德撲“人機大戰”爭奪200萬獎金,李開複:人類這次還有10%勝率

來源: http://www.iheima.com/zixun/2017/0405/162387.shtml

德撲“人機大戰”爭奪200萬獎金,李開複:人類這次還有10%勝率
黑智 黑智

德撲“人機大戰”爭奪200萬獎金,李開複:人類這次還有10%勝率

但是,這或許是人類最後一次戰勝人工智能的機會了。

AlphaGo戰勝了人類圍棋國手。今年1月,AI程序擊敗了德撲人類頂級職業玩家。面對人工智能,人類還有多少次可以戰勝的機會?

明天,亞洲的頂尖德撲牌手將再次迎戰人工智能。這次出戰的人工智能“冷撲大師”,是基於卡內基梅隆大學開發的Libratus,就是在1月在美國賓夕法尼亞,擊敗了四名頂尖人類高手,一舉獲得了20萬美元將近和177萬美元籌碼的德州撲克人工智能系統。

它將面對的是,是華人牌手“龍之隊”,由2016年世界德州撲克大賽WSOP金手鏈冠軍得主、常春藤資本合夥人杜悅領軍,戰隊成員由許朝軍、張淮、童舟、朱亞希、王天建六位撲克玩家圈內熟知的高手組成。這次比賽由創新工場、海南生態軟件園聯合主辦。

“勝率大約有10%。”杜悅在出征前坦承,“我希望中國龍之隊是最後一支能夠戰勝人工智能的團隊。”

“如果人類還有戰勝AI的可能,也許就是這次。”創新工場CEO李開複說。“當下次AlphaGo對戰柯潔,我認為,人類的勝出概率,基本為零。”

這次賽事,將在海南進行5天,長達45小時。獲勝一方,將獲得200萬元的獎金。而當人類面對機器已然勝算逐步下降的今天,這場人機對戰,又將代表什麽樣的意義?

突破“不完美信息”遊戲

創新工場之所以參與主辦這一賽事,或許與李開複的“人機對弈”情結息息相關。1988年,李開複在母校卡內基梅隆大學開發了“奧賽羅”,成為第一個擊敗黑白棋世界冠軍的人機對弈系統。而這次,他不僅為活動牽線,更為Libratus專門起了一個中文名“冷撲大師”。

2016年,卡耐基梅隆大學的Tuomas Sandholm教授曾領導開發了一個打撲克的程序Claudico,但是在一場面對數位高手的比賽中慘敗。這也是Libratus的前身。2017年,Sandholm 教授聯同Noam Brown博士開發完成了Libratus。

德撲和AlphaGo所擅長的圍棋不同。此前的20年里,被人工智能所攻克的圍棋、國際象棋和西洋雙陸,都是“完美信息”遊戲。也即是,所有玩家在遊戲中,能夠獲得公開和對稱的確定信息。遊戲中需要作出的決策點的數量,決定了機器的計算量。

而與之相比,德撲則是“不完整信息”遊戲。其中包含了更多的隱藏信息,每個玩家掌握的信息都是不對稱的,他只能看到自己的牌,卻不知道對手的牌,需要根據直覺推測對手手牌,選擇下註和放棄,並判斷對手的打法,想得到理想化的戰略,是非常困難的。因此,“不完整信息”博弈,就成為難以攻克的計算機難題。

冷撲大師Libratus,基於在匹茲堡超級計算中心大約1500萬核心小時的計算,用算法分析德撲規則,預測所有步驟的勝率,來進行自己的下一步。和AlphaGo用大量棋局做訓練不同,它的策略並非基於專業玩家的經驗,沒有用專業牌局進行神經網絡訓練,而是用隨機生成的牌局(隨機產生公共牌、底池籌碼、玩家拿牌概率)和嘗試性的動作帶來的結果(在隨機生成的輸入情況下模擬玩家跟牌後的結果)來作為訓練數據。Libratus還采用了博弈論,它通過納什均衡來計算如何應對對手的招數,通過平衡風險和收益,對自身的下一步進行修正,以期達到收益最大化。其程序名Libratus,就是來源於拉丁文“制衡”。

也因此,德撲被認為是人類博弈心理、智商和情商的高度體現,其中信息具有不透明性和不確定性,可以“詐唬”,甚至還帶有一定的運氣成分。打德撲所需的推理能力和心理戰術,是機器很難模仿的。也正因此,Libratus之前取得的成績,才在人工智能領域引起了巨大關註。

而在李開複看來,現實中,這種“不完整信息”才是常態。“世界上大部分的決策問題、商業問題,都不是單純靠強力的搜索和人工智能就可以解決的。”

高“情商”的AI

啟動2


根據賽制,在4月6日-10日巔峰表演賽期間,中國龍之隊的六位牌手每人同時打兩手牌,進行每天上下午兩場共10小時的人機對戰,全程估計長達45小時達到36,000手牌。

表演賽為求降低發牌中的運氣因素,機器人將采用複式對稱發牌,兩兩成對的牌手其中一人將拿到與配對牌手對打的機器人底牌,因此六名牌手將拆分於兩個房間和冷撲大師對陣,比賽過程中還必須確保配對牌手彼此不能碰面交流。4月10日完賽時,將以人機各自積累的總計分牌數計算成績,決定最終200萬元獎勵花落誰家。

對於這次的德撲“人機大賽”,他和杜悅仍然“大膽”地把人類勝率預測為大約10%。“第一個畢竟這次的表演賽不如上次的對決那麽長,這次是36000手牌,上次是12萬,運氣成分會增加一些,人類的機會會有一些。第二,這次出戰的‘龍之隊’有計算機專業的學霸,他們對於計算機的理解更為深刻。”盡管如此,他也仍舊認為,遲早機器在符合以下三個前提的領域里,將全面戰勝人類:

第一,有海量的數據;

第二,數據有標準;

第三,單一領域。

“人工智能從AlPhaGo和冷撲大師所提煉出來的想法、技術和先進已經遠遠超過人類。”李開複說。“我們可以把AlphaGo理解為高‘智商’,但是冷撲大師是高‘情商’的。而且這樣的技術可以在很多商業的領域里面應用,因為大部分人類的信息都不是彼此公開的。”

同時,李開複表示:“另外一點就是,冷撲大師並非運用深度學習,而我們會由此認識到,未來會有更多的科學家發明更多的技術,讓AI給人類帶來更多的價值。”截止到目前為止,創新工場已經投資了Face++、馭勢科技、小魚兒科技等人工智能創新公司,但在李開複看來,更多地垂直領域的人工智能應用,仍將出現。他預計,現今這套人工智能撲克程序背後的模型,將適用於需要用到戰略推理和多方談判的場景,從企業談判、商務談判、外交談判、甚至到生活面的房屋買賣談判,十年內都將會部分或全面被人工智能所取代。

值得一提的是,這次表演賽,將在海南生態軟件園落地。而海南也將借此啟動人工智能產業基地。據了解,騰訊、樂視、360等1500家企業,也已經在海南生態軟件園落戶。助理總經理唐堯表示,人工智能產業得到了海南省的高度重視和扶持,海南生態軟件園也配套專項政策、政務及服務,積極布局人工智能產業。看來,業界對海南的認知,也在重構。

人工智能 李開複 德撲大賽 Libratus
贊(...)
文章評論
匿名用戶
發布
德撲 人機 大戰 爭奪 200 獎金 李開 開複 人類 這次 還有 10% 勝率
PermaLink: https://articles.zkiz.com/?id=244310

AlphaGo將與柯潔大戰,德撲AI戰勝人類牌手,但是So What?

來源: http://www.iheima.com/zixun/2017/0410/162493.shtml

AlphaGo將與柯潔大戰,德撲AI戰勝人類牌手,但是So What?
黑智 黑智

AlphaGo將與柯潔大戰,德撲AI戰勝人類牌手,但是So What?

兩場人類的反攻戰。一場已經以人類的再次失敗宣告結束,另一場即將開始!

本文系i黑馬原創 首發黑智(VR-2014)

圍棋和德撲,兩次人類組織的對機器的反攻,在今天都有新的消息發布。

就在剛剛,谷歌在位於北京的中國棋院就“中國烏鎮·圍棋峰會”召開了新聞發布會。據發布會宣布,此次圍棋峰會將於5月22-27日在中國桐鄉烏鎮舉行,在開賽的前三天中,AlphaGo與柯潔之間將進行三番棋對弈。

從4月6日持續到10日的“冷撲大師V.S.中國龍之隊-人機撲克巔峰表演賽”在今天中午正式落幕。經過了5天的征程,這場比賽,最終以人類的落敗而告終,德撲AI程序“冷撲大師”最後以792,327總記分牌的戰績獲勝,同時,200萬元的獎金,也歸屬冷撲大師所有。

兩場人類的反攻戰。一場已經以人類的再次失敗宣告結束,另一場即將開始,勝算還很難預測,但是至今為止,不看好人類棋手的預測居多。

圍棋和德撲,人類已經接連失守。這是一個值得人類反攻的戰場嗎?它又值得我們緊張,會給我們帶來“末日危機”嗎?

對戰人工智能,人類的絕望?

1

柯潔(最右)與聶衛平(柯潔旁邊)去年在北京聶衛平圍棋道場,憑記憶複盤 AlphaGo 與李世石第一局的開局,並向 Google CEO Sundar Pichai 展現棋局的精妙之處

谷歌表示,之後的烏鎮圍棋峰會特別設計了 AlphaGo 與中國頂尖棋手的多種比賽形式,包括:

人機配對賽:中國職業棋手將與另一名職業棋手對弈——只不過每一方棋手都將有AlphaGo作為自己的隊友與他們交替落子,真正體現共同學習的真諦。

團隊賽:由五位中國頂尖棋手組隊與 AlphaGo 進行對弈,共同測試 AlphaGo 在面對組合風格時所展現的創造力和適應性。

柯潔對陣 AlphaGo:AlphaGo 與世界排名第一的棋手柯潔進行的三番棋對弈將會成為萬眾所矚目的焦點。柯潔會將 AlphaGo 的能力推向甚至超越極限。

據報道,此次參戰的 AlphaGo 2.0 可能采用了全新的算法模型,即未先學習人類棋譜的經驗,而是直接通過對戰來獲得認知和能力。

AlphaGo的做法是使用了蒙特卡洛樹搜索與評估網絡(Value Network)和走棋網絡(Policy Network)兩個深度神經網絡相結合的方法,其中一個是以估值網絡來評估大量的選點,而以走棋網絡來選擇落子。在這種設計下,電腦可以結合樹狀圖的長遠推斷,又可像人類的大腦一樣自發學習進行直覺訓練,以提高下棋實力。

訓練一個沒有學習過人類棋譜的人工智能。不再受到人類棋譜的局限,走出真正的“人工智能”棋路。現在的AlphaGo,比起去年的AlphaGo1.0,無疑有了更加巨大的飛躍。

而在AlphaGo上,還有一個強大的武器。前不久,谷歌公布了TPU的細節,它在神經網絡層面的操作上,處理速度比當下GPU和CPU快15到30倍;在能效比方面,比GPU和CPU高30到80倍;在代碼上也更加簡單,100到1500行代碼即可以驅動神經網絡。

2

就在今天,德撲人機大賽中,亞洲人類牌手精英們,剛剛敗北。五天對戰下來,德撲AI冷撲大師累計贏得792,327記分牌數,平均22.0每百手損失大盲。200萬獎金,被機器獲得。撲克在幾十年來一直是人工智能和博弈論中的一個具有高挑戰性的問題。作為帶著隱藏底牌的“不完美信息”遊戲,撲克對AI來說,具有國際象棋和圍棋遊戲中未曾出現的信息障礙。冷撲大師相對於AlphaGo更高明之處在於冷撲大師不需要提前背會大量棋譜,也不局限於在公開的完美信息場景中進行運算,而是從零開始,基於撲克遊戲規則針對遊戲中對手劣勢進行自我學習,並通過博弈論來衡量和選取最優策略。

人機撲克大戰巔峰表演賽的發起人、創新工場CEO李開複更是明確表示:“通過冷撲大師和龍之隊表演賽的對戰結果,人機對戰基本沒有懸念了。據聞AlphaGo近期即將來華和柯潔對戰,其實已經不再具有科學意義了。”

AlphaGo和柯潔的對戰結果,在李開複這里,已經提前被判了人類的“末日”。

過去的那些人機對戰

3

迄今為止,已經有多少次人機對戰了?

一次是全球矚目的AlphaGo對戰李世乭。它完全可以稱作一次“巔峰對決”,它掀起的是體育和科技界共同的高潮,吸引了全世界的關註,在首輪對決中,根據某門戶的數據,就有全球1億人次觀看了直播,其中中國就有6000萬人。而它的結果也可謂成功,那就是,人工智能、深度學習,這些原本是高在雲端的名詞,瞬間被大眾所接受,帶來前所未有的AI熱潮,人工智能相關的創新技術和公司,紛紛走向前臺。

Master在去年年末掀起了第二波熱潮。以此為註明網名的“棋手”,在圍棋網站弈城和野狐上,一路過關斬將,擊敗了常昊、時越、古力等眾多圍棋好手,“韓國第一人”樸廷桓、“日本第一人”井山裕太,以及世界排名居首的柯潔,也對戰落敗。60連勝後,Master被證實是AlphaGo。

今年1月,在美國賓夕法尼亞,卡內基梅隆大學開發的德撲AI程序Libratus擊敗了四名頂尖人類高手,一舉獲得了20萬美元將近和177萬美元籌碼的德州撲克人工智能系統。這也是人工智能第一次在德撲比賽中獲勝。

在今年3月19日結束的第10屆UEC杯世界圍棋“機機大戰”中,來自中國的騰訊圍棋人工智能程序“絕藝”,戰勝衛冕冠軍日本圍棋人工智能程序“DeepZenGo”奪冠。UEC杯是世界權威的計算機圍棋大賽,由日本電氣通信大學於2007年創辦,承載了計算機攻克圍棋項目的使命。在取“絕藝”這個名字之前,它以weigo為名,以“虎虎有生氣”的ID於2016年8月首次在野狐平臺(騰訊旗下圍棋對弈平臺)下棋,8月23日首次戰勝職業棋手;9月4日,weigo以“野狐掃地僧”ID連贏 ID為tby的網友8局;11月1日,weigo正式以“絕藝”ID亮相野狐,並沿用到了現在,多次戰勝中日韓三國一眾頂尖棋手,成為野狐首個晉級“十段”的棋手。

更遑論,今年還有百度的小度,在最強大腦的節目舞臺上大“秀”頭腦,用自己的圖像識別等技術,挑戰人類智商。

每一次的人機對決,人類都毫無懸念,毫無勝算。

無法戰勝AI,人類會被機器取代嗎?

4

如果人工智能不能比人類更強,被創造出來,又有什麽樣的意義呢?

機器戰勝人類,並不是初次。汽車和飛機被創造出來,跑得更快,飛的很高。那麽為什麽我們會對人工智能產生“擔憂”的情緒?大約是,人類最恐慌的,就是有朝一日,被機器所取代。

就像AlphaGo剛剛戰勝人類棋手時,外界討論更多的是:它會像人類一樣思考嗎?

在前不久的IT領袖峰會上,李彥宏說:“強人工智能時代,也許永遠不會到來。”

人工智能能否擁有人類一樣的智商、情感,或擁有自主意識?回答這個問題之前,人類需要先搞明白人類自身的大腦。

在博鰲論壇上,魯白也作出了同樣的回答:“絕對不會。”他解釋,人腦有五個方面的功能:第一是感覺,第二是運動,第三是記憶,第四是情感與情緒,第五是認知。“怎麽樣跟人工智能或者電腦產生感情,論題中包括兩個方面:一個就是情感的產生與情感的交流,延展一下就是社會性;一個方面是認知。認知又分兩個部分,一個是一般的認知,連動物都有,我覺得人工智能可以有這個方面的認知功能,包括邏輯思維分析,以及決策之類。人還有另外的一個方面的認知叫做高級認知功能,里面包括語言包括自我的意識,包括想象力、創造力最後還有人所特有的一種目的性的行為,而我認為,人類是在這方面,是不能被機器代替的。”

借助強大的數據處理能力和深度學習,機器已經在很多領域超越人類。但是,它不能做到的,是如何模擬人類大腦的運行,擁有自主意識和情感。

那麽,機器將在哪些領域代替人類?李開複的答案是,人工智能在符合以下三個前提的領域里,將全面戰勝人類:

第一,有海量的數據;

第二,數據有標準;

第三,單一領域。

在前不久,黑智也在采訪中,總結了機器逐漸取代人力的領域。比如鑒黃師。企業只要用互聯網音視頻有害信息監測系統,就可以自動識別網絡上傳播的涉恐、涉暴、涉黃信息。

通過音、視頻雙通道進行有害信息檢測,語言類內容為主的音視頻,采用語音識別、關鍵詞檢索技術檢測;圖像類內容為主的,就通過定時采集關鍵幀圖像,進行圖像識別,判斷是否為色情、性感、正常。

“我們的系統對直播平臺涉黃圖像檢測的準確率高達99%以上,誤報率低於1%,需要客戶進行人工複核的比例不超過3%。人工複核後的數據會被收集起來進行叠代訓練,不斷提升識別的準確率。”極限元聯合創始人馬驥說。

比如客服和呼叫中心。大型呼叫中心的坐席,也在比以往有了縮減的幾率。以前,人工客服超過50%的時間,都在處理用戶咨詢的大量重複性問題。現在,用AI機器人客服屏蔽掉這些重複問題,就減輕了人工的工作量,並且以客服助手的形式提高人工客服的工作效率,也給企業降低了成本。

智能客服公司智齒科技CTO吳立楠以樂視為例,解釋了實際的應用場景:“在樂視,智齒科技機器人解答環節可以擋住60%的用戶。也就是說,100個咨詢者只有40個會轉到人工,另外60個都被機器人服務了。原來一個客服只能同時服務5個用戶,有了機器人的輔助,現在可以同時服務15個。如果最多只有100個用戶咨詢,原來一共需要20個客服,現在只要3個就夠了,節省了85%的人工成本,並且機器人的準確率達到97%。”

這種模型廣泛應用於各種自然語言處理問題,如語音識別、機器翻譯、分詞、詞性標註等。

什麽職業將被機器改變?和黑智談過的眾多業內人士也總結,勞動並無高低之分。那些和數據相關,重複性較強、邊界清晰的工作,容易被機器所取代。

另外,人工智能聯盟已經組建,目的就是為了防止人工智能危害人類。

當然,我們還會拭目以待,下一次機器與人類的對陣。就像馬雲在IT領袖峰會上的發言那樣:“AlphaGo 贏了李世石,so what?下圍棋本來的樂趣就是對方下一把臭棋,結果機器不會下臭棋,那還有什麽事情呢?”

或許,我們可以期待烏鎮,AlphaGo會不會特意,下一次臭棋給我們看。

640.webp

AlphaGO
贊(...)
文章評論
匿名用戶
發布
AlphaGo 將與 與柯 柯潔 大戰 德撲 AI 戰勝 人類 牌手 但是 So What
PermaLink: https://articles.zkiz.com/?id=244821

德撲人機大戰落幕人類慘敗 會打撲克的AI有什麽用?

經過五天的鏖戰,德州撲克人工智能系統Libratus毫無懸念獲得最終勝利。在這場德州撲克人機大戰中,中國龍之隊的六位牌手共與冷撲大師打了36000手牌,共輸792327分,AI完勝人類。

比賽的結局並不出乎意料,開賽之前,創新工場創始人、董事長李開複就曾表示:“對人類能贏感到悲觀,贏的概率不到10%。”事實上,今年1月,在賓夕法尼亞州匹茲堡的Rivers賭場,CMU開發的Libratus人工智能系統就曾擊敗過人類頂級職業撲克玩家,那場比賽共持續了20天,對玩了12萬手,最終AI贏得了176萬美元。

會詐唬的AI

Libratus是一個玩無限德州撲克的人工智能程序,Libratus的策略並非基於專業玩家的經驗,所以它的玩牌方式可能有明顯的不同。基於在匹茲堡超級計算機中心大約1500萬核心小時的計算,它使用算法分析德州撲克規則,從而建立自己的策略,而且它能夠在比賽中,通過預測所有未來步驟的勝率來思考自己的下一步。

與圍棋強調計算和形式判斷能力不同,德州撲克更講究多人博弈過程,如何避免人性貪婪等弱點,並將科學的概率統計與靈活的實戰策略很好地配合起來。在圍棋、象棋等遊戲中,機器和人類在決策前可以獲得全部信息,而在德州撲克中,彼此無法得知對方的底牌是什麽,也不知道發牌員發出的下一張牌是什麽,在“不完整信息”下,人工智能需要根據經驗或概率統計知識,猜測對手底牌和下一張牌的可能性,然後再制定自己的應對策略。

“如果AlphaGo是一個超級天才,冷撲大師CMU系統其實一定程度上是一個EQ專家,是靠EQ來打敗你。”李開複表示。表演賽為求降低發牌中的運氣因素,機器人采用複式對稱發牌,兩兩成對的牌手其中一人將拿到與配對牌手對打的機器人底牌,因此六名牌手將拆分於兩個房間和冷撲大師對陣,比賽過程中還必須確保配對牌手彼此不能碰面交流。在整個比賽中,冷撲大師也經常出現一些“詭異”的打法,例如時常超池下註,給對手造成極大的壓力,並做出人類出於心理原因做不到但是正確的bluff(詐唬)。

“AI利用增強學習技術,從自我對局中學習最優的撲克玩法,而避免從人類的既定模式中學習經驗,這是非常重要的一點。”李開複表示。不過,據了解,目前Libratus的算法還只適用於無限制投註的一對一比賽,如果將比賽擴展到更常見的多人制比賽,Libratus面對的挑戰會更大一些,還需要進行策略上的升級與調整。

人工智能應用挑戰

正如馬雲所提及的疑問一樣,人工智能打敗人類圍棋大師,所以會打撲克的人工智能在解決更為廣泛的現實問題方面又有哪些價值?在李開複看來,世界上大部分的信息還不是公開的,冷撲大師在面臨不完全或誤導信息時的推理能力,未來能夠解決在決策、外交、商業合作、談判方面的不確定性問題,成為人類的“參謀”。

但如同谷歌人工智能大勝人類圍棋大師,使得AlphaGo的能力被充分認知,但在商業化方法和能力方面卻並不明顯。以AlphaGo為例,需要學習數量龐大的棋局才可以掌握有效的下棋技巧,而冷撲大師目前的對戰形式也是一對一,而現實生活中德撲是多人遊戲,多人遊戲在計算上的複雜程度是目前冷撲大師所無法勝任的。

人工智能和冷撲大師所提煉出來的人工智能技術如何發揮其商業價值,李開複認為仍需要滿足三個條件:海量的數據、數據有標註、單領域。例如在金融領域,金融是虛擬的、由人創造的,數據量龐大且天生帶有標註,譬如股票的漲停、小額貸款是否還錢、買了保險後是否出事都是一種標註,這使得AI在放貸、銀行、投資、保險方面具有潛力。

“相較於告訴人們人工智能能做什麽,目前更重要的反倒是告訴人們,人工智能不能做什麽。”地平線機器人技術創始人兼首席執行官余凱曾向第一財經記者表示,在他看來,人工智能進一步拓展的首要挑戰就是數據不足的問題。眾所周知,人工智能是建立在海量數據基礎之上,通過大數據訓練,來優化算法模型,以人臉識別技術為例,訓練這一算法模型需要至少百萬級別的圖片數據。

目前,人工智能主要是監督式學習,有監督的訓練就需要帶標簽的數據,因此數據的質量和精準度與輸出結果密切相關。“如何剔除數據中的噪音、垃圾信息,獲取優質且帶有標簽的數據成為新挑戰,這其中就涉及到無監督式學習或者半監督式學習。”地平線機器人技術聯合創始人、算法副總裁黃暢說。

另一大挑戰在於深度學習的推廣和場景遷移能力不足,每個領域的數據都需要重新收集、標準和再訓練,很難進行跨領域推廣。這些挑戰也是人工智能工業界和學術界急需突破的問題。“在招聘的過程中,懂得深度學習的人很多,而懂得遷移學習、增強學習,具備思辨能力的人很少。”第四範式創始人、首席執行官戴文淵告訴記者。

在實際應用層面,人工智能仍有很長的路要走。正如李開複在比賽結束後的回應一樣:“人工智能已從完美信息的AlphaGo,延伸到了不完美信息的冷撲大師,人機對戰基本沒有懸念了,據聞AlphaGo近期即將來華和柯潔對戰,其實已經不再具有科學意義了,以後更應該關註商業領域的人工智能,在金融、醫療、教育等領域產生的商業價值。”

德撲 人機 大戰 落幕 人類 慘敗 會打 撲克 AI 什麼
PermaLink: https://articles.zkiz.com/?id=244842


ZKIZ Archives @ 2019