ZKIZ Archives


谷歌戰勝圍棋冠軍幕後的台灣囝仔 黃士傑每天寫16小時程式 業餘圍棋最高段

2016-03-21  TWM

Google突破人工智慧的局限,以AlphaGo電腦程式,首次在圍棋領域打敗韓國九段棋士, 帶領開發團隊的黃士傑,是土生土長的台灣人,他究竟有什麼能耐?

去年十月,Google(谷歌)旗下公司DeepMind開發的人工智慧程式AlphaGo,在圍棋賽五戰完勝棋力達二段(編按:職業級最高九段)的歐洲冠軍職業棋士樊麾,首創人類以電腦勝過職業棋士的紀錄;今年三月,AlphaGo更進一步挑戰韓國十八度獲得世界棋王頭銜的圍棋九段李世石,以四勝一敗作收。在這幾場全球關注的「人機對弈」賽事中,都有一隻手,替電腦下棋,他就是來自台灣的黃士傑。

黃士傑「手」、「腦」並用,不只是替電腦下棋,更是開發AlphaGo的首席工程師之一,同時擁有業餘圍棋六段的實力,這樣的雙才實屬少見。連同樣積極開發圍棋程式的臉書,都公開承認,因為「團隊裡沒有黃士傑(Aja Huang)」,目前還打不贏谷歌。

畢業於台灣師範大學資工所博士班的黃士傑,不到四十歲,沒有喝過洋墨水,是土生土長的「台灣囝仔」。從交大畢業後,他在台師大資工系一待就是十年,進入指導教授林順喜的實驗室底下念完碩、博士;二○一一年先到加拿大工作;一年後,迎來他人生的轉捩點,進入英國的DeepMind,這家公司專研模仿大腦的計算機系統──人工智慧,在一四年被谷歌購併,黃士傑順勢成為谷歌旗下的研發科學家。

沒喝過洋墨水

熱愛圍棋的雙才工程師

為什麼找黃士傑作為替AlphaGo下棋的手?林順喜表示,用電腦挑戰專業棋士,不能讓他們面對電腦螢幕下棋,這有違職業棋士下棋的思考習慣,所以需要一位專人代下,而「團隊只有他常和職業棋士過招,懂得棋賽的各種禮節。」谷歌相當看重這次的比賽,提出一百萬美元的獎金給贏家。第一場比賽,黃士傑代表電腦下棋時,神情凝重,他在臉書上自承,「前天晚上沒睡好,對局時保持嚴肅,一方面也是尊重李世石九段,不影響他的思考,不論勝敗如何,對局時的禮儀還是很重要的。」黃士傑熱愛下圍棋,早在○七年念研究所時,就拿到業餘六段的資格(業餘最高段,約等同職業二段),曾經獲得台灣大專盃業餘圍棋賽冠軍,甚至和學弟妹創辦圍棋社。

當年一起創社的學妹、如今已是業餘五段的圍棋專欄作家張曉茵回憶,黃士傑很熱心地指導學弟妹,年紀最長的他,幫大家擬定分組對戰表,透過圍棋,大家成為好朋友,「有關圍棋程式的知識,都是那時聽他說的。」林順喜的實驗室,主攻的就是各種棋類程式的開發,每年都會送學生出國參加國際棋類程式比賽,黃士傑結合興趣和專業,以妻子的英文名「Erica」開發圍棋程式,一開始成績普通,但是漸漸地認識各方好手。

「黃士傑積極地向他們請教,時常越洋視訊會議。」林順喜說,後來也找了法國知名教授科隆(Rémi Coulom),和他共同擔任黃士傑的博士論文指導教授。科隆研發的「Crazy Stone」,是在AlphaGo之前最有名的圍棋軟體之一。

十年磨一劍

研發程式打敗日本團隊

黃士傑不是沒有遇到低谷,○三年以碩士論文《電腦圍棋打劫的策略》畢業後,他曾擔任林順喜的研究助理,其間也想放棄研究,到外面的軟體公司上班,後來還是放不下熱愛的圍棋軟體開發領域,回博士班就讀。

「其實他念博士早就可以畢業,但是為了想要和一流程式對抗,又多待兩年。」林順喜說,在台灣的資源有限,他總是鼓勵學生,要贏的關鍵,就只有「勤快」兩個字,而黃士傑也不負眾望,「為了寫程式,常常一天十六個小時都待在實驗室。」博士班第五年,黃士傑所研發的程式,已獲得不少獎項,其研究成果足以畢業,他卻不滿足,決定延續既有的研究成果。

一○年,在黃士傑的研究生涯第十年,他設計的「Erica」,擊敗了由日本工程師所開發、也是當時圍棋界公認最強、約有業餘五段水準的程式「ZEN」,在日本舉辦的「國際電腦奧林匹亞競賽」中榮獲十九路(編按:為標準棋盤尺寸,另有九路、十三路等)電腦圍棋金牌。來自台灣的博士生,竟然打敗由專業團隊研發的圍棋程式,是當時轟動的新聞。

「Erica」能勝出,其實和黃士傑本身的圍棋、程式雙棲能力有關,也因此他在一一年發表博士論文《應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》之前,就被加拿大的亞伯達大學網羅,之後更進入英國DeepMind擔任工程師至今,這家公司包含他在內,目前已有四位台灣人。

「要用電腦戰勝圍棋,比西洋棋、象棋等『擒王』型遊戲更難,需要『全局統計性』(布局走法更複雜),納入棋力較高的職業棋士的加入,才能擁有人類綜觀全局的能力。」知名的旅日九段棋士、近年也和趨勢科技合作開發對弈程式的王銘琬說。

一九九七年,IBM開發的西洋棋程式深藍(Deep Blue),曾擊敗當時的西洋棋世界冠軍,被視為是人工智慧史上的里程碑,但是相對複雜的圍棋則多年沒有進展。

常受邀和圍棋軟體對弈的王銘琬觀察,五年前,這類圍棋軟體和職業棋手的差距大約在四子(人類讓電腦先下四子),「之後即陷入瓶頸,一直沒有顯著進步。」根據DeepMind團隊一月登上知名期刊《自然》(Nature)的文章內容,寫到AlphaGo使用了兩種深度神經網絡,策略神經網絡(Policy Network)負責計算每步棋的走法,價值神經網絡(Value Network)則負責「想像」、推算可能出現的局面,以黃士傑為首的工程師群,也為AlphaGo載入超過三千萬步的棋步、兩千萬次自我對局的訓練,才走上正式與棋手對弈的舞台。

讓電腦會想像

千萬次對局磨出魔鬼細節

本次AlphaGo打敗全球在十年內擁有最多世界冠軍頭銜的棋王李世石,無疑是人工智慧的一大突破;然而AlphaGo的目標,不只是讓圍棋程式進化,更期待將人工智慧應用在醫療、生活等層面,可預期的貢獻更大。

黃士傑顛覆常人對工程師「一板一眼」形象,不但會下棋,還念過音樂班、會創作歌曲,理性與感性兼備,也許正是他帶領團隊開發程式過程中,能「更趨人性」地在複雜的圍棋遊戲,打敗人腦的原因之一吧!

撰文 / 賴若函

PermaLink: https://articles.zkiz.com/?id=190203

Next Page

ZKIZ Archives @ 2019