導讀 : 機器學習思考的方式與人類專家不同。

前言

在深藍成功挑戰國際象棋的19年後,2016年3月9日,谷歌公司的人工智能 AlphaGo 擊敗圍棋九段韓國棋手李世石。人工智能再一次刷新了機器智能的記錄,突破了人類最後一個智力堡壘。這一天,也將載入史冊。面對全新的人工智能技術,人類需要氣餒嗎?

“一個超出大部分人意料的結果

今天,2016年3月9日,發生了一件事情,當然不是那邊的日全食,而是地球這邊,谷歌人工智能AlphaGo與韓國棋手李世石的第一場中,AlphaGo 獲得今日比賽的勝利。雙方在較量3個半小時後,李世石宣布認輸。

“ 但大家都對機器很看好嗎?

其實不然,很少有人在這次的比賽中看好機器。在今天早些時候比賽進行的時候,我看過新浪網一個簡短的調查,49%的人認為,谷歌 AlphaGo 會 0-5 輸給李世石。

1

在大部分人心中,不管如何,應該或多或少都會隱隱地相信未來會更好,這點是毋庸置疑的,但在今天的結果的反轉上來看,我想,也許是大部分人接受不了機器發展的速度。

“ 一個大家依然質疑的問題,人類會輸嗎?

李世石可能會贏嗎?

雖然受到很大沖擊,但還是很享受這盤棋,並且很期待後面的比賽。這盤我沒下好,所以想後面的棋我勝算還是會很大吧,勝算會是五成吧。” 李世石在今天賽後是這麽說的。

我想他是以人類的方式方法這麽觀察和評估他今天的對手的。所以他認為依然有勝算。

但是!機器是沒有特定的 Character 的!

觀戰的金成龍九段說:“AlphaGo下圍棋不像人,可以說是超越了人類的風格。”

是的,對手似人,但不是人。AlphaGo 能快速學習李世石的棋風,但是李世石能知道AlphaGo 的棋風嗎?所以這里請允許我用一個詞“無懈可擊”。

而且大家不要忘記,這還只是一個 Alpha。

“ 這是為什麽?

19年前,IBM公司的“深藍”計算機戰勝了國際象棋世界冠軍卡斯帕羅夫。當初的方式方法真的追究起來,可以說是勝之不武,畢竟我們認為通過窮舉和作弊無兩樣了。

2

(圖:超級計算機“深藍”PK國際象棋大師。來自互聯網)

這一次不一樣。

由於圍棋的可能性如此之多,根本就沒有什麽套路可言。以前的窮舉的方式方法根本無法應用於此。下贏圍棋的唯一的辦法就是讓電腦也學會“學習”,而不是死記硬背。

3

(圖:AlphaGo 核心算法原理,來源:gogameguru.com)

簡單的說,深度神經網絡是AlphaGo的”大腦“,我們先把它當做一個黑匣子,有輸入端,也有輸出端,中間具體怎麽處理先不考慮。那麽AlphaGo的”大腦“實際上分成了四大部分:1、Rollout Policy 快速感知”腦“:用於快速的感知圍棋的盤面,獲取較優的下棋選擇,類似於人觀察盤面獲得的第一反應,準確度不高;

2、SL Policy Network 深度模仿”腦“:通過人類6-9段高手的棋局來進行模仿學習得到的腦區。這個深度模仿“腦”能夠根據盤面產生類似人類棋手的走法;

3、RL Policy Network 自學成長“腦”:以深度模仿“腦”為基礎,通過不斷的與之前的“自己”訓練提高下棋的水平;

4、Value Network 全局分析“腦”:利用自學成長“腦”學習對整個盤面的贏面判斷,實現從全局分析整個棋局。

可以這麽說,

機器學習思考的方式與人類專家不同。

這是一個不對等的思考。

AlphaGo 能快速基於海量的數據進行反複比較演練學習,李世石能夠在一晚上學習到嗎?

網上有個段子,“不怕AlphaGo 勝,就是怕它假裝輸掉。”細思極恐。

而且從某種角度看,傳統專家會消失殆盡。

這並不是一句戲言。如果上面講解 AlphaGo 的原理過於技術化,我們依然可以通過這樣的方式進行闡述:

如果非要把專家和機器智能進行比較,我們可以這麽絕對的理解。以一個人類的技術專家為例,他的大部分的經驗模式是從可能長達10年的從業經驗上累計必要的事件數據,然後總結這種可能存在的模式並不斷測試累積,而技術專家之間又通過一定的方式不斷進行知識傳授和交流,從而實現因果的轉換。

那麽機器呢?

過去,很多行業專家對於數據的理解是基於統計的。他們總是想從中得到一些啟示,然後再基於他們自己的大腦進行思考決策。這也是我個人在給一些部署和實施數據智慧應用項目中遇到最大的非業務問題,從方案到實地評估等過程無一不充斥著這樣的難點。

可見,雖然很多人打著大數據的旗號,但依然采取這種工業3.0時代信息化的做法的話,效率將是非常低的,換作企業的話,這在新的中國制造方面也會很難走出成效。

因為人類大腦根本無法處理這種維度和量級的數據。

因此,不管企業還是社會,如果希望通過大數據和計算獲得新的生產效率,勢必要從不肯放手的,強定勢思維式的分析角度,切換到一個新的角度。

“ 與其掌控,不如放手。

這不是機器替代人的時代,而是人放手讓機器為他服務的時代。帶著傳統的思維嘗試去掌控是沒有意義的。這也是從工業3.0跨越到4.0必走的路。

工業3.0時代的特點

過去,我們給機器裝了一盞報警燈,試圖讓機器變的更智慧,可惜,並沒有如願。

從某種程度上,人對機器還是不放心,總是希望人能夠及時看到或得到第一手的警報信息進行處置。

但是,人真的能看到故障信息就馬上找到故障原因嗎?

工業4.0時代的特點

因此我們需要認識到的是試圖掌控,實則毫無所控。傳統手法的信息化建設並非一無所用,只是需要更高級的方式,跨維度層次的應用。結合我們實際的企業實施項目來看,必不可少的是:

1、從機器的角度重新治理數據信息;

2、在合適的位置及時應用機器智能;

3、轉變觀念,向機器傳授知識並鼓勵它自學習。

作者:Hyman追燦數據首席數據官,資深數據科學及應用解決方案顧問。