📖 ZKIZ Archives


李開複:創新工場為什麽看好人工智能?

來源: http://www.iheima.com/zixun/2016/0717/157465.shtml

李開複:創新工場為什麽看好人工智能?
李開複 李開複

李開複:創新工場為什麽看好人工智能?

我們人所想象的機器人一定會先在商業領域出現,之後才會在家庭有希望。

創新工場CEO李開複7月16日在2016矽谷高科技創新·創業峰會上表示,創新工場正對人工智能進行非常大的布局,到今天已經投資了接近1億美金,接近25家公司。

他談到,人工智能之所以強大的原因在於,“今天人類做的大部分工作是重複性的,是基於一個有限的領域的,是基於可以客觀思考甚至窮舉的。這些工作在未來的十年都會被人工智能取代。”

同時,李開複列舉了十個有可能在未來十年被機器人取代的職業:包括翻譯、記者、助理、保安、司機、銷售、客服、交易員、會計、保姆,他認為,這些職業中的90%的從業者將會被機器人取代。

李開複表示,在這些領域里,人工智能不是模仿人類,也不僅僅是取代人類,所謂的人工智能就是用特別巨大的數據集看到一個人一生,甚至一百個人一生,也不能看到那麽多的數據,然後用數據推算出邏輯、判斷和推測,來做比人好的判斷。

以下是創新工場CEO李開複演講實錄:

我們今天管理大約12億美金的基金,投了接近300個項目,包括好幾家獨角獸。但是今天我想特別講的是我們投資的一個專門的方向和趨勢。

創新工場的特色是做技術型的投資。我們自認為最專長的是看到一個趨勢的崛起,並對這個趨勢做深度的分析,而且非常早期的布局。

比如說在2009年我們對移動互聯網的投資,在2011年左右我們對娛樂內容的投資,而我們今天正在對人工智能做一個非常大的布局。到今天已經投資了接近1億美金,接近了25家公司。

我們今天想分享一下為什麽我們會特別的看重這個領域?

最近人工智能得到全球關註主要是因為阿爾法狗擊敗了李世石。在很多的世界媒體上我們看到的,就是機器是否會取代人腦?我個人認為沒有足夠的科學根據,讓我們想那麽多,擔心那麽多。

而短期讓我們更應該關註的是怎麽用人工智能,我們的工具,我們的奴隸來為社會創造價值,來為創業者創造機會。

為什麽人工智能會這麽強大呢?就是因為今天人類做的大部分工作是重複性的,是基於一個有限的領域的,是基於可以客觀思考甚至窮舉的。這些工作在未來的十年都會被人工智能取代。

這些工作我這里列了一些,如果你們不太相信的話,我們可以舉幾個例子。今天美國的美聯社90%的稿件已經是機器人取代了。

在過去的十年華爾街交易員已經一半下崗離職了。未來我們肯定會看到無人駕駛的車,當這一天來到的時候,世界上大約9%的人他們部分或者全部的工作就即將被取代。當然無人駕駛可能還需要十年的時間,但是十年不是很久。

怎麽能做到呢?其實在這些領域里,人工智能不是模仿人類,也不僅僅是取代人類,所謂的人工智能就是用特別巨大的數據集看到一個人一生,甚至一百個人一生,也不能看到那麽多的數據,然後用數個數據推算出邏輯、判斷和推測,來做比人好的判斷。阿爾法狗就是研究了幾百萬的棋譜和花無數小時的時間來打敗人類專家的。

有人說這個公平,一個棋手不可能花一百萬個小時研究棋譜。這不是公平不公平的問題,而是我們如何用人工智能做出人不能做的的。最近特斯拉出了一個問題,大家可以想想它有幾億小時在車的進行中,這些數據來難道不會做比人更好的司機嗎?這一天還沒有到,但是如果有一個司機做十億小時的練習,哪怕他開始像個孩子,學完以後難道不會超過人類嗎?

我們可以想像,如果有一個人臉識別的機器,它把全世界罪犯的臉都背下來了,有人能夠做到這一點嗎?所以從這個例子可以看到,我們不用絲毫的懷疑人工智能會全方面的超越人類。

但是這不是在所有的領域里,是在一些領域可以窮舉的領域,或者可以客觀分析的領域,或者有正確答案的領域,有大數據的領域,而且是有專家參與的領域,所以它會逐漸的發生,不會一次到位的發生。

我個人有幸在三十年前開始做人工智能,但是可惜的是當時數據不夠,所以並沒有做太多超越人類的事情。所以各方面我們可以看到對弈只是遊戲的領域,它本身並不帶來巨大的商業價值。

更多我們在業界會看到的可能是感知,就是用算法,人工智能來做判斷或者反饋,這個時候機器就要動起來了。

我們可以看到過去七八年來有特別大的進步,這是為什麽呢?這是因為在機器學習的領域有一套技術叫做深度學習。它是帶來了巨大的變革,今天可能沒有時間太解釋這套算法。但是簡單來說,就是過去人是需要一步一步地告訴電腦你該怎麽走,該怎麽做,之後人可能說我一步一步來教你可能會犯錯,可能不全面,可能也不適合計算機的結構,更適合人腦的結構。

但是是不是就是人來說,就先對人臉找眼睛、找鼻子、找耳朵,但是這個大概是所謂的專家系統,就是人告訴機器一切,然後機器來計算,這個大概是三十年前的技術。

大概十五年前的技術是人落找特征,機器學參數。這里就是人告訴他識別人的時候找眼睛、嘴巴,然後你再來計算。這個有一個提升,這是人機結合的學習。

深度學習的技術應該算是最近五年推出的技術,這個技術幾乎人都不參與了,特別神奇的地方,給看一億張臉,你自己看,該學習眼睛、嘴巴,還是別的事情,也許法令紋更重要,也許耳朵的大小更重要。我們不要假設人比機器更重要,我就把大量數據給你,讓你收取你認為重要的特征。

而且這些特征只有機器懂,人都聽不懂的。這就是阿爾法狗戰李達以後世石的時候,下出了人類頂尖棋手都沒有辦法看懂的步驟。這就是深度學習,它能自我學習,抽象的概念。

而且這個抽象概念超越了人類的想象,因為它用的數據集比人更大。它就像一個孩子,能夠自我學習,而且數據量夠大的時候,什麽都學的會。所以這大概解釋了什麽是深度學習。

深度學習,這是一個識別物體的領域,而且是有人標註的數據庫。我們可以看到大概僅僅在五年前,一個機器跟人的差別還是一個74%對94%的差別。如果算錯誤率的話,可能是六七倍的差別了,所以不太能夠用到實際的場景里。但是每一年都在快速的進步著,我們可以看到在2014、2015年的時候已經超越人類,而且差距越來越大。

就是說當機器識別人臉,比人更厲害的時候,那些以識別人臉工作的人就要下崗了。同樣的,識別也超過了人,語音識別超過了人,像客服,比如每天打電話賣房地產產品的人,以後打電話的不是人了,因為機器比人更聽的懂。

所以當每個技術超越人的時候,它帶來的機會是巨大的。所以我們要認為下一個階段,未來的五年什麽東西產生巨大的價值,可能有這些領域,當然這些領域包括了高科技,用麥克風,用攝像頭等等的,這些會產生很大的價值。但是還有另外一個領域,就是如果一個領域有特別大的數據了,只是這個數據沒做挖掘,沒有產生價值。

比如說商業化的流程,比如說互聯網的數據。所以今天誰最適合做大數據人工智能呢,其實就是BAT,在美國就是Google、微軟和FB,因為他們已經有互聯網大數據。這些怎麽做到呢?

像百度搜索的十個結果,我一個都沒有點,這暗示這十個都不好,但是這不是絕對的暗示,但是數據足夠多,是可以充分的學習。其實這些BAT走在使用,滴滴、美團都在使用,只是在創業領域大家還沒有足夠的機會。

這個世界上還是Google做的最好,因為它有世界最大的數據集,它使世界上做人工智能做的最早,然後再加上Google多年累計了大浪的技術人才,還有特別快的機器。

所以為什麽Google做出來阿爾法狗,而不是BAT,美團和小米。但是Google的野心不僅僅是阿爾法狗。前幾年我們看到Google自我命名為Alphabet,是互聯網的一家公司,它可能還有做醫學的公司,可能還要做基因檢測的公司,可能做汽車等等領域。

Google做智能產品的過程中發展了一套Google大腦。其實Google里有兩套大腦,這個可以用到各個領域。發現這個大腦,其實才是它的最大價值。在其他的領域,只要有數據就可以啟動。

所以Google擁有了巨大的數據量,它們啟動了數十個不同的項目。在美國有一些機構,比如OpenAI,也擔心,Google如果這麽多數據,還有沒有機會跟它競爭,它歸不會人類知道的太多了。

我覺得這類的問題對Google,對FB,BAT,我們作為消費者和媒體都要擔心他們。當然的最好的辦法是讓更多的人參與到這個領域來創業,這樣就不會被某一個壟斷了。

Google有這麽大的野心,我們怎麽知道是深度學習呢?這是Google用深度學習的數量,在過去的三年可以一看到深度學習的數量和應用的領域在大大提升。所以剛才講的並不是空穴來風。

這麽好的機會我們怎麽捕捉這個機會呢?講了這麽多樂觀的事情,我要稍微保守地告訴大家說,這並不是人人能做,做起來也不是很簡單的。

第一,有些領域是要平臺

比如開發一個蘋果APP,或者安卓的APP,使要有平臺的。你只要是計算機程序員就可以學會開發一個安卓APP。但是你即便是一個優秀的程序員也沒法兒用深度學習,因為這個還沒有平臺化,你還要知道進去很多微調的東西。這方面的專家可能只有幾百個人,所以這樣的人才很稀缺。

第二,需要海量的數據。

說一千萬的數據就是大數據,其實那是小數據。真的要機器學習要用用武之地,要有更巨大的量。這些數據儲存,還有存儲量。我們都認為這個超越人了,可以倒過來解釋給我們聽,但是機器學習沒有辦法告訴你怎麽決定的,你要相信就相信,按照結果說話,回來說怎麽打贏李世石的,說不出來。

怎麽做呢?買這個數據,標註這個數據,不要浪費錢,GPU可能比CPU好用。

第三,找專家,這樣的專家真的不多。

Google已經開出九位數的代價挖這樣的專家。這是我們過去不能夠想象的,在國內我們也看到,比如說看到投資的Face++,最近也是努力挖到了華人在深度學習的研究員,這些人才的價值使特別巨大的,因為非常稀缺。

但是話說回來,這個稀缺也是未來兩三年的現象,之後我覺得會有很多聰明人,尤其在中國會湧入這個領域。因為重賞之下必有勇夫。

最後,是學怎麽調這些參數了。但是有這些東西還不夠,深度學習說實在的還會有一些挑戰,最後貼貼補補還不能完成你的應用該怎麽辦呢?就要用巧妙的,非技術的方法,就是不要取代人,而是輔助人就好了。

比如做安防的人,他不一定帶著槍的機器人,他只要帶著攝像頭,拍出來的東西告訴人,這邊動靜,那邊的窗子壞了,其實就夠了,所以輔助人就夠了。還有輔助醫學,我們不是說取代醫生,但是可以給醫生做一些工具是完全可以的。第二,我們有容錯的界面,其實搜索引擎就是容錯的界面,界面設計的好也能彌補人工智能的不足。

第三,怎麽用草船借箭的方法,從用戶那邊拿多數據。我沒有數據,就像當年孔明沒有箭就是借來的。所以不一定是要買或者數據在有些例子是可以創造的。

最後,我們不要解決最大的AI問題,而是我們是不是能局限於領域一領域和場景?比如為什麽要全天候無人駕駛,為什麽在可控的領域做好無人駕駛呢?

現在特斯拉的車,我們看到這次出車禍,就是它分不清巨大的卡車和天空的顏色。我們就找一個領域不會有巨大卡車出。而且阿爾法狗怕的是天黑、下大雪,我們就找一個不一樣的場景。像在智能倉儲里做一個插車機器人,這個倉庫里燈光和環境是可控的,這里不會下雨和夏雪,不會有卡車出來。所以用一個聰明的局限領域來創造價值。

這是今天一張重要的PPT,但是我也能保證這張是有錯的,因為沒有人可以預測未來。我們相當看好大數據,尤其是剛才談的金融領域,因為它有最大的黑盒,能夠產生最大的效應,也能吸引最大的應用。在感知方面有一個誤解,就是自然語言理解。就是聽到語音了,變成字了,我就懂了。

因為人是很容易懂的。但是聽,識別你講的字,和懂你的意思還是有一個特別大的鴻溝。這點我覺得至少五年,甚至十年的時間才能突破。

人方面都想做家庭機器人,我們認可是有商業價值,能掙錢,省錢的,而不是家里有兩條腿、兩個手的人在家里跟你打打招呼的,這樣是不能滿足家庭期望值的,這個在日本可能是可以的,但是我不認為有一定的代表性。

這樣的機器人好玩兒,可以做老人陪伴,可以做小孩的玩偶,但是就是這麽多了。要期待它幫你炒菜、掃地,成為家庭主婦,或者家庭的新的一員或者新的電器,這個還是一個天方夜譚。當然你很聰明的把這個機器人做成了一個音響,或者做成了陪伴老人的小機器,像我們投資的小魚在家,當然也是可以做的。

但是我們人所想象的機器人一定會先在商業領域出現,之後才會在家庭有希望。

最後關於無人駕駛,就是怎麽樣去應用我們的約束,讓它在有些場景可以有用,先幫助人,人幫助它,最後才是無人,而是這還是在十年以後。

創新工場過去兩三年在悄悄的耕耘這個領域,因為有些領域投資一對外公布,這個領域很快就被玩壞了,現在我們投資了20家公司,我們願意和大家分享投資的兩家公司,就是Face++  ,還有駕勢科技,這兩個項目應該在國際上達到了很高的知名度。

除此之外,我們還投了很多公司,像地平線機器人,它是硬件平臺來打通這個領域,而且它會用大家電來做它的第一步的切入。

或者我們投的第四範式,它在銀行和保險業做了非常大的突破。我們將在下個禮拜做非常大的發布會,讓大家知道它做的事情,怎麽改變了中國的金融領域。還有很多中國和美國的投資。

因為深度學習需要非常大的數據量。我們跟像富士康這樣的公司有很深度的合作。所以這個領域我們是特別特別的看好,希望今天的演講對大家有些啟發。

李開複 人工智能
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=205297

Next Page

ZKIZ Archives @ 2019