📖 ZKIZ Archives


創新工場王詠剛:人工智能時代的科研與創業

來源: http://www.iheima.com/zixun/2016/1220/160425.shtml

創新工場王詠剛:人工智能時代的科研與創業
創新工場 創新工場

創新工場王詠剛:人工智能時代的科研與創業

當我們把人工智能定義成依賴於機器學習為主的技術,來擬合世界的一部分,就會發現,這樣一個定義可以很自然地應用到我們的生活中。

本文由創新工場(微信ID:chuangxin2009)授權i黑馬發布。

當下是人工智能的黃金時代,那科研里面人工智能的角色是什麽?創業里面人工智能的角色是什麽?人工智能如何從書本上跳到真實掙錢的公司產業,能夠創造出許多既賺錢,又實現人生夢想的企業家和創業者呢?

近期,創新工場AI工程院副院長王詠剛在北大做了一場名為“人工智能時代的科研與創業”的演講,在此次演講中,王詠剛從美圖上市談起,談到人工智能的科學定義,人工智能的歷史,科研與創新的關系,以及人工智能最近這次熱潮背後的技術驅動力和創投規律。以下是演講全文。

剛剛大家看了創新工場相關的視頻,里面有一家叫美圖的公司。美圖馬上就要在香港上市了(12月15日,美圖公司正式上市),這是創新工場投資的一個開始成長為獨角獸的公司。

其實,美圖也是一家AI公司,有非常多的可以用人工智能的地方,最典型的的就是人臉識別。除此之外,還有很多可以應用AI的地方,比如,傳統的磨皮是典型的數字圖像處理算法,但是不是也可以用人工智能技術來改進呢?讓機器學習什麽是最白最美的皮膚,什麽樣的磨皮方式和現在要處理的皮膚是最匹配的。這樣,就能既做了臉部美容,又因人而異,保持每個人的皮膚和臉型特點。

美圖有世界上最大的人臉數據庫,也許其中女性臉部居多,但也因此有非常廣泛的人工智能應用場景。在這樣的創業公司里面,人工智能變成了公司的內在驅動力。而美圖本身就是一個非常技術化的公司,美圖上市後,會變成一個獨角獸規模的公司,它未來的發展一定會不斷引入新的人工智能技術。

所以,今天我想跟大家討論的主題就是科研和創業的關系,它的核心話題是人工智能。大家都知道現在是人工智能的黃金時代,那科研里面人工智能的角色是什麽?創業里面人工智能的角色是什麽?人工智能如何從書本上跳到真實掙錢的公司產業,能夠創造出許多既賺錢,又實現人生夢想的企業家和創業者呢?

我們先看第一個問題。

什麽是人工智能?

這個問題,我覺得對計算機專業以外的人和計算機專業內的人,對不懂機器學習的人和懂機器學習的人,得到的答案未必是一樣的。而且我相信,即便是同樣學計算機的人,即便是同樣懂得機器學習或者深度學習的人,對於什麽是人工智能,給出的答案也未必是一樣的。

很多人說人工智能的時候,腦子里會出現一個像人一樣的機器人。這個圖景在科幻小說里比較常見,在科幻電影里比較常見。但不要把它想象成,僅僅是非專業人才會想象的一個途徑,專業人為什麽不能想象這樣的人工智能定義?

專業人士天天看教科書,看數學公式。可是你看這些數學公式的時候,有沒有想過,這些東西未來的某一年會不會突破某一個臨界點?會不會讓你做的一個程序變得真正和人一樣聰明,甚至比人還聰明?如果你的答案是“會”,那麽為什麽?如果你的答案是“不會”,那麽又是為什麽?

我們完全可以從數學的角度,從計算機科學的角度去想一想這些理論上的問題成立不成立。我們應該建立一些相對比較科學的邏輯,就是當你去看待人工智能是什麽時候,你應該有你自己科學的邏輯,有你自己科學的認識,或者說你自己科學的定義,然後從科學的角度,判斷人工智能技術會不會突破臨界點。

22222222222

今天流行的深度學習技術是機器學習算法的一種。而機器學習從本質上來說,其實就是用數學或計算機科學的手段,對世界的局部或整體進行建模。如果世界簡單到黑白分明,那一個簡單的線性函數就能描述這個世界。但我們要處理的局部世界的問題總是越來越複雜的,因此就需要越來越複雜的算法、函數來描述這個世界。

深度學習之所以取得這麽大的進展,主要還是因為深度學習提供了一種非常豐富的、非常有描述能力的建模方式。比如許多許多層的神經網絡結構可以模擬非常複雜的世界規律。

學數學的、學計算機科學的同學不妨在腦子里做一個頭腦實驗:如果深度學習的網絡結構是可以不斷擴展的,那麽,多複雜的神經網絡才可以描述我們身邊的真實世界?這一方面取決於實現深度神經網絡的計算結構、計算能力是不是真的可以不斷擴展,另一方面取決於我們如何理解這個宇宙的複雜度。

假設你的答案是,深度學習在未來可以通過不斷擴展,達到描述這個真實宇宙的能力,那不用說,基於深度學習的人工智能算法一定會超越人類的智慧。因為人只不過是這個宇宙中的一部分,人的智慧也不過是建立在對身邊這個真實世界的建模的基礎上。當然,你的答案也可能是否定的。但這個頭腦實驗會是個非常有意思的實驗。

為什麽我們說人工智能就在我們身邊呢?

當我們把人工智能定義成依賴於機器學習為主的技術,來擬合世界的一部分,就會發現,這樣一個定義可以很自然地應用到我們的生活中。

333333333333

這是一個手機截屏的圖片,可以看到,這個手機上裝了非常多的應用。

事實上,當我們在用手機的時候,很多常見的應用,已經嵌入了人工智能的特點和特性。比如說微軟小冰可以跟用戶聊天;滴滴出行、亞馬遜購物這些應用里面的一些推薦算法都會自動推薦最好的產品,或給出租車司機安排一些最好的路線;而Google、百度這樣的搜索引擎本身,事實上已經是人工智能驅動的了,無論是搜索結果的排序,還是搜索引擎智能回答一些人類問題,這背後,都是基於機器學習的人工智能技術

回顧人工智能的歷史

我們基本可以把人工智能的發展劃分為三次熱潮,每次熱潮其實不太一樣,但貫穿這三次浪潮的,有一個很有意思的現象,就是都有下棋這件事。下棋是人工智能的研究者最愛用來展示人工智能技術的一個領域。原因在於,一方面,下棋是人類智慧的一個體現,機器一旦在這個領域取得突破,所有人都會覺得很吃驚,另一方面,解決機器下棋的問題,涉及人工智能研究的許多根本性技術,像搜索啊,貪心算法啊,強化學習啊,等等。

五六十年代的人工智能大師在通用計算機剛剛誕生不久、計算能力還非常有限的條件下,純粹通過數學或者非常原始的編程模型去實現他們心目中的人工智能。早在那個時候,那些人工智能大師就已經看到了下棋這件事。圖靈曾在他生命的最後幾年,在紙上寫過一個可以實現國際象棋原理的代碼,只是當時的計算機的處理能力不夠,這個代碼沒有辦法變成一個真正的可以與人下棋的程序。

實際上,五六十年代有一種比較適合當時計算機能力的棋類,叫西洋跳棋。計算機的西洋跳棋程序曾經在五六十年代戰勝了一個人類的專業西洋跳棋棋手。雖說對手在專業級別水平也不算很高,但當時的電腦,你們想象一下,是什麽樣的,電腦處理能力又是什麽樣子。電腦戰勝了人,所以在當時是一個小小的轟動事件,意味著人們已經開始關註人工智能。

當西洋跳棋勝人之後,人們會說,計算機好厲害,是不是要毀滅人類了。可沒過幾年,人們就會說,西洋跳棋太簡單了,國際象棋這種才能代表人類智慧。計算機不是厲害麽,那麽你下個國際象棋試試?

後面的故事大家都知道了。1997年IBM的深藍戰勝世界棋王卡斯帕羅夫。那時候,我在讀大學,那件事給我的震撼,給我們這些懂編程的人的震撼,一點都不亞於今年3月AlphaGo戰勝李世石時帶給我們的震撼。

可沒過幾年,人們又覺得,戰勝國際象棋的計算機程序其實也算不了什麽。我們人類不是還有圍棋嗎?今年3月以前,很多圍棋培訓班的老師都會對孩子們說,圍棋是目前唯一一種沒有被計算機攻破的人類智慧運動。可結果呢?

444444444444

這種所謂人類的智慧遊戲貫穿著機器的AI發展史,成為技術人員和普通人的認知能力之間的一個非常好的橋梁。你給普通人講人臉識別,他最多會當作一個計算機的技能,就像所有的停車場都會識別車牌一樣,他不會覺得這個東西有多困難。一張人臉,普通人只會把它理解成鼻子、眼睛嘴巴。很多不會下圍棋的人,認為圍棋也不過如此,但會下圍棋的知道圍棋的深淺是深不可測的。所以一旦計算機在圍棋上贏了人類,那人類受到的震撼遠遠不是一般的技術超過人類所能夠比擬的。

我講歷史,只是想告訴大家,人類是一個健忘的動物,也是一個喜新厭舊的動物。設想一下,過兩年Alpha Go已經遠遠超過所有人類棋手,連手機上的圍棋也可以輕松打敗人類的九段,那時候人類還是會說,圍棋算什麽,圍棋可不能算人工智能,這個東西太簡單了,計算機必須拿出更大的本事來,才能被稱作人工智能。

很有意思,人類就是這麽嘴硬。當然,這也可以認為是普通人對於人工智能定義的自適應性,就是根本沒有一個量化的標準。計算機智能在不斷發展,但到底發展到什麽程度,才是普通人心中的人工智能呢?這個尺子一直在變。

深度學習的複興

從技術本源上說,深度學習有好幾十年的歷史。但2006年,才是深度學習複興的一個標誌性的年代。這不完全是因為深度學習的鼻祖Geoffrey Hinton在這一年發表了那篇著名的深度學習論文,其實,在2006年前後,深度學習賴以發展的大數據、計算能力、移動互聯網等等,都開始發展和成熟起來。

從2006年開始,業界慢慢具備了大數據的能力和計算能力。對世界建模的前提是這個世界要有豐富的數據供計算機來學習。但是在2006年以前,這個數據是非常非常匱乏的,這個世界擁有數據,但這個數據未必能夠被數字化,或者未必能夠數字化之後未必能夠被收集起來。

那麽2006年前後,產業革命發生了非常大的變化,我相信大家能夠想到一些,一個非常大的要點就是搜索引擎,搜索引擎起到了把大數據聚合起來一個提綱挈領的作用,它把所有的網上信息都聚合在一起了。

另一個非常有標誌性的技術進步就是移動互聯網。移動互聯網讓我們每個人都可以非常方便地為這些大數據庫來貢獻數據。你在網上的每一次購物,每一次打車,每一次點擊行為都會變成大數據的一部分。

有了這些大數據,也有了一定的計算能力,深度學習就有了用武之地,這是深度學習複興的根本。

人工智能步入黃金時代

有人說現在人工智能這麽火,這麽多人給出高價來招聘人才,這麽多創業公司這麽多錢堆上去,這次的人工智能浪潮會不會又像前兩次一樣,馬上就跌入低谷,沒有後續了呢?

我們不是未來預測學家,也沒法預測未來,但是我可以給大家一個我們創新工場的判斷。

第三次人工智能浪潮和前兩次相比,有著本質的不同,這是因為,在很多的垂直領域,人工智能第一次展現出來計算機能把一件事做到足夠好的能力。

至少在語音、在視覺等垂直領域,計算機做的事情都可以超過人類的心理閾值。是否超過心理閾值,是人們是否接受你的產品,接受你的技術的一個前提條件。

555555555555

比如語音識別,人類對語音識別的準確率一定會有一個心理閾值。一旦你低於這個閾值,不管你是低1%還是低50%,人們都會認為這個產品是沒用的。只有你高於這個閾值,人們才認為這個產品是有用的。

至少在視覺領域,在語音識別領域,在深度學習工作得非常好的領域,第一次第二次人工智能浪潮的時候,這些技術雖然發展到了一定的高度,但是還沒有達到人類的心理閾值。

而第三次人工智能浪潮非常不一樣。

大家可以回想一下2014年這個時間節點,普通人大概是在2016年知道人工智能這件事。但科研界的人更多的看到的是科研數據上的突破。比如機器視覺,科研界通常用ImageNet視覺比賽的結果來衡量機器視覺的發展程度。恰恰是在2014年,基於深度學習的計算機算法在ImageNet上超越了人類,一下子將識別錯誤率降低到了比人類識別錯誤率還低的程度。

一張圖片上有多少個人臉,有很多相對模糊或者相對陰暗的人臉,人可能都未必分得出來的時候,計算機就認出來了。在這種情況下,說明計算機在視覺領域解決方案達到的程度已經超過了人們的心理閾值。所以人一下就感覺這個東西有用了。

這是我們想說的第三次人工智能浪潮和前兩次浪潮的本質不同。這個本質不同帶來的結果是,計算機人工智能的程序,人工智能的應用真正能在商業領域開花結果,能在商業模式里賺到錢了。以前是拿人工智能“騙錢”的,現在是拿人工智能賺錢的。

所以會說從2006年開始的這樣一個第三次人工智能浪潮,創新工場非常確信它會是一個產業革命,會進入一個穩健的發展、成熟期,而不是一個曇花一現的浪潮。原因就是我剛才說的,在很多領域,它已經超過了人的心理閾值,已經變成了一個可以用的算法或者說可以用的工具。

剛剛提到深度學習複興,其實在人工智能的第三波浪潮,它做到了在多個領域超越人類的心理閾值,並開始創造商業價值。這些領域可能包括識別領域、自動化領域、互聯網大數據領域。而深度學習,或者說人工智能正在解決這些領域里的問題。

66666666666666666

如果說在這些領域里面比較一下,我們認為可能未來最大的領域是無人駕駛。

無人駕駛

為什麽說人工智能可以代替司機?

我不知道大家對人工智能或者說無人駕駛,是怎麽預期的。是預期每天去哪里都有無人駕駛車來接你,還是會預期每個人家里買一輛無人駕駛汽車?

業界主流的判斷會認為,無人駕駛會首先從一些限定領域進入我們的生活。比如說在美國,現在業界看好幾個無人駕駛落地、產生商業模式的機會,其中之一就是貨車運輸。因為貨車運輸相比較來說有固定路線,同時對人類來講,貨車運輸是一個非常艱苦的工作。貨車運輸用無人駕駛可以大大提高效率。

在美國實驗過,把若幹輛貨車編排成一個車隊,貨車之間間隔2米或1米,然後在路上就像一個火車一樣。只有最前面的貨車有一個人類的司機幫忙監控一下,後面的貨車都跟著前面的貨車的行為來走,可以保證不會追尾,然後快速地把大量的貨物像火車一樣,從一個地方運到另一個地方。

所以這是美國人非常看好的一個無人駕駛的應用領域,但我覺得這未必是中國的第一個應用領域。中國有中國的特點,很多中國的無人駕駛公司已經在設想許多特定的領域,開展最早的無人駕駛商用化的實驗。

比如說,在我們北大的校園里,先把校車做成無人駕駛。校車的好處是路線固定,範圍固定,時間固定,就連校車能夠遇到的交通標誌和障礙都是已經確定的。那麽在這個基礎上,要解決的問題相對簡單得多。

所以人工智能取代人類一定是一步一步的,絕不會有一天,你睡覺起來發現樓下司機全沒了,全變成無人駕駛的,這是不可能的。當無人駕駛在生活中潛移默化地一步步取代你的時候,甚至你都感覺不到人工智能來了,你會說什麽智能,不就是開校車嗎,這不叫無人駕駛。

直到有一天,無人駕駛的出租車來接你了,你可能也未必覺得它是人工智能。這個例子只是告訴大家,就是人工智能會悄悄地成為我們人類的幫手,甚至在你無法覺察的時候。

但是對於我們專業的人來說,我們應該盡量留意這些事情,盡量去看到什麽東西可以給我們創造機會,什麽東西有潛在的商業價值,而自己應該在里面扮演什麽角色。

時代的技術主流

其實,計算機的發展經歷了非常明顯的時代化。在每一個時代,只有一種技術可以主導,也只有符合時代技術潮流的公司才能生存下來。在1990年做人工智能,敵不過那些做PC和互聯網的,但是今天就不同了。今天已經不是PC時代或早期的互聯網時代了。今天,你能跟聯想搶PC的生意嗎,能跟戴爾搶顯示器的生意嗎,能跟百度搶搜索引擎的生意嗎?作為創業者,必須在最好的時代做這個時代里最有機會發展起來的事情。

創新工場認為,當今時代的主流方向是人工智能。

未來5到10年甚至更長一段時間的主流是人工智能,如果你們有創業的理想,恰好又學過人工智能,那就處在了一個非常好的,也是非常有挑戰的位置上。這個時代正在召喚創業者,這個時代正在召喚像PC時代的柳傳誌,互聯網時代的李彥宏,移動互聯網時代的王興那樣的創業者,來投入到人工智能的創業浪潮中。這個未來的創業明星,也許就在你們中間。

77777777777777

創新工場會把一個新興的產業,比如人工智能,按照架構分成不同的部分。在不同的部分,會有不同層級的公司進行創業,從而搭建整個生態環境。這種劃分是我們創新工場,用來指導人工智能投資的基本原則,在每一種細分領域,都有可能創造出很多十億級別百億級別,甚至萬億級別的初創公司。

一個最有趣的例子是Google。我在Google的時候很多事情未必看得那麽透,但是我離開後,從局外人的思路看很多事情,會看到一些規劃確實高人一籌。比如說,當年Google和百度一樣都是在做桌面搜索引擎,但是Google是第一個從桌面搜索引擎提出了移動優先的策略,這為移動互聯網打下了非常紮實的基礎。同樣的,Google在2011年就開始做谷歌大腦,在2012年就提出了AI First的戰略,基本是走在了所有科技公司的最前面。

Google每一個產品,只要能和人工智能結合的,它都會選擇結合。因為人工智能會在很多領域提供一些高級算法。在座的學過深度學習的應該比較清楚,深度學習的平臺化是一個非常大的挑戰。我相信在未來3年左右的時間,會有一個非常徹底的改觀。因為很多公司包括谷歌在內都在大力地做這些方面的事情。其次呢,深度學習需要大量的數據,可能要百萬千萬甚至億級數據,才能達到一個非常非常好的效果。但其實,有些領域根本就沒有所謂的海量數據,更不要說大數據了。那反過來講呢,深度學習這種對人類世界的建模方式,是唯一的建模方式嗎?我覺得未必,在未來幾年,大家可能會發明出更好的建模方式,去適應那些缺乏大數據的領域。

機器雖然在模仿人,但其實只是模仿人的一部分。人的學習有一個非常大的特性,叫舉一反三。我們家孩子只有5歲,可是我清楚地記得他兩歲的時候,我帶他去商店里,看到小孩玩的那種滑板,他就看了一眼。然後過了很久,他又到一個場合看到了一個不一樣的滑板,他馬上就說,這是滑板。而計算機視覺程序,這些對象識別程序要學上百萬張滑板才能辨別出來。這是計算機和人一個非常大的差異。

大家應該知道,現在正在研究的許多熱門領域,比如遷移學習,比如少樣本情況下的機器學習算法等等,就是讓機器來更好地模仿人類的智慧,而不是必須有巨大樣本量的情況下才能學到東西。

創新工場布局藍圖

這是創新工場,為人工智能未來的發展和投資所畫的一個藍圖。這也許是今天我的演講里最重要的一張圖。

8888888888888

這是我們對機器學習對深度學習,對人工智能在各個垂直領域,在不同的應用場景,幾年內走向成熟,幾年內走向產業化的一個預判。大家可以5到10年後再拿出這張圖來看一下,看看創新工場的對未來的感知,是不是像當年對移動互聯網未來的感知那麽準。

這是創新工場目前在人工智能的布局。右邊的方案是我們正在投資或者已經投資的人工智能的公司,這里面有很多公司已經發展得非常好。

999999999

比如曠視,美圖,馭勢,第四範式。說到第四範式,大家可能感覺名字比較奇怪,他們做的是商業智能,把金融行業的數據拿過來,幫助建立這些金融行業需要的各種模型。大家知道金融行業數據可能是現在所有行業里面數據最全,質量最高,同時是對數據的需求最大的一個行業。

創新工場實際上已經投入的人工智能相關的公司就有大概20家,同時在左邊,我們希望利用新成立的人工智能工程院來做一些人工智能的早期研究和早期孵化。

對正在學習的和即將畢業的學生來講,這都是一個好消息。如果你們想從事人工智能,如果有創業的打算,想趕上這波人工智能的大潮,那創新工場的人工智能工程院可以提供一個非常好的機會。

如果是畢業應屆畢業生的話,可以以工程師或者研究員的身份加入,如果是非應屆畢業生,可以申請實習。我們和從美國回來的大牛一起來搭建四五個小項目。每一個小項目,做人工智能領域的一個方向,包括自然語言處理,機器視覺,數據挖掘等。做項目期間,可以拿工資,可以接受導師的培養,不用定點上下班,只要完成任務就可以。在這里可以學習到足夠的知識,也能夠為科研貢獻一份力量,還有可能走上創業的道路。

問答環節:

1.  問:你好,我想問一下,在教育領域的應用,可以怎麽進行改革呢?另一個問題是,非技術背景怎麽進入人工智能領域?

王詠剛:在教育領域的應用,我可以給大家舉一些例子。我們創新工場投資的教育公司很多,有一家叫vipkid。美國的老師來教中國的小朋友,現在有3000多個美國老師,然後在美國老師和學生交流過程中,用的是一個視頻教育系統。現在這種最基礎的視頻教育系統能夠把兩個人從美國和中國連接在一起,那麽接下來呢?是不是應該利用這種虛擬的環境,讓教學更身臨其境?這里面有很多VR/AR以及人工智能技術的用武之地。

第二個問題,非技術同學如何參與其中,比如說創業,甚至說參與到工場項目中來。我覺得有兩個層面的問題,一方面是非技術有沒有可能轉行做技術,我覺得這是有可能的。另一方面是說,如果你想在非技術領域從事創業又該怎麽做,其實即便是一個人工智能公司,也需要商務落地,也需要商務人才,特別是在現有條件下。

2.  問:現在,比如說互聯網,肯定有些好的項目就被大公司買掉了,包括BAT都在做很多嘗試,我們做項目有什麽優勢呢?

王詠剛:非常好的一個問題。這個問題其實在創新工場內部也有爭論,雖然我們看好人工智能是一個大勢所趨,但是大公司小公司都在做人工智能,為什麽小公司就一定會有更好的成功機會呢?

從歷史角度來看會發現,實際上在每一輪的歷史浪潮里,比如在互聯網的時代,有百度有谷歌,但是絲毫不影響移動互聯網時代出現新的公司。這是因為在每一個技術浪潮里,上一個技術浪潮的領軍人物,他的企業重點,研究重點,或者研發方向未必能夠快速轉型,在新出現的熱點領域里面,中小公司擁有大把的機會。

3.  問: 我一直想問一個問題,任何一項新技術出現都會變成一個非常嚴重的問題,就是安全問題。安全問題會不會帶動安全產業共同發展?

王詠剛:我覺得這是兩個層面的事情,一個是從技術層面,技術只是人類的工具,任何技術都不是非黑即白的,任何技術都有安全上的缺陷,需要其他技術或者管理手段來彌補。技術怎麽被人類使用,這個才是安全的問題。我們都在用電、用汽車,但沒人會問,用電或者用汽車會不會導致大規模的安全隱患。其實每個懂科技的人都可以用電來制造殺人的武器,也可以把汽車改造成殺人的武器。人工智能技術也是一樣。人工智能和其他任何技術一樣具有好的一面和危險的一面。我們必須研究如何使用人工智能技術,如何與好的應用模式、應用規範相結合,才不至於出現危險的局面。所以,安全專家會不斷面臨新的挑戰,人工智能技術的發展也會反向促進安全技術、安全產業的相應的進步和發展。

人工智能
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=228307

Next Page

ZKIZ Archives @ 2019