AI的應用與未來:輔助人,代替人,超越人;機器將造成未來社會出現90%的閑人,但機器難以替代資本家、藝術家和手藝人
本文系源碼資本(ID:sourcecodecapital)對i黑馬投稿。
源碼資本在2017年碼會上宣布,前金山CEO張宏江博士加盟源碼資本任投資合夥人。張宏江博士在2017年碼會上分享了重磅觀點“AI的本質與機遇”。
張宏江博士曾為前微軟亞太研發集團首席技術官、微軟亞洲工程院院長、金山軟件CEO,是世界多媒體研究領域一流的科學家,是計算機視頻檢索研究領域的“開山鼻祖”,獲得過IEEE(美國電氣和電子工程協會)和ACM(美國計算機協會)兩大計算機專業協會頒發的重大獎項,是第一位也是迄今為止唯一同時獲此殊榮的華人科學家。
張宏江博士在2017年碼會的演講全文:
今天,我們從AlphaGo講起。我們的議題包括這一波AI潮流的原因是什麽,機器學習的驅動燃料——大數據的發展,深度學習的基本原理,AI技術的發展給我們的日常生活,給我們的創意以及工作帶來什麽樣的影響。最後是投資AI領域有什麽樣的機會以及陷阱,尤其是陷阱我會多講。
1、從AlphaGo說起AI潮流:算法+計算力+大數據
典型的深度學習算法就是深層的神經網絡;AlphaGo在一場比賽中消耗的能量是人的300倍;數據爆炸在過去十年改變了我們的生活。
這一波人工智能的熱潮其實是從去年AlphaGo與圍棋大師李石世對決開始的;雖然我從來不會下圍棋,但我下了賭註賭AlphaGo會贏。
為什麽我會下這個賭註?我們讀過關於AlphaGo的文章,其實它是一個典型的深度學習的系統,它用了深度的神經網絡,還用了深度學習里面的強化學習,半監督學習,還用了蒙特卡洛搜索的方法。
整體來說是經典的技術和新的機器學習算法結合在一塊,從而能夠提高算法的性能,使它的學習能力更強。通過增加深度學習網絡的隱層神經元數目從而建立起很好的學習能力,吸收知識的能力。這是算法上。
其實在這個背後還有非常重要的兩條,這是過去幾十年計算機發展帶來的結果。
第一條,互聯網過去20年的發展帶來了大數據,而且是高質量的大數據。以AlphaGo為例,在它跟李世石對局之前已經跟人類六到九段的棋手對決過一萬六千多次,這個中間他獲得了超過3000萬的布局點,這個對於它的能力提高非常重要。它跟自己下棋的過程中又獲得了3000多萬個布局點,同時形成它的決策網絡。這是我今天講的重點,就是高質量大數據這一塊。
第二條,高性能的計算資源。如果我們看一下最終AlphaGo拿出來跟李世石對局系統用了1920個CPUs,超過280個GPUs。這是什麽意思?我們知道一個衡量圍棋大師的標準是一到九段,而更細的平級是用ELO這個數。
用了1920個CPU,280個GPU以後AlphaGo的能力,ELO數,從一開始兩千多到了三千多,我們看李世石的數字是3500個,其實已經相當接近了。正是因為有了高質量的大數據,有了高性能的計算資源,有了新的學習方法,使得AlphaGo能夠輕松地戰勝了圍棋大師。而且我們說到一點是,當李世石艱苦贏了第四局之後,這個時候AlphaGo當天晚上又自己跟自己下了一百萬次。
為什麽這次AI的浪潮跟前兩次不太一樣?今天我們談的AI其實談的是大數據小的新的算法。計算資源這些年發展下來,隨著摩爾定律的指引,計算性能增加是快速的成指數的增加,同時計算的成本也是隨著指數往下走的,計算資源越來越強,價格越來越便宜,從而我們可以廉價地利用大量計算資源。
過去十年的另外一個根本性的變化,就是如果你自己不想買計算設備,你可以用雲計算。我們看雲那一塊,大數據的處理能力在雲計算的平臺上已經以標準雲服務的方式提供給大家,大家可以很方便低成本地使用。這是另外一個在計算方面的進步,根本改變了在機器學習只是在大公司來做的狀態,今天小公司可以用雲計算來做了。
回頭來講數據,這是我特別喜歡的題目。在AlphaGo之前,我就一直跟大家講大數據,當然心里面是想推廣金山雲。但是大數據確實在過去十年內改變我們的工作、改變了我們的生活,改變了我們的思考。
IDC有過一個報告指出,在2013年的人類產生數據是4.4個ZB,到了2020年的話這個數字將會增加到44個ZB,增加10倍,年增長率是40%。今天每4小時沃爾馬用戶產生數據超過2.5PB,每天Twitter產生推文有5億條,今天今日頭條的用戶請求超過60億次,每天頭條處理數據量超過6.3PB,這是每天人們產生的數據。假如說這些數據又有很好的跟蹤和標註,這些數據可以驅動人工智能,驅動人工智能的算法。
2、大數據:機器學習的驅動燃料
人臉數據庫的進步大大提高了計算精度;Jim Grey的科研四範式:從觀察、實驗到計算模型,到數據推動的模型;大數據正在成為企業AI的標配。
講一個人臉識別的例子。
今天大家覺得人臉識別已經過關了,一系列的公司在人臉識別上做的比人的識別率還要高。這個功能在手機上也已經做的非常好。之前一個人拍了很多照片,開始找這些照片的時候就發現比較麻煩了,但現在你想找某一個人,可能需要記住什麽時候照的照片。但更方便的是記住了和哪些人照的照片,通過識別人臉能使得找照片變得非常容易。這種功能是我們20多年前的夢想,今天在手機上就可以做成了。
這是我手機上的一個屏幕,我自己的照片,我太太的照片,小孩的照片都在這兒。以前我工作的老板雷軍照片也在上面。我一點,所有雷軍照片全都出來了。我想看某一個具體的照片,這是雷軍和戴爾電腦創始人Michael Dell的合影,還有和Dell團隊的其他人的合影。我們看到手機把這些人名字自動標出來了,這個人是誰,那個人是誰,以後他所有的照片進來就全部能夠識別了。這個在今天的品牌手機上都提供了這種功能。
我20年前在惠普實驗室申請過一個美國專利。這個專利的內容恰恰就是我剛才所說的那個整個流程:拍了新的照片以後把它的數據庫照片進行比較,從而識別出這個人是誰。在20年前我們很清楚移動設備計算能力有限,我們覺得這個處理的能力應該是分布式的計算,今天我們叫做雲。20年過去,現在恰恰把20年前的事情變成現實,這個中間可以說是算法的進步,也可以說是計算資源的進步。
我實際上想跟大家說是人臉數據庫的進步。
在20年前做人臉的時候,我們手里面拿到幾百個標準的照片,今天我們拿到上億張的照片。最早90年代的時候你只有幾百個人,幾百張照片的數據庫,90年代末2000年的時候到了上千張、上萬張照片,從而可以看到識別率的提高。到了工業時代,也就是5、6年前谷歌、Facebook分別用深度學習的方法做人臉識別,做訓練的數據量比以前增加了非常多,使識別精度增加。
當用戶的數據大量增長的時候,同一個算法的識別的精度也在快速的成長。而且當我用的計算量,CPU用得多的時候。性能也有快速的提高。所以這再次證明了剛才的觀點,數據本身可能比算法還要重要。或者說沒有這麽多數據的時候根本不可能想象深度的神經網絡。
再難的事情到了中國人手里面就有改善,世界上沒有任何一個地方像中國有如此多的攝像頭,如此多的頭像和身份證的照片,就形成了中國的優勢。今天不是兩億張照片,是幾十億張的照片,上億被標註的人。只有有了大量數據之後你才可以用深度神經網絡,才可以把這些內容、這些信息提取出來。
今天人臉識別的這些公司已經遠遠超過了人眼識別率,而且在世界上走在前列。當你在一張照片跟數據庫進行比較這個人是不是你的時候,這種精度已經到了萬率級的誤差。基本上用攝像頭以及算法,在中國最好什麽壞事都不要做,哪怕在你的汽車里面,在加油站的時候拍了一張你的手放在不該放的地方,很快就會被傳播出來,識別精度如此之準確的。
一年多以前微軟亞洲研究院的孫劍帶領著團隊用了152層的神經網絡作出了超過人類的圖象識別精度的算法。再次想跟大家驗證的是,當我們模型複雜度剛剛開始增加,從8層到152層的時候,我們看到計算量增加,看到持續的訓練數據的增加。在2012年8層神經網絡的時候,相應的神經元超過65萬個,連接超過6億。152層網絡的時候神經元到了2200萬,因為有新的算法,但參數調整更加準確,因為它的連接可以看到有113億,我們大腦里面神經元的突觸鏈接應該是一百萬億的。
人工智能的進展在很大意義上是從原來的傳統建模、制定規則到今天依賴於數據機器學習的根本轉變。這種轉變恰恰是因為我們今天有了數據,覆蓋度越來越好,精度越來越高,從而我們對模型的依賴比較低了,或者是說再複雜的模型都有足夠數據訓練。
過去的傳統AI的算法或者是神經網絡之所以不能夠達到今天的精度,很大程度上是因為我們沒有非常好的數據,從而依賴於某種模型,依賴於某種算法。在今天,我們已經在很大程度上覆蓋整個樣板空間的時候,我們數據如此之大,從而使得我們原來非常困難的問題,今天解決的非常好。
不同的算法的性能會隨著數據量變化產生的變化,當數據量增加的時候它的精度也在迅速提高。但是你可能會問一個問題,是不是現在我們有足夠多的數據,從而我們人工智能就能夠覆蓋所有的場景?去年發生第一起特斯拉傷人的事件,說明即使特斯拉這樣每天有幾十萬輛車在路上跑,但是數據依然不夠,依然在有些情況下出現死人的事故。
如果做數據庫的人不知道Jim Grey,那基本上不應該跟別人說是做數據庫的。Jim Grey他在十多年前就提出了人類在做科研的四個不同的範式。過去最早的純粹基於觀察和實驗,百年前的理論模型,幾十年前開始的計算模型,到今天數據推動的模型。過去十年大數據進展非常快,大數據已經開始在企業里面大規模的進行運用了。
美國一個咨詢公司調查了300家3000人以上的公司,基本上60%的IT公司都在使用大數據了,只是說使用層次不一樣。最早期是統計發生了什麽,後來分析發生的事情,到今天預測怎麽樣發生。未來,大數據將洞察什麽樣的決策是好的商業決策,再進一步的認知真正落實到行動上,也就是自我學習的能力了。
英特爾這樣老牌的公司今天在瘋狂並購做AI或者創作數據的公司,比如說兩個月以前以天價並購了一家以色列公司Mobileye。原因很簡單,英特爾認為汽車其實是人類生活中能產生大量數據的設備,這些數據能夠幫助數據使用者給人畫像、判斷一些商業應用。而這一切產生的過程、處理的過程由英特爾控制,這意味著它控制了另外一個新的平臺,這是為什麽英特爾在這方面投入這麽大的資本。
講完了計算和大數據。再回到一開始的所說的算法的進展。
3、深度學習的基本原理
大數據驅動的深度學習方式,是機器自主學習;深度學習第三次浪潮的特征:大數據+強計算+新算法。
AI做了60年,終於迎來了第三次浪潮,這次浪潮看起來比前面兩次浪潮來得更猛烈,而且解決的問題比以前更多。很重要的是,我們用的深度學習的方式與傳統的專家系統方式有很大的不一樣。專家系統的方式是人總結規則,然後把規則交給機器,機器來開始利用這個規則面對使用場景。深度學習方式,大數據來驅動的是機器自己來學習的。好處是機器本身具有學習能力,所以可以較容易地從一個應用擴展到另外一個應用。
過去的十年,恰恰是深度學習迅速發展的十年。2006年Hinton在Nature發表文章,標誌了深度學習這個詞誕生。2010年隨著大數據的爆發,深度學習熱潮開始興起。2012年Hinton這個團隊用CNN模型以超過第二名10個百分點的成績奪得當年競賽冠軍。到了2016年的AlphaGo,人們對深度學習的能力沒有懷疑了,深度學習將會改變人類,這是一個新的時代的到來。
深度學習,到底是什麽樣的東西?神經網絡這件事其實在第二次浪潮(80-90年代)就已經開始了,大家已經用過了,80年代-90年代初,神經網絡泛濫的一塌糊塗。那個時候數據量不夠,就是輸入層、輸入層、隱含層。另外一個根本改變是今天的設備、速率如此之強大。
為什麽深度學習方法不一樣了?首先是一開始的原理就是神經網絡,類似大腦的思考原理。人類大腦大概有1000億個神經元,在這些神經元之間有超過一百萬億的連接。神經元的數字還有連接的數字,是人智力很重要的標誌。一個具體的神經元就是有一個核加上一個突觸鏈,我們根據這種原理做模擬神經元。並且將它跟別的神經元的連接。經過一個非線性的函數,從而轉成一個輸出。輸出的信號就是你所需要的結果。當神經元多了的時候,或者層數多的時候顯然需要的訓練數據就要更多。
為什麽大數據實際上是深度學習驅動力?以前模擬系統來做的神經元,用物理模擬機器來做這個複雜度,不可能做到一億的神經元,不可能做到一百萬億的連接。但是今天我們用計算機能夠做到。深度學習是什麽意思?很簡單,深度學習就是層數比較多的神經網絡。每一次訓練你輸出一系列的數據,當實際輸出和目標函數有一定的差距,這個差距反饋回去再進行訓練,這是整個循環的過程。
4、AI的發展與影響
AI的應用與未來:輔助人,代替人,超越人;機器將造成未來社會出現90%的閑人,但機器難以替代資本家、藝術家和手藝人;
機器在感知上超越了人類,但在認知上還要5-10年。
講完深度學習,我們可以想像當神經網絡增加到152層的時候它的複雜性是什麽樣的增長。這種增長使得今天的AI,今天的機器學習不光是能夠輔助人,而且很大程度上會代替人,未來還會在很大程度上超過我們。也許這是我們今天不願意接受的。
未來AI會超過我們。到底怎麽樣超過?其實我們想象一下人工智能今天確實能夠做很多人類能夠做的事情。原因是為什麽?人類可以像AlphaGo一樣一晚上下一百萬盤棋嗎?能夠像特斯特收上百輛的車同時收集數據並進行同時學習嗎?這做不到。同樣今天人類不可能對遍布於全國各個火車站,各個機場的數據同時進行處理,也就是說規模你也比不上。
人工智能會代替人、超越人是時間問題。不光是這樣,機器學習在一些場景做的比人還好,因為人通過觀察、通過思考判斷出來的東西,人工智能通過學習很大程度上比你做得快。AlphaGo已經完全展示出了,人們在圍棋這一點上是已經被人工智能打敗了。
投資決策、政策、規劃、戰爭沙盤推演這些很大程度都是靠經驗的。今天從AlphaGo上看到的,人工智能在這些場景里都會超過人類,這是因為機器本身的自我學習的能力已經非常強大。像開車、滑雪、畫畫、拉提琴這些不可能通過看手冊就能學會的事情,人工智能也已經超過了人類。其實我們自以為很了不起的東西,人工智能看的比我們要透徹。
前一段AlphaGo隱姓埋名跟人類下棋,世界排名第一名的柯潔下輸了後感慨地說人類三千年的圍棋文化只是接觸了圍棋的皮毛。我們以前下圍棋,人類的思考實際上只是看到一個本地的最優解,不可能翻山越嶺去看,但是AlphaGo可以看到山外還有山。是因為它的數據處理能力比我們強,所以它學到了這一點。人類以後再也不可能贏AlphaGo了。這就是殘酷的現實。
舉一個微軟研究院的例子。在這個例子里,機器看到Stop Sign標誌,會描述出這是在一個城市邊上有這樣一個標誌,有紅色,立柱,與交通相關等等標簽。這個系統希望能看圖講故事,不是看圖識字,是識圖講故事。
這里有另外一個例子:這幅照片是一位婦女在廚房準備食物。第一個描述是一個婦女在廚房準備食物。第二個描述寫的是,一個婦女在廚房水臺邊上準備一份午餐或者早餐。第一個是機器學的,在這一點上機器已經超過了人。你可以說這個人不會講故事,但是至少機器能夠講出比他還好的故事。當然了,這還是屬於探索的階段。
據說在AI的浪潮下最安全是考古學家。可是這個社會上考古學家也不需要太多,工資也不會太高。男怕入錯行,女怕嫁錯郎。隨著這些的變化,未來哪些工作會被AI取代,社會將是什麽樣的?
全球化是在全球範圍內尋找最廉價完成某一項制造的過程,於是全球化導致了兩級分化,導致了跨國企業效率不斷提高,也導致了包括美國在內發達國家藍領工人的失業。AI是否會加劇這個趨勢?
未來可能會有兩種人,一種叫神人,一種叫閑人。問題是90%以上的是閑人,這怎麽辦?其實去年瑞士的國家有一個議員提出了,不管工作不工作每個人先發三千法郎,工作再拿另外的錢。瑞士人還是比較冷靜,全民公投沒有通過。未來可能只有三種人能夠對抗AI,資本家是沒有問題的,未來仍需要資本運作。另外就是藝術家和手藝人,這類技能機器暫時不能學過來的。當然大部分人很難做到這三種人。
人工智能的局限在哪兒?強AI(GAI)依然道路漫長。機器在感知上已經超過了人,但是認知可能還有5-10年甚至更長的路要走。
深度學習的方式,有沒有問題?其實有一個很大的問題,事實上是人們給自己創造出來的一個問題。人工智能或者機器智能是機器通過觀察體驗來學習,機器本身可以對自己進行編程,程序員不再需要寫命令解決問題,而程序會根據示例數據和期望輸出生成自己的算法。
今天在很多領域已經往這些目標行進,第一個案例,比如Nvidia無人駕駛車,不是靠程序員指令走的,完全靠觀察人的行為,觀察人們開車的行為來確定自己駕車方法。第二個案例,在紐約一家醫院開發了一套系統,叫做Deep Patient,醫院只給了它70萬個病例,然後這個系統從70萬的病例中學習,通過數據發現規律,總結出了非常強的疾病預測能力,尤其患精神分裂癥的預測能力遠遠超過了大夫。第三個案例,美國軍方大量投入機器學習,為車輛和飛行器導航確定攻擊目標,在大量數據中間挖掘出恐怖分子的一些信息,都已經遠遠超出了人們一開始的預期。深度學習已經具備了這樣的能力,但是深度學習依然沒有能夠解釋自己的行為。還是黑匣子。
人類歷史上從來沒有創造過這樣一個機器,這個機器的行為和判斷連人類都不能完全理解。今天我們創造了深度學習的機器不能判斷和解釋自己的行為,這就是今天我們感覺到不舒服的。人們反而問自己,我們自己作出了很多判斷我們自己能夠說清楚為什麽做的嗎?可是人類可以容忍自己的這種情況,但是不能容忍機器的這種情況。美國國防部就將機器學習的不可解釋性定性為“關鍵的絆腳石”。
當然未來一定是說,人們需要跟機器不斷合作。我們看動物到人的進化,其實智力進化的本質特征是進化到一個系統,這個系統連創造者都無法解釋。今天我不敢保證上帝理解我們今天做的這麽多的事情。為了這個擔心,研究人員已經開始在進行一些分析,來試圖理解或者跟蹤這種決策的過程。
終級目標,機器和人到底有什麽區別?
它比你來得快,比你大,某些能力比你還強。它和人類區別在哪兒?
求生本能,對於死亡的恐懼,這是機器沒有的,這是定義出人和機器一個根本性的區別。人和動物的演化速度,一系列的求生本能,被打了會跑,避免疼痛,會食色,會有歸屬感。人類做壞事也是因為對死亡的恐懼,對欲望的驅動。機器本身目前為止因為它不懼怕死亡,所以也沒有感情,沒有感情是不是就不能說有智能呢?這是一個宗教問題,不是一個科學問題。
講完了機器學習我們到此打住,我時間到了,很快講一下AI投資的判斷。
5、AI投資的機會與陷阱
在對AI投資的判斷中,產業鏈包含:基礎,技術,應用;基礎被巨頭控制,技術層面能否出來一些公司依然存疑;應用層要尋找能夠大量產生數據的產業。
過去經驗也告訴大家,每一波科技浪潮中會有一些平臺性的公司。我們談AI投資,到底投什麽?就像我們談PC的投資,談互聯網的投資我們是談生態鏈。
在對AI投資的判斷中,產業鏈包含基礎、技術,應用。基礎這個層面已經被巨頭控制了,基礎層有兩大塊:基本計算能力和數據。基本計算能力無論是谷歌還是微軟,包括中國百度都已經把它作為SaaS服務提供出來了。技術這一塊,沒有數據能否成為一個平臺?。在SaaS這一塊,不是通用的SaaS,也許在SaaS應用這一塊能夠出來一些公司?這也是一個非常大的問號。
應用層中,AI其實是AI+這個場景,它是一種生產力提高的工具,會讓所有以前的應用變得更加有效,當然你要找比較容易突破的。顯然這個錢多和數據多的行業是最早發揮功效的地方。所以我們要找這個產業是不是大量產生數據,是否有這個數據能夠不斷拓展,不斷創造價值,從而使得我們能夠在這一里面把原有的生態進行改變。
如果說上一波是互聯網,這一波是AI。大家要註意AI跟互聯網的區別。最簡單的可以說,AI發展到一年多以後我們就發現實際上是智能+。AI技術驅動,更加從垂直開始。因為技術本身發展的太快了,而互聯網是商業模式創新,是全新的應用,贏家通吃在AI那一塊未必行得通。
根據這個觀察可以看一下今天AI投資的情景,今天AI顯然是有很多泡沫,最大的泡沫我覺得是在估值公司。你去你找一家公司談,每一家公司都說我自己是AI公司。真正看這家公司是不是AI公司,更重要的是它要有數據。能夠不斷有數據,它能夠不斷搶占數據的高低,這是我們的核心。
今日頭條這家公司,之所以能夠站穩,在過去五年之間突然出現,有它一個根本的原因,那就是信息的獲取這個大的需求。今日頭條在人工智能開始使用的時候迅速占領高地,它第一個用搜索的方法做了新聞推薦,從而它本身這個系統就是一個很大的學習網絡,使得今天能夠不斷的演化,推薦的能力不斷增強,從而在這個基礎上對核心的能力進行突破。我們完全可以預測未來的今日頭條就是一個超級的智能系統,同樣我們看到了它的數據量是如此之大,它已經遠遠超過了一開始的文字到今天走向圖象,走向論壇,走向直播,它其實所具備是不斷增加的數據。
最後,AI的投資。如果你記住我剛剛所說的話就是三個投資點,第一是“智能+”,所有公司都應該具備的一種能力,而這個能力是它核心競爭力。第二,AI產業,包括自主開發、咨詢服務、人工智能即服務AI-aas。第三,要有數據和人才。
人才、數據是核心,投算法本身就是投人,我前面談到深度學習的訓練需要人對於這個算法的理解並且掌握的訓練的技巧,懂算法還要懂應用的人才是非常有價值的。另外,數據實際上是AI公司最終的護城河。
最後一點,給大家一個信息,就是AI這個領域里面中國人才是非常多的。高盛的一個AI報告指出,在過去的五年里面發表的跟神經網絡和機器學習相關的文章里面,中國人作者的數量已經超過了美國,而且還持續增長。在引用的文章里面中國作者的數量也超過了美國,而且還在持續增長。所以至少我們在這個是里面中國人不少,數量多了之後以後自然就有強人。在人才這一塊中國不差。
另外,中國發生的數據如此的巨大。也就是說中國有人才、有數據。所以AI這一塊一定是中國創新和投資的新希望。謝謝大家。
谷歌I/O大會是這家公司一年一度的開發者大會,通常在6月前後舉行。會如其名,谷歌公司在此時發布自己最新的軟件系統,給開發者指明下一年的寫碼方向,由此引導相關行業硬件發展。
今年的大會在加州山景城召開。谷歌CEO桑德爾·皮查伊登臺作主題演講,並與公司成員一起展示多個谷歌產品的新功能。
Google Lens:全新的 AI 視覺搜索應用
谷歌今年已經把大會的主線從“Mobile First”(移動優先)轉移到“AI First”(人工智能優先)。今天的第一個體現谷歌AI的實際新品是Google Lens應用,用手機攝像頭理解圖片內容而不僅僅當個翻譯,它有了“視覺助力”。比如拍照識花,或將攝像頭對準餐廳顯示餐廳評分等。Google Lens 還有一些更加智能的功能,比如在手機連 Wi-Fi 時,可以將攝像頭對準路由器上的資料,Google Lens 就能自動提取 Wi-Fi 的賬號和密碼,然後提供一鍵連接的選項。該功能將在未來數月向用戶推送。
Google Assistant:登陸 iPhone
智能助手Google Assistant可以更好地展示谷歌的人工智能已經發展到何種地步。最近亞馬遜微軟都在這上面發力,據說蘋果下月也會發布相關產品,競爭相當激烈。Google Assistant可以與實時相機翻譯無縫結合。谷歌高管斯科特·哈弗曼用自己在日本旅遊的經歷親自演示:智能翻譯菜單,告訴他這行日語是個什麽菜,之後找圖直觀的告訴他這菜是什麽樣?(註:國外菜單上大多沒圖片)
大會上哈弗曼介紹,Google Assistant這個App即將登陸iOS系統,這種移植只能讓蘋果用戶們淺嘗輒止體驗一下它的智能之處。因為iOS的封閉系統機制,它不能調用系統功能,效果必然不如Android平臺。
據介紹,Google Assistant不只是一種新的搜索方式,除了找信息,其實還能讓它幫你做各種事情,並且支持第三方開發,還支持了意大利/西班牙/韓文等更多語言,但是並不包括中文。
Google Home:硬件無更新,軟件大升級
Google Home智能音箱在硬件沒有升級的情況下,加入了大量有用的新功能。一個新功能是兩個Google Home之間可以打電話(美國和加拿大免費),不用撥號,對它說給“給媽媽打電話”就可以通過網絡連接那個Google Home音箱通話。
Google Home內置Spotify和Soundcloud音樂服務以及HBONow網劇,同時還可作為藍牙音箱使用。
Google Home新增了“主動提醒”功能,會主動提示日程和交通狀況等相關信息,並可以通過手機或電視屏幕實現“視覺反饋”。
Google Photo:讓分享更智能
Google Photo可以識別照片內容,並自動建議那些照片適合分享,而且還能夠自動與家人分享與之相關的特定相冊集。圖像識別技術可以把最好的照片選出來,自動去除掉重複或者質量差的,然後組成一本相冊,並提供打印服務。
YouTube:更多用戶,更多互動
據介紹,YouTube 的日觀看數已經超過 10 億人次。接下來,YouTube將進一步增加互動性和增值服務。YouTube 加入了 360 度視頻的功能,拿著遙控器,你就能在視頻中進行 360 度的視角轉換,你可以在電視機上,看到與以往不同的風景,也可以在看演唱會直播時有更加身臨其境的感覺。新增的付費功能Super Chat可以讓用戶掏出真金白銀來支持喜愛的主播,並且在聊天中獲得一些更醒目的標誌作為一定的特權。
Android O:為了下一個 10 億用戶
Beta版Android O即日起對普通用戶開放。Android O包含眾多新功能,比如自動填充、重新設計的“系統設置”以及可選下載的字體。此外,Android O還擁有新特性“Vitals”,旨在保障手機的安全;同時應用商店通過Google Play Protect顯示經過審查的安全應用。
同時,谷歌還發布了輕量級Android Go來幫助低配手機和偏遠地區的用戶使用最新系統,能夠支持大量印度方言。Android Go可理解為精簡版的Android,可在低於1GB內存的手機上使用。
對開發者們來說,另一個大事是Android系統有了自己的開發語言Kotlin,谷歌稱這是更高效且智能的語言。
VR:獨立新設備
雖然進入到 2017 年國內的 VR 市場趨於平靜,但對於谷歌來說 VR 仍然是非常重要的戰略陣地。首先,谷歌 VR 負責人 Clay Bavor 宣布:三星 S8、S8 Plus 和 LG 即將發布的旗艦機將支持 Google Daydream VR 平臺。谷歌還嘗試打造獨立的VR設備,獨立於PC和手機運行;谷歌聯手高通,並與聯想和HTC合作打造,首批產品預計今年晚些時候面世。
AR:在室內定位中派上用場
谷歌宣布 Tango 項目將和 Google Map 合作,推出一項室內定位服務 VPS(visual positioning service),它可以在沒有衛星信號的室內也能精準定位。Tango是谷歌2014年推出的AR平臺,通過手機的攝像頭和處理器配合,能夠對環境進行實時建模,並將現實世界和虛擬圖像結合起來,進而實現各種各樣的 AR 功能。谷歌在這次開發者大會上還表示將把 Tango 設備普及到校園中。
最近四年,谷歌已經把I/O大會的主線從“移動mobile”完全轉移到了AI人工智能,後者花費最長時間,講得最深入,也貫穿全場;移動戰略甚至也成了AI的服務形式。
這是在硬件和軟件之後,谷歌給自己加上的一個新維度,相比移動設備,AI是一個更有想象力的空間:智能助理、機器人、無人駕駛、醫療,教育都能跟它關聯,那是一個比具體產品更有趣的故事。
反倒是VR這部分,不像去年那麽重要了,雖然宣傳片依然精彩,但VR或AR沒有想象的落地那麽快,所以它成了最後15分鐘的故事,但不是壓軸戲。
柯潔對決AlphaGo的人機大戰又一次燃起公眾對人工智能的關註。過去的一年,正是因為人機大戰讓人工智能概念從陌生變得耳熟能詳。
“人機大戰最大的意義在於讓公眾認識到技術的力量,雖然它沒有很明顯的商業價值,但向AI傾斜的資源更多會加速整個行業的發展。”在2017年第一財經技術與創新大會會後專訪中,第四範式創始人兼CEO戴文淵告訴第一財經記者。
“AlphaGo下圍棋已經無敵,但幹別的還不行。”香港科技大學計算機系主任楊強表示。對於以楊強、戴文淵為代表的人工智能科學家而言,人機大戰雖然燃起公眾對人工智能的熱情,但AI仍未變成大多數人的工具。
如何降低人工智能領域的門檻,讓更多的“外行人”有機會開發出屬於自己的人工智能服務,是人工智能真正發揮商業價值的關鍵。
各大科技公司也意識到這一問題,包括IBM、谷歌、Facebook、微軟在內都在開源自己的人工智能框架,其中不乏一些擁有認知功能的算法,例如神經網絡、深度學習、圖像識別等。
在戴文淵看來,這類框架只是將人工智能科學家的門檻降低,而並非讓更多人使用,即會做的人更會做,不會的人依舊不會。
“無論是PC時代還是移動互聯網時代,都不是科學家做應用,當下的人工智能主要是科學家在做應用,科學家是小眾人群,需要從科學家做研究變為開發者做研究,讓AI的門檻真正降低,行業才能爆發。”戴文淵說道。
通過封裝人工智能算法,降低建模過程中數據科學家的工作量,將人工智能數據清洗、特征變換和選擇、特征組合、算法或者參數調優等變為更易用的產品,供普通人使用,第四範式機器學習平臺“先知”應運而生。
今年上半年第四範式舉行一場特殊的建模比賽,參賽選手均為工程師、商務、售前甚至是離業務比較遠的行政等非專業人士。比賽利用真實業務數據建立模型,比拼模型對業務關註目標的預測能力。最終在沒有任何專業培訓的情況下,超過70%的參賽組合ACU成績(ACU是衡量模型效果的專業指標,取值在0到1之間)跨過0.8大關,達到工業水準。
戴文淵希望將“先知”打造成為人工智能時代的“Windows95”。在90年代,人們需要受過訓練才能使用計算機,但很多人並沒有這樣的天賦。直到20年前的今天,微軟發布Windows 95,普通人都可以操作計算機。
如果說DeepMind將端到端的深度學習應用在了強化學習上,使得強化學習能夠應付大數據,讓人工智能在圍棋上將人類擊敗,但在解決新問題上,像DeepMind這樣的人工神經網絡卻面臨“遺忘性災難”,這也使得遷移學習成為人工智能熱門話題。
“深度學習和強化學習,沒有積累,只能學習掌握單一任務,面臨新的場景需要抹掉記憶從頭學習,而遷移學習則是讓機器具備舉一反三、觸類旁通的功能,是終身學習。”戴文淵解釋道。
“遷移學習能夠讓人工智能得以擺脫對大數據的嚴重依賴,從而讓人工智能不再只是‘富人的遊戲’”。在此前的采訪中香港科技大學計算機系主任及大數據研究院院長、第四範式首席科學家楊強告訴記者。
在富人遊戲向大多數人遊戲遷移過程中,數據場景的變化也在發生作用。“以往數據集中於類似BAT這樣的大公司,現如今銀行、保險公司、零售企業、醫院也都在搭建自己的大數據系統,數據場景在發生遷移,在這種情況下BAT變成整個人工智能大版圖中的萌芽,人工智能未來會進行更大面積的推廣。”
目前楊強所在的實驗室正在進行一些遷移學習的研究,例如教計算機去讀一些文章,使得計算機在識別圖像方面也變得更簡單。一個有趣的是實驗成果是,機器曾識別一張香港科技大學的圖片,基於這個圖片計算機寫了一首詩,“草堂山水下、漁艇鳥花邊。”
正如柯潔在微博中所言,“人工智能始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。”人工智能科學家們正在試圖讓機器更富“感情”、更聰明,“AlphaGo雖然很厲害,但並不會取悅你,希望未來的計算機並不僅僅是替你做一些工作,還能夠取悅你,讓你變得更開心。”戴文淵說道。
5月23日下午近3點,經過4小時17分37秒的鏖戰,圍繞在柯潔和 AlphaGo的第一場人機大戰的結果最終定格在“AlphaGo 執白1/4子勝”。19歲的柯潔一邊數子,一邊露出苦笑。
“輸得沒什麽脾氣。”柯潔在賽後新聞發布會上說。
對一個職業棋手來說,爭勝是他的宿命。但柯潔不得不承認,AI 進步速度太快了,AlphaGo和去年相比判若兩人,“當時覺得它的棋很接近人,現在感覺越來越像圍棋上帝。”
至於AlphaGo的弱點,柯潔坦言自己暫時還沒有看到,想贏可能要通過找BUG,但對自己依然有信心。“讓AlphaGo主機更發燙一點也好。”
而在Deepmind創始人Demis Hassabis看來,自己並不同意這是人機大賽,這不是任何電腦的競賽,而是人利用電腦發現新的知識。“就像人們利用哈勃望遠鏡發現新的宇宙空間一樣。AlphaGo就是圍棋界的‘哈勃天文望遠鏡’。”
“我輸得沒有脾氣”
與AlphaGo 對決前夜,柯潔感慨萬千。
“現在的AI進步之快遠超我們的想象。”柯潔說,自己相信未來是屬於人工智能的,可它始終都是冷冰冰的機器,與人類相比,感覺不到它對圍棋的熱情和熱愛。“對它而言...它的熱情——也只不過是運轉速度過快導致CPU發熱罷了。”
他說,要用自己的所有的熱情去與AlphaGo做最後的對決,“不管面對再強大的對手——我也絕不會後退!”
這次的人機對戰采用“慢棋”賽制,這對於人類棋手有一定利好。但距離今年年初AlphaGo 的化身 Master以60戰不敗成績完勝世界頂尖棋手已經過去4個多月的時間,柯潔面對的是又一次進化了的人工智能。
相比較並無太多懸念的比賽結果,人機對弈的過程不失精彩。
比賽中柯潔執黑先行,在比賽前半段中,柯潔表現相對輕松,還曾露出微笑,引發了現場人士的不少猜測。但在比賽接近尾聲時,他的表情漸漸冷峻起來,時而托腮,時而眉頭緊皺,並且頻繁地抓著頭發。
中國圍棋協會秘書長華以剛在解說中透露,抓頭發是柯潔下棋時的小癖好,但這一次,形勢似乎不太樂觀。
相比之下,AlphaGo落子速度飛快,有些棋子甚至是“秒下”。
AlphaGo早已展現出超越人類棋手固有思維和套路的招法,為了應對它,柯潔還專門想了一些有針對性的招數。例如在開始時下了兩個“三三點角”,這其實是AlphaGo 特別喜歡下的招式,柯潔模仿了它的下法,想看看對方怎麽應對,結果發現AlphaGo不僅應對得很好,而且不少新的下法都在意料之外。
再如,AlphaGo在中間斷過一次,這讓柯潔很震驚,在人類的比賽中這樣白棋就變成了後手,但柯潔事後分析認為這是一手好棋,其實一石二鳥,做厚了白棋角部的勢。AlphaGo這一大膽出擊,令柯潔感慨“AlphaGo實在下得太出色了,我輸得也沒什麽脾氣,真的是很厲害。”
在講解中,常昊九段評價,AlphaGo十分註重全局和中央的勢力發展,每一手都追求效率,樊麾二段也說,AlphaGo力爭在棋盤上的每一個子都能綜合利用起來。
到了提問環節,柯潔再次感慨:“他下得太好了,也在改變我們最初對圍棋的看法,沒有什麽棋是不能下的,它可以大膽創新,大膽開拓自己的思維,很自由的下棋。”
他評價, 自己本來的想法是“先撈後洗”,沒想到開局有個地方,還是被AlphaGo撈回去了,變成了它有很多實地。“這個棋跟去年相比,好像完全是兩個人,去年時完全是兩個人。第一次時還接近人,現在越來越接近上帝了。
至於接下來的比賽,他表示:“我希望我盡全力去拼每一盤,也希望自己給大家帶來圍棋的快樂。”柯潔透露,這三場比賽將是他與人工智能的最後3盤棋。“希望不留遺憾,下出好棋,讓AlphaGo主機更發燙一點也好。”
AlphaGo的下一步
在圍棋領域,人工智能戰勝人類似乎已經沒有太多的懸念。但其實,勝負或許早已不再重要。
在此前接受第一財經記者采訪時,古力九段曾說,對於這場人機大戰,人類勝率比10%低一些,“我不知道這樣說是低調還是高調”。
他認為,AlphaGo有弱點,只是棋手們目前還沒有觸碰到它的弱點,或者說還沒觸發出來。“隨著局數越來越多,有可能發現它的弱點。”
Deepmind創始人Demis Hassabis也在當日說,期待柯潔這樣的頂尖棋手能找到此前不知道的弱點,幫助 AlphaGo進步。
在現場觀看比賽的英語流利說首席科學家林暉博士對第一財經記者說,這個結果並不意外。
“從技術上看,AlphaGo勝在‘沒套路’,它嚴格意義上來說並不是人類教出來的最好學習生,不會被人類的下法所束縛。AlphaGo2.0已經超越棋譜,自我督學。AI與AI之間可以相互較量,甚至不眠不休、無時無刻地‘左右互搏’。因而在布局和下法上自成一體,超越人類。” 林暉說。
在Deepmind創始人Demis Hassabis 看來,AlphaGo不是以編程的系統,而是以增強學習的方式,以人類棋手的經驗為基礎,進行不斷學習形成自我的能力。“就好像哈勃望遠鏡一樣,我們和它一起探索宇宙。”他同時評價,柯潔是一個天才選手,相信他會以一個全新的方式與AlphaGo對弈,為圍棋界探索新的方法。
值得一提的是,此次跟柯潔對戰的AlphaGo版本是單機版,而且比此前的計算能力高10倍。 至於AlphaGo 是否能夠做到控制勝負差距,Demis Hassabis稱它的目的是要將獲勝概率最大化需要做決策來實現完勝。
事實上,站在人工智能發展如火如荼的今天,這場圍棋對決的終極要義是:人工智能為探索圍棋的奧秘將帶來什麽?它的極限在哪里?它將怎樣更好地造福人類?
李開複更直言:“我們應該更加關註商業領域的人工智能,在金融、醫療、教育等領域產生商業價值,讓世界變得更美好。”
而在今年 IT 領袖峰會上,馬雲更稱“AI下棋” 並不是人工智能應該體現的能力。“機器要做的是人類做不到的事情,這才叫本事。”
其實,現在已經很難說AlphaGo只是一個面向圍棋這一垂直領域的人工智能了。
Demis Hassabis表示,DeepMind正在使用AlphaGo系統的變體來服務其他行業,例如通過與人類專家的合作,可以找到各種各樣的創新方式,包括從“其中一種變體應用於醫療行業,我們正在著力解決蛋白質折疊的問題,用來治療各種疾病。”
此內容為第一財經原創。未經第一財經授權,不得以任何方式加以使用,包括轉載、摘編、複制或建立鏡像。第一財經將追究侵權者的法律責任。
如需獲得授權請聯系第一財經版權部:021-22002972或021-22002335;dujuan @yicai.com。
在行業熱潮背後,人工智能投資領域毅然存在一些尚未被完全認知的隱憂。
作者 | 郝毅文(源碼資本投資部副總裁)
●在實際接觸到的AI項目中,處於技術工具“造榔頭”階段的多,離產品化“造出房子”還遠。
●目前人工智能人才的最大缺口是技術型人才,但下一個缺口將會是商業化人才。
●AI類型項目主要退出方式還是被巨頭收購(15年69起,16年84起),目前尚未看到哪家有獨立上市苗頭,和熱度略遜的大數據領域也差距較大,基金退出渠道不明。
AI:創投圈2017年最熱方向
根據烯牛數據的統計,16年底-17年初,國內各大機構在關於今年投資方向的98篇討論中,人工智能的提及次數占48次,是第二位“文化娛樂”的1.8倍。
按Venture Scanner數據,2016年,全球人工智能領域創業公司獲得的融資總額達到了50億美元,658個公司獲投。市場火熱程度毋庸置疑。
但繁榮之下也有隱憂。
Source:CBInsights
產品化與估值泡沫
我們認同AI技術的普及和爆發是必然趨勢,但回到實際接觸到的AI項目中,處於技術工具“造榔頭”階段的多,離產品化“造出房子”還遠。
對比同樣To B為主,以解決企業實際問題為目標的SaaS行業,AI領域有一定估值泡沫存在。
業內對SaaS公司有按Forward P/S 5-10倍來估值的共識,而AI類項目還在看人頭,看簡歷定價階段,或許存在按發表論文Paper數+H Index(學術產出水平)估值的P/P方法。
此外不少換包裝的“準AI”項目也大量入市。甚至有些消費類項目,商業模式關鍵點並不在於AI技術應用,也在融資時湊熱點,堆砌一些技術名詞“忽悠”投資人。這反而掩蓋了自身特點,帶來不必要的技術DD,以己之短博人之長。
人才瓶頸
人才需求爆棚,薪資翻番,創業公司招人難。北美地區16年AI開發的相關職位供需比是3:10。該領域人才在國內的供求失衡更為嚴重,或達到1:10。學術圈人才大量進入工業界,也有諸多大公司骨幹按耐不住開始了創業。
Source:David Simonds
目前該領域最大缺口的是技術型人才,但下一個缺口將會是商業化人才:理解技術邊界和實現機制,更懂行業需求的“翻譯官”類型。
創始人背景:目前普遍受認可,也是最多見的創始人背景是有學術高度的海歸博士,在產業圈公司工作3-5年,晉升快,又有商業思維的。
其次是大公司研發線高層創業以及教授選手,一般在副教授級別,30-40歲,有一定學術影響力,有全職下海決心的。科學家創業需要盡快找到商業合夥人,對要落地的行業非常了解的。
退出路徑
全球範圍,AI類型項目主要退出方式還是被巨頭收購(15年69起,16年84起),目前尚未看到哪家有獨立上市苗頭,和熱度略遜的大數據領域也差距較大,基金退出渠道不明。在國內的環境中,大公司依然傾向收購資源和收入,對人才和技術的收購並不積極。
學術界的技術從論文想法到產品落地,再到成為行業常識的時間越來越快,具有技術收購價值的窗口期縮短。例如去年的熱門軟件Prisma所用到的風格遷移技術,概念最早發表於 15 年 8 月的一篇論文《A Neural Algorithm for Artistic Style》,3-4個月後,開源社區將算法速度提升了幾個數量級,16年上半年有2-3家創業公司擁有這個技術,7月Prisma引爆朋友圈後,現在已有不少於20個團隊在這個方向創業,也成為所有美圖類的標配。屆時技術收購價值也大大降低。過高估值的公司,自我造血能力跟不上的話,形勢尷尬。
技術成熟周期
前沿科技領域的創業公司需要尊重商業規律,尋找價值創造點,敬畏技術成熟周期。Gartner每年都會公布新興技術成熟度曲線,創業者應審視自身實力,尋找技術到站距離比較近,或是至少有中途停靠補給站(商業化應用)的賽道,偉大的企業都從滿足客戶需求開始,而不是依靠贏得世界級的學術地位。
Source:David Simonds
AI領域巨頭積極開源,平臺類型技術很快會商品化。例如Google Tensorflow這樣的框架,現在不少非AI公司都在實際應用了,就像3年前Hadoop的普及一樣,靠這樣的框架做AlphaGo還不可能,但分析一些離線業務數據已經足夠。
源碼所看好的AI領域公司特征
數據是生產資料、計算是生產力。縱觀整個產業鏈,我們更看好應用層的行業解決方案公司,在垂直行業中找到價值創造點,能借助AI技術提升行業效率的,或者滿足必須依賴AI才能實現的新需求。同時我們也看好沈澱有大量自有數據,未來可能用AI技術發揮更大價值的公司。
Source:網易 烏鎮智庫 源碼資本整理
以下AI+行業會更早引來爆發機會:信息分發、金融、醫療、教育、安防、物流人流等。
Source: 三橫九縱投資地圖
未來的AI投資難成獨立賽道,將會分散到各個應用領域投資中。源碼堅信,AI技術是如今最激動人心和最具變革性的機遇,但AI在2-3年後將是一個消失的獨立投資領域。它會像第二次工業革命中的電一樣,成為基礎能力,給每個產業帶來新的商業機會,也解放數以百萬計現有工作崗位。
“靠譜”AI類創業公司的特征側寫:
●從技術創業開始,從技術層切入,找到優勢點後,進入某個行業做應用;
●好切入點,有行業Know-how的高管團隊;
●數據端卡位的意識;
●算法端可靠+性價比:基礎算法不落後,創始人能卷起袖子解決工程問題;
●To B創業公司占絕大多數,To C很少見。收入以項目制為主,初期一般是分包商地位。賦能傳統中間商/集成商/代理商是這個賽道里好的商業模式。
歡迎關註黑智
未來20年內,都不會出現強人工智能。
5月20日,2017CCF青年精英大會在北京國家會議中心舉行。本次大會由中國計算機學會(CCF)主辦,Xtecher協辦。大會邀請了30+位學界大咖,首次曝光12項高精科技,並設有人工智能、大數據、雲計算、信息安全、綜合領域等5大前沿技術頭腦風暴會。百度創始七劍客之一、酷我音樂創始人、北京大學人工智能創新中心主任、國家千人計劃特聘專家雷鳴做了主題為《AI時代,科研如何創造產業價值?》的分享。
雷鳴在演講中,總結了人工智能對未來的影響。他認為,智能革命會不斷的替代技能勞動者,進而把人類逼向創新勞動。未來20年,人工智能還將是弱人工智能時代,而在自動駕駛、金融、機器人、工業制造和醫療等領域,人工智能的公司正在快速改變世界。對於人工智能領域的創業,他建議,要找到需求、找到產品化的團隊以及調整產業態度。
對於科研如何創造產業價值,雷鳴表示:“科研是不斷進步的,但是產業是能不能用,好不好用。比如說人臉識別,錯誤率從8%-7%,每一步進步在科研上都是重要的,都是全球最好的。但是產業根本不管這兒,產業說我雇了一個人,假如說人的錯誤率是3%,你達不到3%對於我來說沒有用,你一旦超過3%立刻就有用了。所以說他是非常零散的。基於這麽多的區別點來講,很多人說這個挺難得。還是那句話,看到區別才能找到聯系,我們去思考這些問題。”
以下根據演講實錄整理:
各位計算機界的同仁大家下午好。我很高興,今天能夠跟大家分享一下我對人工智能時代科研如何跟產業結合的一些想法。我本人關註人工智能產業大概有四年之久。幾年前我和百度的創始人以及谷歌的高層有過溝通,大家認為這個方向發展前景很好,後來在這一方面投入了不少的時間,做了一些孵化、投資、研究,中間有不少想法,在此跟大家做一個分享。
人工智能將如何影響人類社會?
首先講人工智能對人類影響多大。大家都知道霍金,去年劍橋大學的人工智能中心成立的時候霍金講了一句話,“人工智能的產生可能是人類歷史上最重大的事情。”科學家說話都不願意說得太滿,他既然說到最高級,那就表示他認為人工智能是非常重要的。他對人工智能有很強的個人看法。
加州大學的Gregory Clork教授研究了人類一千年來的收入水平,人均收入和勞動生產率以及人均GDP是可轉換的。到公元1820年為止,幾乎過去兩千多年,人類的勞動生產率基本沒有什麽變化。
工業革命之後出現了非常完美的指數曲線,今天我們看這個會議室所有的東西,我們自己穿的用的吃的,基本上所有東西都是過去兩百年前的產物。甚至過去幾十年,因為科技不斷進步,淘汰了很老的蒸汽機,現在都是最新電子電氣化設備,社會發展得很快。工業革命在這里給我們演繹了一個完美的拐點,從這兒我們再想為什麽?為什麽工業革命會使人類有一個突變性的變化,值得我們深思,如果我們找了這個東西,我們就會知道是什麽在影響人類的發展。
舉一個簡單的例子,從農業社會到工業社會,勞動生產率的客觀數據就是以收割為例,農業社會一天一畝,工業社會一天一百畝,這是一百倍勞動力的提升。為什麽會有這個提升?因為有了收割機,而收割機只是一個事情,但並不是因為收割機而產生勞動生產力。
收割機分為設計、創新、生產、銷售使用等一些環節,哪一個環節是最重要的,是整個價值鏈的起源?顯然就是創新。誰第一個把收割機設計出來了,這才是推動社會勞動生產力的根源。包括我們剛才看到的,現在收割機一天一百畝,如果說誰通過創新把它變成一天兩百畝,在勞動生產率這項任務上又提升了一倍,也就是說,我們認為社會的快速發展來源於創新,來源於不斷創造出這個世界上不存在的東西,而這個東西恰好對社會的發展起到推動作用。
大量有效的創新在推動著社會的發展,第一個造出電腦,第一個發明算法,第一個做了O2O等等,創新不僅僅是科技,也包括了我們剛才講的商業模式。所以創新是推動社會發展的根源,工業革命之所以能夠拉出一個完美的曲線,就是因為工業革命使得更多人開始參與創新。
工業革命之前是農業社會,農業社會、工業社會,現在要進入智能社會,或者說是信息社會。農業社會很重要的體力勞動者占社會的90%,他們基本上是農民;技能勞動者占社會總人口的個位數,這些人就是我們平常所說的鐵匠、磨坊等等;手工業者和管理人員,創新勞動占1%,比如發明新事物(四大發明)的人等等。
但是過去發明創造更多是偶然事件產生的,工業社會之前很少有一個機構專門負責研究、創造。而進入工業社會後,工業革命產生能源和機械。這兩個因素做了什麽事情?其將體力勞動完全從社會舞臺上抹掉了,所有的農民不能從事以前的工作了,進而改變整個社會結構,改變技能勞動。
工業革命也是現在教育的起源,在這兒開會的都是大學教授、研究者,都是現代教育的一份子。現代教育為什麽往這兒走,就是因為在農業社會里面我們更多依賴生物能量,即體力。工業社會靠技能,技能和體力不等價,技能是需要培育的。現在來看,技能勞動占社會90%以上,另外一部分也把很多人逼向創新勞動,有明確的機構做創新,比如大企業里邊的研究院,比如我們所說的學校,咱們中科院的各種研究機構、研究中心,經費支持也很多,所以大量的資源、人力物力財力湧向創新,使得創新推動社會迅速進步。
智能到底會做什麽事情?大家說數據等價於過去的能源,這個比較對不對,在與很多專家及企業家都聊過後,我們覺得也對也不對。對在哪兒呢?數據確實與過去的能源有相像之處,沒有數據,算法根本轉不起來。那麽不對在哪兒呢,就是其中一個屬性很不一樣。能源是標準化產品,是可流動的,你去國際原油市場按照標準的價格一定能買來相應的石油,是可購買標準化的產品。但是我們今天發現私有化非常嚴重,雖然我們也在推動所謂的數據交易平臺,但是大量的數據,由於各種原因是私有的,比如微信數據,除了騰訊可訪問之外,我相信任何其他一家公司很難訪問到,還有一家可訪問的是政府。這樣的話,數據的私有化在這一波里面是很有意思的事情,大家創新很多都需要顧及到這一點。
智能革命到底改變什麽?其實智能革命會不斷的替代技能勞動者,我們可以看到掃地機器人;下一步的人臉識別會把安防領域保安以及檢票替代;自動駕駛會把司機替代。不斷往前推動,進而把人類逼向創新勞動。在座大部分都是創新勞動,在研究各種新算法,新的東西,所謂的技能勞動更像你經過了一個培訓學習之後,然後有相對標準化的方法對社會提供一個服務。創新勞動主要的人大部分提升之後,可以預計社會進步還會再加速。將來還有一條曲線更快,會迅速走上去。
未來20年,人工智能的發展會如何?未來總是不可預期的,我們只能大概的看一看,去想一想。所說的有可能都是錯的,但我們還是盡量地想去透見未來的星星點點。全球前五大市值公司跟互聯網、或者軟件有關的公司,也可以做某種預期。
我們認為20年前前五的公司都是和人工智能有關的公司,人工智能的公司正在快速改變世界,互聯網到現在不過20年的時間,人工智能很多人認為去年或者今年,最多推到前年算元年,這樣的話未來20年將會翻天覆地。
這里面其實有幾個特別有意思的事情,我們看這五家分析,首先是這里沒有百年老店,願意讀書的人,尤其讀管理學,大家有一定年紀的人看過一本書叫做《基業常青》。這本書非常火,後來這本書出版以後5-10年,《基業常青》的公司有一半就不常青了,大家覺得很困惑,總結出來的規律到底有沒有用?後來寫了叫做《從優秀到卓越》。看這個圖會發現一個很有意思的點,這五家公司歷史最長:微軟,1975年建立到現在為止不過40年的時間,蘋果和微軟是40年的公司,另外三家是20年的公司。我們因此得到一個東西,不存在永久的偉大公司。第二,偉大公司在一個偉大的時代,做了一件非常重要的對於人類有貢獻的事情。所以未來人工智能正在一個風口,這里面將來會湧現出很多重要的公司,會改變這個世界和人類。
實現路徑,人工智能怎樣影響這個社會,大體上總結有幾點:
第一,未來20年還是弱人工智能時代。很多人一談就談到了什麽天網滅掉人類,跟人類競爭,這個東西還比較遠,我們都是搞科技,那是幾十年以後我們再說的事情。
第二,低技能到高技能,這個技能人學的時間越短,機器學相應複雜度低一點。最普遍的機器人就是掃地機器人,因為掃地這個技能比較容易,還有說停車場的收費現在也在變化,我記得這是最近兩年的事情,以前每次都要取個卡,現在你的車直接開過去,視頻這個車直接拍過去了。這個低技能到高技能,高數據化向高技能,互聯網有關的數據走得早一點。現在金融走得不錯,歷史上這些產業上積累了很多的數據,因此大量的數據就容易學習。但是有一些行業比較累,比如說自動駕駛,谷歌各個企業其實現在都在攢大量的數據,包括農業、工業也是數據量嚴重不足,醫療數據量很大,但是質量嚴重不足。這些都面臨著一些問題。當這些行業不管通過創業公司或者大公司,從零開始攢數據或者清洗數據,當數據量足夠的話,相應的智能也會慢慢發展起來。
智能駕駛領域基本上來看,5年左右應該有商業化的車。很多時候我們開玩笑,或許20年以後人在路上開車都是違法了,因為自動駕駛,它們之間的車聯網可以有非常好的交流溝通,所以人上去跟它們反而很難溝通,所以人其實有一個很大的問題,從生物學上來講,就是我們看到了事情,然後轉化為腦子處理,再轉化為行動有一個0.1-0.2秒的延遲,但是車,如果高速傳感器高速運轉,比這個高效多了,互相之間可以同步做很多的事情,使得效率大幅度的提升。
機器人我們看到有挺多的,掃地機器人賣得不錯,我跟國內很多家企業都討論過這個問題,包括百度、華為、聯想都在想人工智能到底怎麽起來,亞馬遜並不是人工智能見長的公司,但全球銷量超過一千萬臺,正在逐步建立自己的生態,變成一個新的所謂互聯網入口,這些都值得思考。很多人都認為是一個對話系統,但是其實更像是一個萬能系統。只解決狹窄領域的問題,現在逐漸往上面加東西。
工業制造,現在這一塊也是發展得非常快,很多現在新建的這些,比如特斯拉工廠實現了所謂無人化,無人不是沒有人,是沒有流水線的工人,只有工程師盯著整個系統的運轉。
醫療,大家也知道了,今年開始或者去年年底,陸續有過幾篇文章,在醫學影像、疾病預測等等方向上取得一些突破。逐漸在一些狹窄領域上、一兩個點上達到或者超過了人類醫生的水平。
整個螞蟻金服估值非常高,在全球獨角獸排第一的公司,它做的核心就是阿里積攢了大量的交易數據,進行分析之後做出來很多模型,用到金融上。對於信用和貸款這一塊,我們更相信它會變成產業鏈或者行業金融的形式,誰擁有這個行業的數據比較多?進而產生一個衍生品,有數據對借貸者進行準確評估、風險控制,因此就可以更準確、更敢於把錢用給他,保證他能還。如果說從外面弄,沒有這些基礎數據,難度會非常大。
所以很多人說現在Kensho很火,想想它未來在哪兒,誰有競爭優勢。
創業的風險和機會
有些人說創業是過程,中間熱一段大部分還是未到,只有未來能夠站得住腳的假設,才能真正走下去。
大公司的創業公司,現在創業蠻多的。我知道現在很多人,尤其很多院校的一些教授、博士參與或者說已經出去創業了。我相信未來的五年十年,還會有很多這樣的現象。因為我們有非常深厚的技術積累,用到產業上,一旦找到一個好的點就真的能夠突破了。
這里面去創業到底有什麽風險,大概幾年前很多公司的高層都在聊,人工智能這波創業,創業公司有沒有機會?是不是就是大公司的菜?BAT有錢有人有數據,怎麽辦?
我們看一下這大論據,第一叫人才很貴,招人很貴。在座的人更多有兩個想法,第一個是說我管這個部門,我管這個系,這個學院,我下面的老師被挖的差不多了,還有一堆人正在被搶怎麽辦?還有一種想法,我正在被挖,我到底該留下來還是該走?現在很多的一些博士剛剛畢業,做美國的話有一些好學校,做得非常好的,博士一畢業薪酬往百萬美金沖,國內上百萬人民幣的也有一些,這個行業是真的非常熱。你說一個創業公司招不起人怎麽辦?
數據剛才也講了,BAT真的有很多數據,他們天天都在搜集數據,處理數據,分析數據。我們作為一個創業公司沒有數據怎麽辦?怎麽跟BAT相比?
機器,大公司有機器,小公司有夢想。你可以融資,挑戰就是機遇,你被逼到死角要找。我特別欣賞北大的師兄俞敏洪,絕望中尋找希望。這個創業事情永遠都是九死一生,如果你只是看到困難就不要做了。
在這種高壓下,機會有沒有?
從人才方面講,最優秀的人才是願意打工還是願意自己幹?大家心里其實比較明白。最近我們看到了很多創業公司,都是從BAT、谷歌、臉書、微軟跳出來的,有一定成就的人做的。他們更願意追求自己的理想。有時候在大企業他會遇到很多限制、機會的問題,所以很多的創業者覺得優秀人願意出來創業。
不能把數據狹窄化,認為互聯網數據就是這個世界上僅有的數據。其實我們要知道現在互聯網僅僅是有一些產業的數據,比如說阿里是零售業的數據,百度是信息服務業的數據,騰訊是我們所說的人的交流和溝通一些數字娛樂的數據,但是比如說醫療數據,這些企業都沒有交通運輸物流的數據,農業數據沒有,制造業數據沒有,法律數據沒有,很多行業的數據他們都沒有,因此這些行業都有很多機會可以做。
機器,最近大家都知道,人工智能公司還是很能融錢的。我剛才跟他們聊,他們以前投的公司最近剛剛拿了三個多億的融資,一旦有未來的話,很多VC真的給你錢,你燒起錢來比大企業膽量還大。你還記得O2O的時候,可以燒到百度跟阿里發顫,創業公司還拼命燒,沒有上市,就沒有股東,所有股民的股東。投資者只要看遠期,他是支持你燒的,但是作為大企業,你的利潤突然有一個劇烈的下降,你很難跟股民解釋。所以這個里面有時候不好說,創業上還是有機會的。
怎樣做產業需要的科研呢?大家對這個問題蠻感興趣的,我自己也做很多的事情。我在北京大學人工智能創新中心當主任。我們主要想做的事情,就是學校、科研機構擁有最好的技術,怎麽樣能夠落地呢?
我特別關註AI加產業,包括北大也開了一門課,我發現因為AI很火,學校選修的學生很多,400多名研究生選了這門公選課。因為教室的原因,最後錄了兩百人。人工智能是大家熱切關註的領域,那麽怎樣做一個有用的研究呢?
我簡單分享一下個人的想法。我從網上獲得的數據顯示(這個數據不保證完全正確),中國的研究成果轉化率:發改委副主任說是10%,歐美是40%,當然我也不知道這個歐美40%是不是真實的,但是總體來講確實不高,做了這麽多研究真正能夠落地的多嗎?
科研如何創造產業價值?
我們再看一個事情,科研和產業真的能夠聯合起來做成一些事情嗎?其實不一定。
先說不同點,首先科研追求學術價值,產業追求生活中的需要。什麽是學術價值?在一個地方做到世界最領先這是學術價值。但是產業不是這樣,他說我解決一個問題,能解決問題就行了,不需要最先進的技術。比如:掃地機器人,也是人工智能,但是並沒有太多人工智能,就是路徑規劃加一些硬件做得比較好。
解決實際的問題和高大上的、做最活的東西之間確實有一些不匹配的點。另外我認為有一點特別重要,單點突破,完整的產品或服務。學術在一個點上精益求精,很多人參與創業或者在一些公司做顧問,你就會知道如果做產業的話,其實我不關註你那個刷的榜,把這個攝像頭安在海關上,能夠給我抓一個罪犯,這個人到底是不是假證,能不能認出來這是我最關註的事情,同時要給我一個完整的解決方案,這個不能宕機保證穩定性,是個完整的東西不是一個某一個點。
科研為了做一個事情不惜代價,但是產業不可以。舉一個例子,大家做量子研究,需要投入非常高,但是產業絕對不可以這樣,產業要以買得起來衡量。舉個例子,比如說谷歌的眼鏡,感覺蠻酷的,但是這個東西很重,我記得在美國賣的時候大概是一兩千美金,完全不是老百姓可以買的,因此這個東西很難落地。例如,像汽車也是非常貴的,所以必須要降到一個可接受的範圍。比如做一個特別好的手機,一個手機賣兩萬我敢保證不一定賣得很好,但是賣四千我覺得你可以把蘋果幹掉了。
科研是不斷進步的,但是產業是能不能用,好不好用。比如說人臉識別,錯誤率從8%-7%,每一步進步在科研上都是重要的,都是全球最好的。但是產業根本不管這兒,產業說我雇了一個人,假如說人的錯誤率是3%,你達不到3%對於我來說沒有用,你一旦超過3%立刻就有用了。所以說他是非常零散的。基於這麽多的區別點來講,很多人說這個挺難得。還是那句話,看到區別才能找到聯系,我們去思考這些問題。
研究的時候完全可以從真實需求中探求課題,做人臉識別挺好,不要做狗臉識別。完整服務的這一塊確實很難服務。我們需要找關鍵的部分,比如說用來抓壞人,這個人臉怎麽識別,你把這個解決了,再配一些其他技術就可以賣錢了。良好的性價比,研究的時候看這個東西成本是否是可控的。
能不能用,好不好用的問題。這個語音基本上在實用很邊沿,人臉提前研究的時候可能錯誤率還高一點,可能接近實用投入很大量,做成全球最高,當他一有實用價值,你的價值可以展示出來了。我並不否認做基礎研究,大家一定要註意,確實需要很多人做一些基礎的研究。大家需要有一個長遠的思路,大家有些人更願意跟產業結合,用這些東西好好想想,選擇研究課題的時候確實落地起來更容易一些。
魚和熊掌可不可兼得?你選擇理論物理學咱們就先別想它能不能用,產業研究就想怎麽樣落地。科研+產業型研究可不可以?這項東西很高大上,但是接近產業化了。AI時代,科研產業化有什麽特點?什麽樣的研究特別有價值?
第一,AI做的東西快要接近或者超過人了,這一般都是非常有價值的,一旦超過人,它的產業價值立刻就可以出來了。第二,有足夠的數據。不要做一個東西,BAT有足夠的數據你沒有數據真的很難打,但是跟醫療機構合作,有教育機構有數據可不可以,這非常好,BAT跟他們合作相對更難。因為傳統產業在過去很長時間老被顛覆,它都快狂掉了,這個時候BAT再找他合作,第一想法就是黃鼠狼跟雞拜年。然而小企業合作起來更順暢,你可以跟他一起共贏,但是我們也知道最後能否共贏那是一個未知數,但是起碼開始進得去。
關於創業我有幾個建議:第一是找到需求,創業團隊在介紹自己技術的時候,常說自己的技術可以應用很多行業。例如:教育、安放、工業等,都可以用這個就是沒用。因為技術不落到一個實際場景上解決實際問題就是沒有用,所以我們要迅速找到你的需求。第二找到產品化的團隊,一個技術能用到原型實用有很大的距離,光靠科學家完全不行,找到工程團隊。商業化的團隊。第三是調整產業態度,我知道很多創業公司在那兒刷榜,其實刷榜已經少了。刷榜沒有什麽太大用處,刷一刷一個技術發展到一定程度,大家差得不多,但是實際的應用環境下的話,你結合不好反而差得特別多,所以這個里面一定要找,就是調整到產業態度,我解決實際問題解決得好不好,我讓產產業人評價而不是搞技術的人評價。
最後說到商業模式,現在很多VC最後一個問的很多,你怎麽樣賺錢你跟我講清楚,你有技術別人也有,現在的技術不太稀缺了,不像兩年前你說我做AI,別人說你很有名我就研究。大型科技公司已經占領的領域確實有挑戰,但是有沒有機會,也有機會,難一點。這個世界沒有任何是必然的,職業概率。
下面這些領域我覺得很有機會,比如說企業服務,以前叫BI換成新BI,客服機器人,幫企業找到他的客戶,輿情監控等等一些東西;醫療健康,包括家庭機器人,掃地機器人,助理,自動駕駛,包括法律、審計這些,其實都是有機會的。
每一個產業都有很大的市場,比如醫療領域,中國GDP6%美國18%,在每個比整個互聯網產業還要大的產業,當然有機會。比如:駕駛,基本上也是在中國10%以上的GDP的產業。我指的較物流運輸業,整個加起來非常大,機會非常多。
其實我們在一個非常令人振奮和激動人心的年代,AI的技術已經到了一個突破口,因此這些技術會不斷應用在各行各業里面,大幅度提升這個行業的效率,解決實際的問題,進而使得行業有深遠的發展。我相信未來20年一定會比過去2我年的更加精彩,機會更多,無論大家搞研究或者搞產業,只要在這個領域里面我相信整個能夠為社會做的價值,機會,比以前還要多,謝謝大家。
歡迎關註黑智
中國創業就像跑百米一樣,要跑的非常快,第一個到達終點才可以活下來。
5月20日,以“科研·產業·融合”為主題的2017CCF青年精英大會在北京召開。本屆大會由中國計算機學會主辦,科技創新產業服務平臺Xtecher協辦。
中國工程院院士趙沁平、香港中文大學教授湯曉鷗、百度創始七劍客之一雷鳴、清華大學教授鄭緯民、IEEE Fellow陳熙霖、中國人民大學教授杜小勇、中國計算機學會秘書長杜子德、中國人民大學信息學院院長文繼榮、紅杉資本合夥人周逵、高榕資本創始合夥人嶽斌、寰景信息董事長陳擁權、CCF YOCSEF學術委員會學術秘書陳健等近五十位學術界、產業界、投資界大佬和數百位計算機領域的科研人才出席了此次活動。
本次CCF青年精英大會進行的“思想秀技術秀”上,共有22位青年學者、科技人才展示了前瞻性的思想觀點以及最新的技術成果。最終,評委會選出了2位優秀青年赴 CNCC(2017中國計算機大會,將於10月26-28日在福州舉行)進行演講。
此外,大會還公布了“青竹獎” 獲獎名單,表彰推動科研進步的青年學者,鼓勵產學研各方面創新人才。“青竹獎”由中國計算機學會牽頭,聯合Xtecher 共同發起,經過評選委員會李開複、王恩東等17位委員的專業評審,最終評選出了6位獲得“青竹獎”的最具潛力青年精英:碼隆科技聯合創始人兼CEO黃鼎隆、真格基金合夥人兼首席投資官李劍威、清華大學芯視界(北京)科技有限公司創始人兼董事長鮑捷、中國科學院計算技術研究所研究員張雲泉、雲從科技公司創始人周曦、物靈科技公司聯合創始人兼CEO顧嘉唯。
在會議上,香港中文大學教授湯曉鷗做了主題為《人工智能的明天,中國去哪?》的特邀報告。湯曉鷗在演講中,講述了人工智能和深度學習的發展,並指出,深度學習的三大核心要素,就是算法設計、高性能的計算能力,以及大數據。
湯曉鷗表示:“無論人工智能怎麽樣發展,年輕人選擇創業還是做研究,其實我們要做的就是三件事情:第一,我們需要花時間把基礎打好。剛才趙沁平院士講得很好,就是要堅持,真正花時間把人工智能的基礎打好。第二,我們要創新,要做新的東西,不要老是跟在別人後面走。第三,我們要把 ‘漂在上面的東西’落地,最終實現產業化。”
以下根據湯曉鷗演講實錄整理:
今天我講的題目是:《人工智能的明天,中國去哪兒?》我選了一個比較大的題目,希望能壓住場。原來我想的題目比這個還大:人工智能的明天,地球去哪兒?後來發現“一帶一路”會議剛剛開完,地球去哪兒的問題已經解決了,我還是回到我的小題目——中國去哪兒。
不管是中國人工智能接下來如何發展,還是年輕人如何創業或者做研究,我們要做的事情也就是這三件:
第一,要堅持,要花時間把基礎打好。
第二,要做創新。要做新的東西,不要老是跟在別人後面走。
第三,要把飄在上面的東西落地,要產業化。
今天從我們實驗室的研究成果和公司做的產品,來講講我對這三個方面的理解。
人工智能和深度學習的突破
首先,什麽是人工智能?這個概念現在已經非常難定義了,大家幾乎把所有的事情都往人工智能上靠。從我的理解來講,人工智能真正落地的部分就是深度學習。因為以前的人工智能確實是在很多情況下用不起來,人手設計的智能還是比較難超越人來做某一件事情。而有了深度學習之後,我們可以把這個過程變成一個數據驅動的過程——當做某一件特定事情時數據量及參數量大到一定程度時,機器就可能在做這件事情上超過人類。很多現實中落地的產品化的東西,大部分是深度學習做出來的。深度學習做的東西,成功的案例比較多,一方面是在語音識別領域,另外可能更多的是視覺這方面,所以大家可以看到很多計算機視覺方面新的成果。我今天給在座講的人工智能其實也就是計算機視覺,是用深度學習去做計算機視覺,就變得更窄了。
大家可以看到“深度學習“”這個詞在谷歌上的搜索情況:從2006年才開始有人搜索這個詞,是Hinton(黑智註:深度學習的開山鼻祖Geoffrey Hinton)和Yann LeCun(黑智註:Facebook人工智能研究院院長、卷積神經網絡之父)們那個時候發明了這個算法。這中間很長一段時間,2006-2011年曲線是很平穩的,只有學術界才會去搜索這個詞語,才知道這個事情。2011年突然之間搜索量開始呈現指數型增長,各行各業都在討論深度學習,現在搜索量已經非常的巨大。這條曲線形象的演示了深度學習的爆發過程。
深度學習到底在做什麽事情?實際上他所做的事情抽象出來是比較簡單的,就是在做一個從X到Y的回歸、或者說從A到B的Mapping(對應)——你給它一個輸入,我怎麽樣給出一個對應的輸出?特殊的地方就是深度學習把這件事情做得非常非常好。以前也有其他算法可以做,只不過一直做不過人,現在深度學習做到了極致。比如說給了一張人臉照片,它就可以給你對應出這個人的名字;給你一個物體的形狀,它就可以告訴你是什麽物體;給一個車的行駛場景,我就可以給你輸出這個車應該往哪兒拐;給一個棋局,它能算出下一步怎麽走;給一個醫療的圖像,能幫你判斷這是什麽病……實際上就是這樣的一個過程。不要把人工智能想象成可以超越人類,可以控制人類,這些都是所謂的“好萊塢的人工智能”或者想象中的人工智能,真正人工智能在現在這個階段其實就是做這麽簡單個事。當然做成這個簡單的事情其實已經很不簡單了。
最近這幾年深度學習確實在學術界、工業界取得了重大的突破。第一個突破是在語音識別上。Hinton和微軟的鄧力老師,在2011年用深度學習在語音識別上取得了巨大的成功。昨天可能大家在微信也刷屏了,我們中國科大畢業的師兄鄧力老師從微軟出來到頂級對沖基金工作。我的理解這也是一個A to B的mapping 的過程:把鄧老師的深度學習的經驗等內容都輸入到對沖基金的算法里,這個對沖基金的錢就自動Map到了鄧老師口袋里。
語音識別取得了巨大成功以後,緊接著在視覺方面又取得了重大突破。2012年時,Hinton在ImageNet上將圖像識別一下子提高了十幾個點,以前我們都一年一個點在推,他一年就推了十年的進步,在學術界引起了很大的轟動。2014年我們團隊做人臉識別,通過深度學習,做到算法首次超過人眼的成績。
最後,在2016年,還是谷歌最厲害,每年120億美金的研發投入沒有白投,下了一盤棋叫AlphaGo,這盤棋下完之後人工智能就不需要我們解釋了,大家忽然都明白了,人工智能原來是這麽回事兒,就是下棋。
接著人工智能在自動駕駛領域也取得了一些重大的突破。現在比較熱門的是醫療影像方面,借助人工智能進行診斷。
深度學習的三個核心要素
深度學習有三個核心的要素:
.學習算法的設計,你設計的大腦到底夠不夠聰明;
.要有高性能的計算能力,訓練一個大的網絡;
.必須要有大數據。
接下來分享我們在深度學習方面做的一些工作。我們從2011年開始做這項工作,一開始沒有開源的框架,所以要自己做很多的工作。做的時間長了,我們就做了一套Parrots系統,這個系統目前還不是開源的。
我們用這套系統訓練的網絡可以做到非常深,原來AlexNet是8層,後來GoogleNet在2014年做到了22層,後來Resnet做到了150多層,去年我們的PolyNet做到了1000多層。大家可以看到這個網絡發展趨勢,越來越深。這是我們設計的1000多層的網絡,比較細的線就是整個網,中間一個格往下走,放大出來的部分就是網絡的細節結構,這個網叫做Polynet,Dahua團隊的這個網絡設計和Facebook的Kaiming團隊的Resnet,在圖像分類上做了目前為止全球最好的結果,最後基本上成了我們實驗室出來的兩個學生之間的競賽。這個網絡的最後形狀有點像 DNA 的雙螺旋。
在物體檢測上大家也可以看到這個進步速度,2013年一開始的時候,200類物體的平均檢測準確率是22%,但是很快谷歌可以做到43.9%,我們做到50.3%,緊接著微軟是62%,現在我們做到最好結果是66%。這個速度是幾年之內翻了三倍,也是深度學習的力量,我們這方面的工作是Xiaogang和Wangli團隊做的。
我們訓練出來這樣一個大腦,可以把它應用到各個方向,做出很多不同領域的不同技術。在人臉方面我們做了人臉檢測、人臉關鍵點定位、身份證對比、聚類以及人臉屬性、活體檢測等等。智能監控方面,做了人,機動車,非機動車視頻結構化研究,人體的屬性,我們定義了大約70種。人群定義了90多種屬性。下面這些是衣服的搜索、物體的檢測、場景的分類和車型的檢測,車型檢測我們標註了幾千種車型的分類。在文字方面,小票的識別、信用卡的識別、車牌的識別,這些都是由深度學習的算法來做的。同時在圖像的處理方面,在去霧、超分辨率、去抖動、去模糊,HDR、各種智能濾鏡的設計都是用深度學習的算法,我們基本上用一套大腦做很多的任務。
深度學習另外一個門檻就是高性能計算,以前高性能計算大家都是講的CPU集群,現在做深度學習都是GPU,把數百塊GPU連接起來做成集群目前是一個比較大的門檻。我們在北京做了三個GPU的集群,在香港做了一個大的集群,用這些集群,原來一個月才能訓練出來的網絡,加速到幾個小時就能訓練完,因此我們訓練了大量的網絡。
深度學習第三個門檻就是大數據,如果把人工智能比喻成一個火箭的話,大數據就是這個火箭的原料。
我們與300多家工業界的廠商客戶進行合作,積累了大量的數據,數億的圖片,我們有300多人的團隊專門做這個數據標註。包括幾千類車型的數據、人群的大數據以及衣服的搜索和分類的數據庫,這些對於學術界以及工業界都是很有益的。實際上谷歌所做的數據體量更大,他們和National Institutes of Health (NIH)合作很快會開放一個非常大的醫療圖像的數據庫。在醫療方面我相信大家很快會有大量的數據進行處理,這個時候對於我們的高性能計算又提出了一些新的要求。
實驗室有幸對深度學習研究較早。在計算機視覺包括人臉檢測等各個方面起步較早,這里列了18項計算機視覺領域由我們在全球最早提出來深度學習解決方案的問題,也相當於對創新的一些貢獻。我們被評為全亞洲唯一的人工智能研究十大先驅實驗室,非常榮幸跟MIT、斯坦福、伯克利這樣的名校,以及深度學習的頂級工業實驗室臉書、谷歌的深度學習負責人團隊等等在一起獲選。我們也在研究一些現在沒有的技術,比如說,大家可能以前見過很多依賴深度攝像頭才能做的人體跟蹤算法(比如Kinect)。目前我們團隊做的算法,用很便宜的單個RGB攝像頭就可以做到同樣效果,這是非常不容易的,尤其要做到實時,在智能家居,自動駕駛等方面都有很大的應用前景。
下面這個工作是去年做的,根據一張照片里兩個人的姿勢,可以自動判斷兩個人之間的情感,是友好的還是敵對的。同時可以根據兩個人的表情也可以判斷兩個人的關系。所以以後如果你把你的照片上載到互聯網上,實際上我們可以判斷出來跟你一起照相的這個人和你具體是什麽關系。
這有什麽用途呢?大家經常會把照片放到網上,我們用這些照片分析這些人,如果你跟一個非常有名的人,或者跟一個非常有錢的人照了一張合照,那你這個人可信度可能就增加。或者你和一個罪犯、或者信譽不好的人拍了一張照片,你的可信度就下降。我們用這項技術可以做金融的征信,把不同人的關系網建立起來,把信用度傳遞出去。這個關系問題還可以做得更多,把一張圖片任何物體之間,哪個在上面,哪個在後面,互相是什麽關系,可以由一張照片判斷出來。
下面這是最新的工作,我們以前定義了70種人的特性,根據這個特性進行視頻搜索。現在定義一個新的搜索模式,是用自然語言來搜索,即我說一段話來描述這個人,把這個人描述出來以後用這段話去搜索我要找的這樣一個人。實際上,其中涉及的信息量是很大的,尋找也更加精準,我們已經建立了一個大的開源的數據庫來幫助大家做這個研究。
在這些數據中,從這些自然語言里面我們可以抽出不同的詞,用詞來描述不同的人,其信息量巨大,搜索準確率也大幅度提高。這是具體的監控方面應用的結果。用自然語言做人的搜索。大家可以想像一下在醫療上的應用,如在多模態的醫療診斷上。一個是醫療的圖像,一個是醫生的文字診斷,可以實時的識別出來,進行自然語言的分析,把兩個進行結合再進行診斷。
下面這個也是一項新的研究工作,根據這個Video,識別內容,判斷劇情屬性。以泰坦尼克號電影為例,你可以看到那兩個曲線,現在是浪漫的場景,代表浪漫的線就上來了,如果是災難,那個災難的綠線就上來了,實時根據這個內容判斷劇情,這也是去年的工作。
今年目前團隊又做了一個新的工作,可以根據電影的實時計算分析,來理解判斷這里面的劇情,可以把一個演員,在整個電影里面,在什麽地方出現,在那段時間是什麽劇情,用自然語言描述出來,把整個電影的內容分析,用計算機視覺和自然語言自動可以分析出來了。將來可以用來分析和插播廣告,還可以直接用自然語言搜索各種不同的片段。
我們還有一項工作是超分辨率,就是把很小的圖像放大,最大化還原細節。這是好萊塢電影的圖像,視頻抓到一個很模糊的嫌疑罪犯的圖像,然後把它實時的放大變得很清晰。這只是諜影重重電影上演的效果,還是很震撼的。
2016年的時候,推特跟谷歌密集發表了幾篇關於超分辨率的文章,其核心就是深度學習。而我們早於他們,就已經做了大量先期研究。我們在2014年發表了全球第一個用深度學習研究超分辨率的論文,在2015年又發表了一篇相關文章,2016年發表了兩篇,取得了更大的突破,而在2017年緊接著發表了三篇。我們的Cavan教授團隊是第一個做的,也是目前做的最好的。目前超分辨率已經走向實時以及效果實用化的階段,利用這項技術在某些實時監控,公安監控攝像頭可以把人看的比較清晰了。
而在自動駕駛上,我們也做了大量研究,六大類別的技術,有30多個細分核心技術。我在這里面就簡單舉幾個例子做演示。比如車的檢測、行人檢測、路道線的檢測、實時的場景分割……我們也做到前端,用前端的芯片做實時的效果。
這是人臉的布控系統,目前已在很多城市實時布控了。還有百米之外抓人,百米之外看到一個目標拉近然後進行人臉識別。
這是視頻結構化,把視頻里面的人,機動車,非機動車及其特性都檢測出來了,自動標註出來了,這樣把整個視頻變成了文檔,就可以進行文檔性的搜索。
下面這些也都是我們所做的技術的落地產品:在中國移動的實名認證系統,去年給中國移動做了三億人的實名認證;小米的寶寶相冊;華為Mat8的智能相冊;FaceU、SNOW等做的特效;微博相機;這絕大部分是基於我們的人臉識別、人臉跟蹤等技術做出來的。實際上在人工智能落地方面我們做了許多的落地產品,去年的雙創活動中幾百家企業里面選了兩家代表中國人工智能,右邊是百度,左邊是商湯科技。
因為主辦方希望我講一下學術研究和創業的關系,我最後總結一下,在中國創業是一個什麽感受?我覺得中國創業就像跑百米一樣,要跑的非常快,第一個到達終點才可以活下來,但是這個跑道並不是塑膠跑道,而是滿地都是坑的土路。這場賽跑有兩個結局,一個是全力跑到最快,另外一個是剛起步就掉到坑里了。創業的困難是一定存在的,年輕人要不要創業?盡管路上的坑比較多,但還是可以試一試。
另外用什麽錢創業也是個問題?什麽錢可以用?什麽錢不可以用?我的忠告是,首先父母的錢你不可以用,那是他們養老的血汗錢;你自己掙的錢可以用,你的第一桶金可以用,你們還年輕,用光了可以再去掙。投資人的錢是可以用的,因為大部分都是有錢人的錢,我覺得劫富濟貧人人有責,所以如果大家一定要創業那就創吧。
歡迎關註黑智
“中國的BAT有上億用戶群,如果他們用我們的TensorFlow,可以運轉得更好,預測用戶、更快地服務用戶。”
在AlphaGo和柯潔首場人機大戰的第二天,當被第一財經CEO周健工問及如何對比中國BAT和Alphabet AI的優勢時,Alphabet執行董事長施密特這樣回答,還不忘給自家產品TensorFlow打一回廣告。
在施密特眼里,中國是互聯網的中心。而之所以進行AlphaGo和柯潔的比賽,是希望通過柯潔去看看AlphaGo的潛能,從第一場的結果來看,差距也非常小。
一個小插曲是,在3個月前的RSA安全大會上,施密特曾承認自己錯了,誤判了人工智能。過去他對人工智能持一定的懷疑態度,直到後來他意識到AI對全球經濟和Alphabet完成自己的使命至關重要。
“我80年代就研究了人工智能,但很多嘗試失敗了,我也放棄了,80年代末,深度學習神經網絡發明出來並且很快升級,今天的方法20年前的電腦是不能有的,正式因為今天的電腦有了這個能力,才讓點子成真,今天的TPU二代采用浮點運算,非常強大和很準確的提升,這是智能時代的開始。”他對周健工說。
他還調侃道,如果自己是一個22歲的年輕人,首先會希望到DeepMind、TPU這樣大的業務和方向中提升自己,接受挑戰,然後利用學到的人工智能的技術,應用到更多實際方案和問題中。
施密特認為,人工智能的創新速度甚至是呈指數級的。比如神經網絡和深度學習的出現,機器可以實現自我學習,開始加快叠代。
具體到應用領域,施密特認為最大的影響是翻譯,“這是我這輩子都沒想到過的事實。”此外,當電腦有了視覺,電腦可以推理,就會發生質變。
當被問到最看好的人工智能應用領域時,施密特的答案是醫療健康。
“醫療領域需要大量培訓數據,生理健康數據太充分了,有治病率和死亡率等。技術可以促進人健康,生理學和藥物學未來5年將給人類巨大貢獻。”
他舉例說,iPhone和安卓的出現不過才十年,人們現在很難想象離開手機如何生活。”
至於人工智能的未來以及和人類的關系,他不認為會造成大規模失業和威脅。
他認為,未來AI的發展,可能的方式是人類+人工智能的結合——機器更聰明,成為人有力的助手。例如,一個化學家,可能沒法窮盡所有的論文,但可以通過與一個相應的機器模型的對話、問問題,解決時間,提升科研能力。
提到失業問題時,施密特拿“撫養比”來舉例,老齡化和人口壽命變長讓每個人負擔的“撫養”任務變得更重,但之所以經濟還能持續發展,是人工智能等帶來的賦能。
當談到人工智能領域的競爭時,施密特談到了目前爭奪人工智能話語權的競爭。在他看來,無論是亞馬遜的 Echo 還是其他公司,都在利用最適合自己的方式,去使用人工智能、建立通用語言。所以目前在人機交互、機機交互方面現在競爭也非常激烈,而且這樣的競爭也肯定在中國發生。
對於AI會不會被少數精英和巨頭公司掌握,從而造成社會不公平和壟斷的負面擔憂,施密特認為不會出現這種情況。他認為,AI像手機一樣會讓每個人受益,很多創業公司也會利用AI成長為新的巨頭。“中美創業者很多,他們可以連續叠代。這是智能時代,還有更多公司有待出生,如無人駕駛,醫療,智能交通和分布式智能雲。當我們使用tensorflow在各行各業應用時,可以不斷推陳出新。”
第一財經CEO周健工與Alphabet執行董事長施密特主要對話內容:
周健工:作為IT領域最重要的思想家,您的想法對我們影響深遠。您如何看待昨天這場比賽?
施密特:柯潔準備充分,他借鑒了AlphaGo的打法,也在想辦法打敗AlphaGo。
周健工:AI現在大熱,引發很多人思考,那麽AI技術將如何影響生活?
施密特:最大的影響是翻譯,這是不得了的成就,這是我這輩子都沒想到過的事實。此外,當電腦有了視覺,電腦可以推理,就會發生質變。
周健工:AlphaGo背後有很多應用領域、產品和服務,哪個領域潛力最大?
施密特:健康潛力最大,醫療領域需要大量培訓數據,其生理健康數據太充分了,有治病率和死亡率等。技術可以促進人健康,生理學和藥物學未來五年將給人類巨大貢獻。
周健工:技術進步如何帶來AI,AI會帶我們去哪?
施密特:最大變化就是神經網絡,深度學習。機器學習讓我們可以讓系統相互學習,可以指數級地進步。
周健工:為什麽您曾經錯判了AI的重要性?
施密特:我80年代就研究了人工智能,但很多嘗試失敗了,我也放棄了,80年代末,深度學習神經網絡發明出來,很快升級,今天的方法20年前的電腦是不能有的,技術是使能,因為今天的電腦有了這個能力,才讓點子成真,今天的TPU二代采用浮點運算,非常強大和很準確的提升,這是智能時代的開始。
周健工:數據爆炸如何應對,知識碎片化時代讓我們不得不用AI技術嗎?
施密特:化學生物學這些領域很複雜,如果化學家和AI合作,當化學家睡覺時,AI可以建議他做哪些研究,就像美國化學家和中國化學家不斷切換閱讀,24小時運轉一樣。
周健工:Alphabet是AI為先的公司,中國有BAT,這些公司都有未來大計,Alphabet AI有哪些戰略優勢?
施密特:BAT有上億用戶群,他們如果用我們的tensorflow可以運轉更好,預測用戶、更快服務用戶、自我加速並可以不斷提高。亞馬遜蘋果FB也用我們的系統。我們有自己的產品,亞馬遜也有Echo,競爭可以推進發展,中國也一樣。
周健工:AI對未來不是平均分配的,矽谷精英們可以靠他一夜成名,那麽美國中產階級註意到這個技術了嗎?AI會走進尋常百姓家嗎?
施密特:Alphabet能走進尋常百姓家,百度也是,只要技術打造在開放環境中,就可以走進尋常百姓家。它可以推動每個人的交易速度,中國那麽多人上網,每個人都是受益者。當然不平等也存在,但不是技術產生的。我們關註如何讓消費者受益,手機被發明後,剛開始很貴,但越來越便宜,這是革命。未來社會老齡化,撫養比降低了,我們可以用機器人助力人。
周健工:我們擔憂壟斷,美國有五大巨頭,中國有BAT,他們有很多數據、人才和強大的計算基礎架構,接下來會去向何方?如果基於AI的社會,會不會五大巨頭和BAT獨統天下?
施密特:我不同意。中美創業者很多,他們可以連續叠代。這是智能時代,還有更多公司有待出生,如無人駕駛,醫療,智能交通和分布式智能雲。當我們使用tensorflow在各行各業應用時,可以不斷推陳出新。
周健工:Deepmind和普通公司不一樣,他的創新戰略是什麽?
施密特:Deepmind很獨特,來自不同領域的科學家集合於此,開發出強人工智能,讓人更聰明,賺更多錢,從而應用到更多領域。當強大的東西到來時,你肯定會賺錢,你就知道如何讓用戶訂閱,廣告分發。Deepmind也會針對這個開發。
周健工:您對大學生有何建議?
施密特:如果我今天22歲,我會做計算機科學,在Deepmind公司工作,去做大事,因為這是萬里長征第一步,會給世界帶來積極正面,讓每個人智能,一邊賺錢一邊解決問題。中國是人工智能領軍國家,很多大學都有。
未來已來,等你啟動!
經過了60年,人工智能在2017年,正式走向主流。
AI以前所未有的力度覆蓋了各大媒體的頭條,成為人們已不陌生的話題。但和之前不同的是,一場關於人工智能商業化的革命,已然顯露雛形。
人工智能在2017,創業的難度已經大大降低,創新的大門正在向各種規模、各種行業參與者敞開。
算法不再是護城河,智能革命走向現實應用。在人工智能相關技術驅動下,推動全新的應用場景落地,助力產業升級,成為這個時代的焦點話題。
人工智能如今已經有了規模商業化的技術基礎與市場潛力,我們已經處於一個產業化爆發的前夜。
因此,創業黑馬旗下新媒體黑智(VR-2014),聯合鉑諾,邀請多家專業投資機構合作,從產業洞察的角度,重點關註幾年來,在人工智能應用場景落地、推動產業升級領域不斷探索的創新創業公司,評選“2017年度最具商業價值人工智能創新公司TOP50”榜單,最終結果將在6月底公布。
評選流程
❶在線報名
將由專業投資機構和專家推薦、創業者自薦的方式征集候選名單。
報名標準:
1、主營業務是基於人工智能技術提供產品/服務,或者AI的支持服務提供商;
2、公司主要在國內運營,已有具備創新性的產品/技術研發成果推出;
3、公司未上市,融資輪次在C輪以下,並至少獲得天使輪以上融資;
4、公司具有較強的商業前景和發展潛力,項目創新性強。
❷網絡展示
自薦或推薦之後,篩選出的候選名單將在i黑馬網/黑智(VR-2014)進行展示。
黑智將通過創業家&i黑馬媒體矩陣,聯合多家網絡媒體、紙媒對進入候選名單的人工智能優質公司進行專題報道,並邀請優質人工智能企業創始人在“學吧APP”進行直播。
❸專業評委團評選
我們將邀請頂級投資人、人工智能技術專家、著名企業家專業評審,成為評委團成員。他們將從專業角度對候選名單進行投票評審。評委將從產品業務、團隊、投資價值、市場前景等領域進行投票評選。並在2017年6月底之前完成評選過程。
評選結果將在i黑馬、黑智等創業家媒體矩陣、合作媒體等渠道同步傳播。
頒獎典禮
6月24日·北京
人工智能先行者大會
基於人工智能技術推出產品/服務,
助力全新的應用場景落地,推動產業升級,
AI+金融、AI+家居、AI+企業級服務……
我們將選擇:
3個不同場景;
5個項目路演;
邀約不同的場景新革命的先行者,
共同討論這場變革。
同時,揭曉榜單,盛大頒獎!
主辦方:
聯合發布:
合作媒體:
合作機構(排名不分先後):