上世紀90年代初,劍橋大學特洛伊計算機實驗室的科學家們編寫了一套程序,在咖啡壺旁邊安裝一個便攜式攝像機,鏡頭對準咖啡壺,利用計算機圖像捕捉技術,傳輸到實驗室的計算機上。這個簡單的“本地咖啡觀測”程序方便了工作人員隨時查看咖啡是否煮好,省去了上上下下的麻煩。
後來這個監測咖啡的系統又經過其他同事的更新通過實驗室網站連接到了因特網上。沒想到的是,僅僅為了窺探“咖啡煮好了沒有”,近240萬人點擊過這個名噪一時的“咖啡壺”網站。後來這個咖啡壺被命名為“特洛伊咖啡壺”,也是物聯網最早期時候的一種形態,只是當時還不存在“物聯網”的定義。
這只是故事的前序。真正的“物聯網”概念最早由英國工程師Kevin Ashton(凱文·艾什頓)於90年代中期提出,你想不到的是,啟發來源於一支唇膏。
唇膏的秘密
在提出物聯網概念之前,Ashton的成長經歷與很多人一樣,在不斷嘗試中選擇、放棄、堅持。
他出生於英國伯明翰一個單親家庭,後隨母親搬到倫敦,媽媽給他買了一個蘋果電腦二代,激起了Ashton編寫程序的欲望。但隨後他發現自己更加感興趣的是文學和寫作,在周遊北歐過程中,學習了挪威語,在易蔔生的小說里尋找快樂。
1990年, 21歲的Ashton決定要上大學了。出於對北歐文學的熱愛,且這樣冷門的學科被錄取的幾率更大,他申請了倫敦大學的斯堪的納維亞文學課程,最終被錄取了。
1995年,他和朋友一起開了一家面條快餐店(noodle bar)wagamama,並幫助它在網上建立起品牌形象。後來因為創始人Alan Yau沒有錢投入互聯網的運營, Ashton選擇了離開。現在wagamama在全球已經擁有140家門店。
受益於在大學校報當主編時結識的廣告商寶潔,Ashton最後加入了寶潔公司幫助其建立玉蘭油的產品線。好奇且不安於現狀的Ashton在那里發現了“唇膏”的秘密。
當時還是寶潔公司(P&G,Procter&Gamble)一名產品經理的Ashton觀察到貨架上的一排棕色的唇膏總是持續缺貨,又不能及時補上,沒人能告訴他為什麽。後來他發現這款型號的唇膏在倉庫有大量的存貨,但沒有一種能夠把所有的包括倉儲管理到物流再到商品上架的整個流程聯系起來的技術。
也恰恰在那個時候,英國零售商開始試驗會員卡制度,卡片里面運用了一種新的射頻技術,安裝進一片小小的射頻芯片RFID卡。一個制造商給Ashton演示了這種芯片是如何工作的,告訴他關於用戶的信息數據都存儲在這張芯片上,而且能夠無線傳輸,無需讀卡器。
在開車回去的路上,Ashton忽然受到了啟發。他想為什麽不能把這個芯片安裝到唇膏里面呢,如果無線網絡能夠獲取會員卡上的信息,那麽同樣也能獲取唇膏包裝盒上的信息,從而告訴商店貨架上還需要補上哪些商品。
Kevin Ashton(凱文·艾什頓)
經過研究Ashton發現,RFID是使電子標簽變成零售商品的絕佳信息發射器,並能夠由此變化出千百種應用與管理方式,來實現供應鏈管理的透明化和自動化。要知道,當時美國零售業者一年因為貨品管理不良遭受的損失高達700億美元,零售商們抱怨自己只能“眼睜睜地看著錢一分一秒地從貨架上流失”。
在寶潔公司和吉列公司(Gillette)的贊助下,Ashton與MIT的教授Sanjay Sarma、Sunny Siu和研究員David Brock共同創立了一個RFID研究機構——自動識別中心,他本人出任中心的執行主任。該中心成立於1999年10月1日,當天也正是條形碼問世25周年。
Ashton預測電子產品代碼(EPC,Electronic Product Code)網絡將使機器能夠感應到全球任何地方的人造物體,從而成為真正“物聯網”的開始。
如今物聯網已經成為人盡皆知的概念,但是和很多創新一樣,物聯網的誕生也是用來解決老問題的。重要的是,有了物聯網技術,人們可以解決原來並不相幹的一系列的問題。
Ashton對物聯網的定義很簡單:把所有物品通過射頻識別等信息傳感設備與因特網連接起來,實現智能化識別和管理。美國麻省理工學院(MIT,Massachusetts InstituteofTechnology)自動識別中心(Auto-IDCenter)提出,要在計算機因特網的基礎上,利用RFID、無線傳感器網絡(WSN,Wireless Sensor Network)、數據通信等技術,構造一個覆蓋世界上萬事萬物的“物聯網”。
“在這個網絡中,物品或者商品能夠彼此進行‘交流’,而無需人的幹預。”Ashton對《第一財經日報》記者表示,“這是比因特網更大,為公司創造一種使用傳感器識別世界各地商品的方法。這將徹底改變我們以往從生產廠商到顧客,甚至是通過回收產品來跟蹤產品的固有模式。事實上,我們創造了物聯網。”
中國的機會
近年來中國物聯網的飛速發展也吸引了Ashton頻繁地來到中國尋求新的機遇。不久前他在京東方全球創新夥伴大會上對《第一財經日報》記者表示:“現在人類面臨的主要挑戰是,如何利用技術讓生活變得更好,包括延長壽命、提高生活質量和治療疾病等等。城市的發展,人們的出行,交通擁堵和環境汙染等問題都應該通過技術的手段來解決。這不僅僅是中國的問題,也是全球的問題。”
“上世紀90年代,互聯網還很新,很多人仍然很迷茫,不知道前景如何,那時候手機還沒有數據,只有通話功能,沒有無線網絡,要知道物聯網的發展是基於無線網絡的發展。”Ashton表示,“現在互聯網已經可以布局到任何地方,而且帶寬很寬,同時傳感技術和智能手機的發展也引領了物聯網技術的飛躍。”他認為,智能手機的普及和傳感器成本的下降,極大降低了物聯網技術的研發成本,並使得這些研發成果很快就可以用在其他領域。
一談到中國,Ashton就表現出非常親切的感覺,他曾在複旦大學的自動識別中心和中國教授一起研究物聯網的相關技術。Ashton還相信中國將引領本世紀物聯網技術的發展。“我覺得很有趣的是,我們在美國談論谷歌、Facebook,但是你看一看,這些都是上個世紀的公司,未來物聯網的機會將在中國誕生。”Ashton說,“中國在五年前就提出了物聯網的概念,目前中國已經超過美國成為全球技術相關產品出口最多的國家。比如騰訊就引領中國的社交媒體走向了世界,這些都是非常了不起的成就。所以我們有理由相信在本世紀內,中國的技術一定能夠主導全球。”
以中國的公交卡為例,Ashton認為中國的物聯網技術已經走在世界的前列。“比如上海的公交系統早在2000年時已經采用RFID接觸式公交卡,就是一個很好的例子。中國在智慧城市、物流、個人可穿戴設備等多個領域未來也將迎來爆發。”他說。
質疑人工智能
今年9月底在波士頓哈佛大學的一場關於物聯網的論壇上,Ashton對《第一財經日報》記者表示:“無人駕駛技術是物聯網實現飛躍的重要因素。無人駕駛技術的實現將最早發生在中國,中國將會引領本世紀無人駕駛技術的普及。”他預測,“中國在硬件制造等領域已經走在全球前列,無人駕駛技術也已經處於領先水平,中國已經有了自主研發的無人駕駛公交車。在汽車制造等方面都具有優勢。”
Ashton認為,其中很重要的原因是中國城市化發展,催生了巨大的需求。消費級的無人駕駛汽車可能在10年後能夠上路,但仍然需要取決於政策和監管何時成熟。
事實上,目前上路使用的一些汽車已經具備無人駕駛功能。無人駕駛汽車技術被定義為:具備在無人為參與的情況下,能有限度地允許加速、制動和控制其方向功能的任何車輛,都可被稱作無人駕駛汽車。而全自動無人駕駛汽車可以進一步區分為用戶操控的無人駕駛汽車和完全的無人駕駛汽車。由於監管和保險方面的問題,完全的無人駕駛汽車投入使用還需要很長一段路要走,這也是Ashton所指的的無人駕駛汽車。
在Ashton看來,無人駕駛技術將會是未來物聯網發展的一個最重要的領域。“無人駕駛技術是一個非常重要的方面,上世紀80年代中期,我第一次去北京,當時滿大街還都是自行車,現在已經變成了汽車,但是交通狀況並不理想,這也為無人駕駛的發展提供了必要的條件,未來無人駕駛技術一定會率先在中國率先取得突破。”他表示。
但Ashton並不是人工智能的信奉者。他表示,他所理解的物聯網與人工智能無關。“物聯網就是傳感器的連接網絡,我不相信人工智能在500年內會對人類有什麽實際的幫助。現在可能有些軟件可以分析數據,但是我們還是不知道機器到底應該如何模擬人腦智能,這還只存在於科幻片。”
物聯網是繼工業革命和互聯網革命之後的第三次技術浪潮。物聯網夾雜著人工智能和大數據向人們席卷而來,一時托起了很大一批創業公司。但往往大潮過後,很多公司都會石沈大海。對此,Ashton表示:“在中國人人都能夠創新,這種氛圍是非常好的。而且每個國家有其創新的特點。但不管在哪里,創新性的創業者是我們最為看重的。在關註大城市的發展時,我們面臨很多挑戰,也有很多機會,所有的問題都已經不再是孤立的存在,如果用一種聯系的眼光去看待事物、解決問題,或許會有意想不到的解決方案。”
一向以商務、沈穩形象示人的老牌IT企業IBM難得在今年的互聯網大會上賣起了萌。
第二次參加烏鎮互聯網大會的IBM全球副總裁、大中華區董事長陳黎明這一次做起了詩。
事實上,這首詩真正的“作者”是被安置在烏鎮IBM自動詩文寫作系統“偶得”。陳黎明在大屏幕上輸入“最美烏鎮”之後,屏幕上呈現出“最無春草滿江山 美人仍憐舊羽冠 烏雁自飛明月上 鎮雲長在翠微見”的詩句。
除了作詩,這一次IBM還在自家展臺上玩起了遊戲,讓大家通過腦電波意念控制小機器人BB-8,並完成打保齡的任務。在我們現場工作人員的控制下,BB-8簡直是滿屏的橫沖直撞,現場絕對是一場腦與腦之間的保齡球較量。
BB-8保齡球大賽之外,IBM這次還展示了溫暖的成長小夥伴——智能玩具小恐龍Dino。作為陪伴孩子成長的學習型“玩具”, Dino能在與孩子不斷的聊天中與孩子一起學習,成長。
而這些看似相當不IBM的產品背後都有IBM近來力推人工智能產品Watson計算機的身影。
在e-Business、智慧地球之後,擅長以概念領跑的IBM這次在中國打出了“認知商業”的口號。
來自IBM大中華區董事長陳黎明的“野心”是:認知商業是繼“智慧地球”之後,IBM發布的又一次重大轉型戰略,它將引發堪比電子商務的又一次的商業變革大潮。
IBM首席執行官羅睿蘭(Ginni Rometty)在2016年CES期間公開宣布“IBM不再只是一家硬件公司、軟件公司、服務公司,而已經轉型為一家認知解決方案和雲平臺公司”之後,曾有誤傳IBM會“放棄咨詢業務”。
2016年春節後再度面對媒體,陳黎明一開始就主動談起這次轉型。“發布之後有不同的解讀,說IBM的業務是不是有些傳統的行業不做了?不是,在這里我再做一個澄清。IBM在一些核心的傳統領域,包括我們的主機、高性能計算機(Power)、存儲,也包括很多傳統的軟件,我們依然會做下去。當然,像雲計算、大數據、移動社交及安全,包括雲平臺、認知計算這個領域的轉型,也是勢在必行的。”
對於IBM的傳統業務和新興業務,陳黎明的觀點是就整個行業的發展來看,傳統的IT行業在全球是呈下降趨勢的,但在中國目前下降的趨勢不像國外那麽迅猛。可以肯定的是,IBM在雲平臺、認知計算領域未來的收入將會占到相當的比重。
對於認知商業,羅睿蘭的觀點是“未來是認知的,而我們正朝著一個認知的物聯網前進。”
作為最早從事人工智能、認知計算的公司之一,IBM從數十年前就開始在認知計算領域進行投資。2014年,Watson集團成立,2015年10月,成立了業內首個“認知商業”咨詢部門。
這一次的世界互聯網大會上,陳黎明透露,在機器學習算法領域,IBM 已經獲得一系列專利成果,使得Watson可以自動選擇和優化機器學習算法和模型,整個過程無需人工介入,無需編程,消除了人工智能和大數據分析的一個關鍵瓶頸。IBM還投資數十億美元,與數千名醫療、法律、金融等領域的專家和專業機構合作,為二十多個行業建立了知識本體,Watson通過閱讀和分析海量的專業文獻和數據,進行知識吸收、展現和推理,建立證據庫,並與領域專家交互合作,增強知識本體,擴充和改進證據庫,迅速成為該領域的頂級專家。
在癌癥領域,目前Watson已經向美國、中國、印度、泰國等國家和地區的2億病人提供診斷和治療:在中國,IBM與杭州認知合作,幫助全國21家醫院引入Watson腫瘤解決方案,幫助醫生根據每位患者需要制定個性化的治療方案;在日本,Watson在10分鐘之內閱讀和分析了2000萬份醫學文獻、論文和病例,找到了東京大學收治的一位66歲女性白血病患者的一個活性基因突變,幫助醫生采用新的醫療方案,使患者順利康複。
按照IBM方面公布的數據,目前 Watson已經能夠為全球超過2億的消費者提供服務:IBM與GM合作,將Watson的強大能力整合到首個汽車認知移動平臺“OnStar Go”之中,為司機和乘客創建更加高效、安全的行車體驗,如燃料不足時臨時停車、激活燃油泵並付款加油後再行上路,在旅途中訂購一杯咖啡,或在路過藥房前收到處方藥購買提醒等;Watson還分析了時尚明星李宇春從2013年以來的出鏡形象及其全部微博和微信評論,建立了李宇春“時尚形象”與粉絲及公眾評論間的關聯模型,把握其時尚特質,在短短一周時間之內幫助設計師設計出了個性化的李宇春“認知禮服”;Watson還為超過50萬學生選擇合適的課程,幫助教師制定最佳教學計劃等。
此外,陳黎明發布了IBM類腦計算機及原子存儲技術等。據了解,作為一款用於深度學習的類腦超級計算平臺,IBM TrueNorth其處理能力相當於 1600萬個神經元和40億個神經鍵,消耗的能量只需2.5 瓦。將低能耗的類腦處理器應用於深度學習無疑是未來大數據處理創新方法。相比目前存儲一個比特的信息需要100萬個原子的現狀,IBM新一代存儲技術只需要12個原子。
本文從三個方面來解讀技術創新帶來的投資機會。
本文由華創資本(微信ID:ChinaGrownthCapital)授權i黑馬發布,作者為華創資本投資人公元。
人工智能並不是一個新鮮的詞匯,無論從學界還是業界,人工智能在過去60年里已經經歷了三起三落,但人類從未停止對“機器實現人類水平智能”這一最初夢想的追求。不管是投資還是創業,我們都在探索如何在商業環境里找到人工智能的應用價值。那麽,已經發展了60年的人工智能,今天我們該怎麽看?
技術發展有周期性
從1956年達特茅斯學院第一次正式確立了“人工智能”(AI)這個研究領域開始,歷史上的人工智能經歷了繁榮的“黃金年代”,也度過了理想破滅的“低谷”,人們在低谷時一度試圖采用一些新詞(例如:大數據、機器學習)來掩飾這個被三次擡高又三次破滅的概念。 然而,人類對AI最初的夢想一直沒有改變,終於隨著AlphaGo戰勝李世石再次被喚醒,並且期待這一次它能為產業發展帶來質的突破。
其實不止人工智能,如果我們看關於IT和互聯網的熱銷書籍《浪潮之巔》、《沸騰十五年》等等,整個IT產業在過去幾十年同樣經歷著起起伏伏的周期,這說明了一個問題:技術的發展史是有周期性的。通常上一波技術的普遍應用,往往是引起新的一輪技術發展的原因,這是一個不斷從量變到質變的過程。
人工智能發展史
Timing很重要,量變產生質變
在周期性發展的技術創新領域里,創業和投資都需要著眼時代的需求,提前於周期,但又不能超前。正如在YouTube出來之前的許多視頻的公司,受制於帶寬限制,使它們最終失敗;而手機如果只是工作在2G網絡下,相信很多移動應用也不可能有今天的成功。
技術創新一定是上一波的量變引起的下一波的質變,當量變沒有到來時做質變的事情,就會導致失敗。
這也就是為什麽技術創業和投資的Timing很重要。 中國的創業環境經過了產品創新和模式創新兩個階段,隨著國內基礎通信設施越來越完善,互聯網的普及帶來了海量數據積累,摩爾定律和雲計算大大提升了計算能力,我們認為中國已經做好了迎接下一個“技術創新時代”的準備。
除了基礎設施完善、計算能力提高、海量數據積累,中國在技術人才的占有率上也逐步走向世界第一的位置。
據前不久白宮發布的《國家人工智能研究與發展策略規劃》統計:從2013年到2015年,在SCI收錄的論文里,提到“深度學習”的文章數量增長了約六倍,同時由中國科學家發布的相關論文已經超過了美國,成為世界第一。
這也是為什麽今天很多人都在談論技術創新這件事的原因,而對於涉足看上去很廣的技術創新,我們重點關註什麽方向呢?我從以下三個方面來解讀技術創新帶來的投資機會:
1.數據處理及決策。隨著海量數據的積累和計算處理能力的量變,使得不論是從需求端還是供給端都迎來了質變的機會。我們看到大多數在過去幾年蓬勃發展的互聯網公司基本都是野蠻生長的,之前積累下的海量數據金礦並被沒有被挖掘。而如今互聯網流量的紅利正在消失,在線流量越來越貴,深度挖掘流量帶來的價值、增加用戶留存,都是早期野蠻生長後的互聯網企業如今越來越迫切的需求。從供給端看,機器學習、雲計算、數據人才的量變,都使得數據處理的能力大幅提升。因此,我們會在未來很長一段時間內重點關註和布局數據驅動的技術創新機會。
2.機器代替人。世界人口結構在近些年來發生了明顯的變化,發達國家的老齡化和發展中國家勞動力成本的加劇提升,都使得我們對機器代替人越來越渴望,這無疑給創業和投資帶來了巨大的機會。機器如果要代替人,必然需要相繼學會獨立完成“聽”、“說”、“讀”、“寫”、“走”、“做”、“理解”等人類行為,但要完全攻破這些技能達到人類的水平,我們認為起碼還需要幾十年的時間。
然而,隨著視覺識別、語音識別、NLP(神經語言程序學)、SLAM(即時定位與地圖構建)等底層技術越來越成熟,我們認為,有些簡單且重複性的工作是可以優先被機器學會的。在商用領域和工業領域,“機器代替人”都在慢慢迎來從量變到質變的過程,比如客服和售前機器人(chatbot)的大規模應用,比如工業制造型機器人等等。
3. 沈浸式交互。隨著人類信息獲取的手段的豐富和信息處理能力的增強,新的人機交互形式也將會在這個量變到質變的大浪潮中產生。這里面包含的機會很廣,從傳感、通信到數字內容,都將會是打通這條產業鏈的重要環節。如今很熱的VR、AR其實都是整條產業鏈的整合,每個環節都決定著這個概念是否能夠最終真正實現普及。比如很多VR廠商現在都無法解決的OLED屏的供給問題,除了三星能否有另外的廠商能做出高質且量產化的屏幕,這就成為產業鏈一個很關鍵的問題。當然除了屏幕,在整個沈浸式交互的大品類中,還存在著大量的機會等待技術創新類企業去挑戰。
沈浸式交互站在前人的肩膀上,與時間做朋友不同於產品創新和模式創新,人類對任何一項技術創新的追求都將會是持續不斷的。
過去的幾十年,各大高校和大公司的AI 實驗室都通過大量研究把資金不斷的變成知識,而投資和創業則是在不斷的把知識變成商業應用,這是技術創業獨特的魅力所在,因為我們永遠都是站在前人的肩膀上不斷追求。
不同於移動互聯網帶來商業模式創新的極速爆發,在技術創新領域,無論是投資還是創業都需要與時間做朋友。每一個暫時的技術困難被攻克的時候,都會打開新的商機。因此現在我們看待AI應該比以往的任何時候都更加謹慎,卻也要相信它比以往任何時候都更加接近成功。
情感合成、遠場方案、喚醒二期技術和長語音方案……這些聽起來有些陌生的技術,未來將可能改變我們的生活。
11月22日,百度公司首席科學家吳恩達在談到百度語音技術的最新進展時,對外介紹了百度這四項語音技術,並宣布將免費開放給用戶和開發者。
“我們已經站在人工智能的黎明。”吳恩達對包括第一財經在內的記者作出樂觀的預測,他希望通過開放人工智能技術,讓每個人都能更容易地開發出“智能應用”。
不過,站在“黎明”的人工智能何時能有“質”的跨越,或許還需時日。一個細節是,在接受記者采訪的會議室里,吳恩達座位不遠處還是坐了一位實時整理文字的速記人員。
智能語音:已超正常人類的識別能力
事實上,開放語音 API(應用程序編程接口)已經成為行業趨勢。
今年3月時,谷歌在Next雲計算大會上發布了面向開發者的新機器學習平臺,並開放語音識別的API,即谷歌語音搜索和語音輸入的支持技術。Google Cloud SPeech API一開始將免費提供,以後再進行收費。這一應用包括了80多種語言,適用於各種實時語音識別與翻譯應用。
在開放背後,互聯網公司希望借此推動智能語音模型的進一步演進和智能語音技術的快速普及。
對於百度公布的四項語音技術,吳恩達告訴第一財經記者,目前百度還沒有收費的計劃,這些技術旨在解決用戶在使用語音交互的場合時,普遍感到困擾的一些關鍵問題。“目前的語音識別已經超過了正常人的語音識別能力。”
以情感合成為例,主要是基於深度學習和大數據處理技術,在數據采集、處理、建模等環節進行一系列創新,實現更接近人聲的富有表現力的自然朗讀效果。
讀者甘肅數碼科技有限公司總經理金大時告訴記者,目前“讀者數字農家書屋”在甘肅慶陽市試點,根據百度大數據合成情感語音實現書籍有聲閱讀,讓很多不識字的老年人和留守兒童也享受到了閱讀的樂趣。
而遠場方案技術則是百度自主研發的遠場識別技術,基於麥克風陣列,利用麥克風陣列束形成、語音增強、回聲消除、聲源定位等技術綜合實現高準確率遠場識別。
百度稱,開發者可以通過這一新的技術接口,使語音識別距離增加到3~5米,設備的語音喚醒率提升到95%以上,或解決長時間語音識別的準確率問題。這將為語音技術帶來遠比現在更多的想象空間,而不只是遙控電視或解鎖手機。
例如,百度在上海肯德基旗艦店投入使用的“小度機器人人機語音交互點餐”,可遠距離隨時應答點餐。
百度語音喚醒技術,主要是通過通用喚醒詞解析、大數據聲學模型、雙層解碼等技術優化,喚醒率達95%,支持用戶自定義喚醒詞。喚醒二期加入指令喚醒,優化喚醒和識別性能。
長語音技術則在LSTM (Long Short-Term Memory,一種時間遞歸神經網絡)音頻切分技術、深度學習預測停頓、說話人自適應、智能糾錯等方面技術突破。這意味著它將在方便語音輸入、內容記錄、智能客服、視頻轉寫等應用場景表現出想象空間。
這也令來到中國的斯坦福大學的人工智能專家James Landay感慨:“近兩年,受益於大數據和深度學習技術的不斷發展,語音識別技術突飛猛進,速度及準確性都有了長足進步。”
百度首席科學家吳恩達
智能語音混戰
語音技術作為人機交互方式的入口,是人工智能重要的一環。不只是 BAT(百度、阿里巴巴、騰訊),搜狗、科大訊飛等加速智能語音的布局,不少圍繞AI的創業團隊如雲知聲也都將語音作為探索人工智能的方向。
要想順利進入這一領域,需要的是多年的技術與經驗積累。
吳恩達告訴第一財經記者,語音識別技術非常複雜,最難的是核心技術的提升,例如識別率的提升,幾年前語音識別率還只有80%多,當時用起來還是相當困難;還有大數據語音合成等,現在的目標是如何才能遠遠超過人類的識別能力。此外,百度語音識別97%的準確率是在比較安靜的環境下達到的目標,在噪音幹擾的情況下如何提升識別率,百度還有工作要做。
除了百度之外,可以看到的是,今年9月,騰訊雲技術團隊和微信AI團隊開放微信語音處理技術,推出了智能語音服務。在語音識別、語音合成、聲紋識別等功能上提供了垂直領域定制化的語音產品。阿里的人工智能系統,已具備智能語音交互、圖像識別、交通預測、情感分析等功能。
在語音識別領域,搜狗 CEO 王小川在不久前的世界互聯網大會上透露,搜狗輸入法一天處理的語音輸入請求達到1.9億次,產生超過16萬小時的語音數據。在龐大的用戶基礎和數據積累後,可以把語音輸入做到更極致的狀態,如語音合成、聲紋識別等。
公開資料顯示,在技術指標方面,百度語音識別、搜狗輸入法語音識別、訊飛輸入法語音識別準確率達到97%,騰訊雲智能語音識別技術在通用領域中準確率達95%。
在投資人士看來,智能語音仍是一個好的投資機會。
此前,峰瑞資本早期項目負責人朱祎舟提到,盡管各家根據實驗數據得出的語音識別準確率達到 95% 甚至更高,但在實際使用時並沒有那麽高,前端的語音/聲學交互的很多問題如果得不到解決,整體的體驗始終不夠好;而包括家居、車載、可穿戴設備、機器人等大量智能終端的爆發,智能語音將變得更加友好和重要。
在IBM前全球副總裁、賽伯樂投資集團總裁王陽看來,未來人工智能在醫療、無人駕駛、金融、零售、安防、個人助理等七個領域有強大的應用空間。其中他提到,人工智能個人助理目前普遍應用於智能手機上的語音助理,語音輸入、家庭管家等,最終是在收集消費者的消費習慣,從而提供各類服務。
Research and Markets研究報告顯示,預計2016年全球智能語音產業規模可達82.3億美元以上,到2020年,全球語音市場規模預計將達到191.7億美元。
負責一家互聯網金融公司大數據業務線的HR陳晨這幾天忙著在各大招聘網站刷簡歷,年底了,按常理人員流動應該減少了,忙活了一年,至少得拿著年終獎走人吧。
今年卻有些不按常理出牌了,“這個行業挖人挖得太兇了!”陳晨對記者抱怨,“我們也在通過獵頭挖其他公司的人,但新進來的員工比同一崗位的老員工工資至少要高20%以上。”
人工智能和大數據有多火?除了雨後春筍般湧現出來的創業公司以及閉著眼睛往里砸的錢,還貢獻了超高的離職率。
《2016早期企業薪酬調研報告》顯示,人工智能以及大數據的快速發展,創造了非常多新的職位空缺,加速了人才的流動,是2015年唯一超過行業整體平均離職率的板塊。2016年這一現象也在繼續,行業平均員工離職率高達44%,排名第二和第三的消費升級和電商分別為38%和34%。
這份關於早期創業公司的薪酬報告由華創資本、經緯創投、創新工場、真格基金、北極光創投、紅杉資本、順為資本七家VC聯合人力資源管理咨詢機構美世發布,調研主要是針對B輪和B輪之前的公司,涉及電子商務、企業服務、消費升級等七大熱門領域。
對於早期公司來說,關鍵技術崗位的人員留存對於公司發展至關重要。上述調查顯示,高成本技術人才在早期企業中的占比要遠遠高於產品人才,薪酬也是一樣。越是早期的公司,這一現象越明顯,以天使輪及pre-A的公司為例,技術人員的薪酬占比達到了42%,而產品人員僅為8%。
像陳晨的公司一樣,在同樣的崗位上,新招聘的員工成本要遠遠大於老員工,也會導致公司的人力成本水漲船高。因此,老板需要通過各種物質和精神上的辦法來穩定軍心。
人工智能的明星公司圖靈機器人的技術人員經常也是被挖的對象。但公司離職率和流動性很小,老員工占有比例70%以上,研發人員的薪酬水平在行業里偏中上。圖靈機器人副總裁王向一對記者表示,公司能否留住人首先還是看發展前景,其次是工作氛圍,另外,薪酬、福利和公司文化都是非常重要的因素。
有意思的是,在上述報告對於公司福利的調查中,HR們為了員工的福利各出奇招,比如員工家屬節日禮物、員工生日、結婚紀念日,甚至是美甲、上門按摩服務等等。
此外,調查還發現,無論是管理序列還是專業序列中,創始人的年度總現金都是遠遠落後的。
一家早期企業創始人的年度總現金收入是公司里最高的嗎?並不是!相反還遠低於很多其他重要崗位。報告數據顯示,早期企業創始人的年度總現金收入為269,500元,不僅低於技術、產品、財務、品牌、人力資源、設計、銷售、市場營銷等8大管理職能總監,也低於所有資深開發工程師、架構師、資深前端工程師和資深產品經理。
IDG資本此前一份關於準獨角獸公司薪酬的報告也指出,非創始人CEO總現金薪酬約為創始人CEO的2.2倍。IDG認為,這個現象一方面反映出創始人角色的事業導向,另一方面也與創始人持有的大量股權有關,所持股權可能為其帶來比現金薪酬豐厚得多的回報。
不過,除了創始人,創業公司的CXO們也並不全是“多金”。以首席技術官為例,首席技術官的崗位毫無疑問是早期創業公司的重中之重,但是上述早期公司薪酬調查顯示,和行業成熟公司在現金收入的對比上,早期企業的CTO和成熟企業CTO之間的現金收入差距比例達到了137%。
情感合成、遠場方案、喚醒二期技術和長語音方案……這些聽起來有些陌生的技術,未來將可能改變我們的生活。
11月22日,百度公司首席科學家吳恩達在談到百度語音技術的最新進展時,對外介紹了百度這四項語音技術,並宣布將免費開放給用戶和開發者。
“我們已經站在人工智能的黎明。”吳恩達對包括第一財經在內的記者作出樂觀的預測,他希望通過開放人工智能技術,讓每個人都能更容易地開發出“智能應用”。
不過,站在“黎明”的人工智能何時能有“質”的跨越,或許還需時日。一個細節是,在接受記者采訪的會議室里,吳恩達座位不遠處還是坐了一位實時整理文字的速記人員。
智能語音:已超正常人類的識別能力
事實上,開放語音 API(應用程序編程接口)已經成為行業趨勢。
今年3月時,谷歌在Next雲計算大會上發布了面向開發者的新機器學習平臺,並開放語音識別的API,即谷歌語音搜索和語音輸入的支持技術。Google Cloud SPeech API一開始將免費提供,以後再進行收費。這一應用包括了80多種語言,適用於各種實時語音識別與翻譯應用。
在開放背後,互聯網公司希望借此推動智能語音模型的進一步演進和智能語音技術的快速普及。
對於百度公布的四項語音技術,吳恩達告訴第一財經記者,目前百度還沒有收費的計劃,這些技術旨在解決用戶在使用語音交互的場合時,普遍感到困擾的一些關鍵問題。“目前的語音識別已經超過了正常人的語音識別能力。”
以情感合成為例,主要是基於深度學習和大數據處理技術,在數據采集、處理、建模等環節進行一系列創新,實現更接近人聲的富有表現力的自然朗讀效果。
讀者甘肅數碼科技有限公司總經理金大時告訴記者,目前“讀者數字農家書屋”在甘肅慶陽市試點,根據百度大數據合成情感語音實現書籍有聲閱讀,讓很多不識字的老年人和留守兒童也享受到了閱讀的樂趣。
而遠場方案技術則是百度自主研發的遠場識別技術,基於麥克風陣列,利用麥克風陣列束形成、語音增強、回聲消除、聲源定位等技術綜合實現高準確率遠場識別。
百度稱,開發者可以通過這一新的技術接口,使語音識別距離增加到3~5米,設備的語音喚醒率提升到95%以上,或解決長時間語音識別的準確率問題。這將為語音技術帶來遠比現在更多的想象空間,而不只是遙控電視或解鎖手機。
例如,百度在上海肯德基旗艦店投入使用的“小度機器人人機語音交互點餐”,可遠距離隨時應答點餐。
百度語音喚醒技術,主要是通過通用喚醒詞解析、大數據聲學模型、雙層解碼等技術優化,喚醒率達95%,支持用戶自定義喚醒詞。喚醒二期加入指令喚醒,優化喚醒和識別性能。
長語音技術則在LSTM (Long Short-Term Memory,一種時間遞歸神經網絡)音頻切分技術、深度學習預測停頓、說話人自適應、智能糾錯等方面技術突破。這意味著它將在方便語音輸入、內容記錄、智能客服、視頻轉寫等應用場景表現出想象空間。
這也令來到中國的斯坦福大學的人工智能專家James Landay感慨:“近兩年,受益於大數據和深度學習技術的不斷發展,語音識別技術突飛猛進,速度及準確性都有了長足進步。”
百度首席科學家吳恩達
智能語音混戰
語音技術作為人機交互方式的入口,是人工智能重要的一環。不只是 BAT(百度、阿里巴巴、騰訊),搜狗、科大訊飛等加速智能語音的布局,不少圍繞AI的創業團隊如雲知聲也都將語音作為探索人工智能的方向。
要想順利進入這一領域,需要的是多年的技術與經驗積累。
吳恩達告訴第一財經記者,語音識別技術非常複雜,最難的是核心技術的提升,例如識別率的提升,幾年前語音識別率還只有80%多,當時用起來還是相當困難;還有大數據語音合成等,現在的目標是如何才能遠遠超過人類的識別能力。此外,百度語音識別97%的準確率是在比較安靜的環境下達到的目標,在噪音幹擾的情況下如何提升識別率,百度還有工作要做。
除了百度之外,可以看到的是,今年9月,騰訊雲技術團隊和微信AI團隊開放微信語音處理技術,推出了智能語音服務。在語音識別、語音合成、聲紋識別等功能上提供了垂直領域定制化的語音產品。阿里的人工智能系統,已具備智能語音交互、圖像識別、交通預測、情感分析等功能。
在語音識別領域,搜狗 CEO 王小川在不久前的世界互聯網大會上透露,搜狗輸入法一天處理的語音輸入請求達到1.9億次,產生超過16萬小時的語音數據。在龐大的用戶基礎和數據積累後,可以把語音輸入做到更極致的狀態,如語音合成、聲紋識別等。
公開資料顯示,在技術指標方面,百度語音識別、搜狗輸入法語音識別、訊飛輸入法語音識別準確率達到97%,騰訊雲智能語音識別技術在通用領域中準確率達95%。
在投資人士看來,智能語音仍是一個好的投資機會。
此前,峰瑞資本早期項目負責人朱祎舟提到,盡管各家根據實驗數據得出的語音識別準確率達到 95% 甚至更高,但在實際使用時並沒有那麽高,前端的語音/聲學交互的很多問題如果得不到解決,整體的體驗始終不夠好;而包括家居、車載、可穿戴設備、機器人等大量智能終端的爆發,智能語音將變得更加友好和重要。
在IBM前全球副總裁、賽伯樂投資集團總裁王陽看來,未來人工智能在醫療、無人駕駛、金融、零售、安防、個人助理等七個領域有強大的應用空間。其中他提到,人工智能個人助理目前普遍應用於智能手機上的語音助理,語音輸入、家庭管家等,最終是在收集消費者的消費習慣,從而提供各類服務。
Research and Markets研究報告顯示,預計2016年全球智能語音產業規模可達82.3億美元以上,到2020年,全球語音市場規模預計將達到191.7億美元。
“科學上每走出一步,你發現前面還有十步不了解,見得越多發現不懂的更多。”搜狗CEO王小川在烏鎮向《第一財經日報》記者回憶他早年研究基因學的感受——每過幾年的重大發現都推翻了之前的結論。他覺得人工智能也是如此,在談到的無人車等現有AI產品時,他會用“不太靠譜”來評價。
這似乎有點潑冷水的意思。剛剛感慨“人工智能在烏鎮大會上火的一塌糊塗”的小米董事長雷軍說,中國互聯網正在從模式創新進入技術創新階段。普遍看來,技術創新過去一直是矽谷的代名詞。但目前在國內,BAT均在人工智能領域進行布局,連業務相關度並不算高的網易創始人丁磊也在潛心試水。
在清華讀書時就學習人工智能的王小川說,AI不是表面上那些酷炫的東西,真正的方向是讓機器做決策,具備人的推理能力,但現在看,還沒有誰能做到。“算法結構上的創新發明都是國外的,國內只不過看誰先把這些國外論文翻譯過來,最快用到應用中去。”在他眼中,國內外在人工智能上的差距還是很大的。
冷眼看AI
今年3月份,谷歌AlphaGo戰勝人類棋手時,王小川給公司放了一天假,慶祝人工智能的歷史性突破。放假那天是周一,這件事很快成為互聯網圈的談資,這一天還被戲稱為“狗勝節”。背後是這個38歲的“四川神童”對人工智能的執著。
3個月過後,王小川來到英國倫敦拜訪DeepMind公司(谷歌母公司Alphabet所擁有的英國AI公司)的工程師,問當時機器輸掉第四局棋時究竟發生了什麽?“不是程序有BUG,就是深度學習本身有瓶頸。”但對方用了3個月去複盤,仍沒有給出解決的答案。這給王小川留下一個深刻的印象,深度學習還是存在瓶頸的,未來AlphaGo會繼續出錯。
他拿無人車向記者舉例,以今天的技術,無人駕駛確實可以在它熟知的、較封閉的環境下應用,但在面對真正開放的環境時,人類的技術仍不狗安全。“這個場景只要它沒見過,可能就會犯嚴重的錯誤,就像AlphaGo下棋一樣會突然發瘋。”
互聯網大會上,百度的十幾輛藍色無人車在烏鎮路面上“秀肌肉”,這是國內無人車第一次在城市道路上測試行駛,但出於監管與安全方面考慮,這條3公里長的道路是事先劃批的,但並不限制社會車輛通行。谷歌的無人車已經在路面上跑了五年,但遇到像極端天氣、前車突然變道等複雜路況時,仍難以精準地自動調整。規模化商用還很漫長。
就連自家發布的AI產品,王小川也透露出謹慎的態度。當時,他在烏鎮主持了一場匯聚海內外人工智能專家的移動互聯網論壇,他演講時,大屏幕上實時顯示出演講內容的中英文對照文字,本來帶著同聲傳譯耳機的斯坦福大學客座教授傑瑞·卡普蘭等老外摘下耳機,看屏幕上的文字理解。但不知是否出於緊張,王小川竟然忘了在臺上發布這款機器同傳產品,而這是全球首次基於神經網絡的實時機器翻譯技術在大型活動上做展示。
臺下,他一邊自責自己“邏輯好,記性差”,一邊針對這項技術對本報記者分析說,這就像火箭上天,不是每一次發射都能成功。因為實時處理對後臺算法模型的要求非常高。這個過程首先要求機器準確識別語音,一旦語音識別成文字這一步出錯了,後面的翻譯就更是差之千里。在他看來,在技術上第一步的語音識別比翻譯更難。
除了搜狗,阿里雲、百度、科大訊飛等公司也在公開場合展示過實時語音識別,並均對外聲稱對中文語音識別的準確率達到了97%左右,但實際也出現過“演砸了”的時候。如果場景並不像會場那樣有序,或者演講者有較重的口音,現在還沒有一家公司敢將語音識別技術公開拿出來測試。
不只是輸入法的爭奪
目前,搜狗、百度、訊飛是第三方手機輸入法活躍用戶數的前三名,三家在語音識別上的多年布局,正在將手機輸入法帶進一個比拼人工智能水平的新階段。事實上,早在蘋果發布iPhone 4S手機時,就隨機發布了人工智能Siri,但從這兩年實際使用反饋來看,Siri尚沒有達到用戶對這個智能機器人的期待。而微軟、谷歌、亞馬遜三家公司在該領域被看好。
王小川判斷,人工智能有兩個方向,一是虛擬體驗,像戴著VR頭盔看視頻、玩遊戲等與娛樂相關,將視頻、音樂、小說等帶向虛擬;另一個是機器智能,未來更多的是商業應用。這也是搜狗在人工智能的布局方向,與同為搜索出身的百度一爭高下。百度總裁張亞勤在烏鎮峰會上說,搜索是使用人工智能時間最長的領域,人工智能的突破需要更先進的算法、超計算能力和海量數據。
王小川拿出自己的手機,向第一財經記者演示了一款尚未發布的輸入法測試版本。在輸入框里鍵入中文,輸入法會實時翻譯出英文,作為待發布項;或者按住屏幕說一段語音,系統實時反饋一段對應的英文語音。這樣就解決了與老外實時聊天的問題。從現場實際測試來看,翻譯的準確性很高,對於隨口而出的一句話中出現的“牛X”一詞,系統可能給出“great”(很棒)的翻譯。
在科幻小說《銀河系漫遊指南》中有一種叫“巴別魚”(babelfish,取自和人類不同語言相關的巴別塔故事),能在任何語言之間做實時翻譯,如果這種魚可以作為一款人工智能產品存在,相當於每一個人都可以用母語與世界上任何一個地方的人進行交流。
谷歌翻譯近日取得的技術突破正朝著這個方向邁進。谷歌在一片論文中揭示了Zero-Shot翻譯,即便機器從未進行過日韓語言間的互譯,但它可以憑借之前完成的韓英、日英翻譯訓練,自動學習並進行日韓語言間的翻譯工作,也相當於有望解決谷歌神經機器翻譯系統擴展到全語種的難題。但對於巴別魚的設想,谷歌大腦工程師陳智峰認為,這離實時的語言翻譯還有一定距離,未來三到五年可能會有一些突破。
“未來會自己做一款硬件嗎?”王小川思考片刻搖搖頭,盡管自己做硬件對於用戶數據反饋的回流掌控力更強,但他堅持更可能會通過合資形勢進入硬件市場。搜索就是在幫助人們獲取信息,而輸入法則在幫助人們進行表達。他專心於怎樣通過人工智能讓這兩種行為變得更簡單。
我們每個人都是信息時代的“拾荒者”。
據統計,微信公眾號每天發布文章約800萬條,一個“王寶強事件”就能在“今日頭條”產生10629篇文章。
每一個熱點事件,都會產生成百上千的稿件。
然而我們都明白,一個人不可能閱讀成百上千的稿件,在信息洪流下,我們搞明白事情的真相的成本卻越來越高。
轟動一時的“王寶強離婚”事件,“娛樂圈內人”金星就在自己脫口秀中表示,所有文章中,只有4條信息真實的。但是,在今日頭條、微信公眾號等閱讀平臺,卻產生了總計2.5萬篇相關文章信息,10萬+的文章數量超過1千篇。
信息越多,我們反而離真相越遠,想快速了解王寶強事件的真相,我們最快的方式是去問問金星這樣智慧的“圈內人”王寶強事件是怎麽樣的?
然而,熱點事件太多,我們離她太遠。
我們都痛苦
每天面對海量信息,我們都痛苦。
這周,百度新聞組織了一個閉門產品沙龍,邀請我們一同討論這個痛苦,百度的新聞產品團隊,技術團隊一起思考各式各樣的新型的新聞產品,希望有好的解決方案,而人工智能給了他們最大的啟發。這或許是一個不錯的解決方向。
在王寶強事件中,做個比喻,金星就像一個強大的人工智能,她有閱歷(足夠多的樣本信息),有判斷力(算法),自然能輸出最準確的真相。
百度新聞產品團隊就設想——何不嘗試做個虛擬的“金星”,可通過對話獲取信息的人工智能,讓大眾們通過詢問它最快得知事件真相。
在國外,也有類似“對話新聞”的閱讀產品Quartz,但Quartz還只能通過選擇固定對話內容進行互動——像個帶著互動按鈕的新聞閱讀器,Quartz給我推送了一條麥當勞巨無霸發明者去世的消息,我只能點“看下一條”(NEXT),或者“知道更多”(MORE)選項。
而百度新聞產品技術團隊開發的新功能產品,能讓用戶直接輸入各種開放式聊天內容,查找熱點事情的真相脈絡。
估計也只有百度、Google等擁有強大的“語義識別技術+爬蟲技術”的搜索巨頭,才能做出實用度如此高的新聞聊天機器人了。
(打開“百度新聞”,下部就有個醒目的“聊新聞”標誌)
例如我輸入“王寶強”,別的新聞APP可能搜出來的文章是一些《馬蓉離開王寶強30萬都付不起?》、《王寶強現身機場,潮衣名牌不見“傻根”》等離王寶強近況相去甚遠的“垃圾文章”。
要知道王寶強事件的近況,我得花不少精力從這些垃圾信息中尋找有用信息。而百度新聞“聊新聞”,卻在1秒鐘內準確的告訴我“王寶強馬蓉離婚已三月...如今......”
雖然對信息的給予還不夠好,但是我看到了人工智能通過聊天最快給於我真相的可能性。從時間、背景等維度,給我展示事件當下的情況。
人工智如何殺掉垃圾信息?
據百度自然語言處理部工程師介紹,百度是通過對新聞信息的分類,之後進行結構分析,通過信息特征學習等方法,實現自動為用戶提供最核心的信息。
也就是說,百度新聞的人工智能,是在模仿人的思考,例如把“王寶強事件”相關的所有文章進行樣本分析,把內容進行“標簽化”區分,分割到最小維度,然後找出事件核心發展脈絡,去偽存真,把掌握最真實的事件通過聊天的方式輸送給用戶。
這就像創造了一個虛擬的“金星”,為你看了上千篇文章,然後經過分析整理,用幾百字告訴你真相。
百度的算法團隊認為,核心的內容本身有序的,聊新聞呈現的內容,是事件的核心內容,對於每一塊核心內容來說都能夠抽取一些關健詞,關健詞還可以為用戶進行衍生閱讀服務。
例如了解事件的更多背景,例如“王寶強事件”對婚姻法感興趣的用戶,可以被推薦關於這個事件法律分析的深度文章。當對同一個事件有深度個性化需求的用戶,通過人工智能推薦,可以對該事件做深度的外延閱讀。
對話,或許才是人類獲取信息的最初形態
百度聊新聞用聊天獲取信息的方式,業內有一些產品經理認為有“逆用戶習慣而為”的意味,但當我們拉長人類歷史,會發現一直以來,對話式反而都是人類獲取信息最簡潔方式、有碰撞、直擊問題,《論語》、《聖經》許多部分等都是對話式的。
自第一份現代報紙的雛形,1566年威尼斯不定期發行的“威尼斯小報”為公眾分享商業信息開始,經過幾個世紀的發展,現代人類已經越來越習慣用閱讀新聞的方式獲取信息。然而,在更早之前,我們更喜歡用對話的方式獲取信息。
就像第一代iPhone誕生前,人們之前覺得“鍵盤”才是最好的人機互動方式,然而自然手勢互動才是更早前人類最自然的人機互動方式。
1985年,《科學發現》雜誌采訪了“人工智能之父”明斯基,他認為人類是一種獨特的足智多謀的動物,當人類思考某一事物時,你可能以語言表達的方式去思考,也可能以邏輯術語的方式去思考,或者是圖表、圖像,甚至是某種結構的方式。
而如今,百度新聞正試圖用人工智能,完全顛覆我們幾個世紀以來獲取信息的方式,但按明斯基的理論,這或許並非激進,而是一種“回歸”,我們其實能用各種方式獲取信息,何不用更高效那個?我們需要站在未來看未來。
人工智能這個事情,其實絕對不僅僅是取代人腦,它會比人腦厲害很多。但是這不是說它是在所有領域,它一定是在幾個前提條件下,而且一定是在某一個狹窄的領域。
今年年初AlphaGo戰勝李世石後,人工智能的浪潮也伴隨著此次的勝利席卷而來,現在幾乎每家企業都在談論AI、深度學習和大數據,無論互聯網巨頭還是新創企業,AI都受到了前所未有的關註。
35年前,創新工場董事長李開複博士就進入了人工智能領域,無論在大學,還是此後在蘋果、微軟、谷歌的工作,到現在作為風險投資人,其對人工智能技術的進步以及由此帶來的對經濟社會的影響都非常關註。
在最近格隆匯的演講中,李開複博士為現場觀眾分享了自己對於"人工智能的黃金時代"的獨特看法,結合創新工場的諸多投資項目以及個人在人工智能領域的學習成長經歷深入淺出的分析了人工智能的過去、現在、未來和中國在人工智能領域的巨大機會。
以下為演講全文
很高興有這個機會來格隆匯和大家交流,我知道大家今天想聽的不是技術,是怎麽賺錢,所以在我的演講過程當中,至少會講到有三個如何賺錢的機會,所以大家要仔細聽。
如果你們在2008年,2009年創新工場成立的時候,我們當時就告訴全世界移動互聯的時代將來臨,安卓將是最重要的手機操作系統。那時候,大多數人,不相信我們,也不聽我們,但是少數投資我們的,比如說在座的徐小平先生,就看到移動互聯的爆發成長,然後在最早期我們的投資也獲得非常好的回報。
如果再有一次移動互聯網時代,我們應該怎麽做投資?
我覺得有幾個建議。
第一個建議,如果能夠找到真的特別靠譜的互聯網公司,直接投資他。因為當風口來的時候,頂尖的公司可能可以賺1000倍,普通的公司也可以賺幾十倍,我們投資的過程真的是這樣。
第二個是找一個好的基金,這個基金很懂這個領域,比如說今天要投創新工場,投真格基金都是很好的選擇。
第三個方式,你可以想想,如果移動互聯網時代起來了,哪一支股票會漲得最多?這是非常簡單的問題。我們回到2009年,哪一支股票,無論移動互聯網公司誰會贏,最後這個公司都會大漲,這是哪一支股票?有人說谷歌,不對,谷歌起來必須是安卓贏才對,不過你投資谷歌也不錯,但是谷歌大概只漲了三四倍吧,有一個公司比它更厲害,漲了二十倍。它就是ARM。無論你是哪一個移動互聯網操作系統或者應用軟件,這個公司的底層必須一定是包含芯片的,這個芯片無論是高通的還是聯發科的,它一定是有ARM的重要技術來做這個芯片,所以買ARM是絕對正確的。
講完了移動互聯網時代,當然今天這些投資機會也都不在了,ARM也已經被別人買走了。但是對於人工智能時代,這將是一個比移動互聯的這個時代大十倍的市場。
所以我們今天要用剛才的三個方法來思考:在人工智能時代來的時候,如何去找最好的創業者?如何去找最好的基金?如何去找二級市場的這個股票?至於,第三個答案我最後會公布給你。
下面容我介紹一下人工智能為什麽這麽偉大。
大家聽到人工智能這個詞大概是在今年年初,AlphaGO 戰勝李世石的時候。當時在討論人工智能是在模仿人腦,超越人腦,奇點是否來臨?我們是否會被機器統治?
實際上這些都是很玄很遠而且也不太靠譜的說法。所以我建議大家也不要再看任何討論剛才幾個問題的文章了。其實,人工智能跟人腦的關系也不大,也沒有什麽超越人腦的可能。人工智能全部都是我們完全控制的奴隸,我們讓他們做什麽,就做什麽。有沒有一天它們會比我們聰明,告訴我們做什麽,這個我不知道。但是對於我們來說,至少還有20年,這20年我們應該專註怎麽用好人工智能,給人類創造價值,幫我們賺錢。還有就是怎麽去投資人工智能,以及擔心人工智能會取代哪些工作。至於其他的問題就不用考慮了。
人工智能這個事情,其實絕對不僅僅是取代人腦,它會比人腦厲害很多。但是這不是說它是在所有領域,它一定是在幾個前提條件下,而且一定是在某一個狹窄的領域。
比如說圍棋,比如說傳一篇文章,比如說量化交易,這些領域里面,它可以非常的厲害。因為它用巨大的數據,來做一些分類,預測或者對未來的推測。比如說,演示文稿上的這10個工作, 10年以後90%幹這些行業的人就都失業了。當然,剩下來的則是頂尖的,對於記者他可以寫很深度的文章,而頂尖的翻譯他可以為元首做實時的翻譯,或者是翻譯詩詞、詩歌。這些人工智能做不到,但是普通的翻譯、記者、助理等等都不需要。普通的保安也不需要了。有沒有一個作為人的保安可以記住20萬犯罪者的照片,不可能的,但是機器可以。所以在這些領域里面,人根本沒有任何的機會,這不是說什麽機器會不會比人能幹,在這些領域里面,確實,人就是沒有希望。
比如說司機,無人駕駛10年左右就會來臨。無人駕駛來的時候,世界上做司機工作的9%的人類他們都要換工作,所以在這個領域,就是如此被巨大的顛覆了。
人工智能也就是這樣幾個事情,感知、決策、反饋。
前兩件已經做的很好了,後一件還需要時間。我們在這幾個領域可以看到,過去二三十年有很多重要的里程碑,尤其是在最近的5年,我們發現人工智能能用了。
當然如果你像我這麽不幸在30年前就做人工智能,我們就沒有生逢其時,也沒有找到這個風口。我們就只能寫寫論文,然後再換份工作。但是30年之後,我們非常清晰的看到這個領域成熟了。
為什麽說這五年成熟了呢?30年前做的太早呢,為什麽三十年前成為先烈,現在成了偉大的創業者呢?
就是因為一個特別重要的技術,叫做深度學習。
深度學習是什麽?你丟一大堆數據給它,然後問它,我應該買什麽股票?這個人的保險該付多少錢?這個想貸款的該不該貸?這個信用卡的交易是否有欺詐的嫌疑?你還可以問他,這麽多的男人你應該找哪一個為對象?你也可以問他,今天晚上這麽多好吃的,我應該吃哪些?它都會告訴你一個答案。
但是非常重要的是它來做這麽個決策只會在一個狹窄的領域,而不是任何的領域。
深度學習其實只是一個技術,以後還有很多其他的技術,這里就不說了,但是絕對不是人工智能就能取代人腦。人腦的情感、自我認知是機器完全沒有的,還有我們人可以跨領域思考,比如說我現在跳出來說我中午不要吃漢堡,你們每個人都可以懂,但是機器不能懂,機器一次只能懂某一個領域。
所以說人工智能的五個條件很簡單。海量的數據,清晰領域界限,頂尖的AI科學家,還有自動標註數據,以及超大的計算量。原來所說的,7年前聽到我所說的移動互聯網的時代來到了,任何三個小朋友都可以創業。在人工智能的時代,這個完全被顛覆了。三個小朋友你不要想創業了,因為你沒有巨大的機器,沒有頂尖的科學家,你也沒有特別大的計算量。所以這個是科學家的創業時代來臨了,而不是三個小朋友的創業時代。
深度學習到底有多了不起?
大家看左邊這張圖,你可以看到在5年之內,左上角代表的是在圖像識別領域機器超越人類,左下角是語音識別領域機器的錯誤率低於人類。一個往上,一個往下,都是代表超越人類的表現。
當人臉識別超越了人類,我們還需要保安嗎?當語音識別超越了人類,我們還需要客服嗎?還需要打電話推銷嗎?當自動駕駛超越人類,我們還需要司機嗎?當傳內容,寫新聞,金融稿件的能力超越了人類我們還需要金融界記者嗎?這些都不需要。90%的金融領域的報道都是傳出來的,這些報道以後絕對不是人寫的,人寫是會犯錯的,機器不會犯錯,只有深度的報道才需要人寫。所以,這就是超越人類的一些領域。
那到底哪些領域可以做人工智能,可以掙錢呢?實在太多了,我在這里隨便列了三十多個領域,在任何一個領域就是一個商業計劃書,如果你能找到一個該領域的超級的商業專家,銷售專家,再搭配一個人工智能的科學家,那就是一個黃金創業團隊。這些細節這里就不多講了。
簡單來說,誰能做人工智能的創業,第一種,誰手中擁有互聯網數據的這個是最了不起的,也就是BAT、滴滴、美圖等等,他們手中有數據,而且已經標註,只要有科學家就可以產生價值。
第二種是傳統企業,比如說股票的數據,比如說保險業、銀行業,各種金融的。我覺得數據非常的豐富,而且是非常的狹窄領域,不用跨領域的理解,而且可以快速產生商業價值。再往下醫學,如何看片子,看MRI,看CT,看各種人的健康記錄一定是超過醫生的,現在至少有3種重要的病癥人工智能已經超越了醫生的平均水平,而且你像這個是要花多少臨床的時間,現在三種可能再過5年就是300種,再過10年可能就是3000種。然後90%的醫生就都不需要了,至少被機器取代。那這些醫生就要做更高等的工作,更深入的工作,去發掘新的醫藥的工作,或者是做更心理醫療的工作。面對病人,機器還是冷冰冰的,可能還需要一個人臉對著病人,但是90%的醫生,在10年以後應該都打不過我們機器的診斷能力了。這對人類是有很大意義的,教育的數據也是很多的,就不多細講。
最右邊是無人駕駛。這是我們特別看好的領域,它是最大顛覆量的,以後都不需要人開車了。再加上電動車和共享經濟,以後我們出門的時候,一輛坐一人的車就會出現在我們面前,它帶我們去要去的地方,節能低碳,減少霧霾,而且這還會影響整個經濟。如果大家誰有投資停車場的,十年以後就沒有停車場了。所以,這些都有巨大的顛覆性。如果你們覺得聽起來像是天方夜譚,像是科幻小說,那麽你們也可以想一想,2009年當我告訴所有人移動互聯網時代來臨的時候,大部分人也是這樣想的。甚至當時的BAT聽了移動互聯網的預測之後,他們總是認為沒有PC大,沒有PC賺錢,成長的會很慢。但現在你看他們一個個也都追上來了。所以人工智能是一個特別巨大的領域和機會。
那麽我們到底該和誰學人工智能呢?
世界上最懂人工智能的絕對是谷歌這個公司了。在一年前他就宣布了要做Alphabet這個母公司。
什麽是Alphabet呢?其實它就是把谷歌里面做搜索提煉出來的人工智能做成谷歌大腦,然後把它用到各種領域。用在圍棋就成了AlphaGo,我們已經看到它的威力有多大了,用在汽車就是Google car,用在健康就是Google house用在基因檢測就是Google genetics,所以在Alphabet上面,谷歌的野心就是要把一個谷歌的成功變成26個,這是一個特別有野心的人工智能的公司。
而這個公司內部也是在用剛才所說的深度學習。這個圖是來自谷歌的一個科學家,他對外演講用的我們可以看到也是在這4年,他們才領悟了人工智能的價值和谷歌大腦的價值,收購了Deep Mind這樣的公司。所以很明確的就是,谷歌的Alphabet這樣的一個動作,絕對是它看到了機器學習可以進入各種領域的機會,這也是它所進行的一個很有野心的探索。
到底人工智能如何克服挑戰產生競爭壁壘呢?
簡單的來說。
第一,就是要尋找行業里面有特別大的大數據,然後是壟斷性和閉環的。
第二是買很多機器,尤其是CPU+GPU。
第三是有很厲害的深度學習的科學家。左邊兩個,谷歌基本是為了買這兩個人,花出1億到4億美金,右邊的是我們投資的Face++公司聘了的,剛才看到的2015年超越人臉識別,超越世界圖像識別人類能力的那位科學家孫劍,他是我們Face++挖過來的,這邊就不放金錢了,因為我們投的公司不好意思去說我們花了多少錢雇了這樣一個人,但是至少可以說明一點的是,這樣的大腦是有特別巨大的價值的。
第四,雖然這些頂尖科學家很有價值,同樣的小朋友也有價值。不過小朋友還不能創業,需要培訓。只要我們找到前10名的高校畢業的頂尖畢業生,這些畢業生必須是學下面幾個領域,計算機、統計、數學、應用數學,電子系,還有自動化系。在這6個科系里面的頂尖學生,前10學校的前10到50名的學生我們全部招進創新工場我們來培訓他,成為人工智能科學家。只要給我們6個月的時間,然後有左邊的這些高手來帶他們一下。人工智能很大的一個特色是速成,他不像是你去找一個化學科學家,或者說生物科技或者甚至是計算機領域的這個Networking、Database之類的,非常難學。人工智能不一樣,它很好學,前提是你一定要是一個數學天才。所以我們就設立這樣一個計劃,這是人工智能很大的一個特點,是可以速成快速創造價值的。
這個可能主要是對產品的探討,這里就不多說了。
接下來說下怎麽樣讓人工智能快速商業化,雖然它的技術還不夠好。
有四個理由,第一是做助手,而非取代人。第二是界面要用好,給很多結果,而不只是一個結果。第三草船借箭,要用戶提供數據,如果你的數據不夠。第四局限你的領域,不要做一個特別偉大的超級的技術。
下面我要講的是中國的一些特別的機會。
中國在人工智能領域比移動互聯網領域還適合創造世界頂尖的公司。
第一個理由就是,中國人很適合做人工智能。我們知道美國的很多中學的學生,加減乘除都做不好,我們中國雖然教育有很多的挑戰和問題,但是理工科的學生平均水平特別強,人數又特別多,所以今天在世界上做人工智能的科學家有43%是中國人,所以我們可以知道,當然很多是在海外讀書,現在要把他們拉回來,所以這是一個特別大的機會。
第二,訓練小朋友非常快速,這剛才已經講過了。
第三,傳統企業的人工智能技術非常的弱。就是他們現在的這個產品,是沒有用人工智能,相對來說是很弱。
比如說我們現在做一個Credit Card Fraud Protection。就是去識別信用卡被盜卡的這樣一個現象,比如說我突然在這個阿布達比刷了2萬塊錢銀行就會警覺了,實際上很多偷信用卡的人,比這個聰明,他不會去刷2萬塊錢,他會刷100塊,200塊,他還會到各種城市去刷,也許就是請朋友吃頓飯之類的。我最近的信用卡就是這樣被盜的。
這個如何抓呢,美國的銀行做信用卡已經做了40年,他們靠非人工智能的技術,就是一條一條的規則寫進去,然後把用戶做各種的規則,比如這個人收入是怎麽樣的。然後如果他突然飛到幾千里之外,用的金額是什麽,如果有三次什麽之類的。這樣一大套,如果是這個就怎麽樣,如果不是這個就怎麽樣,套這個來做這個信用卡的盜卡的識別。那這些銀行沒有人工智能,但是這些技術在美國做的很好,所以要在美國做人工智能的公司,去賣這樣一個Credit Card Fraud Protection技術給銀行是不靠譜的也是不可能的。除非你是有拿了大數據來做,不過那得有多難。
但是在中國幾個小朋友隨便寫一個簡單的機器學習算法,深度學習都不用,拿到中國的任何銀行馬上就能產生價值。所以呢,過去這些銀在國內不太開放,技術也比較落後,不太願意別的技術進來,還是要感謝AlphaGo 自從它打敗圍棋世界冠軍以後,中國的銀行開始相對開放了。我們投的一些公司,比如說第四範式就已經進入了十五家銀行,產生了特別大的價值。
銀行曾經不是經常打電話給我們說,要不要買什麽產品,過去它的這個轉化率非常低,但是經過我們人工智能一條就增加了65%。所以以後銀行打的垃圾電話,經過創新工場投資的這個第四範式,精準度會比較高。過去1000個電話買1個,現在接600個電話就會買一個。這個對於你來說,都是讓人煩擾的電話,但是對銀行來說,產生了多大的價值,它如果一年靠這個電話賣20億的產品,現在就賣33億了,因為有了之前說的那65%的成長。所以這一類的人工智能在國內因為它的算法競爭對手太弱,在銀行保險、券商等等的機會特別大。
在座可能有些看過量化交易的,但是你們看的量化交易都是沒有智能的,都是拼速度的。但是加上智能就不得了。我讀博士的時候就是做人工智能,我的一個同學跟我學一樣語音識別,但是他比我聰明,我畢業之後去蘋果了,他去了文藝複興科技公司(Renaissance Technologies)。它是美國做量化交易第一的公司,他在那邊做了30年,然後我們在Wikipedia可以看到他的這個身價大概是我的幾十倍。當然我說的不是這個,更重要的是說他把機器算法很早就做到了二級股票市場交易中去了。他們內部基金每一年的年化收益,20年,71.8%。這就是人工智能的力量。當然這個基金做不大,一做大這個收益就會下來,但是至少也還是幾十億的規模。所以你可以看到,這些機會,是非常非常的大。
當然30年前美國的股票交易也很落後,量化一進去,就把大家都擊潰了。他今年是Renaissance的CEO,你可以看到在這種算法里,科學家的力量是多大。整個Renaissance的公司至少在創立的時候,都是不懂股票的,一大堆算法進來,交易大師就打不過他們了。那麽在中國,這個景象正在發生。我們看到的人工智能的項目里,三個就有一個是做股票交易的。在過去兩年里面,我除了個人買了一支股票之外,其他的錢都是交給這些小朋友打理,他們在國際國內港股A股的這些市場,加上做這些AI的對沖,每一天大部分交易就是T或者T+1,然後就結算,基本沒有什麽風險,收益率也沒有一個月是負的,每一年的回報雖然不到71.8%,但是也是很高的。所以這是一個特別大的機會,在國內量化AI的環境還不成熟的時候,如何找到這些機會,可能獲得的是比VC的基金或者PE的基金回報都還要高。
第四個理由,因為中國市場大,互聯網公司多,很多非AI的公司到了一定的規模,就開始需要AI。比如我們投資的美圖,知乎,VIP KID。我們也恭喜美圖準備在香港上市,我們是美圖最早的投資人,也非常看好,我們會繼續的持有,非常看好他。
美圖的這個公司呢,你可能覺得就是幫助女孩子變漂亮一點,但是變漂亮的過程中你要知道大家都喜歡哪樣的漂亮,得到用戶回饋,加入AI算法這個是非常重要的。從這里我們可以學到,中國的女孩子喜歡非常的白,但是印度的女孩子白一點就好,非洲的女孩子也希望白一點。中國的女孩子希望眼睛越大越大,但是美國的稍微加一點點眼影就可以了。修改以後就看用戶是否喜歡不喜歡,這個可以做人工智能的回饋,甚至人工智能還可以生成,可以幫助來推測,你會喜歡什麽樣的照片,或者甚至把你變成卡通畫,或者是一張很美的像畫出來的畫一樣。這是第四點。
第五點,美國人工智能現在是絕對領先中國的,但是他們進不了中國,中國上面有各種理由。因為美國公司進不來,給我們3年時間就不輸於美國公司了。人工智能的這個技術都是美國和加拿大做出來的,他們是非常樂於公開的,每次寫完了就放到網上,放到網上大家就學去了,中國和美國的公司一起學,所以這也沒有太大的門檻。中國的公司只要給我們3年的時間,給我們更多的機會,我們一定會產生和美國一樣的價值。
最後一點是中國對人工智能各方面的約束較少。比如說Trump上臺以後,假如我們兩年以後發現Uber的Otto,這個Otto它是取代卡車司機的,假如它做的非常好,兩年以後會取代這個人類的話,會不為有這個卡車的工會冒出來一起抗議。美國有150萬的卡車司機,他們也是投了Trump票的,我們也很清楚低收入的美國中年男人尤其是白人投了這個票,這些人要是抗議,會不會有可能通過一個法律使得卡車無人駕駛先暫緩推出,或者先要證明自己不傷人之類的。就這樣,很簡單的一個規矩就把這個技術給放緩了。所以我覺得中國在這方面就會有更大的機會。
還有無人駕駛最大的敵人是什麽?第一是法律,第二是人。我們人是最差勁的司機了,容易犯困,要睡覺,還喝酒,然後犯錯,而且不可預測等等。機器則是非常冷靜的,但是它面對這些不冷靜的人也會很頭疼。如果某一天這個城市里都是無人駕駛的車,不允許人開車了,這一天就是技術飛騰的時候了。那麽哪個國家會有可能做這樣一個小城市?肯定不是美國,但有可能是中國。你可以想象,如果路上都沒有人了,車子也都安全了。比如說一輛車可以告訴後面的車,我爆胎了,你小心一點。甚至你可以想象這樣的一個環境,車子會說我的主人急著上班,請你讓我一下,我給你2毛錢,這些情況都可以發生,前提是人要被趕出去,所以我非常急迫希望人類不要開車。
創新工場對人工智能有一個很完整的投資藍圖,在這里我想就不適合講太多的細節了。
講幾個重點。
第一個重點是大數據的機會,這是現在面臨的,也是即將到來的一個巨大的機會。
第二個是語言方面,聽到的語言不代表聽懂的語言,所以人類的語言,對自然語言的理解還是一個很大的問題,所以要推到接近10年以後,
第三呢,是傳感器的降價非常的重要。現在它太貴了,但是我們非常有信心在無人駕駛和機器人的推廣下,量產它就會降價,所以這可能需要3年的時間。機器人,我們都認為,家庭機器人基本不靠譜。因為我們科幻片看太多了,尤其是機器人有眼睛、耳朵、手腳,所以把我們的期望值就變得太高了。我們更看好的是家里的家電,比如說Amazon Echo,是個音響,但是它也慢慢的變聰明了,放的是周傑倫它能知道,放的是古典音樂它也都知道,過幾天你說,家里沒有牙膏了,它還能馬上跳出來說京東立刻幫你寄到家里。這些功能在美國已經實現了,京東當然也做了類似的這樣的技術,這些我覺得還是比較靠譜的。還有我們投資的小魚在家,這些產生陪伴這類功能的是可以的,但是前提是家庭機器人一定不可以有眼睛、耳朵、手和腳,聽到這樣的項目你趕快跑。
最後是自動駕駛,它需要時間,就像剛才所說的。
那麽創新工場在人工智能領域在做什麽呢?
右邊我們在做VC,我們投了很多國內的公司,包括剛才講的美圖、face++,第四範式、地平線機器人等等公司,也投了一批美國的公司。還有馭勢科技,是國內領先的無人駕駛公司。當然這是VC的投資,如果說有好的創業者拿了項目來,我們可以像其他的VC一樣可以投資他。
左邊做的是一個人工智能的孵化,我們做了一個工程院,在直接的招頂尖的人工智能專家,還有一批剛畢業的學生,我們會出主意給他,買數據給他,拿機器給他,讓他在這些方面,能夠快速的探索,創造價值,然後出來創業,創業的時候我們的基金也可以投他。這個布局很像我們在移動互聯網時代的布局。當我們有一些這個領域的優勢的時候,我們認為這個是一個可行的方法。
VC投資就不多說了,我們一共管理大概12億美金的基金,這是我們些投資的公司,這里剛才講的差不多了。
再提一個美國的項目,中間下面是wonder workshop,它是一個人工智能的玩具。它可以跟著小朋友,就像現在的這個大疆新的機型,可以讓它跟著你一樣。甚至兩個機器可以在一塊玩等等,很有趣的。它是一個沒有眼睛、耳朵、手與腳只是幾個小輪子做的這樣的一個機器人,我們認為這個領域也像Echo音響一樣是有機會的。
那麽講到創新工場人工智能工程院,剛才我們也說過了,我們會找一批專家帶一批學生,買大量的數據,數據也包括了金融交易的數據。其實現在美國有很有意思的公司,我覺得國內也有一些類似的公司,就是把這個量化交易做成一種競賽,把這些數據全部弄好了,然後這些小朋友上去比算法,然後Backtesting,看看過去3年,5年,10年可以賺多少錢.誰做的更好,我們基金就跟他分紅,當然,這里說的不是我們創新工場的基金,它指的是一個特殊的量化基金,這是一種比賽。
然後還有無人駕駛和一些識別之類的也是一些領域。我們認為在AI科學家,AI時代的創業呢,都是科學家。科學家呢,不知道怎麽買數據,沒有錢買機器,不懂商業,我們可以在這些方面補足,所以這是一個很特殊的新的做法。
那我們在這方面的布局也得到不少國內外的認可,在紐約時報、華爾街日報、Forbes等也都有報道我們的投資和我們投資的一些公司。
最後我答應告訴大家三個秘密,如何去做早期公司的投資。
第一個怎麽投資公司。剛才我已經說過了,要衡量它有沒有大數據,然後有沒有獨特的大數據,不是買來的大數據,有沒有科學家,有沒有閉環,有沒有很多機器。然後他做的這個領域,是不是可以產生商業價值的領域,還是一批科學家在瞎搞。這是第一個。看這些項目要小心,還有看機器人的項目,有眼睛耳朵手與腳的就千萬不要再聽了,雖然聽起來很酷。無人駕駛可以去想想怎麽去參與。
這是投公司的,投基金呢?投創新工場和真格基金就可以了。
至於買股票呢?我是美圖的董事,可能下面不適合說,但是你應該知道我要說什麽,我們看好美圖,認可美圖。
剛才也分享了,量化AI在國內的投資應該機會特別大,這不是一個人工智能投資,這是一個真的二級市場的投資,當然要避免一些法律所不允許的事情,但是機會還是很多。那麽我們現在也在專門看這個量化AI投資,對於這些呢,如果有興趣的我們也可以一起以後在別的機會一起探索。
我也給大家說了,過去兩年,我所有的資產基本都是在創新工場里,除了一棟房子,創新工場,我所有的資產基本上都是交給機器人管理,都是用AI量化來管理。這個也就是告訴你我對這個領域是多麽看好和認可。當然三年後這個領域可能就是紅海了,只是說現在的機會是非常好的。當然我還有一支股票是例外的,是我孩子決定要投資的。就像如果說在移動互聯網時代,二級市場最好的投資標的是ARM,人工智能的時代是什麽?大家確實可以看一看NVIDIA。
3Q財報顯示從圖形芯片到人工智能平臺的華麗轉型
2017Q3財報超預期,股價暴漲30%
英偉達凈利潤長同比增長124%,比市場預期高出39%。GPU巨頭英偉達(NVDAUS)發布2017Q3季度財報,受遊戲和數據中心等業務的提振,營業收入和凈利潤等指標大幅超出預期。公司在2017Q3營業收入首次突破20億美元大關,同比增長54%,遠超去年同期6%的增幅;公司2017Q3凈利潤達創紀錄的5.7億美元,同比增長124%,對比去年同期的只有16%增長;公司當季毛利率為59.2%,較去年同期的56.5%上漲2.7%。
財報發布的營業收入比市場一致預測高18%,毛利率1.2%的提升也造就了凈利潤大幅超過市場預期達39%。公司同時亦表示,其每季度股息將提高22%到每股14美分。4Q預期方面,公司的收入指引為21億美元加減2%左右,也是遠遠超出市場預期的16億美元。
英偉達股價在財報發布當天暴漲29.8%。自今年年初起,英偉達股價已經上漲174%。如果比較英偉達兩年前的股價,增幅更加是驚人的323%;同期納斯達克指數的增幅為11%。
圖形處理器成為人工智能平臺的核心
我們為什麽要采用圖形處理器
圖形處理器(即GPU)是英偉達在1999年8月發布GeForce256繪圖處理芯片時首先提出的概念,旨在加速3D渲染等大負荷圖形計算,增強計算機的圖像處理功能。在此之前,電腦中處理視頻輸出的顯示芯片並未被視為是一個獨立的運算單元。
深度學習算法的GPU加速:為人工智能插上翅膀,新時代的超級摩爾定律。基於多層神經網絡的深度學習算法自2012年ICLR(InternationalConferenceonLearningRepresentations)會議上後引起了學術界和工業界的廣泛關註。由於深度學習算法運算量大、所需計算單元多的特點,傳統的CPU在用於人工智能計算時耗能過大,已經難堪重任。因此,基於GPU架構的計算芯片被推上了人工智能的舞臺。GPU采用眾核同步並行運算,適用於人工智能海量數據處理,並且能耗適中。事實證明,在浮點運算、並行計算等部分計算方面,GPU可以提供數十倍乃至於上百倍於CPU的性能。在摩爾定律即將失效的今天,人工智能將因為自身強大的增強學習能力和提升速度超越摩爾定律,成為IT產業未來穩定健碩的增長點。實際上,擅長處理並行工作負載的GPU在僅僅三年內便將深度神經網絡(DNN)的訓練速度提高了50倍,預計未來幾年還將再提高10倍。
英偉達是是GPU的領航者
英偉達在獨立GPU市場獨占鰲頭。英偉達自1993年創立一直深耕於GPU芯片,成為了全球GPU的絕對龍頭企業。目前國際獨立GPU市場已被英偉達和AMD兩大公司瓜分。截至2015年第二季度,英偉達市場份額已達到82%。
英偉達的遠期戰略即是從一個圖形芯片公司轉型為人工智能平臺搭建者。英偉達基於自身在GPU和深度學習領域的強大積澱,從數年前就已開始了華麗的轉身。英偉達創始人兼CEO黃仁勛日前在接受采訪的時候表示:英偉達的遠期戰略即是從一個圖形芯片公司轉型為人工智能平臺搭建者。在向人工智能平臺轉型的道路上,英偉達多線出擊,已經邁出了堅實的腳印。
GPU系列產品繼續保持高增長高利潤,Tegra處理器虧損減少。英偉達的產品線主要分為:GPU系列產品、Tegra處理器和其他類。其中GPU系列產品繼續為公司貢獻了絕大部分營收,占公司2017Q3營業收入的84.7%,同比增長52.9%,較上季度增長41.9%;Tegra處理器在2017Q3營收達2.41億美元,同比增長86.8%,較上季度增長45.2%。
在凈利潤方面,GPU系列產品2017Q2的營業利潤達到3.79億美元,同比增長38.8%,較上季度增長8.9%。相比之下,Tegra處理器和其他業務則長期處於虧損狀態,但在Tegra處理器的虧損由上一季0.38億美元縮減到2017Q2的0.14億美元;其他業務的虧損也由上季的0.65億美元縮減到0.48億美元。未來,Tegra處理器和其他業務或將扭虧為盈,對公司業績構成持續利好。
遊戲、數據中心、汽車、專業可視化多管齊下
遊戲、數據中心和汽車是增長的新引擎
按照終端用戶應用領域拆分,英偉達的主營業務可以分為:遊戲、數據中心、專業可視化、汽車和和OEM&IP。。其中遊戲業務、數據中心業務和汽車業務的快速增長已經成為英偉達業績騰飛的新引擎;原始核心業務專業可視化也依舊保持穩健,同比增速為9%。公司業務組成成分相比較於兩年前,已經出現了較大轉變:OEM&IP業務從兩年前的3.51億美元縮水至2017Q3的1.86億美元,占比也從29%跌至9%;專業可視化業務營收基本保持不變,但占比從17%減少至10%;遊戲業務營收占比從43%大幅上漲至2017Q3的62%;數據中心和汽車的份額也均有不同程度地提升。我們預計,隨著未來人工智能和虛擬現實時代的到來,這三類業務將繼續成為公司業績增長的核心推動力。
深度學習運算需求帶動數據中心業務的爆發
數據中心業務爆炸式增長,深度學習技術業界領先。根據2017Q3財報,數據中心業務當季營收2.4億美元,占總營收12.0%,同比增長193%,較上一季增長58.9%。實際上,數據中心業務的爆發式增長有益於英偉達在今年矽谷GTC發布的深度學習超級計算機DGX-1。公司創始人黃仁勛稱之為“裝進機箱里的數據中心”:DGX-1內置了8塊基於Pascal架構的TeslaP100加速器芯片(專為人工智能設計的加速芯片),在深度學習訓練上的整體性能相當於250臺普通x86服務器。根據財報透露,DGX-1人工智能超級計算機已經於本季開始發貨,第一批客戶包括斯坦福大學和微軟在內的眾多人工智能頂尖高校和科研研所,其中DGX-1的第一個用戶就是ElonMusk的人工智能項目OpenAI。此外,英偉達本月還同微軟Azure達成合作,雙方將借助英偉達數據中心的計算資源共同優化微軟CogitiveToolkit,共同協作為人工智能的加速做出貢獻。
正如IBM之於大型機,英特爾之於微機,英偉達有望借數據中心業務成為人工智能時代的王者。我們認為,英偉達未來難遇敵手,在人工智能時代的數據中心業務將占據不可撼動的壟斷優勢,包括DGX-1在內的深度學習超級計算機系列產品有望在未來成為AI數據中心的標配。據IDC測算,2015年高性能計算服務器的市場規模達到114億美元,未來五年的年複合增長率將達到5.9%,2020年市場規模有望達到151億美元。
此外,英偉達數據中心業務在本季度的亮點新聞還有:
·英偉達本季度發布TeslaP40、P4GPUs以及NVDIATensorRT深度學習組織架構,為超大規模數據中心的AI計算加速打下了發展基石;
·宣布同日本FANUC展開合作,旨在提高機器人的效率並為自動工廠帶來創新;
·英偉達本季度在八個城市舉辦了GPU技術會議,在1萬8千名GPU開發人員、科學家中推廣了影響力。
未來的汽車電腦系統
搶攻汽車業務,英偉達的無人駕駛遠景。根據2017Q3財報,汽車業務當季營收1.27億美元,占總營收6.3%,同比增長60.8%,較上一季增長6.7%。作為汽車業務的硬件核心,Tegra處理器基於ARM構架的芯片計算機(ComputeronaChip)。它把整套計算機配件包括GPU、多核CPU等整合到一塊芯片上,能夠為便攜設備提供高性能和低功耗的體驗,幫助汽車感知、探測、預判風險,並整合了深度學習功能。
英偉達於此前還發布了汽車解決方案:英偉達DriveCX數字駕駛系統以及ADAS解決
方案:英偉達DrivePX2汽車車載電腦。目前英偉達的戰略合作夥伴及方案使用廠商市場分布廣泛,包括22個汽車廠商、16個tire1供應商和39個汽車技術和軟件公司,未來市場潛力巨大。此外,英偉達汽車業務在本季度的亮點新聞還有:
·英偉達DRIVEPX2平臺將會在新一代特斯拉AutoPilot系統中使用;
·透露下一代Tegra處理器(代號Xavier)將通過AI超級計算機芯片的方式用於無人車;
·與百度達成合作意向,將共同開發無人車、人工智能汽車和成像系統;
·與歐洲公司TomTom達成合作意向,為使用英偉達DRIVEPX2的無人車開發”雲to車”成像系統。
虛擬現實的進一步落地將有利公司遊戲業務的進展
遊戲業務繼續高增長,英偉達與任天堂達成全方位合作。根據2017Q3財報,遊戲業務當季營收12.44億美元,占總營收的62.1%,同比增長63.5%,較上一季增長59.3%。過去,英偉達遊戲業務主要集中在PC遊戲上,但隨著PC遊戲的發展速度放緩,英偉達早已將觸角伸向了遊戲主機和虛擬現實行業。英偉達於本季度透露,公司將在未來為任天堂Switch遊戲主機提供顯卡,這標誌著英偉達繼NintendoNX之後與任天堂開展全方位的合作。
立虛擬現實對高端獨立GPU需求強勁,未來VR將成為最強推動力。在虛擬現實領域,由於高清三維圖像渲染對芯片的計算能力有非常高的要求,高端虛擬現實設備的普及勢必將帶來一撥獨立顯卡升級換代的高潮,英偉達和AMD作為此領域的唯二玩家勢必將具有巨大的議價能力。目前,英偉達GTX970已經成為OculusRift和HTCVive等高端VR設備的最低標準配置。此外,英偉達於去年分別發布了VR內容開發的解決方案英偉達VRWorks並親自開發了一款搭配GTX1080運行的VR遊戲VRFunhouse。據Gartner估計,2020年全球高端VR硬件設備出貨量有望達到2600萬臺。未來伴隨著VR行業的高增長,英偉達在遊戲行業中的霸主地位有望變得更為不可替代。
此外,英偉達遊戲業務在本季度的亮點新聞還有:
·擴大Pascal架構的遊戲顯卡GTX1050和GTX1050Ti的生產線,期望讓更多PC遊戲玩家體驗到GTX顯卡帶來的樂趣;
·開始在筆記本電腦中搭載GTX1080、1070、1060,為PC端虛擬現實設備的普及打下基礎。
專業可視化業務保持穩健,GRID遠景可期
GRID是英偉達力推的圖像虛擬化的計算平臺。根據2017Q3財報,專業可視化業務當季營收2.07億美元,占總營收的10%,同比增長9%,較上一季下降3.2%。作為專業可視化的領導者,英偉達依靠QuadroGPU在全球專業可視化市場占據了90%的市場份額,是設計行業的計算基石。專業可視化作為英偉達的傳統核心業務,近年來已經趨近飽和,未來英偉達希望借助GRID平臺繼續維持這一行業的增長前景。GRID是英偉達近兩年來力推的圖像虛擬化的計算平臺,旨在借助數據中心的計算力賦予每一個終端超強的虛擬計算能力,讓工程師的工作不再受計算能力的掣肘。目前,包括思科、聯想、惠普和戴爾都已經成為了GRID的用戶。未來,隨著虛擬現實內容制作的發展,專業可視化業務或許有機會迎來第二春。
高增速支撐高於行業平均估值水平
相比於半導體行業的10-20倍平均P/E水平,英偉達的股價大概是在35x今年EPS的P/E倍數高位。公司現階段的預估市盈率也是靠近歷史高位,從2015年頭的15-20x左右擴張到現有的水平。
我們認為根據現在的股價,市場對英偉達未來1-2年的利潤增速預期大約為20%-30%。而股價進一步的上升很可能會來自進一步上漲的EPS,而不是進一步的P/E倍數擴張。在公司的四個主要業務中,我們認為遊戲業務和深度學習可能是公司業績增長的短期驅動力;而虛擬現實和無人車業務將在更長的時間尺度上刺激公司的業務增長,任何提早的利潤實現都將為公司的股價帶來新一波的上行驅動。
風險因素
數據中心終端市場收入的不可確定性和不穩定性;
宏觀經濟下行為高端遊戲需求帶來負面影響;
新興業務板塊的競爭日益加劇。
投資機會和評級
英偉達是人工智能領域基礎層最有代表性的龍頭企業,公司在新板塊業務的成功轉型將帶動國內外相關公司的增量投資和預期提升。我們維持“人工智能”主題“強於大市”評級。涉足相關領域的國內上市公司包括:軍工相關應用的GPU標的景嘉微,針對車聯網主控芯片的全誌科技、四維圖新,幫助國外廠商AMD做芯片封測的通富微電等。
(完)
股市有風險,投資需謹慎。本文僅供受眾參考,不代表任何投資建議,任何參考本文所作的投資決策皆為受眾自行獨立作出,造成的經濟、財務或其他風險均由受眾自擔。
新財富酷魚正在積極建立和讀者、合作夥伴的聯系,你想獲取更多有價值資訊嗎?你想成為我們網站的作者嗎?你對我們的網站的更新有什麽建議?請掃描以下二維碼聯系我們的主編(本微信號不洽談廣告投放事宜,加的時候請註明“新財富+您所在公司”):