Swarm AI再出手預測,雖然保持著75%的勝率,但卻預測錯了兩項大獎。這是怎麽回事?
本文由新智元(微信ID :Al_era)授權i黑馬發布,作者胡祥傑。
2017年2月27日,第89界奧斯卡諸項大獎名單新鮮出爐,《月光男孩》戰勝呼聲甚高的《愛樂之城》拿下最佳影片。大獎公布之前,著名的群體智能預測網站的Swarm AI再出手預測,今年它雖然保持著75%的勝率,但是卻預測錯了兩項大獎。這是怎麽回事?群體智能和群體智能預測原理是什麽?本文帶來詳細解讀。
2017年2月27日,第89界奧斯卡諸項大獎名單新鮮出爐:
最佳影片:Moonlight(月光男孩)
最佳導演:amien Chazelle , La La Land( 愛樂之城)
最佳男主角:Casey Affleck,(海邊的曼徹斯特)
最佳女主角:Emma Stone,La La Land ( 愛樂之城)
最佳男配角:Mahashala Ali, Moonlight(月光男孩)
最佳女配角:Viola Davis,Fences (藩籬)
最佳原創劇本:Manchester by the Sea(海邊的曼徹斯特)
最佳改編劇本:Barry Jenkins,Moonlight(月光男孩)
最佳剪輯:Hacksaw Ridge (血戰鋼鋸嶺)
最佳攝影:Linus Sandgren,La La Land ( 愛樂之城)
最佳外語片:The Salesman (推銷員)
最佳動畫長片:Zoopopia (瘋狂動物城)
最佳動畫短片:PIPER (鷸)
最佳藝術指導:La La Land( 愛樂之城)
最佳服裝設計:Fantastic Beasts and Where to Find Them (神奇動物在哪里)
最佳化妝&發型設計:Suicide Squad (自殺小隊)
最佳視覺效果: The Jungle Book (奇幻森林)
最佳音響效果:Hacksaw Ridge(血戰鋼鋸嶺)
最佳音效剪輯:ARRIVAL (降臨)
最佳原創配樂:Justin Hurwitz, La La Land ( 愛樂之城)
最佳原創歌曲:City Of Stars, La La Land ( 愛樂之城)
最佳真人短片:SING,(校合唱團的秘密)
最佳紀錄長片:OJ:Made in Ameirica (辛普森:美國制造)
最佳紀錄短片:The White Helmets (白盔)
終身成就獎:成龍、安妮·考特斯、林恩·斯塔馬斯特、弗雷德里克·懷斯曼
吉恩·赫肖爾特人道主義獎:黛比·雷諾斯
去年曾經準確預測“小李子”拿下最佳男主角小金人的群體預測AI——Swarm AI再次出手,在大獎公布前先作了一番預測。
來看下它的預測結果:
確定性較強的預測
最佳女配角:Viola Davis, Fences ✅
最佳藝術指導獎:La La Land ✅
最佳攝影獎:La La Land ✅
最佳導演獎:Damien Chazelle , La La Land ✅
最佳動畫長篇:Zoopopia ✅
最佳女主角:Emma Stone,La La Land ✅
最佳原創歌曲:”city of star”, La La Land ✅
最佳影片:La La Land ❌
最佳改編劇本獎:Barry Jenkins,Moonlight ✅
確定性中等的預測
最佳服裝設計:Jackie ❌
最佳男配角:Mahashala Ali, Moonlight ✅
最佳紀錄片:OJ:Made in Ameirica ✅
最佳外語電影:The Salesman ✅
最佳視覺效果:The Jungle Book ✅
最佳原創劇本:Damien Chazelle,La La Land ❌
高度不確定性的預測
最佳男主角:Danzei Washinton,Fences ❌
16項預測中,Swarm AI 預測中了12項,準確率達75%,與去年相比準確率沒有多大變化。但是,今年的預測中,Swarm AI 在最佳男主角和最佳影片上都出現錯誤,也凸顯了一些問題。
預測過程
Unanimous A.I 的研究員集合了近50名電影愛好者群集,來預測2月27日奧斯卡大獎的歸屬。
用戶註冊後可在Unanimous A.I 參與預測,在做出決定時,每位用戶都有一個可以拖向他們的選擇的虛擬圓盤。每個人都可以看見其他人的決定,也可以隨時改變自己決定。這個集群中的每個個體都可以互相影響。
最佳外語片的預測過程示意圖
最佳導演獎的預測過程
最佳影片預測過程
什麽是群集智能(Swarm Intelligence)
Swarm AI 的平臺由 Unanimous 公司開發。
在公司的官網上可以看到,創始人 Louis Rosenberg 是斯坦福大學的博士。他的博士研究聚焦於機器人、虛擬現實、人機交互。曾在美國空軍阿姆斯特朗實驗室擔任研究員。他創造了世界上首個沈浸式增強現實系統。
什麽是群集智能(Swarm Intelligence)?
以下介紹來自Unanimous (UNU)官網:
群集智能的概念是受到鳥類和蜜蜂的啟發, 從對自然界的學習中,我們發現,社會動物以一個統一的動態系統集體工作時, 解決問題和做決策上的表現會超越大多數單獨成員。在生物學上,這一過程被稱為“群集智能”。這也證明了一句古話:人多力量大。
這帶來了一個問題:人類可以群集嗎?當然,我們並沒有進化出群集的能力,因為人類缺少同類用於建立實時反饋循環的敏銳連接(比如,螞蟻的觸角),這種連接是高度相關的,讓群體行為被認為是一個“超級器官”。通過這麽做,這些生物能夠進行最優選擇,這要遠比獨立的個體的選擇能力要強得多。
但是,人類呢?我們能把個人的思考組合起來,把它們作為一個統一的動態系統嗎?這樣能讓我們做更好的決策、預測、評估和判斷嗎?研究顯示,答案是“yes”。事實上,使用Unanimous A.I.的技術,人類群集已經被證明在預測體育賽事結果、金融趨勢甚至是奧斯卡獎得主這些事上的準確率超過了個人專家。
這一技術被稱為“群集人工智能”(Artificial Swarm Intelligence,簡稱 Swarm A.I.),它能讓群體組成實時的線上系統,把世界各地的人作為“人類群集”連接起來。它是一個人類實時輸入和眾多 A.I. 算法的結合。Swarm A.I. 吸引結合人類參與者的知識、智慧、硬件和直覺,並把這些要素組合成一個統一的新智能,能生成最優的預測、決策、洞見和判斷。
論文:
論文地址:http://unu.ai/wp-content/uploads/2016/10/Crowds-Vs-Swarms-SHBI2016-Final-PDF-confirmed-by-IEEE.pdf
那麽 Swarm AI 的未來是什麽呢?如果我們將單個螞蟻的智能到整個蟻群的智能視為一個智能躍升,那麽我們也可以認為,從單個人到一個大群人也將有這麽一個提升,出現一個高級的“超級智慧”。要出現這樣的超級智能,需要上千人一起思考嗎,還是說上萬、上百萬?這個我們還不知道,但UNU是使人們能將他們的知識和見解匯集到一個高級智能中所邁出的第一步。
為什麽群集人工智能(ASI)很重要?在AI 研究的世界里,各個實驗室花費了數十億美元,試圖用純數字化的東西取代人類智能。雖然我們能夠理解這種為創建超智能所付出的努力,但這也令我們害怕。純粹的人工智能沒有理由和人類共有目標和感情,或者遵循我們的道德和價值觀。
所以,我們要問的問題是,是否有一個更好的方式來構建超級智能?答案是肯定的,那就是建立 Swarm AI 系統,將實時的人類洞察和 A.I.算法統一在一起的智能系統。我們相信,這條路相比創建比我們人類更聰明的系統更加安全,因為它可以確保最終的智能與我們的目標和願望相符合的,擁有人類的情感和共情,最重要的是擁有人類的道德和價值觀。簡單地說,Swarm A.I.技術創造放大的智能,同時將人類納入整個過程中。
群集智能的局限性在哪?
在美國總統大選時,Unanimous A.I.也曾做過預測,並認為希拉里當選。它的方法是直接以人為分析對象,即通過詢問參與的選民一組類似的問題,如:“如果希拉里擔任總統,失業問題將如何改善?”參與預測的選民可從五個答案中選擇,即“大幅改善”、“略微改善”、“大幅加劇”、“略微加劇”以及“沒有任何變化”。此外,可選的答案還有“希拉里勝算很大”、“希拉里略勝一籌”、“特朗普勝算很大”、“特朗普略勝一籌”以及“不相上下”。
在Unanimous A.I.進行的預測中,有45個選民參與,其中46%為民主黨人,24%為共和黨人,30%在黨派上保持中立或屬於其它黨派。
從設計的問題和選取的對象看,由Unanimous AI開發的swarm AI-UNU的預測則明顯傾向希拉里。Unanimous A.I. 直接以人為分析對象並使用了一種所謂的“群集智能”的技術。即在實際預測中,一組隨機選取的適齡參選的公民會被提問,參與者按照自己的回答傾向牽動球體。在這一過程中,參與者往往會根據球位置的變化而不斷變化自己的選擇——當發現多數人也支持自己的選擇時,他可能會更加堅定地牽引;而當發現球大大偏離自己希望的方向時,他可能會放棄或減小牽引力,直至最終達成“共識”。
有專家評論說,Unanimous AI采用“集群智能”技術搜集數據的方法更帶有偏見性,這種偏見通過問題的設定和對象的選取得到了充分體現。
可行的解決方案:意外流行算法
群體智慧有失效的時候。例如,讓一群人回答這個問題——費城是賓夕法尼亞州的首府嗎?絕大多數人會錯誤地回答說“是的”。這是因為他們知道:①費城是賓夕法尼亞州的一座大城市,②首府都是大城市。但實際上,正確答案是哈里斯堡,而往往只有少數人會說出這個正確答案。
為了找出那些不為多數人所知的正確信息,普林斯頓大學和 MIT 的研究者設計了一種新的方法,將其稱為“意外流行”(surprisingly popular)算法。研究人員表示,這種算法能更好地從群體中獲取正確答案,尤其是當大多數人的看法是錯誤的時候。相關論文日前在 Nature 發表。
實驗中,研究人員會詢問接受調查的人他們對某個問題的看法,以及他們認為其他人會如何看待這個問題:①你認為正確答案是什麽?②你認為流行的答案(即多數人會選擇的回答)是什麽?
然後,算法會找出“意外流行”的答案,也就是比大多數人預測中更受歡迎的答案。大部分情況中,這些超出大多數人預計的選擇,就是正確的答案。
“我們以為社會平均意見一般是對的,過往對群體智慧的統計也支持這一看法,”研究負責人、MIT 斯隆管理學院的行為經濟學家 Drazen Prelec 說:“但事實證明並非如此。有像醫生那樣的專家存在。這讓我們意識到了少部分人掌握的知識。”
Nature 論文:單問題群體智慧新解
群體智慧優於任何個人智慧的概念一度曾被視為激進的觀點(provocative),但已經成為一種群體智慧,導致有人猜測在線投票都方式可能很快會使認證專家失業。群體智慧近來被用於政治和經濟預測、評估核安全、公共政策、化學探測質量檢測,以及潛在火山爆發危機應對措施。用於獲取群體智慧的算法通常基於民主投票程序,易於應用並且保持了個人判斷的獨立性。然而,民主方法有嚴重的局限性,容易拋棄那些沒有被廣泛共享的新穎或專業知識,反而側重膚淺、最低的共同信息。基於測量置信度的調整也不能可靠地解決這個問題。在這里,我們提出了民主投票的替代方案:選擇比人們預測更受歡迎的答案。我們表明,這個原則在關於選民行為的合理假設下能夠產生最佳答案,而標準的“最受歡迎”或“最自信”原則在相同的假設下無法實現這一點。與傳統投票一樣,該原則適用於單獨的問題,例如關於科學或藝術價值的小組裁決以及法律或歷史爭端。因此,這一方法的潛在應用領域比機器學習和心理測量方法更加廣泛,後兩者都需要來自多個問題的數據。
百度教育正以“ABC”為推動力,朝著內容化、智能化、個性化方向發展,
3月2日,百度教育內容生態高峰論壇在京召開,主題為“智能時代,智慧出版”。百度總裁張亞勤、百度教育事業部總經理張高現身,與多家出版機構、文化界嘉賓共同探討“教育內容生態搭建”、“傳統出版業的未來變革”等話題。
“ABC”三位一體,加速傳統行業轉型升級
近年來,人工智能技術已在多個場景下得到應用,傳統教育領域的發展也直接受益於此。
百度總裁張亞勤致辭
百度總裁張亞勤在致辭中表示,“一直以來,我們高度重視人工智能技術(AI)、大數據技術(Big Data)和雲計算(Cloud),我把它們稱為‘ABC’三位一體。在教育領域與科學技術的雙重探索中,百度教育正以‘ABC’為推動力,朝著內容化、智能化、個性化方向發展,致力於激發人們為提升自身價值的內在學習需求,為用戶提供個性化的知識獲取路徑。”
致辭最後,張亞勤說到,希望百度的人工智能技術能應用到各個領域,與傳統行業深度結合,促進變革、提升效率、釋放潛能。
激發並滿足潛在學習需求,開辟“智慧出版”
激發學習需求,是張高在講話中一直強調的核心語句。升學、出國的的剛性需求已經被大部分滿足,由興趣驅動的個性化需求,是絕大多數教育機構的發力點。
百度教育想做的,是通過人工智能、大數據等技術,激發挖掘每個學習者的“潛在學習需求”,讓所有人更平等便捷的獲取教育資源,找到所求,提升自身價值。
張高說,通過新興科技洞察人們學習需求的同時,實現智能選題、智慧出版,以增加資源利用率、整體出版效率,更有的放矢的輸出最能滿足讀者潛在需求的出版內容。
百度教育事業部總經理張高博士致辭
人工智能破局電子閱讀,讓讀書不再“碎片化”
隨後,百度教育COO胡鑫通過百度閱讀全新版本的產品演示,就百度教育在人工智能技術支持下的產品創新、應用探索、商業模式進行了直觀解讀。他認為,通過人工智能等技術,營造特定的“沈浸式”閱讀場景,將最終實現閱讀的“去碎片化”,讓閱讀更有價值。
目前,國內外數百家主流出版機構包括中信出版社、三聯書店出版社、電子工業出版社、作家出版社等已與百度閱讀合作,2016年線上圖書閱讀量環比增長27倍。
現場,百度教育與牛津大學出版社、北京大學出版社、清華大學出版社、天津湛廬圖書有限公司等出版機構代表共同簽署了戰略合作協議,共同打造內容生態鏈條。
隨後,當代著名作家,茅盾文學獎得主劉震雲在現場發表了主題演講,講述了在數字時代下,對於內容生產第一線的作者有著怎樣的影響。“人工智能將來會發生什麽樣的變化,我覺得這個變化絕對不是只是有無人駕駛的汽車等,改變的一定是人和人之間的關系,也會改變文學、出版和閱讀之間的關系。”
當代著名作家劉震雲在現場進行主題演講
在今年年初的在內部演講中,李彥宏首先提到的業務就是“內容分發”。他之前對媒體透露,信息流是百度比較大的增長點,百度每天分發文章的數量天天都在增長。“一方面網上每天有大量的內容生產出來,另外每天有幾億用戶來到手機百度平臺上,我們怎麽通過最好的匹配算法把內容跟用戶的興趣匹配出來,這一點非常適合百度來做。”
未來所有的技術公司都是AI公司,小米也將發布重磅級人工智能產品。
本文由黑智(微信ID: VR-2014)授權i黑馬發布。
3月5日,國務院總理李克強在作政府工作報告時表示,要“全面實施戰略性新興產業發展規劃,加快新材料、人工智能、集成電路、生物制藥、第五代移動通信等技術研發和轉化”,這也是“人工智能”這一表述首次出現在政府工作報告中。
這一報告的效果立竿見影。今天(3月6日)上午,截至北京時間11:30,高科技企業紮堆的創業板指上漲1.45%,遠高於上證指數0.37%的漲幅。板塊方面,人工智能板塊以2.29%的漲幅領跑,科大智能開盤即封漲停,川大智勝、勁拓股份等相關概念個股也有超5%的漲幅。
1月22日,由國家網信辦和財政部共同發起的中國互聯網投資基金成立,據分析,人工智能也將成為重點投資領域之一。結合政府工作報告,在2017年,國內人工智能的發展,即將迎來一次高潮。而在兩會期間,李彥宏、郭廣昌等兩會代表,也均提出了人工智能相關的提案。而就在今天,雷軍的兩會提案曝光,其中,人工智能也成為必不可少的一環。黑智(ID:VR-2014)在雷軍的兩會媒體見面會上,傳遞回了雷軍關於人工智能提案的解答。
全國人大代表、小米科技董事長雷軍兩會期間共計提交了三項議案:加快實施人工智能國家戰略、大力發展新零售激發實體經濟新動能,以及推動中國科技企業出海。
在下午出席兩會媒體溝通會時,雷軍表示,未來所有的技術公司都是AI公司,目前已經到了技術突破的節點,而小米也將在不久發布重磅級人工智能產品。
雷軍今年提出了3項提案分別是有關於人工智能、“新零售”和科技企業出海。在“加快實施人工智能國家戰略”的提案中,雷軍建議從5個方面加快實施人工智能國家戰略。分別是:
1)在國家層面進行人工智能發展的頂層設計和專項規劃;
2)加強人工智能基礎理論研究;
3)加強人工智能科研人才、技術人才的培養與引進;
4)積極建立人工智能產學研協同創新共同體;
5)大力促進人工智能產業化發展。
小米將發布重磅級人工智能產品
此前,創新工場董事長李開複曾公開表示,未來將有50%的人類工作被機器替代,引發行業內外熱議。
雷軍表示他贊同李開複的判斷,並表示被機器替代的比率“只多不少”。同時雷軍也強調,至於人類被取代工作怎麽辦?他表示也會有新的工作機會產生。
談到小米在人工智能方面的布局,雷軍說:“去年年初,小米設立了探索實驗室。不久將有重磅級的人工智能產品發布。”
雷軍還認為現在處於人工智能的產業爆發節點,他大膽預測道:所有的互聯網巨頭,都是人工智能的公司。這說明產業趨勢,也是技術爆發的節點。而且未來所有的技術公司,都會是人工智能公司。
對於小米去年才開始布局人工智能,雷軍表示“並不晚”。
“我當時問我的同事,我們布局人工智能是不是落後了?”雷軍的同事則告訴他:“知道重要性就是小米在人工智能的優勢。”
雷軍最後還說,10年前他開始談到移動互聯網的重要性,認為手機將取代PC,現在這個判斷已經得到了驗證,而人工智能的發展則會更快,用不了10年,只需要3到5年時間,就能讓每個人享受到人工智能樂趣和便利。
小米的AI布局
早在2016年1月的小米年會上,雷軍就對2016年小米的發展目標進行了定位,稱2016年小米要“聚焦核心業務,組建特種部隊”。
緊隨其後,小米的“特種部隊”——小米探索實驗室就宣告成立了。該實驗室由小米路由器總經理唐沐和小米聯合創始人黃江吉帶隊,黃江吉也在微博上發出人才招募計劃,包括3D引擎研發工程師,計算機圖形算法研究員,Graphics+GPU工程師,3D設計師,用戶體驗負責人等職位,可以通過這份招募名單看到小米進軍AI和VR領域的決心。
六一兒童節,小米正式涉足兒童早領域,推出一款“米兔智能故事機”。這個面向兒童、不斷學習進化的AI產品,采用兒童智能語音引擎,能夠“傾聽”孩子的心聲,與孩子直接對話,用兒童喜歡的口吻與思維方式問答互動,還內置了算數,考考我吧,問答模式等互動環節,還配備了只面向兒童的獨有的語料庫。
8月4日,小米首款VR設備“小米VR玩具版”正式亮相。這款VR眼鏡采用了拉鏈式設計+萊卡棉材質,官方表示它可適配4.7-5.7英寸的手機。
去年的“雙11”,小米主推小米旗下第三款人工智能電視小米電視3s 60英寸電視。這款電視是繼9月27日發布65英寸分體和55英寸一體之後的第三款人工智能電視,擁有“PatchWall拼圖墻”人工智能電視系統。
“PatchWall拼圖墻”人工智能電視系統
緊接著的11月16日,小米電視發布了新一代電視盒子產品小米盒子3s,同時也是被小米稱之為首款人工智能機頂盒。
據了解,“PatchWall拼圖墻”基於“小米大腦”(Mi Brain)團隊技術研發,無縫接入小米電視自建的深度學習、人工智能體系中。系統采用雜誌式排版和無線翻滾的內容瀑布流,可根據用戶的使用習慣進行深度定制,還能不斷學習用戶和家人使用習慣,越來越懂用戶,匹配最精準內容。
小米聯合創始人黃江吉早前接受采訪時曾介紹,小米運用人工智能的方式和業務(搜索、推薦、廣告、雲相冊等等),跟大家想象中的人工智能 AI 可能不完全一樣,但是這些業務都得益於深度學習技術,並且起到了立竿見影的效果。
“人工智能和深度學習這幾年的突破和貢獻,遠不止語音識別、圖像處理等基礎技術。其實在每一個需要算法的應用和產品里面,都能用得上。這才是機器學習對我們最大的意義,它完全改變了工程師做產品的方法論。”
黃江吉所稱的方法論,是指產品因為用戶使用而產生的數據,通過機器學習技術的加工,讓產品更加智能化,從而形成正向循環。他認為,這個循環,已經成為產品開發的新常態。
雷軍兩會媒體見面會實錄,經黑智(ID;VR-2014)編輯:
公眾現在對人工智能,既了解又非常不了解。
了解是因為,過去的30年里,關於人工智能的報道一直特別得多。去年,人工智能特別熱門,AlphaGo擊敗了人類的圍棋高手,讓公眾覺得人工智能又取得了一個重大的突破。其實,去年的報道的熱度跟1997年深藍擊敗國際象棋高手時的報道是差不多的,很多人還是覺得,人工智能總體來說離我們自己還是挺遠的。
但我個人認為,人工智能現在在深度學習的突破不亞於一次技術革命。AlphaGo擊敗了圍棋高手,使深度學習迅速被公眾所接受。
我今天主要是希望傳達一個信息,就是人工智能離我們越來越近。它不像以前一樣高高在上,很快會應用到我們生活和工作之中去。深度學習的算法,通俗來講有點像小孩學知識的過程,機器通過大數據反複訓練,自動掌握規則,這跟以前模式非常不一樣。
很多人預見在10年之內,人工智能會在很多領域超過人的能力。我的提案建議也是把人工智能列為國家戰略,因為我認為人工智能是未來10年最重要的技術革命,勢必影響整個人類社會。政府現在對技術創新高度重視,在過去幾年里面,做出了很大的推動。
互聯網+的行動綱要、大數據的國家戰略、中國制造2025,這三個領域在政府工作報告里面都講得特別詳細,也推動了整個產業的進步。
我覺得,在雙創如火如荼的今天,如果把人工智能列為國家戰略的話,將極大地推動整個產業進步和整個社會的進步。
而且我認為,這次人工智能跟前幾次的技術革命不一樣,對中國是一個時代機遇。這主要是基於三點:
第一,今天的人工智能的背後是雲服務和大數據。我們談大數據這麽長時間,也談了大數據很多的商業模型,但是大數據產業的進展,我覺得是低於大家預期的。但當疊加了人工智能以後,大數據體現了前所未有的魅力。過去這些年里面中國在移動互聯網的領先優勢,通過雲服務和大數據,很快會轉換成人工智能的優勢。
第二,我們更大的優勢在哪里?有專家統計,過去這幾年里面有43%的人工智能方面的論文是中國人撰寫的。我們再來看各大全球互聯網巨頭,人工智能的負責人都是華人。所以我們在這里面有很重要的優勢。
第三,背後的核心原因是中國比較重視數學這樣的基礎教育。人工智能的背後最核心的是算法,而我們擁有大量的基礎科學的人才,所以我們將在人工智能的競爭里面有機會處在世界前列。
基於這三點,所以我建議把人工智能列入國家戰略,抓住這一次屬於中國人的時代機遇。然後能夠迎頭趕上。我覺得在全球範圍內,除了美國以外,中國在人工智能現有的基礎是最好的,所以我提出,要把人工智能列入國家戰略。
比如說,今天在中國在做人工智能的都是互聯網巨頭,或者新興的以人工智能為主的創業公司,中小創業企業還沒有真正參與。它們參與的難點是什麽?最基礎的條件,它們首先要有GPU服務器,一個集群幾十臺,至少要買價值一千萬元的設備。現在全球人工智能都火了,聽說買服務器還得排隊。所以,我認為至少做人工智能雲已經迫在眉睫,做完以後可以讓更多創業公司能參與人工智能浪潮。我覺得,列為國家戰略後,我們還會有很多具體事情可做。
回答記者提問部分:
人工智能的浪潮不是大家都去做人工智能的核心算法,而是怎麽應用人工智能用在你的領域上。
人工智能現在的計算平臺已經非常強大了,關鍵是要用它學什麽知識,算什麽。人工智能時代最有價值的東西是什麽?是大數據。你擁有多少數據,這個數據可以產生什麽結果。今天的人工智能最重要的是深度學習的突破,它的突破時間點是2012年底,到今天為止過了4年時間,帶來了突飛猛進的進展。AlphaGo可以看成是深度學習的一次全世界的營銷,讓全世界一下子認識到深度學習的重要性。
我也看了李開複老師之前關於人工智能的一些論述,其實我非常支持他的觀點。因為人工智能在圖像識別等技術上已經超過了人的識別能力,所以開複說未來10年,他認為機器會取代50%人的工作,我相信只多不少。
可能很多人擔心人工智能把工作都幹了,人怎麽辦?我覺得每一次技術革命都是這樣,革掉了一些落後的東西,但是又新增了大量的新的工作機會。所以我覺得這一點不用杞人憂天。小米去年設立了探索實驗室,投了非常多的人力,在做人工智能方面的研究,我覺得未來半年我們就會有一個人工智能重量級產品發布。
人工智能離我們不遙遠,就在我們身邊。未來兩三年可能各行各業各個企業都需要迅速切入人工智能。就像10年前移動互聯網剛起來的時候大家覺得比較遙遠,但今天我們每個人通過智能手機都享受到了移動互聯網的樂趣。我覺得,可能只需要三四年以後我們每個人都會享受到人工智能帶來的樂趣,這個我在產業前沿看得非常非常清楚。
我也認為現在所有的互聯網巨頭都是人工智能公司,你去問任何一個互聯網巨頭的老板,他都會跟你講人工智能,這說明什麽呢?這說明了產業趨勢,這說明技術已經在成熟的瓶頸點上了,很快就會爆發。未來幾乎所有的技術公司都是人工智能公司,人工智能會成為像互聯網一樣的一個基本元素。
斯諾登事件之後,維基解密再報猛料,3月7日,維基解密公布了據稱是美國中央情報局(CIA)大範圍使用的黑客工具的相關信息,其中包括針對微軟Windows、安卓、蘋果、OSX和Linux等系統及互聯網路由器等對象的惡意軟件。
這些信息多達8000多頁,含有8700個文件。文件顯示其中一些軟件是CIA自行研發,不過英國國家安全局也提供了幫助,例如助美方打造了對付三星電視的間諜軟件。目前尚沒有消息表明維基解密是如何獲得這些信息的。維基解密稱:“這些文件來自位於弗吉尼亞蘭利市(CIA總部所在地)網絡情報中心的高安全級別的獨立網絡系統。”
如果文件顯示的信息屬實,將令消費者對個人信息安全的信心產生很大的負面影響,這也意味著他們所使用的電腦、手機等移動設備,甚至是智能電視都有可能被監聽。文件從專業技術的角度揭示了如何能把普通的家用智能電視機變成監聽設備,以及CIA特工如何通過破壞美國軟件產品和蘋果、安卓和微軟的智能設備來獲取用戶個人信息。
維基解密稱,消息來源透露了此事的細節,希望這能引起公眾討論,即CIA的黑客能力是否已經超越其權限。CIA的一名發言人Jonathan Liu不願對此做任何評論:“我們不會對所謂的情報資料的真實性或內容作出評價。”英國內政部發言人也拒絕就此發聲。
美聯社報道分析稱,維基解密此次曝光了CIA所采用的高度機密的科技手段,恐將給CIA帶來巨大隱患。因為CIA所監聽的那些目標,一旦獲悉對方的監聽手段,很可能改變自身的一貫做法,這將使CIA的監聽範圍和效果大打折扣。維基解密在一份聲明中表示:“CIA近期已經失去了對很大一部分監聽工具和相關文件的掌控。”
位於弗吉尼亞蘭利市的CIA總部所在地
佐治亞州的一位信息安全專家Jake Williams表示:“毫無疑問現在正在進行一場“消防演習”,接下來可能會有人丟掉工作,有人離開他們現在的崗位,這些都不出奇。”
“通常內部網絡防護是在現有已發現漏洞基礎上進行修補,並結合針對外部攻擊的追蹤和反追蹤技術。因此,要形成行之有效的網絡攻擊,通常是內部人員通過特定環境下的網絡工具所為。就像我們的工控類網絡,熟悉一線控制協議的現場工程人員可以很簡單的去發動攻擊,而且根本看不出是攻擊行為。但是這樣的行為,隨著人工智能技術的演進,正在發生著深刻的變化。將來網絡安全將面臨更加嚴峻的挑戰。”公安部第三研究所副研究員楊明對第一財經記者表示。
“由於現在的黑客工具都是基於特定漏洞和特定環境,通過優化攻擊來實現的。如果采用人工智能,機器人將會自主建立攻擊模型並不斷學習和優化。一般是先出問題再去防護的,因此網絡安全防護完全是在被動的情況下進行的。當然人工智能也可以用來反黑客攻擊。” 楊明稱。
泄露的文件中所提到的CIA一項被描述為“Simple DLL hijacking attempt”(簡易動態鏈接庫劫持嘗試)的惡意軟件是專門用來反測試微軟Windows XP,Windows Vista和Windows 7操作系統的。這項被稱為“Windows FAX DLL Injection”的技術是使用一種計算機代碼讓黑客進入計算機程序的內存,並允許他們對信息竊取行為進行偽裝。
維基解密還表示,這些文件中的數據包括一個數字間諜技術的“重要資料庫”,這些技術可能來自於俄羅斯等其它國家。前CIA官員Bob Ayers表示,維基解密已經表示會披露更多和CIA有關的信息。“現在已經造成高級別破壞了。”Ayers說,“但是對一些細節的破壞還會在未來的披露中顯現出來。”
斯諾登事件之後,維基解密再報猛料,3月7日,維基解密公布了據稱是美國中央情報局(CIA)大範圍使用的黑客工具的相關信息,其中包括針對微軟Windows、安卓、蘋果、OSX和Linux等系統及互聯網路由器等對象的惡意軟件。
這些信息多達8000多頁,含有8700個文件。文件顯示其中一些軟件是CIA自行研發,不過英國國家安全局也提供了幫助,例如助美方打造了對付三星電視的間諜軟件。目前尚沒有消息表明維基解密是如何獲得這些信息的。維基解密稱:“這些文件來自位於弗吉尼亞蘭利市(CIA總部所在地)網絡情報中心的高安全級別的獨立網絡系統。”
如果文件顯示的信息屬實,將令消費者對個人信息安全的信心產生很大的負面影響,這也意味著他們所使用的電腦、手機等移動設備,甚至是智能電視都有可能被監聽。文件從專業技術的角度揭示了如何能把普通的家用智能電視機變成監聽設備,以及CIA特工如何通過破壞美國軟件產品和蘋果、安卓和微軟的智能設備來獲取用戶個人信息。
維基解密稱,消息來源透露了此事的細節,希望這能引起公眾討論,即CIA的黑客能力是否已經超越其權限。CIA的一名發言人Jonathan Liu不願對此做任何評論:“我們不會對所謂的情報資料的真實性或內容作出評價。”英國內政部發言人也拒絕就此發聲。
美聯社報道分析稱,維基解密此次曝光了CIA所采用的高度機密的科技手段,恐將給CIA帶來巨大隱患。因為CIA所監聽的那些目標,一旦獲悉對方的監聽手段,很可能改變自身的一貫做法,這將使CIA的監聽範圍和效果大打折扣。維基解密在一份聲明中表示:“CIA近期已經失去了對很大一部分監聽工具和相關文件的掌控。”
位於弗吉尼亞蘭利市的CIA總部所在地
佐治亞州的一位信息安全專家Jake Williams表示:“毫無疑問現在正在進行一場“消防演習”,接下來可能會有人丟掉工作,有人離開他們現在的崗位,這些都不出奇。”
“通常內部網絡防護是在現有已發現漏洞基礎上進行修補,並結合針對外部攻擊的追蹤和反追蹤技術。因此,要形成行之有效的網絡攻擊,通常是內部人員通過特定環境下的網絡工具所為。就像我們的工控類網絡,熟悉一線控制協議的現場工程人員可以很簡單的去發動攻擊,而且根本看不出是攻擊行為。但是這樣的行為,隨著人工智能技術的演進,正在發生著深刻的變化。將來網絡安全將面臨更加嚴峻的挑戰。”公安部第三研究所副研究員楊明對第一財經記者表示。
“由於現在的黑客工具都是基於特定漏洞和特定環境,通過優化攻擊來實現的。如果采用人工智能,機器人將會自主建立攻擊模型並不斷學習和優化。一般是先出問題再去防護的,因此網絡安全防護完全是在被動的情況下進行的。當然人工智能也可以用來反黑客攻擊。” 楊明稱。
泄露的文件中所提到的CIA一項被描述為“Simple DLL hijacking attempt”(簡易動態鏈接庫劫持嘗試)的惡意軟件是專門用來反測試微軟Windows XP,Windows Vista和Windows 7操作系統的。這項被稱為“Windows FAX DLL Injection”的技術是使用一種計算機代碼讓黑客進入計算機程序的內存,並允許他們對信息竊取行為進行偽裝。
維基解密還表示,這些文件中的數據包括一個數字間諜技術的“重要資料庫”,這些技術可能來自於俄羅斯等其它國家。前CIA官員Bob Ayers表示,維基解密已經表示會披露更多和CIA有關的信息。“現在已經造成高級別破壞了。”Ayers說,“但是對一些細節的破壞還會在未來的披露中顯現出來。”
半個月前,騰訊董事會主席馬化騰曾對第一財經記者感慨,現在他和騰訊的焦慮在於“科技”。“掌握技術才能保證戰略制高點,否則當一個浪潮來了的時候,為什麽有的能做到,有的做不到?技術是一個不可逾越的東西。”當時他還透露,騰訊的AI(人工智能)除了有AI Lab 做基礎性的研究外,其實在騰訊各個事業部門(BG)里都有AI的團隊。
在半個月後的第10屆UEC杯計算機圍棋大賽上,騰訊 AI 產品亮出“肌肉”。騰訊AI Lab(騰訊人工智能實驗室)中一支由13人團隊研發近一年的圍棋人工智能程序“絕藝”(Fine Art)首次參加比賽,一路過關斬將,在積分賽七連勝進入16強後,在決賽中經過50多分鐘的“鏖戰”,二度擊敗來自日本的 DeepZenGo,以四連勝戰績奪得本屆UEC杯冠軍。3月26日,“絕藝”還將在東京與日本著名新銳棋手一力遼在“電聖戰”中進行人機對弈。
2007年始於日本的UEC杯,是一項傳統和權威的計算機圍棋大賽,每年邀請各國高水平AI齊聚東京比賽,促進相關學術及科技的交流。在騰訊“絕藝”之前,日本的DeepZenGo、法國的“瘋石”(Crazy Stone)、美國Facebook公司的“黑暗森林”(Dark Forest)等世界著名計算機圍棋程序先後在UEC杯折桂獲獎,今年共有30家軟件參賽。
“絕藝”與日本“DeepZenGo”決勝局對弈圖
“很高興‘絕藝’能夠在UEC杯奪冠,這是非常難得的寶貴經驗。‘絕藝’不同於其他實驗室AI,它得益於世界超一流棋手的指導,通過不斷與高手交流及學習,一步步成長起來。我們希望,通過‘絕藝’能夠讓更多人關註、喜愛進而傳承圍棋這一傳統文化。”騰訊公司副總裁、騰訊AI Lab負責人姚星表示,“‘絕藝’在研究價值上也不止於圍棋AI本身,我們在深度學習和強化學習上進行了非常有價值的探索與創新,之後將通過論文公開這些技術創新和數據庫的細節。“
為什麽是圍棋?
歷史上,電腦最早掌握的第一款經典遊戲是井字遊戲,這是1952年一位博士在讀生的研究項目;隨後是1994年電腦程序Chinook成功挑戰西洋跳棋遊戲;3年後,IBM深藍超級計算機在國際象棋比賽中戰勝世界冠軍加里·卡斯帕羅夫。
除了棋盤遊戲外,IBM的Watson系統在2011年成功挑戰老牌智力競賽節目Jeopardy遊戲一戰成名;2014年,Google自己編寫的算法,學會了僅需輸入初始像素信息就能玩幾十種Atari遊戲。
但在AlphaGo之前,有一項遊戲仍然是人類代表著頂尖水平,那就是圍棋。
圍棋雖然看上去規則簡單,卻因為精妙而富有思想深度,幾個世紀來都牢牢抓住了人們的想象力。例如此前Google介紹說,圍棋的搜索空間是漫無邊際的——比圍棋棋盤要大1個古戈爾(數量級單位,10的100次方,甚至比宇宙中的原子數量還要多)。因此,傳統的“強力”人工智能方法也就是“為所有可能的步數建立搜索樹”,在圍棋遊戲中根本無法實現。
去年3月,谷歌 DeepMind 團隊AlphaGo 戰勝李世石,而從“絕藝”研發近一年的時間表來看,騰訊AI Lab對圍棋的研發就在這場人機大戰之後。據騰訊人士介紹,“絕藝”名字,源自唐代杜牧的送別詩“絕藝如君天下少,閑人似我世間無”。
據介紹,騰訊的AI Lab在2016年成立,專註於人工智能的基礎研究及應用探索,不斷提升AI的決策、理解及創造能力,同時為騰訊各產品業務提供AI技術支撐。騰訊AI Lab的基礎研究包括計算機視覺、語音識別、自然語言處理和機器學習,其應用探索包括遊戲AI、內容AI、社交AI及平臺AI,產品已應用在微信、QQ及天天快報等上百個產品。目前實驗室有超過50余位世界知名學院的AI科學家(90%為博士)、及200多位經驗豐富的工程師。
有意思的是,去年第一財經記者曾詢問百度是否研發圍棋相關的人工智能,一位百度高管否認了這種說法,他稱,百度內部曾認真考慮是否和AlphaGo比賽圍棋,但最後的結論是不值得,有任何 AI的資源應該先放在無人車上。
而騰訊的人工智能研發除了圍棋之外,馬化騰此前曾透露,AI其實在騰訊內部分好幾塊業務,既有AI的LAB做一些基礎性的研究,也有在各個事業部門(BG)里的AI團隊,例如基於人臉識別技術的優圖團隊,以及微信上的語音識別技術等。
與AlphaGo一戰誰贏?
如果讓中國的“絕藝”與AlphaGo一戰,究竟誰會贏?
一個有趣的細節是,“絕藝”曾在圍棋平臺上有個馬甲 ID叫做“天下無狗”。不過絕藝團隊昨日稱,目前沒收到計劃與AlphaGo對弈的消息。
而與AlphaGo圍棋和絕藝都對局過的古力表示,就目前情況看“還是阿爾法圍棋更強,因為還沒看到它的底”。
事實上,圍棋的 AI涵蓋了人工智能最熱門的研究領域——深度學習和強化學習。
此前,GoogleAlphaGo的研究者DavidSilver說,AlphaGo系統的關鍵是,將圍棋巨大無比的搜索空間壓縮到可控的範圍之內,在AlphaGo兩種不同的神經網絡中,“策略網絡(policynetwork)”的作用是預測下一步,並用來將搜索範圍縮小至最有可能引起的那些步驟。另一個神經網絡“價值網絡(valuenetwork)”則是用來減少搜索樹的深度,每走一步估算一次獲勝方,而不是搜索所有結束棋局的途徑。
而根據騰訊方面的介紹來看,“絕藝”的算法與 AlphaGo 類似,主要包括人類棋譜數據庫和機器自對弈,它的算法基於策略網絡與價值網絡兩大核心,並創新性地大幅提升了價值網絡的精度,使其大局觀表現更好。
通俗的說,“策略”指每一步博弈時,各種選擇的取舍,選好棋棄差棋,這是偏微觀評估;而“價值”則指能看懂棋局,判斷給定棋局是不是能贏,這是偏宏觀的評估。“‘絕藝’背後‘精準決策’的AI能力,應用前景非常廣闊,如無人駕駛、量化金融、輔助醫療等。如果AI從圍棋AI進化到不完美對稱博弈系統,也就是能處理現實中更常見的不確定性問題時,想象空間非常巨大。”騰訊公司副總裁、AI Lab負責人姚星表示。
絕藝團隊在賽後接受采訪時稱,在絕藝的研發過程中,如何評估棋力,以及存在哪些問題,是非常困難的。並且隨著絕藝棋力提升,普通的棋手基本無法戰勝的時候更難暴露其不足。因此,絕藝的研發過程中得益於超一流棋手的指導,對研發進度有非常大的幫助。
在參加 UEC 之前,“絕藝”曾先後使用多個ID,在騰訊圍棋(野狐圍棋)平臺與業余和職業高手切磋,多次戰勝中日韓三國一眾頂尖棋手,成為騰訊圍棋首個晉級“十段”的棋手。截至3月9日,“絕藝”對局數量達534盤,戰績是406勝128負,勝率76%,與柯潔、古力、常昊、範蘊若、範廷鈺、樸廷桓等超過100位知名人類棋手有過交鋒。“絕藝”團隊稱,“絕藝”與人類棋手不斷交流,在對戰中學習,一步步成長。這也是AI Lab對於絕藝的期待——希望它能與人類棋手積極互動,從而激發更多關註並傳承圍棋這一中國傳統文化。
在棋類遊戲之外,這些對決也將引發更多的思考——那些人們曾經以為人工智能不可能完成的腦力挑戰,是否都將被一一打破?未來人類是否會被人工智能所取代?未來人工智能除了圍棋還能做什麽?
在百度董事長李彥宏看來,人工智能堪比工業革命。他今年在兩會上的三個提案,全部聚焦在人工智能領域。其中包括用人工智能技術解決兒童走失的問題,用人工智能技術調交通信號燈,以及人工智能和各個行業的結合。目前,百度正在把人工智能重要的精力放在無人駕駛方面。
而馬化騰稱,騰訊 AI 要做的是更希望是能結合到自身的產品里面,讓用戶用起來產品發現越來越好用,或者說後臺(包括信息安全方面)也可能需要用AI的技術,“這樣的話你不用鋪很多的客服去看這些數據,那這樣你完全是用AI的技術來去做信息安全,我覺得也是更有效的。”
他還提到,在有一些更有趣的、未來感的一些AI上騰訊也有很多的團隊做研發、嘗試。“這方面我們還是很鼓勵創新,甚至是同一個課題有多個小組同時在做,哪怕有一定的冗余度,我覺得都應該鼓勵。我覺得這方面的投入都不會浪費。”
下一位會是誰?
本文由羅超頻道(微信ID:luochaotmt)授權i黑馬發布,作者羅超。
昨晚看了一場TED演講,演講人是在科技圈久負盛名的凱文凱利,主題是人工智能。整個演講,給我留下最深刻印象的內容不是人工智能本身,而是一個觀點:
技術的趨勢在很大程度上是能夠被預見的,就像重力一樣,一滴雨點流入山谷的實際路徑是無法預測的,我們並不知道它的具體走向,但大方向是很顯然的:往下流。因此,電話是必然的,但 iPhone 不是;因特網是必然的,但Twitter不是;而在未來二十年中,人工智能也會是一種必然。
碰巧就在今天,百度首席科學家吳恩達宣布離開百度,這件事在科技圈掀起軒然大波。李彥宏昨天在與以色列總理內塔尼亞胡對談時還在說,互聯網只是前菜、人工智能才是主菜。有人說,現在百度主菜的主廚離開了還能做出來嗎?我對此的觀點是,就像凱文凱利的邏輯一樣:百度做人工智能是一種必然,而吳恩達的離開只是一種偶然。人工智能已上升到百度公司級戰略,絕不可能因為吳恩達的離去而改變既定戰略,百度在AI上的實際業務也不可能受影響。
吳恩達的離開確實是百度的損失
必須要承認,吳恩達的離開對於百度而言確實是一大損失。
吳恩達是大約三年前加入百度擔任首席科學家,之前其已頭頂大量光環,尤其是Google大腦聯合開創人的身份以及所領導的著名的“機器識別貓”實驗,讓他在科技圈名聲大噪。
在百度的三年時間里,吳恩達再次證明了自己。正如其所發布的公開信所言,在他加入百度之後的三年,百度人工智能團隊增長到近1300人,形成中國首屈一指的AI研發隊伍和體系,吳恩達作為AI界的旗幟人物對於頂尖人才有很強的號召力,Adam Coates、景鯤、李平、徐偉、以及朱凱華等AI大牛被吸引到百度。同時,百度在深度學習、NLP、語音、自動駕駛技術等AI核心技術領域也取得多個里程碑進展,這些技術被應用到百度業務尤其是內容分發、自動駕駛以及移動搜索上。百度還推出了包括小度機器人、度秘等在內的AI應用,從研發體系到底層技術再到業務應用,過去三年是百度AI戰略從雛形到成型的三年,吳恩達功不可沒。
2014年,吳恩達在百度世界大會上演講
正是因為此,吳恩達的離開對於百度而言,堪稱一大損失。如果吳恩達不離開百度,必然還有更多貢獻,並且與普通人才不同,隨著AI的爆發,門檻頗高的AI領域技術人才本來就稀缺,更何況吳恩達這樣的全球頂尖人才,真的是鳳毛麟角,說其價值等身黃金也不誇張。然而,天下沒有不散的筵席,沒有人能保證終身為一家公司效力,聯合創始人離開公司比比皆是,更何況是吳恩達這樣的頂級科學家——他有太多選擇,科學家AI創業方興未艾,被百度對手科技公司獵取也有可能。
然而百度AI不會因此受到任何影響
吳恩達在百度的三年,百度人工智能技術上,形成了超過1000人的研發隊伍和人才梯隊、以及研發體系,自然語言處理、語音、知識圖譜等技術都取得對應進展。可以說吳恩達幫助百度打造了一個AI機器,但是現在這個機器正在高速運轉,打造機器的人離開不會有問題。
吳恩達在公開信中透露新任百度研究院院長林元慶,“是位出色的技術和業務帶頭人”。百度則在隨後宣布,整合包括NLP(自然語言處理)、KG(知識圖譜)、IDL(深度學習研究院)、Speech(語音)、Big Data(大數據)在內的百度核心技術組成百度AI技術平臺體系(AIG),任命百度副總裁王海峰為AI技術平臺體系(AIG)總負責人,同時晉升其為Estaff成員,轉向百度集團總裁和首席運營官陸奇匯報。
可以預見,百度的AI戰略不會因為誰的離開而改變(除非李彥宏離開百度,但這顯然不容假設),百度AI業務不會受到影響。劉江峰率領華為榮耀拿下互聯網手機戰役的勝利之後離開,趙明接手榮耀業務依然進展順利,類似案例還有很多。
對於百度來說值得慶幸的是,不會面臨AI人才的青黃不接。
百度AI技術平臺體系負責人王海峰是自然語言處理領域的頂級牛人,他是國際學術組織ACL(Associationfor Computational Linguistics)50多年歷史上唯一出任過主席(President)的華人,同時也是截至目前最年輕的ACL會士(Fellow)。空降百度擔任COO的陸奇,同樣是人工智能領域的大牛,工程師出身的李彥宏直言其對人工智能的理解不及陸奇十分之一。當百度已經構建起超過1000人的AI研發團隊,並且具有包括多位頂級AI領頭者在內的人才梯隊時,任何一個人的離開都不會影響這部機器的運轉。
陸奇率領下的百度AI會加速應用化
對於百度來說,吳恩達的離開反而讓其AI的未來變得更加清晰起來,或者說,這是一個新的開始。
與吳恩達不同,陸奇不是純科學家型人才,而是兼具商業能力和領導能力的複合型人才,擔任過微軟全球執行副總裁意味著他有豐富的管理經驗,微軟CEO斯蒂芬·鮑爾默評價他是“集資深專業技術知識、出色的領導能力和廣泛的商業知識於一身,在業界是非常罕見的奇才。”這正是百度眼下推進AI戰略的急需的能力,陸奇將會推進百度AI從研發轉向應用——這並不適合學術型的吳恩達。
李彥宏在年初內部信說:
“人工智能就是整個公司的一個技術的基礎,該沈澱的數據都要沈澱,該整合的技術都應該整合在一處,該開放的要向所有的業務部門去開放。這是一盤棋。”
現在百度對於人工智能的布局考量已不再只是研發技術讓語音識別更準、讓機器學習更快,而是與百度的大數據優勢以及中國的互聯網市場優勢結合,進行技術的整合、開放和應用,反哺業務。
吳恩達在公開信中發表了類似觀點:“美國擅長創造新的技術和理念,而中國擅於將人工智能技術用於開發出好的產品。”,事實上,百度與谷歌布局AI最大思路不同就是將AI技術產品化,比如將之應用到手機百度、百度地圖,而不是讓AI技術去跟人類下棋。
對於百度而言,AI已上升到公司戰略並且有All in的姿態,說李彥宏豪賭AI都不誇張。百度是最早布局AI的中國互聯網巨頭,同時也是投入力度最大、已有成果最多的玩家,牽頭組建國家深度學習實驗室證明了其在AI上的技術實力。百度已經不止一次強調將繼續加大對AI的投入,尤其是進入2017年百度更有舉公司之力押註AI的意思。吳恩達離開了,百度AI的路還會繼續走下去。
人工智能尤其是機器學習已然成為創業和投資繞不開的話題。
本文由金沙江創投(微信ID:GSR-Ventures)授權i黑馬發布。
導語:目前,人工智能尤其是機器學習已然成為創業和投資繞不開的話題。對此,紅點創投合夥人梅達•阿加瓦爾(Medha Agarwal)近日撰文,從投資者的角度分析了目前人工智能領域可能存在哪些機會,這項技術在哪些細分領域更容易孵化出成功的創業公司。
機器學習之熱,毋庸置疑。它甚至有潛力改變各種市場和各個行業。但圍繞這種技術的創業泡沫也引發了巨大討論。作為投資者,我試圖解決一個問題,這項技術在哪些細分領域更容易孵化出成功的創業公司,這些領域應該具備哪些共同點:
1 具備龐大市場空間的垂直應用
成功的機器學習創業公司應該鎖定具有明確技術需求的垂直應用。消費品行業就是個好例子。機器學習可以更加準確地預測庫存水平,從而更好地管理供應鏈,降低庫存成本,盡可能降低產能過剩,消除缺貨狀態。根據埃森哲的最新報告,機器學習可以將配送時效提升4.25倍,將供應鏈效率改進2.6倍。
2 涉及重複性人力勞動的領域
大量的人力幹涉表明複雜的預測算法有很大的優化機會。同樣以供應鏈為例,當今的分析師預測庫存需求時不僅使用歷史數據,還在很大程度上依賴直覺。而如果借助生產時間、售罄率等數據,結合學習模型就可能更加精準地預測未來的需求。
3 有大量數據可供預測分析的領域
創業公司需要借助大量數據才能有效訓練機器學習模型。企業既可以與老牌大型公司合作,利用他們的數據來學習,也可以自己開發產品,然後吸引用戶貢獻數據。這兩種模式都可以成功。
4 網絡效應和防禦性
算法的開源趨勢將會延續,因此專有數據變成了關鍵。為系統提供數據和反饋可以提升精確度,並形成自己的護城河。因此,一款產品應該吸引用戶針對系統的預測和推薦提供反饋。例如,Facebook的照片標記算法可以通過用戶的糾錯達到這一目的。
具體來看,我認為機器學習在以下垂直領域最有潛力:
醫療診斷和生物信息學
機器學習將在整個醫療價值鏈上提高產出、降低成本。機器學習有望提升診斷效果、降低出錯率,還能簡化藥物發現流程,這都令人頗感振奮。病人的數據可以用於早期的疾病診斷,並借此提供個性化治療方案。醫藥和生物科技公司也可以使用計算方法快速而有效地發現效果更好的新藥。
供應鏈
機器學習可以改進供應鏈的多個方面,包括需求預測、市場趨勢、交易促進和新品設計。當今的企業很難評估市場模式和市場波動,因此難以幫助企業制定決策,並精確做出預測。
制造
工業物聯網的市場規模約為120億美元,但目前仍處於普及初期。根據簡柏特對173位企業高管進行的調查,只有25%制定了物聯網戰略,而其中對執行效果真正滿意的只有24%。這些高管都希望借助機器學習解決方案來提高收益率,同時降低庫存和成品率,以此降低成本,尋找新的獲利機會。
合規
金融機構的合規是個巨大的市場。自2008年以來,僅摩根大通一家公司就花費360億美元支付和解和罰款,並且聘請了8000名員工從事合規性評估。機器學習可以幫助銀行和其他面臨嚴格監管的企業改進這一流程。
企業語音
由於語音分析非常複雜,因此雖然這是企業工作流程中的重要元素,但從企業人工智能角度來講,目前只處在在邊緣地帶。NewVoiceMedia 2013年的一份報告顯示,呼叫中心的低下效率每年造成約410億美元的損失。每年約有240萬內部銷售代表與客戶展開數百萬小時的對話。所以這其中明顯蘊含巨大的機會,可以通過自動化流程改進呼叫中心、會議、銷售和營銷活動的效率。
保險
保險是個規模巨大、範圍廣泛的領域,機器學習可以幫助保險公司以更低的費用推出更精準的產品。例如,汽車保險公司可以使用駕駛和其他行為數據進行單獨定價,或者使用更好的欺詐探測系統來降低整體的成本結構。咨詢公司畢馬威認為,機器學習將“徹底改變”保險行業。
個人金融
新的數據和分割模式令“千禧一代”享受到很多之前難以享受的金融產品(例如信用產品)。另外,自動化智能系統也在降低個性化建議的成本,因為它可以追蹤用戶的行為,並根據其偏好和目標提供建議。TechCrunch曾經寫過一篇不錯的文章,分析了人工智能將如何通過個性化推薦對金融行業產生影響。
個性化教育
傳統教育的一大局限在於,老師必須面向整個班級傳授一套標準課程。但實際上,不同學生的理解水平和學習風格各有不同。企業能否利用數據幫助父母和學校為每個學生確定有問題的領域,並制定個性化課程,然後給出單獨定價,同時根據每個學生的問題和風格定制計劃?這不僅可以改變美國教育現狀,還蘊含著巨大的經濟機會。截至2013年,美國每年在公共教育上投入的開支達到6200億美元,約有5000萬學生入讀公立學校。
23年後,人類命運將迎來史無前例的“奇點”,你我無從幸免。
本文由摩登中產(微信ID:modernstory)授權i黑馬發布,作者 。
一
人類唯一戰勝阿爾法狗那個寒夜,疲憊的李世石早早睡下。世界在慌亂中恢複矜持,以為不過是一場虛驚。
然而在長夜中,阿爾法狗又和自己下了一百萬盤棋。是的,一百萬盤。
第二天太陽升起,阿爾法狗已變成完全不同的存在,可李世石依舊是李世石。
從此之後,人類再無機會。
人工智能,不再是科幻小說,不再是閱讀理解,不再是新聞標題,不再是以太網中躍動的字節和CPU中孱弱的靈魂,而是實實在在的宿命。
我們已身處大時代的革命之中,科學家將現今階段,定義為弱人工智能時代。
即便是簡單的人工智能,其實已打敗多數人類。
美國亞馬遜超級倉庫內,無數機器人正在貨架間瘋狂奔跑;歐洲快餐店內,機器人端著漢堡和薯條7x24小時來去自如;而在南非礦井下,電腦正操作精密儀器,向幽暗處進發。
在珠三角,富士康廠區外,那些多愁善感的年輕人,來不及抒發鄉愁,就得爭搶為數不多的機會。
工廠流水線兩側,100萬臺精密機器人正逐步填滿他們站過的位置。
這只是革命的開始,隨著智能飛速進化,AI已殺入世界每一個角落。
全球數百位頂尖科學家,耗費漫長時間,搭建了一個複雜數學模型,通過類似摩爾定律的多重推演,得到一個最終結論。
人工智能或將在2040年,達到普通人智能水平,並引發智力爆炸。這一時刻,距今還有23年。
23年這個時間,並不是憑空杜撰,更非杞人憂天,數字背後是複雜的社科曲線和人為變量。
而且,這只是科學家保守估計。一個砸準的蘋果或者一個任性的天才,都可能將節點大為提前。
比23年更可怕的是,到達節點後,人工智能或將實現瞬間飛躍。
人工智能專家普遍認同,人工智能不可能鎖死在人類智力水平上。它將超越人類,變成我們無法理解的智慧物種。
科學家描述中,一個人工智能系統花了幾十年時間到達了幼兒智力水平;在到達這個節點一小時後,電腦立刻推導出了愛因斯坦的相對論;而在這之後一個半小時,這個強人工智能變成了超人工智能,智能瞬間達到了普通人類的17萬倍。
這就是改變人類種族的“奇點”。
我們,極有可能是站在食物鏈頂端的最後一批人類。
二
一個超人工智能,一旦被創造出來,將是地球有史以來最強物種。所有生物,包括人類,都只能屈居其下。
以谷歌技術總監雷·庫茲韋爾為代表的一群極客,正歡欣鼓舞地期盼這天到來。
他們堅信,一個比我們聰明十幾萬倍的大腦,將解決所有問題,疾病、戰亂、貧困,各種糾纏人類的苦難,都不再是問題。
為等待這一天到來,庫茲韋爾每天吃下100個藥片,希望自己能夠活得足夠長久。他還預訂了冷凍遺體服務,如果提早離世,那麽還有機會在人工智能到來後,將大腦解凍。
他眼中的未來,恍如伊甸。屆時,人類身體內,奔跑著無數納米機器人,幫我們修補心臟或消滅腫瘤。超智能計算機日夜計算,幫我們逆轉衰老。
甚至,我們可上傳記憶,與AI神魂合一。
然而,另一派人卻憂心忡忡。特斯拉CEO埃隆·馬斯克將人工智能比做核能。原子彈問世容易,但控制核武器時至今日仍困難重重。
比爾·蓋茨也站在馬斯克這一邊,“很難想象為什麽有人覺得人工智能不足為慮。”
在他們眼中,超人工智能是盤踞未來的可怕生物。它們的思維方式和人類南轅北轍,且不眠不休,飛速進化。
對超人工智能感到悲觀的馬斯克,正緊鑼密鼓地籌備“火星殖民”項目。
他計劃從2024年開始,逐步把100萬人送上火星,並在火星建立起一個完整可持續的文明。
這位悲觀的天才企業家,其實用心良苦。一方面他寄望於用“火星計劃”,轉移科學界焦點視線,拖慢人工智能到來的腳步。另一方面,他希望,在火星給人類留一個備份。
23年後,我們考慮的可能不再是逃離憂傷的北上廣,而是逃離這個星球。
三
大眾對人工智能的最大誤解,是認為人工智能和曾經的石頭、斧子、打字機、手機一樣,不過是人類肢體的延伸。
但這一輪人工智能大潮,和以往幾次技術革命都不同,人工智能將成為人類的替代。就連我們認為安全無憂的高級腦力工作,都岌岌可危。
美國已經有十家律所聘用了Ross,一個背後由IBM人工智能系統支持的虛擬助理。
Ross可以同時查閱數萬份歷史判決,並勾畫重點。它能夠聽懂普通人所說的英文,並給出邏輯清晰的答案。以前需要500名初級律師完成的工作,它數分鐘內就能夠解決。
此外,交易算法已成為華爾街標配。在投資基金辦公室里,以往急促的腳步聲和電話鈴聲,已被服務器輕微的嗡鳴聲取代。
寥寥數個分析師,偶爾擡頭看看程序運行狀況,在0.01秒內,人工智能就會根據市場走勢和媒體信息作出判斷,買賣數億的股票。
斯坦福教授卡普蘭做了一項統計,美國註冊在案的720個職業中,將有47%被人工智能取代。在中國,這個比例可能超過70%。
過去用幾代人命運承擔的大變革,我們要在20年內獨自面對。失業大潮即將開始,並沒給我們留太多適應的時間。
學者分析,在接下來的幾十年中,只有三類人,能勉強對抗AI的沖擊,即資本家、明星和技術工人。
換而言之,面對步步逼近的人工智能,你要麽積累財富,成為資本大鱷。要麽積累名氣,成為獨特個體。要麽積累知識,成為更高深技術的掌握者。
然而,財富堤壩、個性堤壩、技術堤壩,能在人工智能狂潮下堅持多久,無人可知。
這真是個荒謬又戲劇的時代,我們在狹小的星球上爭吵不堪,黑天鵝振翅而起,地球村分崩離析,當我們以為泡沫劇將一直循環重播時,大結局卻平靜到來。
23年,我們擦亮燈壺,砸掉鎖扣,放出的是阿拉丁,還是潘多拉,天知道。
深度學習是一門看重數據的科學。
本文由金沙江創投(微信ID:GSR-Ventures)授權i黑馬發布。
機器學習熱到不行,甚至有很多人認為它就是人工智能的全部。深度學習更是如此。你的創業公司或許剛剛融資成功,你的團隊或許剛批了一筆預算。那麽,恭喜你!你現在也要來做深度學習了。
到了現在這時候,你應該已經從Keras、Imagenet等技術中找到了樂趣,這確實很令人振奮!但要把技術變成一盤生意,讓你的創業公司真正起步,你還需要考慮一些實際的問題。而我,應該可以算是半個過來人了。我會結合自己在comma.ai與喬治•霍茲(George Hotz)一起合作開發無人駕駛汽車的經歷,來試圖為你提供一些建議。
1 別因為加載數據讓工程師幹瞪眼
深度學習是一門看重數據的科學。你的團隊或創業公司存在的意義就是為這些數據賦予意義。想想看,只有首先為文本賦予意義,才能開發真正有用的人工智能比特幣聊天機器人。只有首先理解圖片、視頻等元素,才能在模仿Snapchat Stories時實現自動化多媒體拼貼。
不能輕視數據處理,一定要在該領域表現優異。例如,如果你只需要花15分鐘來準備和加載數據集,那麽每當你找到更好的模型決策,或者在Tensorflow代碼中找到漏洞,都應該稍等片刻。
原則其實很簡單。確定好數據庫,然後一次性預處理所有內容,之後反複使用。Celery和Luigi這樣的工具會是你的朋友。如果你在一個大團隊里工作,所有的任務都要提交到一個群集里,那就考慮開發一套數據解決方案,向負責模型訓練的員工分批提供數據。千萬不要讓團隊成員非要等到整個數據集下載完畢後,才有可能發現他們的模型里面存在漏洞。
我踩過的坑:
comma.ai或許擁有當今第二或第三大的駕駛數據庫。在comma.ai的每一天,為了訓練駕駛模型,都要向一臺擁有700多Gb內存的大機器里加載好幾個小時的視頻。每當需要更多訓練數據時,喬治都會立刻增加100Gb內存。我加入進來的任務是為這個模型開發更好的版本,但我不想等待15分鐘來加載數據。因此,我從開源項目里吸收了一些內容,開發了簡單的ZMQ服務器。這樣我們就不必因為數據而幹等著了,我們可以開展更大規模的訓練,還可以使用更便宜的機器。唯一能束縛模型訓練的只有GPU和他的研究人員。
2 從你能形象化的東西開始
幸運的是,對深度學習而言,可以使用Tensorboard、最近推出的Visdom以及其他工具幫助我們對結果進行形象化。我相信,DataScience整體而言可以很好地服務於形象化驅動的開發流程。應該考慮在每個階段都與你的問題相一致。你不必非要學習d3.js,也可以獲得有用的形象化效果,除非你過分迷信javascript。
我踩過的坑:
我在離職談話中向喬治征求意見,希望了解如何才能成為更有效率的工程師。(相信我,他是我見過的最有效率的人,我總會抓住每個機會向他學習。)他建議先開發一些東西,把我正在做的事情形象化。喬治本人之前就一直踐行這條建議。另外,喬治所有的IPython Notebook都有一些滑動小工具,可以在開發原型時快速將各個參數對最終結果產生的影響進行形象化。
3 早點確定你的範例數據集
如果你對數據準備感到崩潰,最好先休息一下,其次才是使用有趣的視覺化內容。但如果你不想變成打印機上的猴子,只是盲目地在神經網絡上隨機增加更多層次,就必須確定如何衡量進步。應該探討哪些指標與更好的交付效果關聯性更強,以及你應該追蹤哪些數據。這或許不僅局限於簡單的“隨機拿出10%的數據用於驗證”。驗證數據集最好能與最終的產品擁有相同的統計特征。同樣的產品也可以用於追蹤範例和失敗案例,從而制作未來的驗證集。因此,你的驗證集或許可以不斷進化,並像訓練集一樣調整。
我踩過的坑:
我發現,對於無人駕駛汽車範例和驗證集而言,可以考慮那些你必須奪回控制權的時刻。但最好的驗證集是讓一名經驗豐富的控制工程師在路上詳細判斷無人駕駛系統的質量。如果你在這個行業,最好從特斯拉挖人。
4 過早規模化是早期創業公司完蛋的主要原因
你可能會說:“別跟我說教,我看的創業專欄比你還多!”沒錯,但新常態在於,你應該把GPU和訓練硬件當做與員工相同的因素來看待。一旦你聘用/購買了超出需求的東西,就需要花費很多精力為你的過剩資源尋找用途。管理群集會很困難,而大規模的深度學習HPC本身是一個科研話題。我的建議是確保你所有的GPU都能始終得到利用,然後再考慮新買一個。等到你的效率和盈利能力一樣的時候,才可以像谷歌那樣。
如果你的團隊和公司已經很大,那就在招聘基礎設施相關工作時認真對待。如果你招聘了10倍的研究人員,但卻讓他們無事可做,最好的情況是他們開發對自己足夠好的基礎設施,最差的情況則是他們直接退出。但這肯定不是你想要的。
我踩過的坑:
每當我離開辦公室但卻沒有讓所有的GPU忙碌起來時,尼爾(comma.ai的手機應用副總裁)就對我很失望,我甚至因此變得有點神經質,總是擔心有GPU空閑下來。這如今已經成為一個普遍問題。
人工智能是一個既富有挑戰,又趣味十足的領域。一定要在處理資源和形象化時深思熟慮,這樣就不會有大問題。