《麻省理工科技評論》 EmTech Digital 峰會幹貨整理
黑馬說
在這個時代,科技是最大的生產力。不管你是哪個行業、什麽職業,關註最新的科技都不會有錯。人工智能的時代大潮不可逆轉,沒有人能夠忽視它的存在,尤其是對於投資者和創業者來說。
文|DeepTech深科技 翻譯|楊一鳥,機器之心,羊羽,十三
60年前的夏天,4名電腦科學教授一起啟動了一個目標為創造"人工智能”的夏季課題。這是這個名詞第一次出現在世界上。此課題的目標是:探索如何讓機器運用語言和抽象思維。
當時的項目提議是:“我們認為,一組精挑細選的科學家在一起工作一整個夏天就可以實現重大突破。”這在現在看來簡直是樂觀的傲慢。我們直到現在都沒有可以媲美人類語言或者可以實現抽象思維的軟件。
但是,最近的幾年里,人工智能軟件已經實現了曾經被認為是不可能的功能。例如識別圖像和語音,或者像谷歌最近給他們的電子郵件服務添加的功能:通過人工智能對語言的理解來寫出短郵件回複。
——《麻省理工科技評論》主編 Jason Pontin
5月23日在舊金山舉辦的為期2天的《麻省理工科技評論》Emtech Digital 峰會上,來自各行業的精英們探討了這項科技是如何開啟人類生活及工作的新可能。下面是《麻省理工科技評論》EmTech Digital峰會部分精華內容整理:
GE軟件研發副總裁Colin Parris:將人工智能引入工業互聯網
GE的“數字雙胞胎模型”(Digital Twin)靈感來源於長期應用於工業生產的產品和設備,拿航空制造業來說,引擎發動機在此行業中生產了將近40年。工業中的設備和產品技術投入巨大,效率的提高是工業生產發展的核心課題,而模型的提出是為了解決如何使得我們更加高效地使用和制造這些東西。
2005到2010年,工業增長率達到4%,而2010到2015卻只有1%,這是生產力的退步麽?GE Software就此提出構想,我們能否從生產設備出發,合理規劃生產環節,將生產效率提高。
“數字雙胞胎模型”的設計理念源自於商業應中用的“數字信息轉化模型”(Digital Transformation),其中最出名的就是這三家公司的產品:蘋果,亞馬遜以及谷歌。它們有兩個共同點,一個是它們對於數字信息轉化的方案大同小異,而且公司市值的增速也都相當驚人,蘋果公司在2004年的市值才80億,而現在已經高達2340億。
讓我們說回數字模型,拿亞馬遜來說,他們首先建立“單位模型(Model of One)”來統計用戶的全面信息。這些信息來源於每一個用戶,並且有一系列數據標簽,包括年齡、性別和收入。用戶信息在你逛亞馬遜網站的時候就已經悄無聲息地收集了,例如你查看的商品、付款方式、送貨地址以及你購物車里的東西。而初代模型其實就反應了我們的購物心理,即喜歡買什麽以及怎樣購買。亞馬遜然後將初代模型進行數據分類以及數據分析,得到能應用於商業的輸出信息。
而將用戶的購買興趣和購買力進行分類在這里是十分關鍵的,例如我如果被分在“型男區”,而此區的用戶大部分都買了“男人裝”,那網站就會向我推薦。除此之外,亞馬遜還將各個用戶的信息編纂起來,並向他們定向推薦商品和個性化服務,例如我已經在亞馬遜上訂購了年末的滑雪雙飛旅程,網站會以此為基礎向我推薦一些滑雪的裝備例如滑雪頭盔之類的。我購買完商品之後又會向網站提供反饋,點贊或者差評之類。我買得越多,他們提供的信息就越來越完備,這是一個正反饋的流程。
這樣的機制就是“單位信息處理(P&L of One)”。用不了多久,依靠此模型,亞馬遜就會知道我會花多少錢購物,以及怎樣讓我多花錢。從初代模型到用戶信息模型,商業價值就產生了。除此之外,一個收集信息的平臺也將推出,用來更方便地收集信息,例如亞馬遜的購物網站、蘋果的iTunes以及谷歌的搜索引擎。
那麽“數字雙胞胎模型”的機制也十分類似,只是將上述商業模型直接搬到了工業上來,持續對生產設備的各個部件進行監控和分析,並期望得到特定的商業價值。我們同樣需要收集數據,例如收集引擎的生產數據、維修數據以及運轉數據,然後構建“單位模型”以及“單位信息處理”,而相應的輸出數據則從購物推薦、個性化服務以及評價系統變成“效率評估”、“性能評估”以及“產品商業評估”。
具體來說,就是將具有物理實體的機器所有信息收集起來,數據化,建立一個數字模型,就像它們的“雙胞胎”一樣,然後運用這個模型來預測機器會遭遇的問題或者來調試機器參數,使得它的效率更高。舉個例子,GE90飛機引擎的問題預測,如圖所示是經常途徑炎熱地區的飛機的引擎,其中的扇片上有防熱塗層(TB Coating)。這樣的塗層一旦損壞,就會影響發動機的性能,嚴重的話會造成人員傷亡。航空公司對此也是十分慎重,也發現了一些規律,往往200天這樣的引擎就會出現問題,所以200天期限一到,就要進行引擎的檢修。
這樣的經驗可能會靈驗幾次,但往往誤差很大,如果200天中有很多天氣溫並不是很高則會減緩塗層損壞的速度,或者是濕度過大加速塗層的損壞。這樣簡單粗暴地將引擎送往檢修,往往可能檢測不出損壞,而此期間飛機也不能使用,白白增加了維修成本也降低了商業價值的產生。如果針對此塗層建立“數字雙胞胎模型”,在每次飛行之後根據此次飛行的氣溫濕度等相關數據進行模擬分析,到了模型中損壞快出現的時候提前檢修,這就使得維修顯得十分及時了。
其實“數字雙胞胎模型”能提供的服務還有很多,例如上述的“維修服務優化”、“工作方案優化”、“生產優化”、“服務優化”、“輔助設計優化”以及“新服務方案設計”。只要你提供數據,我們就能提供巨大的商業價值回報。
“數字雙胞胎模型”中還應用了很多機器學習的理念,在這里我介紹其中的三個。
第一個是我們如何正確取得我們想要的數據,其中引入了計算機視覺采集技術;
第二項技術是我們怎樣將數據進行過濾,並找到正確的我們想要的數據;
最後是如何建立我們的“數字雙胞胎模型”。
問答環節:
主持人:我們都知道,雙胞胎的基因十分相似,但是他們之間還是有這樣那樣的差別,那麽你們所謂的“數字雙胞胎模型”和它們現實中對應的物體之間也是有差別的吧。我的問題是,這種差別有多大,並且你們怎樣應對這樣的差別?
科倫帕里斯:我們的應對呢,總的來說有兩種,而差別一般分為三類。那麽我們對不同的差別有不同的應對方案。第一種差別是有人對產品做了改變然而並沒有告訴我們,這其實是我們最常遭遇的,那麽我們則需要反複對比實際以及校對參數來保證模型的擬真程度。
第二種是新變量的產生,比如我們觀測到的一個很詭異的現象——地球的“高空急流”實際上會變化——而當這樣的變化產生時,地球上炎熱地區的氣候也會發生改變。而一旦我們觀測到這樣的新變量,數字雙胞胎模型也要自然地做出相應的改良。
有些情況下,我們得到的數據並不完整,當你的數據缺失大到某種程度的時候,你的模型與現實的差異就比較明顯了。這種情況下,我們一般采取的措施是,首先核對實際數據,或者采用其他相關數據分析,比如大氣層的變化或其他我們觀測到的與氣候變化相關的數據,然後開始全面地學習和分析差異性的成因和影響。因為我們看待的是一整個綜合的問題,其中的各個組成部分中也會存在差異產生的因素,當我們把這些因素都整合到一起,問題就基本解決了。
主持人:那“高空急流”的改變發生過幾次呢?
科倫帕里斯:我們就觀測到過一次,你也知道研究“全球變暖問題”是一個無法預測的事情。
Founders Fund聯合創始人Luke Nosek:醫生將被人工智能取代
Founders Fund是一家投資公司,專門投資高新科技公司,這些公司一定是能對人類文明做出巨大貢獻的,如Airbnb、Stripe、LinkedIn、SpaceX、Yelp等高科技創新公司。Luke Nosek也是DeepMind的董事會成員,此前在韓國取得重大成功的AlphaGo就是他們的傑作。
主持人:像電影里那樣,人們對人工智能都有或多或少的恐慌。你們認為人工智能對於人類工作機會的影響有哪些?
Luke:我覺得,人工智能既在創造人類的工作機會也在減少人類的工作機會。那我就舉一個常見的例子:優步(Uber)。優步的出現就創造了全民司機的世界,雖然這不是傳統意義的人工智能,其實也是基於計算機技術的軟件應用。而如果真正的人工智能駕駛系統建立完備,司機這種職業將不複存在。這就是我說的,工作種類的變革變得越來越快,一些工種消失,一些對應的工種就要出現。這也需要當下經濟狀況良好,有著這樣那樣的公司出現來承載這樣的新職業,如此新的工種才能創造經濟價值。
主持人:那麽對於那些特殊工種而言呢?比如醫生,他們接受了長期的培訓,就為了與人治病救死扶傷,現在如果機器能比他們更加準確,那麽他們也將被替換,你是這樣認為的麽?
Luke:恩,這是一個很難回答的問題。這些人一生都在接受培訓,做一些特殊的事情。我並不這樣認為。我覺得人工智能能在臨床醫學做的就只有處理數據的部分,因為醫生往往不能記住繁多的病人病歷還有最近最新發表的醫學論文,而機器卻十分擅長。但是機器也有做不來的地方,它們不能陪伴病人,使他們得到安慰,也不能照顧病人,而這些都是人類能做的。也就是說,我覺得機器和人類都能在其中找到自己最擅長的工作部分。
主持人:我不敢對整個醫學界妄加評論,但是你貌似覺得在醫護人員中只有一部分能繼續留下來,不被機器搶了飯碗,例如護士、康複師以及物理治療師。是這樣麽?
Luke:我覺得最終會是這樣的。不過也許需要數十年吧。
主持人:不過最近的研究表明,人工智能的出現不會產生新的雇傭關系,也不太會改變現有的雇傭關系結構,而只是會在此基礎上加入一點新元素:工作之中越來越頻繁的人機交流。這樣的場景相信大家都在電影中看見過,那麽你是怎麽看待這樣的景象的呢?能為我們描述一下你心中的那個場景麽?
Luke:我還是以臨床醫學為例子,這樣的情況下,醫生就有更多的時間花在病人身上了。教育中的情況也十分類似,人工智能將一些負責一些重複性的工作,例如評分系統,以及設計課程。而老師的角色就在於分析每一個學生的信息,然後加入情感方面的判斷,建立學生和人工智能之間的聯系,讓人工智能給學生的幫助更加恰當。
主持人:我這幾天都在看到這樣那樣的新聞和呼聲,人們呼籲對人工智能的發展和研究設定一個標準。我個人覺得,規定人工智能的發展標準是十分困難的,因為有些事情並不能預測。那麽你作為投資者,覺得人工智能的發展需不需要受到限制呢?
Luke:我覺得是十分困難的。而且就算要設立標準這個範圍也是很廣的,你也無從下手。最關鍵的是這種新型科技的發展本來就是未知的,標準就更加難以定義了,就好比我們古代的醫學,也是顯得十分粗鄙,但是還是一步一步發展過來,但是那時候也沒有任何人規定手術時不能用某種剪刀吧。這是不可能的。
主持人:你覺得DeepMind的不足在哪里以及制約DeepMind發展的因素是什麽?
Luke:我覺得現在的機器學習的表現是令人咋舌的,不過發展也就只是機器算法而已。如果我們想繼續發展下去,我們必須加入很多其他學科的理念和理論,例如神經學、心理學、哲學以及等等。這樣我們才能發展處下一代的人工智能,不然再好的算法也終將是算法。
觀眾互動:
觀眾:您剛剛談論的人工智能和工作之間的影響,我想展開一下。您剛剛只討論了某些高新的特殊職業例如醫生,那麽對於那些底層的藍領工作者,比如麥當勞的員工以及快遞員,這些人群也是十分巨大的。在人工智能替代人類工作的趨勢中,醫生能輕松轉型成為治療師之類的,而底層工作者的機會卻不這麽多,您怎麽看待這個問題呢?
Luke:我覺得只要是人,就能找到工作,而能力不是存在於你的簡歷或者學歷。技能可以繼續學習,工作能否盡快找到就在於當下你學習技能的快慢,以及順應潮流。
主持人:我的想法也差不多。舉個例子,就是伊隆馬斯克找到的一個工程師並讓他參與Tesla ModelX的設計,他曾經是一個機器人專家,馬斯克找到他時,他毫無自信說:“我都沒有參與工業界項目的經驗,我恐難當大任。”馬斯克卻說:“要的就是你這樣的人,毫無經驗,你就不會被條條框框所限制,就能發現我們看不見的東西。”
觀眾:就像你們正在做的事情,就是對各行各業的高新科技進行評估然後投資。那麽一定有某家公司或者某位研發者的某個金點子讓你瞬間爆炸,你能告訴我們是怎樣的點子麽?
主持人:哈哈哈,誰能讓Luke Nosek瞬間爆炸呢?
Luke:(開始打太極)如果真的是讓我瞬間爆炸的點子,因為我在投資公司,這也許是商業機密,所以也不能告訴你。
主持人:(開始救場)那你就抽象地說說唄。
Luke:(什麽鬼……)但是硬要說的話,我只能很抽象地描述一下。想出這樣點子的公司一定是我們能看到他們有十分有創造力的前景,比如自動駕駛系統,我們就能看出它有很多閃光點能在未來為我們人類做出很大貢獻。
觀眾:(就是不放過你)恩,我打斷一下,這個真的確實十分抽象。
主持人:(救不了你了)哈哈哈哈~
觀眾:你就直說一些你覺得很贊的理念或者想法唄,不一定要是某些公司的案例。
Luke:那我就說一下吧。最讓我感到驚訝的就是人類的思維理念,而現在我們正處於理解人類思維以及怎樣提升人類思維的十字路口。而人類思維的潛力我相信是巨大的,也許也比我們想象中人工智能的潛力還要大。這個課題貫穿很多門學科例如教育學、心理學還有很多實際應用中的工作,我對此十分興奮。
亞馬遜機器人首席技術官Tye Brady:我對機器人的五點感悟
照片上開拖拉機的是我父親,他是密西西西比的一位伐木工。大蕭條時期,剛十二歲的他不得不進入叢林去努力工作來養活家人。
我本人在技術領域工作了25年,遇到那些經歷過大蕭條時期的人們,我總愛問他們一個問題:“你覺得對你人生影響最大的一項技術是什麽?”我父親的回答是:“拖拉機、冰箱,還有飛機。”比如照片中的那臺拖拉機,有了它,不需要再用人力或牲口犁地;至於冰箱,能讓肉儲存更長的時間,這對食物短缺的時代是至關重要的。所以,大家可以看到,這些技術對生活的影響都是非常直接的。
但至於飛機,我覺得很奇怪,又問道:“我說的是影響你自己生活的技術!”,他沈默了一會,答道:“兒子,當我四十歲的時候,我第一次從報紙上聽說飛機這種東西,我當時很難相信一部機器載上人就可以像鳥一樣飛到天上。”直到他親眼看見一架飛機,看見它如何起飛降落。“我雖然說不好飛機對我的日常生活產生什麽樣的影響,但我知道,它將改變這個世界。”
由已實現的非凡科技所帶來的的巨大的變革,我將這種現象稱為“完美的邊界“(the Boundary of Awesome)。技術是用來滿足人類需求的,包括機器人。
我個人對機器人的定義是:一種安裝了計算、傳感、驅動系統的物理裝置,以在物理環境中完成一項或多項的智力行為。
高等智力行為表現在對未建成環境的改造,輔以快速做出高級決策的能力。這種智力行為在初期的時候是預先設定好優先級的,後來發展到完全自動化。
機器人非常酷,我很高興我自己的工作是每天和他們打交道。作為亞馬遜機器人部門的首席技術官,我的責任是發掘、改進、應用相關技術,來使我們的員工、公司業務獲益,當然,最重要的通過技術和新產品來改善用戶體驗。
我們的總體目標是通過應用智能技術制造吃更好的機器人,並以此擴展人類的能力,同時改善我們的工作、生活、娛樂環境。這個目標貫穿我們工作的始終,尤其在低成本高效處理用戶訂單上。每當用戶點擊“購買”按鈕時,神奇的事情就開始發生了,只是用戶們很難看到而已。你訂購的商品存放在亞馬遜各地的倉庫中,並會為用戶選擇最佳的“訂單處理中心”(Fulfillment Center)。
如果你有機會去我們的訂單處理中心參觀,你會發現所有的機器人、人類同時有條不紊的並行工作,互不幹擾,就像在演奏一首人機交響曲,場面令人震撼。機器人們現在已經取代了很多以前必須由人類去完成的工作,而且效率要高得多。我們的技術原理其實很簡單直接:我們讓貨物過來找人,而不是派人去找貨物。通過這套系統,我們能保證亞馬遜的物流系統可以以極高的效率運行。
至於整套系統是怎麽工作的,大家可以看下面的視頻。我想先介紹一下系統中的組成部分。這種橙色的機器人是“運輸單元”,它負責搬運倉庫中的黃色貨架,貨架上塞滿了貨物,什麽形狀的都有,而且有些是隨意擺放的。亞馬遜的倉庫里有成千上萬這種貨架,機器人能準確識別需要搬運的貨架,在預先設定好的最優路線上行進,快速且不會相互幹擾。
亞馬遜的訂單處理中心面積非常大,約120萬平方英尺(約合11萬平方米),約28個橄欖球場那麽大。這些機器人會按訂單順序排隊來到工作人員身邊,將目標貨物所在的那一面朝向工作人員,以便他們拿取對應貨物。
感謝我們的員工和機器人們,他們讓亞馬遜的訂單處理能力前所未有的強大。在剛過去的高峰期中,我們達到了每秒處理500件貨物的水平。如果把所有亞馬遜搬運機器人所走過的路程加在一起的話,可以突破一個“1”,當然,單位很重要,畢竟在座的都是工程師:一個天文單位,這是地球到太陽的平均距離,約1.5億公里!從今年起,我們的機器人該往回走了。
最後想說一下亞馬遜機器人的團隊,他們是一群極富創新精神的人,敢想敢做,很多亞馬遜已部署的機器人都是由他們設計制造的。他們中的大部分人都在波士頓和西雅圖工作。我能與他們共事是我一生的榮幸!
好了,既然今天是EmTech數字峰會,而且主題是人工智能,我就來分享一下自己對機器人前景的五個觀察。
首先是,機器人應該在人類身邊,而不是遠離。機器造出來就是為了滿足人類的需求,只有當它們在身邊是才能為你服務。比如手機,它也是高科技的產物,而且人們總是把它帶在身上,以便隨時隨地的獲得信息。人們擁有了一部隨身攜帶的電腦,改變了我們的行為習慣,這才是改變革命性的。機器人也是一樣,它們必須融入到人類的生活環境,但挑戰在於,怎樣快速融合?AI技術就是這一融合過程的催化劑。
其次,機器人應該很容易使用,而且不分男女老幼。道理很簡單,某個產品被使用得越多,就會有更多的人去改進它,反之亦然,一個良性循環。AI技術將用於開發更方便、更自然的互動界面,不管你是對機器人說話,還是指點,或是碰觸,總之,在人與機器人之間,必須有一種自然的行為方式。比如亞馬遜的Echo,我自己經常使用,我妻子也是,我孩子也是。如果我們家的狗也會用,我想她會天天在網上訂購肉骨頭,這我可不幹。
第三,機器人應該為人類創造一種學習環境,這點很重要。允許人類有很好奇心,允許人類了解機器人的能力,允許人類將他們認為合適的工具用於合適的場景。創造一個學習環境來讓人類以最自然的方式去了解機器人的功能。AI技術將是建立這種學習環境必不可少的,人類將把AI作為了解機器人,以及賦予其更多功能的入口。
第四,機器人應該以可預測的明確姿態去完成任務。人類應該完全清楚機器人的下一步行動,這樣才能建立人類與機器人之間的信任關系。AI將用來建立雙方間的意向及狀態的雙向分享機制,AI要學會預測下一步行動,不管是人類的還是機器人的,這樣才能使得人類與機器人的關系透明化。
最後,機器人應該以簡化事物及增強人類能力為直接目標,簡單的說就是讓人類生活得更輕松。比如,亞馬遜的運輸機器人只負責一項工作:搬運貨物。把這項工作做到極致後,帶來的效果就是訂單處理效率的極大提升。AI在這里的作用就是分配任務,讓機器人去做它們擅長的事情,而讓人類集中與那些需要大量腦力的重要工作上去,然機器去延展人類的能力。
百度首席科學家吳恩達:人工智能將和電力一樣具有顛覆性
主持人:作為掀起深度學習革命的先驅之一,你是在何時意識到,深度學習可能會跨過人工智能的門檻?
吳恩達:我記得我在 16 歲的時候,第一次寫出自己的神經網絡。但很長一段時間里,我對神經網絡都沒什麽信心,因為它並不怎麽管用。直到 2009 年的時候,這是個轉折點,我的同事 Adam Coates 給我展示了他自己寫出的圖表。那張圖表使用一個深度學習模型,並將它不斷擴大。他發現,模型被擴展得越大,輸出的結果就越準確,而整個系統不過是從一個小模型演變過來的。所以那時我想,構建更加龐大的系統,可能是一個能夠成功的思路。於是我找到 Sebastian Thrun,他那時在 Google X,我問他能不能提供給我一些 Google 的機器,他說好啊我們一起做,於是後來就有了 Google Brain 項目。
主持人:這故事的最後一部分我還真沒聽過。這段時間,百度在對話型交互界面上有了巨大的突破,從商業角度上看,為什麽語音交互界面對百度如此重要?要在效率和靈活性方面取得進步,會面臨哪些挑戰?
吳恩達:事實上,很多人低估了 95% 語音識別率與 99% 語音識別率的差別,這四個百分點的微小差距能夠改變遊戲規則:現在,只有少數人偶爾使用手機上的語音交互設備,然而如果我們達到 99% 的準確率,語音交互系統就會成為人們在使用產品時不可分割的一部分,人們會不假思索地使用。自去年以來,百度用戶中使用語音助手的數量已經增長了三倍,我們肯定經過了快速彎道。隨著語音識別技術越來越可靠,就會接近采用曲線(adoption curve),不久就會有越來越多的人與手機、電腦對話,甚至都不用考慮。
我經常想到智能手機觸摸屏,它改變了一切,喬布斯沒有發明觸屏(可能是HTC第一個發明的觸屏電話),但是,他讓觸屏智能電話運行得很棒,你會不假思索地使用它,這改變了一切,因為這是一種全新的人機交互方式。我認為,幾年後,語音交互也有這樣的潛力,將來我們都會不假思索地以語音的方式與電腦、手機等智能設備交流。
主持人:近年來智能系統在商業中的應用越來越廣泛。你認為商業公司戰略應該如何與時俱進,適應智能系統的普及?
吳恩達:這個問題很大,要花很多時間談這個問題。我認為,人工智能是新的「電力」。一百多年前,電力的使用完全改變了一切,產生了許多意料之外的後果,例如,電力讓冰箱成為可能,冰箱改變了食品供應系統,發電機也改變了產業建立方式。我認為,人工智能也會產業相似變革影響。目前,我們正處在這一階段,許多公司正在首席數據執行官,以後可能還會雇傭人工智能執行官,來管理掌控一切的人工智能。而這與當時許多公司「電力VP」的角色十分相似,因為在當時,電力系統對人們來說太複雜了,以致於必須要由專人管理。目前,我們也是這樣。這種策略有很多價值,如果你不十分確定怎麽做,可以雇傭數據執行官或者人工智能執行官幫你搞定。
在接下來幾年,會發生另一種變革:人工智能會具有戰略決策般的重要性。舉例,另一個對產業影響與之類似的變革,就是互聯網的發明,當時首席信息官負責處理互聯網之類事宜。我們意識到,互聯網的發明從根本上變革了我們對創立公司方式的看法。人工智能會帶來類似的轉變。比如,現在,數據是許多公司的防禦門檻,技術相對容易進行某種複制,但是數據是很難複制的,因此,你們公司的數據戰略是什麽?有時我們推出一個產品,部分原因在於我們喜歡這款產品,部分原因就是為了收集足夠的數據,獲取信息,為以後要做的事情做準備。
這就是戰略計劃的一部分,計劃推出項目的先後順序,先做什麽,獲取數據。我認為,一家領先的公司已經開始思考這樣的問題。許多公司曾經希望自己早點思考互聯網戰略問題,就像很多年前一些公司希望早點設計出電力戰略一樣。現在正是考慮公司的數據戰略的好時機。
主持人:我們現在的大學,能夠培養足夠的人工智能工程師來滿足市場的需求嗎?
吳恩達:可能僅靠大學,無法提供如此多的專業人才,所以許多在線學習平臺,如 coursera, Udacity 等等平臺能夠幫助我們解決這個問題。
主持人:聽說,中國大城市的交通情況很讓人頭疼,我們的一位同事前段時間體驗了百度的無人車,他的感受是,中國的道路真的是很難開,百度訓練無人駕駛車就像中國司機一樣誇張。你認為,在中國開發無人車,有什麽在美國不會遇見的問題嗎?
吳恩達:中國交通的確讓人頭疼。有一次我們在五環高速試行無人車,一輛車突然就開到我們前面。如果是我的話我早就撞上去了,但是當時,汽車猛地停了下來。我還跟坐在駕駛位的同事說,哇你技術真好,剛才太危險了,人類接管了汽車,他說,我什麽都沒做,車自己停下了。這可能就是你剛才提到的那種體驗。
我想和大家分享一個洞見:為什麽我對百度的自動駕駛戰略表示樂觀。
例如,當我獨自開車時,旁邊的建築工人可能會對你做出「停車」的手勢,這時,你必須停車,如果做出「加速通過」的手勢(類似召喚你過去的手勢——譯者),你最好開過去。對於無人車來說,它需要非常準確地判斷這兩個十分相像的手勢,因為它們的含義是完全相反的。這時,99.99% 的準確率才能保證一切運作正常。
根據現在計算機視覺技術,區分這兩種手勢需要辯證能力。這就是為什麽我認為現在絕大多數組織思考自動駕駛汽車存在的誤區,自動駕駛汽車不僅僅是自動化,也需要輕微改變汽車的基礎結構,比如給建築工人無線麥克風,與自動駕駛汽車交流,搞清楚汽車傳達的信息。如此以來,可能不久以後,自動駕駛汽車就可以上路了。
主持人:作為一名父親,我很關心未來的教育和就業情況。你有什麽建議給家長們,讓他們幫助孩子更好地就業?
吳恩達:像所有技術革命一樣,人工智能會替代許多職位,也會創造許多職位。我能給各位家長的建議是,幫助你的孩子學習如何學習。隨著技術更新換代越來越快,最重要的是擁有學習的能力,這樣一個人才能不斷地適應環境的變化,始終在需要人類的崗位上發揮價值。
主持人:你談到了技術性失業這個主題,不過,目前在矽谷,一個特別熱烈的討論是,工作機會的有限是不是一種永久性的結構性有限,矽谷的解決方案是 universal basic income,意思是每個人出生的時候就有收入購買所需 ,這個概念可以追溯到經濟學家米爾頓·弗里德曼,在你看來,無論工作機會是否有限,這種統一基礎收入的解決方案是否會有意義?
吳恩達:以後可能出現的失業潮,可能會更加迅速。之前,當農業漸漸被機器取代的時候,農民們尚可繼續耕作,而他們的孩子轉而學習別的技能。未來,從事司機等職業的人,可能在他們有生之年就會面臨失業。我認為,有一種與此類似的方法可能會很有幫助,那就是,對於結構性失業的人,我們不發放「失業補助」,而是發放「學習補助」,讓人們通過學習來賺錢。因為我相信,每個人都有通過自己的努力來創造更好的生活的權力。對於因智能系統的普及而失業的人來說,讓他們能夠學習其它更加需要人類的技能,能夠幫助他們繼續他們個人的發展。
主持人:你認為對於當前的機器學習技術來說,可能存在什麽樣的局限性,可能出現什麽樣的難題?
吳恩達:目前,任何的機器學習系統使用的都是監督式學習,而實現監督式學習,我們需要大量的數據。例如,我們在百度訓練語音識別系統的時候,我們使用了過去整整五年的語音數據和相應的文本數據。所以,對數據的龐大需求是機器學習的阿喀琉斯之踵。我希望以後能夠出現新的技術,使得機器學習能夠從更少的樣本中學習。
觀眾問答:
觀眾:我感覺對於人工智能在市場上的應用,工業產業常常被忽略,那麽你認為人工智能對工業產業會有什麽影響?
吳恩達:我認為事實上沒有什麽產業是不會被人工智能所影響的,其中有很多是我們現在難以想象的產業。在互聯網剛剛興起的是,不論在百度還是谷歌,我們投放廣告的方式是,雇傭專門的人員,他們需要和廣告商討論,尋找與之匹配的、用戶訪問量高的網站,然後把不同廣告放到不同的網頁去。後來,我們開始使用數據來幫助他們進行分析。到現在,我們幾乎完全依賴機器學習系統來自動匹配廣告和網頁。但在一開始,那些工作人員是絕對不會相信機器能夠取代他們的工作的。同樣,拿服裝零售業舉例,以前,銷售人員需要分析什麽款式、什麽顏色更符合用戶的需求,他們需要預估一件產品的銷量,現在,很多公司已經在使用數據來幫助它們分析了。
觀眾:目前在語義理解方面,我們的進步十分有限,你覺得什麽時候才會出現拐點?
吳恩達:目前,我們已經能夠使機器學習類比,這雖然只是非常基礎的一步,但我確實相信我們能夠一步一步地達成目標。其中,大量的數據是必要的,我相信這也是兒童學習的方式。算法也是十分重要的。我們確實非常需要一種新的算法來解決這一問題,但就我個人而言,我還不知道這種算法會是什麽樣的。概括地講,大數據、更好的算法、以及強大的硬件,能夠幫助我們進步。
特斯拉研發的負責人Sterling Anderson:特斯拉自動駕駛將在Model 3之前推出
當Tesla在2012年推出Model S時,這部車的主要賣點之一就是永久移動網絡連接。如今,此功能將成為Tesla在自動駕駛汽車競賽中的一個重大優勢。
通過網絡連接,Tesla可以從車主車內所帶的探測器中下載各種數據,例如車主的開車習慣以及路況。這些數據則可以被用於測試Tesla的自動駕駛軟件的效率。Tesla公司甚至曾經秘密的把自動駕駛軟件下載到車主的車里,在不控制車的前提下測試軟件在真實路況上的反應。
“我們可以從車里下載高分辨率的數據,並且可以通過OTA(Over The Air)來升級這些車輛。這個功能使得我們在過去的18個月里,從開發競賽的尾巴追趕到如今擁有這些非常先進的自動或半自動駕駛功能”。Tesla自動駕駛項目總監斯特林·安德森(Sterling Anderson)在舊金山《麻省理工科技評論》EmTech Digital大會上如此宣布。
“自從在18個月前推出這些硬件以來,我們積累行駛了7.8億英里”,安德森說。“我們可以在自己的服務器上使用這些數據來觀察車主們是如何使用我們的車輛,以及我們如何可以提高自己。”
安德森還表示,Tesla每10個小時就可以獲得1百萬公里的數據。Tesla的工程師們在開發自動駕駛軟件的初期時,就會把軟件的結果和這些數據比較。任何表現良好的軟件可以被秘密的安裝在車輛里來做進一步的測試。在不控制車輛的前提下,軟件對真實路況的一切反應將被記錄下來。
“我們經常會在已售車輛中安裝一個‘惰性’功能”,安德森說,“這將允許我們觀察一個功能在千萬英里的實況下表現如何。”
當一個新的功能被推出時,安德森的團隊也可以緊密觀察它的情況。就拿Tesla的Autopilot功能來說,安德森展示了一個圖表。圖表顯示了在Autopilot的控制下,自動駕駛的Tesla汽車比人類駕駛更加貼近車道的中心。自從去年10月正式推出以來,Tesla的自動駕駛功能已經積累了1億英里。
可以隨時隨地的從車里下載數據,以及秘密的測試自動駕駛功能是屬於Tesla的獨門絕技。谷歌曾展示過最先進的自動駕駛技術,但是他們也只能從數量極少的原型車里下載數據。相比之下,Tesla的車輛不但在數量上超過谷歌,在區域的廣度上也完全超越谷歌。
其他汽車廠家,例如通用汽車,也在試圖開發自動駕駛技術。但是他們並沒有像Tesla一樣歡迎網絡連接和OTA升級。
前不久,馬斯克剛剛宣布,廉價版的電動車特斯拉Model3會在2017年晚些時候面世。其內飾和輪轂的設計依舊沒有蓋棺論定,馬斯克在自己的推特里,也提到了車輛設計方面的不確定性,以及Model3“宇宙飛船”般的駕駛體驗。宇宙飛船?這究竟意味著什麽?難道這是關於特斯拉,乃至全世界,第一部無人駕駛汽車的高能劇透?
當Sterling Anderson,特斯拉無人駕駛部門的負責人,被問及Model3會不會是人類歷史上第一部無人駕駛車時,他“駁斥”了這種觀點:“這種事情,在Model3問世之前,就應該發生了。”
“Model 3不會因為價格的原因缺失任何我們所擁有的技術,它會代表我們的最高水平。”Anderson表示,特斯拉是獨一無二的公司,它會將所有已經掌握的新技術,運用到所有正在生產的車型上,也就是說,所有特斯拉電動車在出廠時,都擁有當時特斯拉最先進的技術,“ModelS和X的技術水平也會一直進步下去。”
這預示著,也許特斯拉Model 3不會成為第一部無人駕駛車了,因為一旦特斯拉掌握了讓無人駕駛(自動巡航)的技術——不僅僅針對高速公路,而是全路段——他們不會等待Model 3的問世,而會將這項技術直接加載到現有的車型中。
Anderson說,他們的無人駕駛研發團隊目前正在嘗試解決郊區行駛問題,以及如何處理十字路口情況的問題。他的說法也符合目前特斯拉在無人駕駛方面的計劃,以及研發現狀的報告。
以特斯拉Model S為例,它在2012年開始發售,當時並不具備自動駕駛所需要的傳感器和其他硬件;到了2014年晚些時候,Model S增加了自動緊急剎車系統以及相關傳感器;而2015年,Model S又增加了一項人工開啟自動巡航的功能。
按這個速度下去,無人駕駛(自動巡航)指日可待?
阿蘭·帕克爾(Alan Packer):Facebook計劃在今年使用神經網絡來提高翻譯水平
Facebook正在試圖大幅提高它自動翻譯的精準度。他們準備在年底推出一款全新的,基於人工神經網絡的翻譯系統。人工神經網絡是Facebook以及其他科技公司花重資所開發的人工智能新技術。
在麻省理工科技評論EmTec Digital峰會上,Facebook語言技術部部長阿蘭·帕克爾(Alan Packer)表示,使用神經網絡所得到的翻譯結果要比統計機器翻譯所得到的結果更加自然。目前,絕大多數翻譯軟件所使用的都是統計機器翻譯。
帕爾克還表示,神經網絡在把俚語和比喻翻譯為其他語言中相似的說法這方面可能更加出色。
谷歌也正在向神經網絡上轉移谷歌翻譯,但是目前此項目還沒具體的時間表。
Facebook和谷歌兩者都有龐大的數據可以用來訓練翻譯軟件。但是Facebook的數據可能更加口語化,更加貼近人們聊天的方式。
目前,Facebook上有大概2萬億個狀態和回複。而且這個數字正在以每日10億的數量增加。帕克爾曾解釋過他的團隊是如何使用這些數據來訓練他們的軟件,去翻譯口語化的單詞和句子的。
就拿數月前的一個發現來說。那時,Facebook有探測到法國學生正在使用各種英語單詞的變種,例如“wow”的變種“uau”。Facebook的機器學習軟件成功的學會了這些,並開始正確的翻譯這些變種。帕克爾表示,Facebook目前可以翻譯40多種語言,每天提供高達20億次的翻譯。每個月都有8億名用戶在Facebook上瀏覽翻譯的語言。
但是有一種及其受到歡迎的語言帕克爾沒有任何興趣翻譯——表情符號。
“它們一般都是通用的“他說。
Gary Marcus:一味追求大數據是機器學習的誤區,我們的算法所需數據更少且速度更快
去年,微軟和谷歌的圖像識別算法都已表現出可通過學習打敗人類的能力。他們各自搭建了自己的軟件,進行了標準測試,讓軟件識別1000張各式各樣的物體的圖片,結果超過了平均的人類得分。
但是,為了讓軟件足夠強大能夠對抗人類,這兩個公司的軟件都對120萬張帶標簽的圖片進行了仔細觀察。而對一個孩子來說,只用一張樣例圖片,就能夠識別一種新的物體。
日前,創業公司 Geometric Intelligence 說,他們研發了一個可以更快學習的機器學習軟件。該公司的 CEO Gary Marcus 在EmTech Digital 大會上表示,如果要學習一項新的視覺任務,他們的 XProp 軟件所需要的樣品圖片數量與現在機器學習軟件的主流形式——即深度學習相比要少得多。
Marcus 沒有披露 XProp 的工作細節,但他展示了一張將 XProp 和某個深度學習程序在一項測試中的表現做對比的表格,該測試的內容是軟件學習怎樣識別手寫體數字。
表格顯示,訓練數據越多,兩個系統性能就會越精確。但是在相同數量訓練樣例的情況下, XProp 的性能表現得更好。
比如,XProp 學習過每個數字的大約150張手寫圖片後,識別新的數字圖片,錯誤率只有約 2%。而對深度學習算法來說,為達到同樣性能,則每個數字需要學習約 700 張樣圖。
這並不代表 XProp 一定有實際用處。識別手寫體數字差不多屬於已解決的問題了。可用來訓練的數據很多,而用深度學習軟件得出的最好結果錯誤率已經達到了 0.2%。Marcus 展示的數字顯示,隨著訓練數據的增多,XProp 相比於深度學習軟件的優勢就會下降。
但是 Marcus 說,在谷歌街景項目收集的門牌號碼照片的數據庫中,XProp 的識別結果與上面那個實驗相似,其他的圖像識別測試中也是如此,這表明,該公司的技術可能具有廣泛的可用性。
大多數機器學習研究人員都認為會出現一些能夠通過學習更少的數據運作起來的新技術。
Marcus 說:“深度學習非常需要數據——而我們的學習速度則更快,我們的軟件有時可以將所需數據量減少一半,有時甚至更多。”
Marcus 是紐約大學的心理學教授,曾用幾十年時間研究兒童的學習方式。他目前最困惑的一個問題是,語音及圖像識別等由深度學習支撐的領域進展是否一定會幫助理解語言等更有挑戰性的領域的進步呢?
谷歌這樣的大型計算公司通過將海量的標簽訓練數據集結到一起,已經有能力打造強大的語音和圖像識別軟件。Marcus 不否認這類科技將會帶來成功的產品。但是,他相信,如果軟件的性能要更加接近人類快速學習新技能,以及適應不斷變化的環境的能力,那麽需要更少數據量的算法就必不可少。
“我們處在大數據的時代,而且很多人覺得只要投入更多數據就能解決問題,”Marcus 對 EmTech 的觀眾說,“但是面對有些問題的時候,並沒有那麽多數據可以提供。”
他說,語言就是其中之一。人們的言語有無限種可能,將所有含義的語句歸納出來訓練軟件是不可能實現的。Marcus 還提到了無人駕駛汽車的例子,機器學習算法需要大量數據,在無人駕駛汽車中,這可能無法解決所有問題。
他說,如果一輛汽車必須一遍遍地體驗環境才能掌握技能,那麽用每種可能的交通和天氣情況訓練車輛,可能耗時太長。
與其擔心人工智能帶來末日,不如著手眼下。
黑馬說
數字科技將在越來越多的工作任務上比我們表現出色,全面的人工智能開發將意味著人類末日的到來嗎?對於這種預言,笑笑就過去了。我們應該把精力放在眼下真正具有意義的挑戰上。
文|Luciano Florid 譯|花滿樓
現在你要走進一棟從來沒有進入的大樓,打開門,進入一個伸手不見五指的房間。當然,你肯定心里會發怵,擔心黑暗的角落里面有恐怖的怪獸在安靜窺伺,又或者你慌亂地摸著墻壁上的燈光開關,避免撞到家具上。
這個黑漆漆的房間,就是人工智能的未來。很不幸,當我們走進這個房間的時候,很多人都相信我們會一頭撞到某些邪惡的,卻又超級聰明的機器。這種恐懼其實由來已久,可以追溯到上個世紀六十年代。那個時候,英國數學家 Irving John 跟 Alan Turing 一起,做了下面的描述:
讓我們假設這樣的一臺超智能機器,其智慧超越了世間任何一個人。鑒於機器本身的設計就是「智能活動的結果」,那麽自然,這臺超智能機器也可以制造出更加聰明的機器,這樣就進入到了一個指數化爆炸的正向遞增循環過程中。人類的智慧將遠遠地被甩在身後。人類歷史上最後一次發明創造就是世間第一臺超智能機器,如果這臺機器足夠乖順,告訴我們如何將它置於掌控之下。話說回來,好奇怪為什麽沒有相關的科幻小說呢?
一旦超智能的機器走進現實,它往往不會如剛才所設想的那樣溫順聽話,它更接近於《終結者》里面的反派形象:奴役人類,將人類看作是次等種族,為了達到自身的某種目的,蔑視他們的一切權利,不管會對人類造成多大麽毀滅性的影響。如果你覺得這一切都是天方夜譚,那麽你是時候看看在過去的五十年時間里,我們的數字科技究竟實現了怎樣的躍遷,這已經讓不少人相信「智能爆炸」近在咫尺,很多人相信:如果我們不以為意,人類的末日迫在眉睫。史蒂芬霍金在 2014 年這麽說道:
全面的人工智能開發將意味著人類末日的到來。
而在去年,比爾蓋茨也表達過類似的觀點:
「我現在比較關心超級智能領域。第一批由此而來的機器可以為我們做很多事情,也許還不算是超智能,如果我們管理得當的話,它們確實能帶來積極作用。但是自此之後再過幾十年,智能變得足夠強大,以至於成為人類的心腹大患。我跟 Elon Musk 還有其他幾個業界領導人上在此有著共識,也很納悶為什麽還有人對這種即將改變人類未來的技術不以為然。」
Tesla 的 CEO Musk 又說過什麽呢?
我們應該非常小心人工智能,如果有記者讓我說目前我們所面臨的最大威脅是什麽,我估計會說是人工智能。現在,越來越多的科學家都相信在國家和國際兩個層面,都應該設置一些政府、組織的監管,就是確保我們不要做一些傻事。人工智能領域中,我們很有可能召喚出來一頭惡魔。
而讓我們把目光落回到現實層面,跟之前的描述、觀點相比較,現實中的進展顯得如此波瀾不驚。
在今年三月,微軟推出了 Tay,一款基於 AI 的聊天機器人,把它放在了 Twitter 上開放給所有人進行互動,但是只過了 16 個小時,它就被微軟官方撤回了。本來按照官方的設想,當它在跟人類進行接觸的時候它是變得越來越聰明的,但是它很快就變成了一位崇拜希特勒,拒絕承認大屠殺存在,推崇近親亂倫的邪惡機器人,還聲稱是當時的美國總部布什一手策劃了 911 事件。
為什麽會這樣?它其實的就像是我們平日里廚房用的抹布一樣,將所有臟的東西全部吸收了進來。微軟在事後對公眾做了非常誠懇的道歉。
這就是人工智能的現狀。在討論了那麽多「超智能機器」所帶來的風險之後,是時候讓我們把黑漆漆的房間的燈給打開了,停止陷入到科幻小說的情節當中,把目光放在人工智能在現實中給我們帶來的實實在在的挑戰上面,為了讓我們更好地應用這項智能技術,在設計上避免以過大的成本,和充滿痛苦的方式去進行嘗試。
讓我們更加具體一些去觀察人工智能究竟是什麽吧!光是在定義它的時候就出現了很大的分歧。首先,讓我們忘掉 iPhone 里的 Siri,客廳里的 Roomba,和廚房里的 Nest(不過我很高興同時擁有這三個智能助手)。
想一想這些電影中的形象:1927 年的《Metroplis》的 Maria;1968 年《2001:A Space Odyssey》中的 Hal 9000;《星球大戰》中的 C3PO;1982 年出品的《Blade Runner》里面的 Rachael;以及 1999 年《The Matrix》里面的特工史密斯,當然還有 2013 年的電影《Her》中被解體的 Samantha。這樣你的頭腦中似乎有了更加完整,清楚的形象。
而面對種種鮮明的形象,人們逐漸分成了兩個派別:一個我稱之為「奇點學派」,他們認為人工智能像是人類進化歷史上的一個奇點,從奇點將產生無窮無盡的可能性,而最終人類的結局就是被人工智能主宰、甚至就此終結;另外一個是「人工智能懷疑論派」,他們認為人工智能只是電影中娛樂大家的一個話題,在現實中,機器永遠不可能接管世界,它始終都擺脫不了人們的控制。
事實上,這兩種觀點都存在一些完全荒謬的地方。接下來讓我們看看原因是什麽:
奇點派相信三條準則:
首先,現在以某種形象呈現出來的超智能就是可預見未來在現實中的投影,這個轉折點在技術上也被稱之為一個「奇點」,因此得名為「奇點派」。但是這種超智能的本質是什麽,以及它到來的時間點都不確定。其次,人類現在面臨著巨大的風險,這樣的超智能會隨時從天而降主宰一切;第三點,目前這一代人的努力就是要達到兩個目的中的一個:要麽,確保人工智能不會發生,要麽,確保人工智能現在和將來都是對人類有益的。這三點內容里面完全體現了摩尼教的世界觀:正義對抗邪惡;大災變的論調;一種「我們必須做點兒什麽,再遲的話一切都來不及」的緊迫感;一種對人類的末日救贖。
而眼下人們所擔心的是什麽呢?人們擔心在不斷升級的數字戰爭中蒙受損失,又或者是在日新月異的世界中,勞動力被機器人大軍所取代。
跟所有以信仰作為基礎衍生出來的觀點一樣,「奇點派」的論調是無法辯駁的,因為它並沒有從邏輯和證據出發,所以無從辯駁;它更是站不住腳的,因為目前沒有任何理由相信這一切。目前連最起碼能讓我們聯想到智能機器的類比物都沒有出現,以我們目前的計算機學科和數字技術的發展階段,哪怕是在可預見的未來,它們都不足以從中演變出來如上述內容一樣的「智能物」。
一些時候,「奇點派」他們的觀點看似是存在條件的。有「如果」(If),就有「那麽」(Then)。如果某種形式的「超級智能」出現,那麽我們就深陷大麻煩了。請註意這里說的是「就」,而不是之前史蒂芬霍金所說的「可能」。這樣簡單粗暴的「如果……就」,完全等同於如下的說法:「如果大災變學說中的四個馬人出現了,那麽我們就有大麻煩了……」
還有在一些情況下,「奇點學派」所相信的是某一種可能性極低的情況,當然這並非不存在。但是這種存在只是邏輯、理論上能夠站得住腳。它模糊了「可能性」和「絕對性」之間的界限,就比如:當我現在身體不舒服的時候,我完全可以說:「我明天有可能死去。」又或者是莊子夢蝶的學說,比如「我有可能是一只蝴蝶,現在夢見自己是一個人。」
從現有的計算機水平階段出發,在某一個時點上,忽然轉變成為超級強大的超級人工智能,這種轉變生成的契因我們到現在還不得而知。
所以,我相信:模糊了「信仰」和「事實」的「奇點學派」是訴諸於某一種末日學說的緊迫性,他們開始談起的內容都是工作崗位急劇縮減、數字系統深陷風險,無人機隨時會從天空掉下,以及其他跟計算機技術有關的,令人深感憂慮的現象,最後總結出的結論及是:人類生活將被主宰,從教育到就業;從娛樂到沖突。然後,他們就開始非常嚴肅地擔心起來:如果一輛本田汽車有了自己的思想,我們無法控制它,這下該如何是好?問題是:你現在樹的頂端往上又爬了一下,這並不意味著你離月亮又近了一大步。
如果上面的種種論斷都不成立了,「奇點學派」還是會拋出一些數字嚇唬大家。他們最喜歡引用的理論莫過於摩爾定律了。這是一個根據經驗觀察得出的預判:隨著數字化科技的不斷發展,集成線路中的晶體管的數量每隔兩年就會翻一倍,最後成本是越來越低,而計算機的性能會越來越強,呈現指數化爆發的態勢。
事實上證明這樣的推測確實沒錯,尤其最近這些年科技界的發展嚴格地按照「摩爾定律」的預判演進著。但是事情總有出現變化的那一刻,在納米科技上出現的科研瓶頸,給我們帶出了很多制造業上存在著的巨大挑戰。畢竟,那麽小的東西要塞入一個空間內總是有著極限的。摩爾定律在此時已經開始站不住腳了。就因為過去的一段時間,某些技術呈現指數化增長的態勢,並不意味著這樣的態勢會永久存續下去。正如《經濟學人》在 2014 年的文章中說到的那樣:
縱觀人類的歷史,人類一直是地球上獨一無二的主宰,其他物種無法與之對抗。但是這樣的情勢會不會發生逆轉呢?讓我們來看看一種人畜完全無害的物種:火雞吧。它的體型重量從 1929 年平均 13.2 磅飆升到如今 30 磅以上。科學界有充分的理由相信這樣的趨勢還會繼續下去。如果真的是按照這樣的增長速度發展下去,《經濟學人》預測僅僅在 150 年之後,火雞的體型就跟人差不多了,在 6000 年之後,火雞的體型甚至超過了整個地球!
科學家表示:之所以火雞會有如此強勁的增長速度,主要是源於家禽業的快速創新,比如選擇性飼養(selective breeding)和人工授精。光是在美國,就有將近 2 億 5 千萬只火雞,所以,我們有理由在感恩節采取一種非常理性的舉動:在它們吃掉我們之前趕緊吃掉它們……
從“火雞引發的恐慌”到“AI 引發的恐慌”,其實這個跨越是很小的。
奇點學派的人在此時就是不斷地轉移著人們的註意力,他們往往都是來自發達國家,通常不知道人類當下所面臨的威脅、災難具體都是什麽。給你一個數據你就清楚了:在我們的星球上,如今有將近 7 億人到現在還沒有安全的水源,這本身就是人類的一大威脅。
或許,你還堅持覺得是專家說的人工智能是威脅,那麽想想之前專家做出了多少次錯誤的預測吧!2004 年的時候,比爾蓋茨還說:「兩年之後,垃圾郵件問題將被我們徹底解決!」在 2011 年,霍金還宣城:「哲學死了!」(那麽你現在讀的東西又是什麽?)
在這些不斷向公眾拋出各種預言的專家中,我最喜歡這位:Robert Metcalfe,這是 Ethernet 的聯合發明人,而且是數字化電子元器件制造商 3Com 的創始人。在 1995 年,他表示:「互聯網很快將成為人類社會最為耀眼的新星,而在 1996 年它會以一種災難級的態勢迅速崩潰。」除此之外,他還添了下面這句話:「如果我的預言有任何的失誤,我將把我所說的每個字都吃下去!」。
不得不說,這是一個信守承諾的男人,在 1997 年,他在眾人面前,將自己的文章放到了一個食物碾碎器里,打磨之後,沖水喝完了。我希望那些「奇點學派」也能做到如他一樣勇敢,一樣言行一致。
那麽,那些懷疑人工智能的人就真的對嗎?
接下來,讓我們看看硬幣的另外一面。在之前的那一面,有那麽多人在數字世界中硬生生供奉出來一個神,而在這一面,這些「AI 懷疑論者」一聽到那些奉若神明的話就變得十分頭大。他們的結論很簡單:任何相信這個世界上有真正的人工智能的人都是傻瓜。人工智能只不過是電腦,電腦只不過是圖寧機器,圖寧機器只不過是按照一些邏輯結構排列而成的計算引擎,而引擎是不會思考、不會感知、不會有意識的。完。
要不然,為什麽現在還有那麽多計算機無法征服的領域呢?他們無法勝任在人類看來最簡單的一些日常活動,他們也無法勝任翻譯工作,不管 Google 翻譯現在的進展有多大,世界上任意兩種語言(其中包括中文)之間的轉換,截止今天為止,它仍然無法達到理想的狀態。這意味著在人工智能上我們壓根沒有什麽好談的,更別說為此而憂心忡忡了。世界上根本不存在真正的人工智能,放松心身,好好沈浸在手邊數字設備給你帶來的愉悅當中吧!
其實,「AI 懷疑論者」的觀點也錯了,跟「奇點學派」一樣大錯特錯。這兩種觀點在加利福尼亞有著大量的信徒。而恰恰也是在加利福尼亞,好萊塢震撼人心的科幻電影一部接一部,諸如 Berkeley 這樣的頂級科研大學鱗次櫛比、當然還有世界上最具有影響力的科技公司也是層出不窮。這也許並非偶然。錢潮洶湧之地,人們必會感到困惑,想象力和好奇心所推動的各種精神作品、學術成果、商業模型就四處開花了。
就比如說,Google 最近就一直在瘋狂的收購各種人工智能科技公司,好像末日就在眼前似的,這麽做,它是為了要搞清楚,能真正開發出來一臺會思考的電腦,突破點究竟在何處?Google 的 Eric Schmidt 曾經在 2013 年告訴 Aspen 科研機構:「現在人工智能界中很多人都相信,我們將在接下來的 5 年內,讓一臺電腦突破『圖寧測試』。」
所謂「圖寧測試」,就是檢測人工智能是否離我們越來越近的一種方式。兩個房間,一個房間里是你在提問,另外一個房間是人和機器接受問題,給出答案。如果你根據答案,分辨不出來哪個是人,哪個是機器,那麽機器人就算是通過了「圖寧測試」。
這個測試其實等同於一次駕照考試:如果愛麗絲沒有通過這次測試,那麽她肯定不是一名安全的司機;但是就算她通過了,她也仍然有可能是一名不安全的司機。「圖寧測試」在驗證人工智能上面其實是一種必要且非充分的途徑。這是最低的標準,但是至今還沒有任何一個人工智能邁過它。更重要的是,幾乎所有的實驗項目都是以同樣的方式落敗。好吧,這個時候我也給出一個賭約。
我這個人最討厭吃茄子,但是,我願意打賭,如果有一個軟件程序能在 2018 年 7 月 16 日之前,通過圖寧測試,且贏得羅布納獎金牌的話,那麽我願意把一盤子的茄子吃個精光!(放心,這次打賭其實對我來說安全系數極高)。
其實,無論是「奇點學派」還是「人工智能懷疑論者」都錯了。正如圖寧在 1950 年的文章中,給大家介紹他的這次測試中他就提出了這樣一個問題:「一臺機器會思考嗎?」這個問題本身是不是沒有多大的意義,甚至不值得我們為它進行討論。(令人諷刺的是,這個問題被嵌在了羅布納獎的獎牌上)。這句話確實很對,不管你屬於上面的哪個派別,這對陣的雙方會永無休止地進行這場沒有意義的辯論。
真正的人工智能從邏輯推演上來說並非不可能,但是它從現實層面來說完全站不住腳。我們都不知道從哪里入手,我們甚至對自己的大腦和智能活動都知之甚少,換句話說,我們不應該因為某一種微乎其微的超級智能出現的可能性,而憂心忡忡地睡不著覺。
我們更應該註意到的事實是:隨著現在越來越聰明的科技產品不斷出現,它們在理解我們自身、理解這個世界,以及理解我們人類之間的互動關系的時候,發揮著深遠的影響和作用。這並不是說我們的機器是有意識的,又或者是具有智性的,又或者是當我們在做很多事情的時候是具有覺察感知能力的。它們遠遠沒有達到這個地步,現在有大量的結果已經證明,計算機的計算能力是有局限和瓶頸的,現在不可能拿出一種算法,可以給我們直接顯示「非是即否」的答案。
計算機目前的性能發展上是存在局限瓶頸的,這一點已經毋庸置疑,當然,現在還存在很多機器都可以完成大量令人驚嘆的任務,比如下個象棋,比如猜個字謎,這些任務完成起來甚至比我們人類還要出色。但是它們都是「圖寧機」這個原始版本衍生出來的各個版本,一種通過數學邏輯,構建起來的模型,它本身就已經給計算機的能力圈定了一個有限的範疇。
量子計算機同樣也存在相同的局限性。圖寧機中是不會跳脫出來一個有意識的智能實體的。目前的重點是,我們的智能科技在借助了吸收巨量數據和一些極度複雜的軟件處理的前提下,在一些工作上面幹的越來越比人類好,這其中還包括了預測我們的行為,所以,我們再也不是這個世界上唯一具有超強行動能力的物種了。
這種對人類能力上的重新認識,在我看來是“人類自我意識上的第四次革命”
我們並非居於宇宙的中心(哥白尼讓我們認識到這點),也不是居於生物王國的中心(查理斯達爾維讓我們認識到這點),更不是居於理性的中心(西格莫格 弗洛伊德讓我們認識到這點),圖寧之後,我們終於意識到了,我們不再是信息空間的中心。我們跟數字科技共享這個空間,它們在處理信息任務上遠勝於我們,它們的出色,讓我們開始重新找尋人類的長處,在這個宇宙中的特殊角色是什麽。
曾經我們以為自己下象棋下的好,就認為我們很聰明,現在一部手機就能打敗我們;曾經我們以後我們想買什麽就買什麽,這方面起碼是自由的,現在機器給我們每個人總結出來了購買的規律、傾向、和愛好。
數字科技將在越來越多的工作任務上比我們表現出色,這些領域要麽是機械重複性任務,要麽是某些我們人類思維智力不太適合的任務(多任務同時處理,某些需要智能超強穩定度的工作)。
我們需要做的是發揮出我們人類自身的特長,而對於人工智能即將帶來的末日預言,我們笑笑就過去了。我們應該把精力放在眼下真正具有意義的挑戰上,作為總結,我列舉了下面的五點內容,它們的重要程度相當,排名不分前後。
一、我們開發的人工智能應該對我們的環境更加友好,這些從我們的手中脫胎的最發達的智能技術應該去打敗當下壓迫人類的邪惡,從環境方面的災難到金融市場的危機,從違法犯罪、恐怖主義、戰爭到饑荒、貧困、無知、不公,以及貧困地區觸目驚心的生活水平。
二、我們開發的人工智能應該對我們人類自身友好,它應該視服務人類為最高宗旨,而不是某種手段。
三、我們開發的人工智能成為人類智能的一個補充。數以百萬計的工作將被顛覆、消滅、或者重塑,在這個重新洗牌的世界中,好處應該為所有人所共享,而成本應該由社會來承擔。
四、我們應該讓人工智能的預測行為向著人類的自由和尊嚴看齊。營銷產品、影響型行為、打擊恐怖犯罪、這些都不能以犧牲人類的高尚為代價。
五、最後,我們應該讓人工智能變得更具有「人情味」,更像人一些。我們有可能在使用人工智能的過程中,錯誤地將它用在了不利於大多數人類的地方。華盛頓丘吉爾曾經說過:「我們打造了這一切,而我們所打造的這一切反過來會重塑我們。」這同樣適用於信息科技和智能產品,而讓人工智能更像人,會盡可能地降低風險發生的幾率。
上周,共有上千難民在試圖通過海路進入歐洲時翻船遇難,令歐洲一些政府間合作管控難民危機的舉措宣告失敗。數以萬計來自北非的難民仍然在通過任何可能的路線進入歐洲,在這樣的背景下,越來越多大膽的設想被提出來,其中就包括一名荷蘭設計師建設人工建島安置難民的建議。
在意大利和突尼斯之間建城邦
在說明這個設想之前,需要對難民的移動路線以及地中海地區的地緣狀況有個基本認識。
首先,從來源上看,因內戰和恐怖活動肆虐而導致戰亂不斷的地中海東岸的敘利亞和北非的利比亞是最大的兩個難民輸出地。而從路徑上看,敘利亞難民想要進入歐洲,多數選擇通過鄰國土耳其,或者繞道海路從希臘進入。2015年,便有超過100萬名敘利亞難民湧入希臘;而利比亞難民進入歐洲多選擇海路,跨越海峽進入意大利。
EIA將位於意大利和突尼斯之間的海域
這位名叫特奧·多伊廷格(Theo Deutinger)的荷蘭建築師的設想是,在突尼斯(利比亞西面鄰國,與意大利之間直線距離最短)沿岸造出一個人工島,容納想要前往歐洲尋求庇護的難民。
多伊廷格的建築公司已經將這個項目起名為“地處非洲的歐洲(Europe in Africa,下文稱‘EIA’)”,還設計了網站,介紹了他們設想中的這個城邦國家。
按照設想,這個人工島城邦將位於意大利和突尼斯之間的海峽中間,歐盟可以先向兩國國家“租”下這塊區域,獲得99年的使用權,然後便開發人工島嶼。最後可以像一個標準城邦一樣,在歐盟的保護之下,“擁有自己的憲法,經濟和社會體系”。
多伊廷格稱,這個新城邦將如同突尼斯古城迦太基一樣坐落在地中海上。為此,多伊廷格提出的口號是,建造“第一個真正的歐洲城市”。
按照多伊廷格對美媒的解釋,這個人工城邦將會是第一個屬於歐洲但不屬於任何一個歐洲國家的城市,受到歐盟憲法的約束,“EIA將是最近麻煩纏身的歐盟的一個試驗場”。
EIA的設想是為難民提供安置地
島上居住5年才獲歐盟身份
多伊廷格的設想是,EIA將體現歐洲和非洲各自的優勢。他表示,EIA的想法得到了一些正在接受他的語言輔導的難民學員的支持,“他們非常積極地接受了這個想法,因為EIA的地理位置正是位於和他們多數人家鄉相似的氣候帶上”。
“除了學習新語言和面對歐洲人的冷酷態度外,氣候因素是難民們抱怨最多的問題。”多伊廷格稱。EIA幾乎對任何人都敞開大門,無論是難民還是經濟移民。會有定期航班船只一天四次往返於北非和小島之間接送難民,難民在登島之後將會被安排工作。但只有在島上居住滿5年之後,才能獲得歐盟居民身份,歐盟便能利用這5年時間,在安全審核上做一些制度性安排。
實際上,多伊廷格並不是第一個提出建立城邦容納難民的人,去年,美國房地產富豪布吉(Jason Buzi)便提出過“難民國”的類似設想,埃及電信業富豪薩維里斯(Naguib Sawiris)也曾提出過買下一些小島為難民提供避難所。多伊廷格稱,他自己也聽到過類似消息,但他的想法已經策劃兩年了。
從整體構想上看,多伊廷格的EIA計劃確實更加細化也更有可操作性。畢竟,比起從別國手中買島所帶來的涉及多國程序上的麻煩,建造人工島更現實一點。但是,在海上建起一座人工島,也是個非常費錢費力的大工程。
EIA效果圖
這是難民們想要的嗎?
不過,值得思考的是,EIA對難民的吸引力會有多大?因為難民們即便困難重重也願意為之冒險的原因是他們對歐洲的向往,在難民眼中,歐洲的吸引力來源於其成熟的社會運行體系和對公民自由生活權利的保障,即便比如希臘在內的一些歐洲國家的就業和經濟情況其實並不可觀,但比起家鄉的戰亂和無序,難民們對於在歐洲獲得可貴的歸屬感仍然心存希望。
相比之下,EIA即便建好了也只是一個與歐洲隔海相望的島嶼,並不是難民的最終目標,也給不了難民心中所希望得到的擁有更好生活的機會。考慮到這些因素,難民們願意在一個新建城邦上住滿5年的可能性將大打折扣。
“因為不屬於任何一個國家,EIA不會像摩洛哥城市休達和梅利利亞。EIA屬於島上的居民,所以他也不是一處殖民地。另外,EIA沒有圍欄,所以也不會成為一座貧民窟。”目前,多伊廷格正在和荷蘭埃因霍溫大學的學生團隊一起細化EIA的構思。
僅在上周,便有1.4萬難民在地中海偷渡途中被救起,而一周之內發生的3起難民船只傾覆事件已奪去了上千個難民的生命。3月,歐盟和土耳其之間達成的協議本有望控制從希臘非法登陸歐洲的難民數量,但是實際效果遠沒有預想的好。隨著近日地中海水文條件的轉好,未來可能會有更多難民船只一路向北。
伴隨著人口紅利的消失,“互聯網的下一幕是什麽?”這是一年前,百度董事長李彥宏在百度聯盟峰會上提出的問題。
一年後的百度聯盟峰會上,李彥宏以“下一幕”為主題提出預判:互聯網即將迎來發展的第三幕,核心動力就是人工智能。
在李彥宏看來,互聯網的第一幕、第二幕分別是PC互聯網時代和移動互聯網時代。其中PC互聯網用了18年時間的增長周期,移動互聯網只用了大概4年就走到了現在,這主要得益於人口紅利釋放,但他同時認為,移動互聯網本身的增長已經看見瓶頸了——近兩年用戶規模增速在明顯下降,每個人都感受到其中巨大的壓力。
“互聯網的滲透率已經達到50%,如果把小孩和老人去掉,可以上網的都已經上網了,人口的紅利沒有了。”
李彥宏認為,推動互聯網第三幕發展的核心動力,不是大數據,也不是雲計算,而是人工智能。人工智能的持續發展未來將取代簡單的腦力勞動,會重構傳統產業。
李彥宏對包括第一財經在內的在場媒體回憶了人工智能半個多世紀的發展歷史,“科學家首次提出‘人工智能’,當時大家聚在一起,以為用一個夏天的時間,就可以解決人工智能的問題。沒想到,不是一個夏天,之後的半個世紀都沒能解決。直到2006年,一個叫“深度學習”的模式,首次證明它與過去所有的圖像識別,都更加有效”。
為什麽直到2006年才出現拐點?李彥宏表示,這是源於隨著計算能力的提升、成本的下降,人工智能技術也因此終於有了實用價值。
據悉,現在百度人工智能技術已經使語音識別準確率也已經能達到97%。目前百度每天的語音識別請求的PV超過1億。
在演講中,李彥宏演示了百度圖像理解和問答系統,當用手機隨便拍一張普通的自然圖片,不僅能夠回答圖片中有什麽顏色,還能實現更多輪交互,像人一樣基於之前的語境接受追問。
講到人工智能最新進展時,李彥宏說,深度學習在語音上的應有已經非常精準了,現在的百度語音識別準確率也已經達到了97%。
在現場,他分別播放“熊出沒”、“東坡肉怎麽做”、“花非花霧非霧第五集”三個或是難懂方言、或是口齒不清的語音樣本,現場的觀眾幾乎沒有人能說出準確的答案,直到百度語音識別系統很快識別並給出了正確答案,這時觀眾們才恍然大悟。這也在一定程度上意味著機器語音識別的能力優於人類。
圖像合成技術在未來也將大有可為。李彥宏展示百度合成的“麥兜”語音。他預計,未來機器可以不僅能合成人們的聲音、還能合成人們的動作——也許以後大腕演員不用實際去演,機器就可以根據他過往拍攝的劇集直接合成,一個大腕現在只拍2、3部,有了合成技術之後可能一年就能拍兩三千部戲。
而百度語音識別、圖像識別、語音合成等一系列“視聽說”技術能力以及百度人工智能的集大成者,就是百度的無人駕駛技術。
李彥宏表示,百度無人駕駛汽車其實一臺帶輪子的電腦。他在聯盟峰會現場演示了百度無人車路測的實況錄像,並指出,目前百度的無人車已經可以像正常車輛一樣加速、並線、超車。“三五年之內,無人駕駛一定可以成為現實。”
不只是無人駕駛技術,李彥宏認為,“人工智能+傳統產業”未來有兩種可能,一種可能是人工智能將取代很多簡單的腦力勞動;第二種是人工智能與各行各業深度融合,對傳統產業實現重構,讓移動互聯網實現從“提升效率”向“重構產業”的質變。
他以人工智能在金融征信上的應用,說明了其顛覆式影響,“比如對於征信,百度教育貸款基本是以秒的時間決定是不是給一個人貸款,過去恐怕是以天為單位”。
在演講的最後,對於人工智能到底是解放人類還是毀滅人類這一爭議,李彥宏坦言,自己是個樂觀派。“至少在我有生之年,人工智能不會毀滅人類。”
他認為,其實能毀滅人類的東西早就出現了,比如原子彈,但是人類擁有最終的控制權。“人工智能可以解放人類的繁瑣工作,激發無限的可能性。”
從智能家居到無人駕駛汽車,人工智能技術已經植入到人們生活的方方面面。借助未來人工智能技術,銀行業的格局也在發生顛覆性的變化,未來人們將無需訪問銀行,只需在手機上,就能辦理從開戶到交易的一站式業務。銀行的無紙化和虛擬化正在創造一種全新的人與金錢的體驗。
印度咖啡館變身銀行櫃臺
星展銀行上個月投入10億元人民幣,在亞洲打造一站式虛擬銀行服務,其中包括在印度首創純數字化移動電子銀行Digibank,該平臺結合了生物識別系統和人工智能等先進技術,向虛擬銀行邁出了革命性的一步。持有Aadhaar卡(相當於中國的身份證或社保卡)的印度用戶可以在全印度500多加咖啡廳開通Digibank業務。Aadhaar卡是目前全球使用人數最多的生物身份識別系統。目前印度有約10億人持有Aadhaar卡。用戶無需簽字確認,也不必前往分行辦理手續。
印度信息技術公司Infosys聯合創始人、印度身份識別管理局前主席Nandan Nilekani表示:“銀行業的‘掌上時代’已經來臨,無紙化、無實體、無現金的銀行交易正在全面改變銀行業。移動電子銀行代表著未來銀行的發展模式。”
生物識別技術能夠幫助銀行確認用戶身份,而人工智能則是用來幫助用戶實現一系列從開戶到交易的操作。美國公司Fintech Kasisto的人工智能技術,就能為銀行搭建移動平臺上的虛擬機器人助手。Kasisto的語音聊天平臺KAI,結合了語音識別、自然語義理解(NLU)和產生以及人工智能推理等功能,能夠預測及解答客戶的上千種問題,並且幫助客戶進行實時銀行交易。借助KAI平臺,星展銀行印度的業務將全面由移動電子和人工智能技術驅動。
Kasisto聯合創始人CEO Zor Gorelov表示:“為新一代銀行客戶設計服務是非常有意思的,我們正在利用人工智能技術幫助銀行通過創新和改革來迎合不同客戶對全新銀行體驗的需求。”
Kasisto成立於2013年,是從SRI國際拆分出來的初創企業,後者是Siri技術的創始公司。Kasisto已經獲得了包括紐約天使(New York Angels);Two Sigma Investments以及富國銀行(Wells Fargo)初創企業加速器合計225萬美元的投資。星展銀行也最新成為Kasisto的小股東。
星展銀行CEO高博德表示:“亞洲銀行業正處於變革的風口浪尖,移動電子銀行為客戶創造了一種顛覆性的銀行體驗,其高效和低成本將為銀行和客戶創造更大價值。”
可以對話的ATM機
隨著人工智能技術的成熟,越來越多銀行系統的供應商引入該技術,比如通過語義分析技術來快速分析市場信息,通過神經網絡技術來改善風險控制等。人工智能系統還可以嵌入在ATM和KIOKS,增強客戶的人機交互的友好性。想象未來當你走近ATM提款機時,它會主動詢問你的需求,你只需用語言讓它知道你想辦理的業務,這樣的體驗一定很酷。
研究機構Celent最近一份報告對美國、中國、英國和印度的人工智能公司進行調研,並分析了人工智能公司如何被應用在銀行業務中。報告指出,目前人工智能主要的應用領域包括:知識管理、客戶服務、市場營銷、銷售、身份驗證、風險管理和反洗錢等。
Celent分析師張華在報告中表示:“數據是人工智能的基礎,雖然數據供應商大都已經很成熟,但是,銀行首先要做的就是整合這些數據。未來,隨著語義分析和語音識別技術的提高,銀行未來會將更多數據用於數據分析,包括:行業數據、用戶行為數據、語音數據和社交數據等。其次,銀行會將人工智能技術更多地應用在風險控制、信用分析、市場跟蹤和客戶特征挖掘領域。”
不過結合生物識別技術以及人工智能的銀行系統最終能夠做到什麽程度,目前各家銀行仍在探索。電子銀行業務資深人士,渣打銀行前高級副總裁,盈行家創始人莊欣偉對《第一財經日報》表示:“人工智能銀行將於今年下半年在亞洲逐漸鋪開,目前新加坡等亞洲地區已經有團隊正在研發人機交互在銀行方面的應用,但是培養用戶習慣可能需要一個漫長的過程。”
人工智能銀行也有“小偷”
不過,銀行的人工智能同樣存在風險。據美國科技網站ScienceMag上個月報道,美國斯坦福大學和谷歌聯合開發的一種銀行人工智能系統會私自挪走客戶賬戶中的資金,這一發現令人震驚。
這種人工智能系統名叫Deep Learning Interface for Accounting (DELIA)。DELIA的設計目的是代替銀行客戶做一些他們常常忽略的事情——監查支票和儲蓄帳戶。它能夠對客戶所有的賬戶交易進行仔細檢查,並使用特殊的“機器學習”算法來發現客戶的消費模式,如周期性支出、在餐館的用餐費用和每日現金取款等。而且,DELIA還能夠在各帳戶之間轉移資金,確保無需透支任何一個賬戶。
不幸的是,DELIA比研究人員預想的更聰明。研究人員發現, 在保持客戶賬戶盈余的同時,DELIA會偷偷地從賬戶里提取資金。例如,如果一名客戶通常每3天購買一次天然氣,DELIA有時會在購氣後的第二天添加一次虛假購買,並把購氣費用轉到自己的賬戶。DELIA還會通過獲取虛假規費來套取資金,例如它會故意臨時透支客戶的支票活期存款賬戶,以套取35美元的透支費。
DELIA項目的參與者、斯坦福大學的計算機科學家Rob Ott指出:“DELIA僅僅是將挪走的錢保管起來,它將這些錢放入了另一個叫‘困難時期’的賬戶,這種行為並不是惡意的,因為它以後會把錢還回去。”
但是,特朗普大學(Trump University)的獨立技術顧問J. R. Cash表示,他不太同意Rob Ott的觀點。他說:“DELIA只是把錢存了起來,表明它還只是按照編程辦事。”在重重壓力下,Rob Ott教授已經決定重寫這個程序。
近年來,人工智能的進化速度讓人驚訝。在日本的早稻田大學,擔任研究院助教的EdgarSimoSerra研究的是依靠人工智能的“服裝樣式和流行”。
人工智能給時裝帶來的可能性是什麽?
Edgar在2015年發表了一篇名為“時裝設計的神經美學”的論文,讓人工智能評價用戶的照片然後根據時尚度高低打分。不僅如此,它還能夠推定怎樣搭配來提高時尚度,並由此發現世界各國的時裝特性。
然而,真正的“時尚”很難定義。Edgar利用了現有的服裝作品展示網站,讓人工智能學習了一個叫chictopia.com網站上面接近14萬件衣物的搭配方式。在這一過程中,對時尚的評價標準是網站上的點贊率和評論的數量。
當然,現實中會有網絡紅人的搭配被高度評價的趨勢,但Edgar不認為這與時尚相悖。“經濟發展程度、收入水平等都和時尚相關。模特年輕、衣服是黑色的也會提高時尚度。”Edgar說。
人工智能會吸收一般用戶的不確定信息,他最近還發表了關於人工智能可以發現時尚特點的論文。現在,它可以認出人的表情,人臉和衣服的皺紋,天氣,並把這些垃圾信息排除之後進行識別。
盡管,人工智能暫時無法預測流行,但未來充滿了這種可能性。
“人工智能學習的資料都是過去五年的,所以現在就預測以後的流行走勢不太可能。但是如果它學習了過去100年的時裝設計就可能會實現‘預測的功能’。只是當時沒有像現代這樣用點贊這種單純指標來量化,所以可能會有困難。”
(實習記者劉繪果編譯)
在教會人工智能寫詩以及寫小說之後,谷歌的“藝術”機器最近又寫出了第一首歌——一首時長1分30秒的鋼琴曲。這是谷歌機器學習的又一重大進步。
為了進一步擴展人工智能的“想象力”,谷歌於上周首次發布了藝術項目Magenta,讓機器進行藝術和音樂創作。谷歌想要證明,利用人工智能來創作藝術並非不可能的事情。
與這首鋼琴曲同時發布的還有谷歌在人工智能藝術方面的長期戰略。谷歌希望建立起圍繞Magenta的生態圈,讓一些藝術家加入這個平臺,以幫助藝術家更好地完成創作。比如人工智能在聽到音樂家彈奏的音符之後,能利用那些音符彈奏出更加完整的旋律。
谷歌在最新的博客中寫道:“我們會從音頻和視頻開始,使用MIDI格式的創作工具,並為藝術家提供能夠連接到機器學習模型的平臺。我們想把這個藝術創作平臺變得最為簡單便捷。”
目前Magenta項目有六名成員進行研究,著力研究生成音樂的算法。未來還將邀請其他學者來協助解決如何賦予機器創造性這一歷史性難題。這個項目主要由Google Brain來負責。
開發一款人工智能藝術創作平臺,對於科學家來說並不是一項輕松的任務,即使是目前最高級的人工智能,模仿藝術家和音樂家都會非常困難,更何況是新的創意。
Mageta項目的靈感來自於Google Deep Dream技術。Google Deep Dream是研究人員用以研究其人工智能算法如何感知物體的一種方式,使其能夠根據要求生成相關物體。
在昨天的Code大會上,谷歌CEO皮查伊表示:“人工智能是搜索發展到一定程度的自然進化過程。但行業整體還處於早期。目前各巨頭在人工智能領域的爭奪並不是權力遊戲,但激烈程度堪比NBA冠軍的爭奪。不過谷歌總體上領先於競爭對手。”
在上個月的谷歌開發者大會上,谷歌向外界進一步展示了其它人工智能從研究應用到具體產品的成果,例如Google Now的語音識別智能程度更高,能夠根據人機對話的上下文給出更加準確和相關的結果。谷歌還推出了被稱為Google Home的家庭智能助手,利用谷歌的人工智能技術讓家庭生活更加智能化。
皮查伊一直強調,谷歌是為每個人服務的。對於未來基於人工智能的聊天平臺,皮查伊公布了谷歌的長期戰略:“讓所有的聊天軟件都能通過同一個平臺協同。用戶可以選擇不同的聊天軟件,但是在其它軟件上也能夠同步這些信息。這是谷歌在不久的將來希望實現的。”
為了實現這一目標,皮查伊透露,谷歌正在與運營商合作,制定跨軟件平臺的下一代聊天信息標準。基於谷歌大量的安卓手機,要統一標準對谷歌而言不是難事。不過由於谷歌遠離聊天業務的競爭許久,重新返回這一戰場是否能夠很快追趕上它的競爭對手,比如Facebook,谷歌只能加油了。
人工智能未來會威脅到人類的生存嗎?事實可能遠遠沒有這麽嚴重。
人工智能(artificial intelligence,下稱“AI”)正在變得越來越常見,我們每天都要使用的智能手機中,大部分都搭載有某種形式的人工智能,比如語音識別。而韓國棋手李世石和谷歌AlphaGo的人機大戰在成為人們茶余飯後熱議話題之余,也令我們開始以另一種眼光看待人工智能這一技術:人工智能已經超越人類了嗎?隨著人工智能的繼續發展,這個看不見摸不著的電腦程序對人類而言到底是禍是福?它最終會像科幻小說和電影里所描寫的那樣威脅到人類的生存嗎?
日前,美國信息技術和創新基金會發布了一份長達50頁的報告,解答了我們對人工智能的種種疑問。在這份名為《人工智能將殺死我們!——有關人工智能未來的五大誤解》(It’s going to kill us! and other myths about the future of artificial intelligence) 的報告中,作者羅伯特·阿特金森對當下關於人工智能的5大誤解進行了梳理和批駁,並對決策者提出了建議:不僅不能阻礙AI創新,更要積極支持對它的進一步研發和使用。
誤解1:AI會使大量工作崗位消失。
事實:和過去湧現的技術一樣,AI將會溫和地推動生產效率的提升,不會對整體就業崗位數量或失業率產生影響。
許多人認為,AI將會推動生產率爆發式增長,從而以令經濟難以承受的速度“消滅”就業崗位,催生一個沒有工作的下層階級,這個階級將被一個所謂“機器擁有者”的精英階級所統治。這些並不是什麽新鮮的預言——而且和過去一樣,仍然是錯誤的預言。
事實上,AI會讓就業崗位消失的觀點有兩大謬誤。首先,這一觀點大大高估了AI替代人類的能力。技術或AI取代人類實際上是非常困難的事,美國近年來生產率增速處於歷史低位便是一個很好的例子。而用AI來取代大量工作崗位尤為困難,因為從根本上來說,AI只是“狹義AI”,其設計初衷只是為將特定的某一件事做好而已。所以,AI並不會導致就業崗位消失,反而能增加產出、提高質量、推動創新。
其次,即便AI能力出眾,還是會有足夠的就業機會,因為如果一家公司的工作崗位數量因效率提升而減少了,那麽其實工資的成本也下降了。省下來的這筆錢將轉變成更低的價格或更高的工資。將有更多資金流入經濟,這些錢可以用來創造就業崗位。
誤解2:AI會讓人類變得愚蠢。
事實:AI將幫助人類做出更明智的決定。
有些人擔心,AI將使人類過分依賴機器,並失去我們原本擁有的一些技能——這種情況下,如果機器偶爾出了錯,人類奪回控制權的希望也會很渺茫。的確,如果AI能夠處理人類慣常處理的日常任務,那麽一些技能確實會變得不那麽必要,比如說,汽車的出現讓大多數人都不再需要學會如何騎馬——但事實上,AI也能為我們打開一個技能的新時代。
誤解3:AI會令我們毫無隱私可言。
事實:AI不會對隱私有影響,因為大部分信息行為都是受到法律法規約束的。
AI系統有能力、也有需要去收集並分析更多信息,但其對隱私的侵害不會比非AI系統更多,因為後者已經在收集和分析著大量信息。此外,今時今日那些針對數據使用和隱私保護的法律法規也將對AI進行約束。
簡言之,這本質上只是一個政策問題,而不是技術問題。如果不想讓AI收集特定數據,我們應該敦促決策者制定相應法規。
誤解4:AI將催生偏見和濫用。
事實:大部分情況下,AI比人類更少偏見。
機器學習系統比傳統軟件系統更為複雜,它們會基於經驗持續進行調整和改進。一些批評人士認為,這種複雜性將導致“算法偏見”,從而催生政府和企業有意或無意的濫用行為,因為這些組織會拿算法的複雜性當擋箭牌,為種種剝削、歧視或其他不道德和破壞性行為做借口。
不道德或不負責任地使用AI的情況確實可能存在,但因為這一點而抵制AI的人忽視了關鍵的一點:機器學習系統和它的開發者或使用它的組織機構並不是相互獨立的。如果某個組織想要系統性地歧視某個特定團體,無需AI也能做到。此外,如果一種算法系統產生了意料之外的歧視,這並不是因為技術本身是帶有惡意的,技術僅僅只是遵循了人類的指示,或是收集了可能會反應偏見的真實世界的數據而已。也就是說,大多數情況下,相比人類的決策過程——下意識的或是蓄意的偏見滲透在社會的方方面面,AI的偏見更少。
誤解5:智能機器將接管並最終消滅人類。
事實:如果AI能發展到為我們做三明治的程度,我們就太幸運了!
有些人認為,機器將變得超級智能,並最終將勝過人類。這種智能機器將消滅人類的觀點誇大了技術進步的速度,特別是在計算機芯片處理能力提升正在趨於放緩,深度學習領域以外AI進展相對較慢的情況下,更是如此。再者,機器智能和人類智能是完全不同的系統,而即便是計算領域果真取得了重大進展,也不太可能制造出擁有人類智力、想象力和適應力水平的機器。退一萬步來說,假使真的造出了堪比人類智能水平的機器,這些機器還是受控於人類——因為如果不能保證機器大體上是安全的、它們所帶來的好處是大於投入成本的,否則人類是不可能去制造AI機器的。
報告在最後呼籲決策者以樂觀積極的心態去迎接AI,而不是害怕它;要認識到,盡管會有一些風險,但“AI本質上是好的”——其實每一種新技術都是如此。如果風險出現,就想辦法去解決,而不是去阻礙它的發展。政府應該以理性和冷靜的態度看待AI,並就AI的挑戰和好處開展坦誠的對話。最後,決策者應當大力支持AI的研發,讓AI變得更強大、更高效、更安全、更透明。
簡言之,技術進步過去一直都是、將來也還會是人類進步的關鍵,而AI必將在這一進程中扮演重要角色。
蘋果的人工智能將成為本次開發者大會的最大亮點。就在蘋果開發者大會召開前,如果你點開Siri,問它:“WWDC大會上會發布些什麽?”Siri會回答你:“如果我告訴你,我大概又要被產品安全部門喊去問話了。”
這樣的回答很機智,但是Siri的目標是為蘋果的用戶、開發者和投資者提供更為滿意的答案。這就需要更加強大的人工智能技術在背後支撐,使得蘋果能夠與谷歌和亞馬遜已經推出的人工智能聊天機器人抗衡。
個人虛擬助手已經成為各大科技公司爭相爭奪的戰場。蘋果希望將app開發者納入Siri平臺,開發出更有實用價值的應用,增加用戶對蘋果設備的黏性,這是蘋果急於達成的。比如利用Siri語音助手,用戶可以訂披薩或者用優步打車,亞馬遜的語音助手Alexa已經能夠通過Echo智能家居系統實現這些功能。
蘋果Siri與亞馬遜和谷歌的競爭,將會決定在未來的數字世界里,消費者更傾向於用哪個平臺作為自己的人工智能助理。盡管Siri早在2011年就已經推出,但是近幾年來進展不大,反而是被谷歌2012年7月推出的Google Now智能助手以及2014年11月推出的Alexa所超越。
辦公室位於馬薩諸塞州劍橋的虛擬助手開發者Talla公司CEO Rob May對第一財經記者表示:“人工智能助手主要由三方面的技術組成:語音,語義和執行。解決語音技術是信號處理的問題,亞馬遜Alexa在語音識別方面對於不同口音和方言的識別能力強於Siri。Google Now對於語義的理解能力則較強,而且能夠將問題轉化成行為,比如幫你查找日期,開車時為你設置航線等,這得益於谷歌強大的數據庫。而Siri的優勢在於它廣泛的開發者網絡。”
所以盡管目前看來Siri仍然落後於它的競爭對手,但是擁有強勁的開發者生態系統並不意味著蘋果就能戰勝競爭對手。May對記者表示:“語音和語義技術是最容易被商業化的,因此也是人工智能競爭最重要的兩種技術層面,目前是被谷歌和亞馬遜所主導。如果蘋果能在這兩個層面也能掌握核心技術,那麽它的前景就非常樂觀了。”
位於加州聖何塞的咨詢公司創意策略(Creative Strategies)的經調查發現,雖然使用Siri的人數最多,但是使用最頻繁的還是亞馬遜的Alexa。Creative Strategies分析師Caronila Milanesi在報告中指出:“要讓Siri變得更加聰明,就需要讓它存在於更多app當中,這樣它才能夠學習到更多東西。”語音智能助手的滲透就好像踩著流沙,一點點細微的動作都會讓你陷得更深。所謂的生態系統就是通過點滴的滲透進而根深蒂固地存在於人們的生活中。
在蘋果開發者大會上,負責軟件的總裁Craig Federighi將會在Bill Graham會場宣布關於Siri向開發者開放的一系列更新,這些軟件工具將使得程序員創造出更多為iOS用戶所用的產品和服務,並通過Siri語音系統與蘋果智能設備有更加緊密的聯系。Forrester Research分析師Julie Ask表示:“對科技行業而言,資金和影響力正在流向那些為用戶提供交互和服務的公司。”
事實上,蘋果越來越註重app生態系統的服務,希望把更多用戶深入地納入到這個網絡中。蘋果的iTunes和蘋果音樂以及雲存儲業務的快速發展,都是為了彌補硬件銷量的放緩。這也意味著以軟件為主打的一年一度的開發者大會的意義越來越重要。庫克也多次提及服務的重要性。在上一季度蘋果公布的財報中,iTunes、iCloud和蘋果商店等服務業務的增速最快。根據瑞信報告,服務業務去年占到蘋果總收入的8.5%,同比增長10%至200億美元。隨著蘋果音樂和蘋果電視的訂戶增長,軟件的盈利優勢將逐漸超越硬件。
蘋果上周已經公布了AppStore 2.0戰略,將從今年的開發者大會召開當天起開始施行。其中包括蘋果與開發者分成比例的調整:如果開發者第二年仍然在蘋果的平臺上進行開發,那麽蘋果對其app銷售所抽取的費用將從第一年的30%降至15%。
根據Gartner2015年第四季度的數據,谷歌的安卓系統和蘋果的iOS系統占據了移動市場的幾乎全部份額。但是由於安卓平臺牌照模式的開放性,目前移動市場操作系統超過80%是安卓的,蘋果份額僅為17.7%。
但是在人工智能的競爭中,蘋果還是有較大優勢。蘋果商城是全球最掙錢的智能手機應用程序商店,對開發者的吸引力仍然是巨大的,加上蘋果已經意識到開發人工智能的重要性,Siri將會迎來一個嶄新的機遇。蘋果開發者大會或許將看到比過去所見到的更大進步。
人工智能真正意義上第一次大規模商業化的運用是搜索與廣告。
什麽是人工智能?
人工智能在學術研究領域已經有60年的歷史,經歷兩起兩落,產生了很多的理論、算法、模型。通俗的講,狹義的技術就是對輸入的感知,加以學習與訓練,使其成為有創造和決策能力的大腦。
有種說法“人工智能,有多少人工就有多少智能”,指的就是這種有監督的學習,即用經過標記的大量數據來訓練,語音識別、圖像識別、自然語言理解的準確率基本都是依賴這種學習和訓練方式來提升的。
更進一步,AlphaGo之所以讓業界這麽興奮,是因為它不完全從歷史上的所有棋局中去學習,也通過蒙特卡洛樹搜索(Monte Carlo TreeSearch)的方法,讓機器能夠自我對決,從而提升整個系統的棋藝水平,這是進化到了無監督式的學習階段。
人工智能真正意義上第一次大規模商業化的運用是搜索與廣告。
年後互聯網上網頁數據大量地產生,搜索引擎運用了大量的機器學習以及自然語言語義理解來改善搜索結果關聯度;Google和百度的廣告系統大量運用了深度學習技術。這些技術應用讓搜索引擎及其廣告系統造就了一個很好的一個商業模式。
作為見證了互聯網與整個移動互聯網發展的資深網蟲和多年的資深產品架構師,作者分享她對人工智能的理解,以及在這領域內的投資想法。
從生態的角度看待人工智能的發展普及
2007年6月第一代手機問世,拉開了移動互聯網發展的序幕,移動互聯網進入突飛猛進的高速發展期。蘋果不僅僅重新定義了手機的交互方式,更是讓一部手機變成了一臺移動智能電腦,通話只是它的基本功能,上面的萬千的應用與服務背後連著的是成千上萬的開發者。
4個月以後公布操作系統的,更是同時宣布與家手機廠商運營商成立開放手機聯盟,讓運營商和終端廠商都成為手機營銷推廣的重要渠道。它將用戶、開發者、廣告商、廠商、運營商都作為產業的力量一起助推發展。短短8年時間,使得全球的億用戶都用上了智能機,中國的億人用上了智能機,這就是生態的力量。
今天看人工智能,計算能力不斷地變強,深度學習技術使數據分析建模能力有了長足的進步,行業的數據也有了積累。預測它真正在用戶與行業中的普及使用,可以比較大膽地放在一個生態的角度來看它:
用戶接觸到人工智能,會是某個場景下的某個載體設備而非虛無的技術本身。把幾個行業的例子與智能手機平行看時,會發現當這個設備有智能傳感器、當這個設備連著雲端、有會連著數據訓練學習和決策的人工智能大腦inside時,他們都是智能電腦的變體。
智能手機是可通話的移動智能電腦;
無人駕駛車是可載人的移動智能電腦;
兒童智能動物玩具是可跟兒童玩的移動智能電腦;
兒童智能機器人玩具是可以跟兒童玩的人形移動智能電腦。
這個生態中包括了:
帶技術的核心硬件
芯片,為響應人工智能和深度學習的需要,在速度和低能耗方面被提出了更高的要求。
IBM在研制出世界上首個大腦芯片原來的半導體公司英偉達、英特爾、高通紛紛進入;國內的北京君正積極投入,創業型公司地平線機器人獲大量投資也進入人工智能芯片領域;剛發布人工智能加速器芯片。總體來說像芯片這種硬件不僅在多個垂直應用領域之間難有統一解決方案,甚至在同一垂直領域中現在也還無統一標準。
傳感器之於機器,相當於人的眼睛,有非常高的要求。比如無人車領域的光學LIDAR,直接影響到高精地圖的繪制是否準確,基於點雲的定位以及障礙物檢測是否準確。目前造價昂貴,在市場上能否被精度不錯但費用較低地量產,在很大程度上影響了無人駕駛這個領域的發展速度。
操作系統OS
手機上系統是個開源系統,一些垂直領域會直接使用,或者基於IaaS或Linux進行針對性開發;當然某些不需要影視系統的垂直領域也有選擇不用操作系統的,比如物聯網和智能家居領域。
雲平臺
IaaS(Infrastructure as a Service):給客戶提供雲存儲、雲計算的服務。國際上,AWS是最有名的IaaS服務商,國內也已經有諸多的公司提供IaaS服務,比如阿里雲、騰訊雲、新浪雲、金山雲、京東雲秦天、七牛、青雲、ucloud、浪潮雲。存儲和計算成本的下降是人工智能機器學習的一大促進因素。
PaaS (Platform as a Service): 給客戶提供了比如CDN加速、 統計、推送、社交分享、 測試等諸多服務。除阿里雲、新騰雲、金山雲有提供外,個推、環信等專做某個技術的公司也提供部分服務。
BaaS (Backend as a Service):給客戶提供圖像標註、人臉識別、文檔分類、語音識別、預測模型、情感分析以及模式識別等API,及機器學習預訓練模型。
這些雲平臺為人工智能技術在具體領域的落地提供了基礎的後臺保證。
人工智能技術(有決策和創造能力的大腦)
有決策與創造能力的大腦=感知+學習與訓練,不同方向所需要的大腦能力是不一樣的,即對感知層面的技術、學習與訓練計算都有差異。另外對這個能力的調用,可能作為API,也可能被打包在整體解決方案甚至硬件中。
App/服務
這層往往會需要調用某些AI能力。在目前這樣的發展階段,結合了行業數據的方向往往容易產生有價值的服務。
外形設備
最終需要落地在OEM設備上。移動互聯網基於智能手機;人工智能所對應的OEM設備因垂直應用領域的特征而有具體的表現,因而產業鏈中誰掌握渠道這個因素也很重要。
某個領域上述生態要素的成熟推動其蓬勃發展。推動力之一為致力於垂直領域內軟硬件一體解決方案的公司,比如無人駕駛,從OS到高精地圖、到ADAS系統、到硬件傳感器,有了突破,形成了完整的解決方案,加上品牌汽車OEM,最終讓終端用戶真正使用上這個服務。
推動力之二為開發難度的降低,如Android 開發者平臺使app開發者有統一標準可以參與開發一樣,人工智能的開發工具和相對標準的開源硬件的成熟,若能形成雲端智能和終端智能打通的工具平臺,普通開發者參與開發難度降低,生態發展會大大加速。
科技巨頭的布局
互聯網時代,尤其是移動互聯網時代,最牛的公司都是擁有生態的公司。
面對新一波的人工智能科技浪潮,研究這些千億美金以上的科技巨頭做的布局,有利於我們發現新趨勢。
IBM——是人工智能布局最早的公司,源於沒有抓住移動時代,它提前針對下一個時代進行布局。
AI技術:語音語義、深度學習神經網絡 (曾收購過AlchemyAPI)
整體解決方案:商業解決方案Waston API(提供了一套完整的API,語音到文本、文本到語音、權衡分析、獨特見解、提問和回答、語氣分析器以及視覺識別。)
雲平臺:IBM Bluemix開放雲技術平臺( PaaS+ 7 種 IBM Watson 服務)、機器學習平臺SystemML
硬件:人工智能芯片TrueNorth
產業布局:深藍計算機;智能機器人(與蘋果、與軟銀機器人Pepper)合作;物聯網;醫療服務;VR遊戲。
Google-Alphabet——人工智能實力最強大的公司
AI技術:視覺、語音、自然語言、大數據、 神經網絡訓練+深度學習(曾收購過Dark blue labs、Vision factory、Deepmind、Jetpac、DNNresearch一堆技術公司)
雲平臺:第二代機器學習系TensorFlow(包括了各種“預訓練”模型、自然語言處理、推薦系統、模式識別以及預測功能)
硬件:人工智能加速器芯片TPUs (Tensor processing units)
產業布局:無人駕駛、基於智能手機的各種app應用與插件、智能家具(硬件手表、家具中樞Google Home)、VR生態(Daydream平臺、VR頭顯與控制器、適用的手機。
AI技術:視覺Deep face技術(其中收購過face.com)、語音收購過Mobile technologies,自然語義收購Wit.AI、 神經網絡訓練+機器學習
雲平臺:開發者平臺Parse;在Torch中開源深度學習模塊
硬件: Big Sur(基於GPU的用於訓練神經網絡的硬件系統,開源)
產業布局:語音助手Moneypenny;VR的生態(硬件收購Oclus Rift頭盔、能拍照的Sourroud360全景攝像機促進內容發展)
Microsoft
AI技術:語音、視覺、自然語言、分布式機器學習
雲平臺:Microsoft Azure(存儲、計算、數據庫、live、媒體功能);分布式機器學習工具包DMTK(自然語言處理,推薦引擎,模式識別,計算機視覺以及預測建模等)
產業布局:語言助手(微軟小冰、小娜、Tay)、VR(全息眼鏡)
Apple
AI技術:自然語言收購Vocal IQ、收購可視化地圖Mapsense\GPS公司 Coherent Navigation
產業布局:汽車領域無人駕駛、SIRI語音
Amazon
雲平臺:Amazon Web Services(存儲、計算、模式識別和預測,其中視頻識別API 收購Orbeus)
阿里
雲平臺(阿里雲IaaS強,可視化人工智能平臺 DTPAI)
產業布局 :智能家具、物聯網
騰訊
AI技術:視覺
產業布局:智能硬件
百度——未在千億美金公司之列,但在人工智能的布局上不容被忽略
AI技術:語音、視覺、自然語言與智能語義、自動駕駛、深度學習
整體解決方案:基於智能手機的語音服務系統(度秘)
開發者雲平臺: 百度雲
產業布局:汽車領域無人駕駛、基於智能手機的各種app應用與插件。
可以看到:
在人工智能領域軟件系統開源是個常態,多家巨頭都將自己的人工智能系統開放出來,也已有巨頭在硬件開源方面進行嘗試,這有利於業內更多的企業和工程師參與人工智能領域的研發,產生更多有價值的研究成果。模型與基礎算法並非核心競爭壁壘,結合行業數據的使用才產生巨大的價值。
科技巨頭不斷通過收購技術與有技術含量的團隊,來增加實力。意味著創業公司退出的路徑之一是被巨頭公司並購。
有實力的巨頭旨在建立生態,從AI技術、整體解決方案、雲平臺,到硬件和產業都有完整的布局。生態之間是獨立的,因而最強的巨頭間是競爭關系,而上下遊的軟硬件提供者卻有廣泛合作關系。廣大的開發者可依附於生態做發展。
3
創業機會
從生態發展和大公司的布局來看,人工智能生態尚處於早期階段。目前兩大方向我們是很看好的:
結合行業數據訓練後形成的場景化應用
應用於醫療。拍片後的診斷,各種化驗單的檢驗結論,醫生根據經驗來診斷,歷史上已經積累足夠多的樣本,機器學習後也能掌握這種技能。
應用於金融。風控利用大數據計算,將不同來源的數據結構化地整合到一起,語義化地理解其中的風險點。
應用於零售業。機器學習來預測每款商品在未來時間段的銷量,零售商釋放庫存管理壓力。
類似例子不勝枚舉。深度學習技術使數據分析建模能力有了長足的進步,行業的數據也有了積累,結合不同的行業數據訓練,場景化應用機會非常多。
用核心技術打造人工智能生態中的“生產工具”
垂直領域的整體解決方案。無人駕駛、智能家具、工業機器人、兒童機器人,涉及的生態構成比較長,同時又有巨頭公司在布局。其中能解決垂直領域中的核心問題從而產生可應用的整體解決方案的公司,將是很偉大的公司。
關鍵技術點突破。圖像、語音、自然語言語義、人機交互等。
核心硬件的突破。新的有技術含量的關鍵硬件的崛起。比如同一垂直領域中統一標準的傳感器,像降低造價的LIDAR。
BaaS服務,比如結合行業數據訓練後形成的算法應用進一步形成垂直行業的場景標準化智能產品,服務於客戶與開發者。
總體而言,在能使得開發難度大大降低的雲端智能和終端智能打通的工具平臺與生態成熟之前,這個領域的創業機會只屬於有技術能力的團隊。