📖 ZKIZ Archives


王小川:人工智能的弱點還有很多

“科學上每走出一步,你發現前面還有十步不了解,見得越多發現不懂的更多。”搜狗CEO王小川在烏鎮向《第一財經日報》記者回憶他早年研究基因學的感受——每過幾年的重大發現都推翻了之前的結論。他覺得人工智能也是如此,在談到的無人車等現有AI產品時,他會用“不太靠譜”來評價。

這似乎有點潑冷水的意思。剛剛感慨“人工智能在烏鎮大會上火的一塌糊塗”的小米董事長雷軍說,中國互聯網正在從模式創新進入技術創新階段。普遍看來,技術創新過去一直是矽谷的代名詞。但目前在國內,BAT均在人工智能領域進行布局,連業務相關度並不算高的網易創始人丁磊也在潛心試水。

在清華讀書時就學習人工智能的王小川說,AI不是表面上那些酷炫的東西,真正的方向是讓機器做決策,具備人的推理能力,但現在看,還沒有誰能做到。“算法結構上的創新發明都是國外的,國內只不過看誰先把這些國外論文翻譯過來,最快用到應用中去。”在他眼中,國內外在人工智能上的差距還是很大的。

冷眼看AI

今年3月份,谷歌AlphaGo戰勝人類棋手時,王小川給公司放了一天假,慶祝人工智能的歷史性突破。放假那天是周一,這件事很快成為互聯網圈的談資,這一天還被戲稱為“狗勝節”。背後是這個38歲的“四川神童”對人工智能的執著。

3個月過後,王小川來到英國倫敦拜訪DeepMind公司(谷歌母公司Alphabet所擁有的英國AI公司)的工程師,問當時機器輸掉第四局棋時究竟發生了什麽?“不是程序有BUG,就是深度學習本身有瓶頸。”但對方用了3個月去複盤,仍沒有給出解決的答案。這給王小川留下一個深刻的印象,深度學習還是存在瓶頸的,未來AlphaGo會繼續出錯。

他拿無人車向記者舉例,以今天的技術,無人駕駛確實可以在它熟知的、較封閉的環境下應用,但在面對真正開放的環境時,人類的技術仍不狗安全。“這個場景只要它沒見過,可能就會犯嚴重的錯誤,就像AlphaGo下棋一樣會突然發瘋。”

互聯網大會上,百度的十幾輛藍色無人車在烏鎮路面上“秀肌肉”,這是國內無人車第一次在城市道路上測試行駛,但出於監管與安全方面考慮,這條3公里長的道路是事先劃批的,但並不限制社會車輛通行。谷歌的無人車已經在路面上跑了五年,但遇到像極端天氣、前車突然變道等複雜路況時,仍難以精準地自動調整。規模化商用還很漫長。

就連自家發布的AI產品,王小川也透露出謹慎的態度。當時,他在烏鎮主持了一場匯聚海內外人工智能專家的移動互聯網論壇,他演講時,大屏幕上實時顯示出演講內容的中英文對照文字,本來帶著同聲傳譯耳機的斯坦福大學客座教授傑瑞·卡普蘭等老外摘下耳機,看屏幕上的文字理解。但不知是否出於緊張,王小川竟然忘了在臺上發布這款機器同傳產品,而這是全球首次基於神經網絡的實時機器翻譯技術在大型活動上做展示。

臺下,他一邊自責自己“邏輯好,記性差”,一邊針對這項技術對本報記者分析說,這就像火箭上天,不是每一次發射都能成功。因為實時處理對後臺算法模型的要求非常高。這個過程首先要求機器準確識別語音,一旦語音識別成文字這一步出錯了,後面的翻譯就更是差之千里。在他看來,在技術上第一步的語音識別比翻譯更難。

除了搜狗,阿里雲、百度、科大訊飛等公司也在公開場合展示過實時語音識別,並均對外聲稱對中文語音識別的準確率達到了97%左右,但實際也出現過“演砸了”的時候。如果場景並不像會場那樣有序,或者演講者有較重的口音,現在還沒有一家公司敢將語音識別技術公開拿出來測試。

不只是輸入法的爭奪

目前,搜狗、百度、訊飛是第三方手機輸入法活躍用戶數的前三名,三家在語音識別上的多年布局,正在將手機輸入法帶進一個比拼人工智能水平的新階段。事實上,早在蘋果發布iPhone 4S手機時,就隨機發布了人工智能Siri,但從這兩年實際使用反饋來看,Siri尚沒有達到用戶對這個智能機器人的期待。而微軟、谷歌、亞馬遜三家公司在該領域被看好。

王小川判斷,人工智能有兩個方向,一是虛擬體驗,像戴著VR頭盔看視頻、玩遊戲等與娛樂相關,將視頻、音樂、小說等帶向虛擬;另一個是機器智能,未來更多的是商業應用。這也是搜狗在人工智能的布局方向,與同為搜索出身的百度一爭高下。百度總裁張亞勤在烏鎮峰會上說,搜索是使用人工智能時間最長的領域,人工智能的突破需要更先進的算法、超計算能力和海量數據。

王小川拿出自己的手機,向第一財經記者演示了一款尚未發布的輸入法測試版本。在輸入框里鍵入中文,輸入法會實時翻譯出英文,作為待發布項;或者按住屏幕說一段語音,系統實時反饋一段對應的英文語音。這樣就解決了與老外實時聊天的問題。從現場實際測試來看,翻譯的準確性很高,對於隨口而出的一句話中出現的“牛X”一詞,系統可能給出“great”(很棒)的翻譯。

在科幻小說《銀河系漫遊指南》中有一種叫“巴別魚”(babelfish,取自和人類不同語言相關的巴別塔故事),能在任何語言之間做實時翻譯,如果這種魚可以作為一款人工智能產品存在,相當於每一個人都可以用母語與世界上任何一個地方的人進行交流。

谷歌翻譯近日取得的技術突破正朝著這個方向邁進。谷歌在一片論文中揭示了Zero-Shot翻譯,即便機器從未進行過日韓語言間的互譯,但它可以憑借之前完成的韓英、日英翻譯訓練,自動學習並進行日韓語言間的翻譯工作,也相當於有望解決谷歌神經機器翻譯系統擴展到全語種的難題。但對於巴別魚的設想,谷歌大腦工程師陳智峰認為,這離實時的語言翻譯還有一定距離,未來三到五年可能會有一些突破。

“未來會自己做一款硬件嗎?”王小川思考片刻搖搖頭,盡管自己做硬件對於用戶數據反饋的回流掌控力更強,但他堅持更可能會通過合資形勢進入硬件市場。搜索就是在幫助人們獲取信息,而輸入法則在幫助人們進行表達。他專心於怎樣通過人工智能讓這兩種行為變得更簡單。

PermaLink: https://articles.zkiz.com/?id=224604

Next Page

ZKIZ Archives @ 2019