ZKIZ Archives


在阿爾法狗完勝之後,谷歌AI“偷”走了人聲

在上海工作的王勇(化名)近日接到一則推銷電話,“賣車險的”。他剛好不忙,於是很紳士地跟這位推銷員小姐聊了一會兒,解釋了一下自己的情況不需要車險了。末了還跟她說了聲“謝謝”。

但是這個看起來普通的電話很不尋常。

在掛掉電話後,王勇收到了一則短信,險些昏厥。短信內容如下:“你好,我是剛才給你打電話的電銷機器人小三,我們公司的聯系電話是XXXXX,歡迎後期來電咨詢。”

時代不同了。你可能被人工智能(AI)騙過,未來你也許也可以用AI去迷惑別人了 。有這樣一個機器人“小夥伴”,它可以代你向餐廳打電話預訂座位;還能冒充你跟熟人調侃、替你回郵件。

這一切正在發生。當地時間5月8日,谷歌I/O開發者大會在美國加利福尼亞州山景城召開。這家矽谷科技巨頭再次強調了AI先行的戰略。

在這次開發者大會上,谷歌不僅展示了功能更加強大的語音助手Google Assistant,還發布了第三代人工智能TPU(張量處理器)芯片,它的前輩就是“阿爾法狗”在圍棋界所向披靡的“秘密武器”。由此,谷歌一方面與人工智能芯片巨頭英偉達的GPU(圖形處理器)形成競爭,另一方面也意在挑戰微軟和亞馬遜雲。

一句“嗯哼”脫口而出

谷歌CEO桑達爾·皮查伊在會上演示了事先錄好的兩段語音對話,分別是語音助手代替人類預約理發和預訂餐廳的。

比起傳統的對話語音機器人,使用谷歌Duplex AI語音系統的新助手要人性化得多,它不僅能夠和人類進行多回合的對話,而且還自帶語氣詞,聽起來相當逼真。

在第一段女聲版機器人顧客和理發店店員的對話中,機器人顧客的一句“嗯哼”以假亂真,與人類使用英語對話的語氣十分相似,而且機器人也不再局限於僅僅以“是”或者“不是”簡單地回答提問,而是會與人類進行談判和商量,最終達成了一致,完成預約工作。

在另一段男生版的機器人顧客和中餐店服務員的對話中,機器人不僅能夠聽懂帶口音和不規範的英語,而且還會在對話中進行即興發揮,讓雙方的交互變得更加“優雅”而自然。比如當餐廳服務員告訴顧客當時“不用等位”時,機器人顧客人性化地追問道:“那麽一般情況下,等位需要多久?”

皮查伊沒有透露這項服務何時能夠讓用戶使用,不過表示從今年夏天起就將進行公測。

值得註意的是,在《愛樂之城》中客串樂手的美國著名歌手約翰·傳奇(John Legend)的聲音也將被谷歌助手采用。包括他在內,谷歌目前已經擁有六種不同的人聲。

皮查伊在大會上表示:“谷歌的語音合成系統Wavenet的模型,是基於原始的音頻來創造出更加接近人類、更加自然的聲音,包括音高、語速以及停頓等。”

這項技術如果普及,或許意味著未來商家接起顧客的電話時,將很難分辨究竟是真人還是機器人在向自己咨詢提問。

中國的人工智能企業出門問問創始人兼CEO、谷歌前工程師李誌飛對第一財經記者表示:“這種場景雖然有點聳人聽聞,但是與谷歌的競爭對手如以網絡書店起家的亞馬遜相比,谷歌在最底層的核心技術以及把技術打磨、做細做精方面絕對是‘一騎絕塵’的,這主要受到公司的工程師文化以及強大的研發隊伍的影響。”

參加完谷歌I/O大會的一位中國開發者對第一財經記者感嘆道:“我已經分不清自己是身處現世或是未來。“

芯片雲端齊發力

谷歌的策略已經從“人工智能優先”(AI First)全面轉向“獨有人工智能”(AI Only)。除了語音功能以外,谷歌郵箱Gmail也加入了智能化功能,運用機器學習可以在人們輸入時實時推薦可能會使用到的短語。該功能被稱作“智能創作”(Smart Compose),本月底將會正式上線。

而人工智能在谷歌地圖方面的應用就更加強大了,利用全新的Google Lens的應用,地圖和相機直接實現打通,與谷歌街景結合,打通虛擬和現實世界,類似於增強現實(AR)的功能,由現實到虛擬,只要打開相機,就能給你指方向。此外,人工智能還能直接與衛星圖像結合,把更多商戶和新地址添加到地圖中。

“這才是我們真正需要的人工智能。”興民智通(002355.SZ)首席運營官張人傑對第一財經記者表示,“一些國內公司紮堆兒在做同質化的東西。有時候,產品設計的初心在某種程度上決定了結果。”該公司的主業之一是智能網聯汽車數據的采集運營。

強大的人工智能背後是高性能芯片的支持。I/O大會上,谷歌還發布了最新一代的人工智能芯片TPU 3.0版本。兩年前谷歌首次宣布推出通用的人工智能芯片時,就意在與英偉達的人工智能芯片GPU競爭。

據介紹,新一代TPU能夠幫助谷歌提升包括錄音音頻中的語言識別功能,還能在視頻和照片中辨別出物體,並從文字當中提取隱藏的表情。

谷歌已發布兩個版本的TPU處理器,公司將允許使用谷歌公有雲服務的第三方開發者在TPU上進行開發,從而在雲服務業務方面與微軟和亞馬遜競爭。本周稍早時,微軟也發布了基於微軟雲Azure特殊芯片的早期應用。

皮查伊表示,最新一代的TPU處理器的性能比去年發布的第二代版本要強8倍,可提供超過100萬億次浮點運算。而且谷歌第一次引入液體冷卻的方法來解決散熱問題。

“把自用的TPU開放出來做雲服務,顯示了谷歌在雲業務方面加大投資布局。谷歌將與所有提供智能雲服務的廠商競爭;而芯片方面則將和英偉達展開競爭。”研究機構Gartner研究副總裁盛陵海對第一財經記者表示。

下一個風口:醫療+AI

國內的智能語音領軍企業科大訊飛(002230.SZ)也在密切關註谷歌I/O大會的新動向。

科大訊飛執行總裁胡郁對第一財經記者感嘆道:“谷歌的語音技術一直挺牛的。”據介紹,一小時的語音數據如果在傳統處理器上進行智能應用處理,需要一萬小時才能完成,因此科大訊飛一直在跟蹤人工智能專用芯片的前沿進展。

胡郁向第一財經透露,科大訊飛看好智能語音在醫療方面的應用。“我們正在和國內的幾個醫院談,用我們先進的智能語音技術幫助醫生記錄下手術的全過程。” 通常醫生在做完手術之後,要通過回憶把手術過程記錄下來留存。胡郁說:“我們讓醫生在手術過程中戴上耳麥,能實時把他們的指令記錄下來,手術完畢後直接匯總成文,為醫生減輕了大量整理工作。”

人工智能和醫療的結合將是科技公司下一個爭奪的主戰場。在印度,谷歌的醫療AI已經在幫助醫生進行視網膜篩查糖尿病和心臟病的工作,以解決醫療資源分配不公的問題。

“兩年前,谷歌開發了一套神經網絡,它能通過眼部醫學造影來探測糖尿病視網膜病變。今年,人工智能團隊利用深度學習模型,已經能夠高度精確地預測一位病人未來心臟病和腦溢血的發病風險。”谷歌5月9日在發給第一財經記者的聲明中表示。

阿爾法 阿爾 完勝 之後 谷歌 AI 走了 人聲
PermaLink: https://articles.zkiz.com/?id=263801

股票掌故 | 香港股票資訊 | 神州股票資訊 | 台股資訊 | 博客好文 | 文庫舊文 | 香港股票資訊 | 第一財經 | 微信公眾號 | Webb哥點將錄 | 港股專區 | 股海挪亞方舟 | 動漫遊戲音樂 | 好歌 | 動漫綜合 | RealBlog | 測試 | 強國 | 潮流潮物 [Fashion board] | 龍鳳大茶樓 | 文章保管庫 | 財經人物 | 智慧 | 世界之大,無奇不有 | 創業 | 股壇維基研發區 | 英文 | 財經書籍 | 期權期指輪天地 | 郊遊遠足 | 站務 | 飲食 | 國際經濟 | 上市公司新聞 | 美股專區 | 書藉及文章分享區 | 娛樂廣場 | 波馬風雲 | 政治民生區 | 財經專業機構 | 識飲色食 | 即市討論區 | 股票專業討論區 | 全球政治經濟社會區 | 建築 | I.T. | 馬後砲膠區之圖表 | 打工仔 | 蘋果專欄 | 雨傘革命 | Louis 先生投資時事分享區 | 地產 |
ZKIZ Archives @ 2019