📖 ZKIZ Archives


黃學東: 機器翻譯離舉一反三還很遠

曾經培養過李開複、陸奇,如今還擁有沈向洋、洪小文的微軟從來不缺華人技術大咖。

而黃學東一直是這家老牌IT巨頭的一線大咖中相當有個性的一位。作為微軟公司語音識別領域的領軍人物,加入微軟25年的老將黃學東至今仍活躍在人工智能領域科學研究的前線。

“我負責的具體範圍過幾年就會有所變化,但是有一件事情沒變,我是微軟語音技術的創始人,微軟的語音識別、語音合成技術都是我一手創建出來的。”對自己成績足夠自信的同時黃學東對於技術本身又表現得足夠謙遜,真正的自然語言理解還需要更長的路要走,那才是人工智能真正的皇冠。

假裝聽懂人話

黃學東有一連串響當當的頭銜。

他是國際電子電氣工程師學會(IEEE)和美國計算機學會(ACM)的雙科院士,也是微軟認知工具包CNTK的締造者之一。2016年他被美國《連線》雜誌評選為全球創造未來商業的25位大牛天才之一。

同時,黃學東還是微軟全球技術院士,這代表著微軟技術人員的最高榮譽,現在全球也僅有20多人獲得這項殊榮,而黃學東是目前微軟唯一的華人技術院士。

但是這一切頭銜面前,讓黃學東目前最滿意的成績是在今年3月份,他帶領的團隊在機器翻譯領域拿下一項里程碑式的成就:其研發的機器翻譯系統在通用新聞報道的newstest2017中譯英測試集上,達到了人工翻譯水平。

“微軟機器翻譯第一次達到了媲美人的水平,這是非常有歷史性意義的事實。語音和語言是人類進化中重要的東西,而現在計算機第一次在翻譯質量上超過專業人士的水平,這對人類文明的進展來說是很震撼的。”黃學東這樣解釋道。

但上述成就對於黃學東所在的團隊而言,其實是不斷挑戰的結果。

2016年,微軟率先實現語音識別系統5.9%的低錯誤率,在Switchboard對話語音識別任務中已經達到人類對等的水平。

2017年8月,黃學東所在的團隊獎又將上述對話語音識別詞錯率降低至5.1%,創造了當時該領域內錯誤率最低紀錄,首次達成與專業速記員持平而優於絕大多數人的表現。

這意味著,如果讓一個人來翻譯,或者把錯誤率整出來,那絕對達不到5.1%,這是一群人聯合攻關才能做到的水平。

黃學東的觀點是,從研究角度來說,這個意義十分重大,即便是0.1%的差距,無論是運算量還是時間,耗費都是巨大的。

黃學東深信“對話即平臺”,“語音交互的發展是一個自然的過程,這是因為語音交互是一個無需觸碰設備即可完成的體驗,它可以讓人擺脫設備的枷鎖。”

目前,微軟已經將機器翻譯技術落地。

但高計算量、噪音問題、理解力這三個問題,目前還是限制了語音交互在實際應用場景中的效果。

“雖然如此,但是語音交互畢竟已經可以落地並產生了商業化應用,‘機器聽懂人話’這個目標已經基本實現。”但黃學東認為機器翻譯是位於感知到認知之間的一個過程,因為它可以“假裝”聽懂,翻譯出來的效果還不錯,但實際上它並沒有聽懂。

語音交互的難題

機器翻譯上從達到人類水平到超越人類水平,在業界一度被解讀為人工智能在研究領域的突破性進展。

但是現有大多數硬件與智能服務的交互體驗仍有很大缺陷。黃學東認為這應該歸於在“語義識別”方面大家還在止步不前。“我們在教計算機不僅是轉錄口語,而且要了解話語的意義和意圖方面仍有很多工作要做。從識別語音到理解話語,是語音技術的下一個主要挑戰。”

黃學東認為在沒有突發事件的情況下,現在的機器翻譯可以做到基本可信、基本可達、基本還算比較雅。但是如果出現突發事件,機器翻譯出錯誤會出得比人類更離譜。而最好的方法是在機器轉錄翻譯的時候,有人在旁邊看著,有錯誤就給糾正一下。

在黃學東看來,語義理解是語音交互中最難攻克的問題之一。他指出,這是因為語音理解方面的標記非常少,而且也沒有公認的標準,所以要通過非監督式學習來攻克這個困難,但是,非監督式學習目前還在探索階段,亟待突破。

“我們現在還沒有達到,什麽時候達到也不知道。”黃學東可以肯定的是,強人工智能一定是由自然語言理解、感知驅動的,讓計算機能達到人的知識獲取能力,可以通過閱讀自動獲取知識。

PermaLink: https://articles.zkiz.com/?id=264602

Next Page

ZKIZ Archives @ 2019