巨頭發力翻譯技術:那些幹翻譯的 看完此文可以轉行了
來源: http://newshtml.iheima.com/2015/0112/148879.html
i黑馬:語音識別的威力很強大,翻譯只是其中一環。目前的瓶頸在哪?語音識別的準確性太低了,它有三個步驟:識別——語義解析——知識圖譜。每個步驟的準確性都不同。目前的APP大多只是把“識別”的準確性提高了,達到90%以上,而其余則很低。不過趨勢已經來了,谷歌、微軟和Facebook等都加入到翻譯技術的研發潮中,正在消除語言隔閡。 隨著通信技術的不斷發展,語言對溝通產生的阻礙越發明顯,所以谷歌、微軟和Facebook等各大科技公司都在努力開發翻譯技術。
上月,微軟旗下的語音通話服務Skype推出了英語與西班牙語之間的同聲傳譯服務。谷歌也不甘人後,很快就會宣布對手機應用進行更新。谷歌翻譯現在可以為90種語言提供筆譯,而且能夠聽譯多種熱門語言。在最新的版本中,這款應用將自動識別某人說的是否是一種熱門語言,並自動將其轉換成文本。
當然,在我試用Skype的過程中,口譯技術的效果仍然很糟糕。這項服務還需要佩戴耳機,而且只有當用戶停下來傾聽對方的話語時,才能達到最佳效果。這種感覺就像在用步話機通話一樣。
盡管存在種種瑕疵,但這仍然不失為一項了不起的技術,它可以實現神奇的效果:幾分鐘內,我就會習慣這一過程,與一個來自哥倫比亞的人隨意談論他的妻子、孩子以及在麥德林的生活。事實上,作為我們之間最大的障礙,語言隔閡已經消失於無形。
雖然翻譯中存在一些錯誤,但這些錯誤卻是在線產品不斷改進的關鍵所在。由於所謂的機器學習技術能夠自動檢測結果,並作出相應的調整,使得這類服務可以隨著使用量的加大不斷改進。事實上,在線拼寫檢查功能正是通過這種方式才變成令人依賴的功能,而地圖導航和其他各種在線服務也都經歷了類似的過程。
塞巴斯蒂安·庫伯羅斯(Sebastian Cuberos),我的這位來自哥倫比亞的新朋友在我們的Skype通話中說:“在你對話的過程中,軟件會進行學習。它目前已經很不錯了。”雖然翻譯出的內容在語法上還算不上精妙,但已經可以讓我明白對方所要表達的意思。
目前在Skype上使用這項服務的只有幾千人。隨著不斷的“學習”,它今後還將為將近4萬人提供西班牙語和英語翻譯服務。即使在發展初期,這項功能依然實現了一些不俗的功能,可以對美國和墨西哥的兒童展開社會調查,還可以幫助記者與身在敘利亞的某個家庭展開實施對話。
谷歌表示,該公司的翻譯應用已經在Android手機上安裝了1億多次,其中多數都可以收到最新的升級。“我們在各大平臺上共計擁有5億多月活躍翻譯用戶。”谷歌翻譯工程總監馬克多夫·休吉斯(MacduffHughes)說。由於整個網絡有80%至90%的內容都是用10種語言書寫的,所以翻譯將成為很多人的重要學習元素。
谷歌Chrome瀏覽器已經可以提供主要語種之間的網頁自動翻譯服務,人們可以借助這款瀏覽器將英語翻譯成韓語。除此之外,Gmail設置等功能還支持140種語言。
用戶完全可以將自己的電子郵件界面語言設計成克林貢語、海盜語、雞蛋頭語這種來自漫畫或電影的語言。當然,Gmail同時也支持切羅基語等真正的小語種,而谷歌希望最終在翻譯服務中全面支持這些語種。谷歌很快還將推出一項服務,使得用戶將手機攝像頭對準外語路牌,便可自動將其翻譯成文字,並顯示在屏幕上。
Twitter和Facebook都使用必應翻譯引擎,Facebook擁有全球最大的圖片分享服務,因此也扮演著重要的跨境溝通角色,所以他們自然不甘落後,同樣在開發自己的翻譯服務。該公司還為Skype等待名單上的數千名用戶提供了其他同聲翻譯服務,涵蓋了漢語和俄羅斯等語種。
對機器翻譯而言,充實“語料庫”是關鍵所在。谷歌使用人類翻譯來啟動這項服務,而在一名政府官員最近通過電視求助後,谷歌還增加了哈薩克語。“人們可能會強烈要求我們將他們的語言加入這項服務。”休吉斯說。
但還是有專家擔心,隨著機器通過語調和幽默等內容更加深入地了解人類,相關企業可能會把這些元素應用到廣告中,甚至透露給執法部門。事實上,谷歌的搜索關鍵詞和Facebook的“點贊”都已經走過了相同的道路。
“這項技術很神奇,但威脅同樣很大。”未來通信研究公司Hypervoice Consortium聯合創始人凱利·菲茲西蒙斯(KellyFitzsimmons)說,“萬一政權更叠後,新的政府不喜歡你的言論,那麽大量的對話內容就會對你構成威脅。”
菲茲西蒙斯表示,目前只有1%的消費者願意讓自己的數據被過度紀錄。而事實上,當人們使用機器翻譯或語音助理時,這種情況就會實實在在地發生。她認為,只有人們自己才能更好地管理自己的隱私,而不應將其外包給服務提供商。但在現階段,為了獲得種種便利,人們都在個人數據方面做出了讓步。
Skype產品營銷總監奧利維爾·方塔納(OlivierFontana)表示,在人們看到翻譯的內容前,對話會被分解成獨立的文件。“不可能知道誰說了什麽。”他說,“美國國家安全局也無法利用這些數據。”
休吉斯表示,谷歌也關註語音處理流程,因為一旦用聲音識別技術取代密碼,這便有可能對安全性造成威脅。除此之外,他還表示,突出翻譯內容的差異也有一定的意義——如果我說中文,可以變成女聲,這樣人們就知道這是翻譯出來的內容。