ZKIZ Archives


【專欄】機器翻譯將成下一輪產業浪潮,翻譯會失業嗎?

來源: http://newshtml.iheima.com/2015/0116/148910.html

也許三五年之後,如今在很多人眼中“高大上”的機器翻譯會走下神壇,不斷融入大家的日常生活中,造福社會。機器翻譯產業必將帶來新的一輪產業浪潮。

\在科幻電影《星際迷航:企業號》里有這樣的情景:星艦通訊指揮官佐藤星利用翻譯器發明了linguacode矩陣,通過翻譯器集成到星艦人員佩戴的交流別針上或者植入耳朵里,不同語言的人們就可以相互間自由交流了。其實,這樣的設備背後的核心技術就是機器翻譯(Machine Translation)技術。國外曾報道過,有人利用Google翻譯遊遍全世界,利用機器翻譯工具與當地人進行交流。其中還特意提到,在生病住院時,他是如何利用該翻譯工具與醫生交流的。

據統計,世界上存在6000多種語言,《聖經》中巴別塔的故事為我們提供過這樣一種解釋:上帝不想讓人類成功建造能夠通天的巴別塔,所以把人們分散到世界各地,讓人們說不同語言,造成大家無法自由交流。如果想重建巴別塔,讓使用眾多語言的人們跨越語言的隔閡,機器翻譯技術將會是解決問題的關鍵。

一提機器翻譯,大家比較熟悉的是Google翻譯和百度翻譯等基於互聯網公有雲模式提供的在線翻譯服務。在2013年谷歌I/O大會上,谷歌翻譯團隊中負責前端產品和移動技術的Josh Estelle曾提到,谷歌翻譯每天為全球兩億多個用戶提供服務,每天翻譯次數達十億次,每天翻譯處理的文字數量,相當於一百萬冊圖書,超過了全世界的專業翻譯人員一年能夠翻譯的文字規模,其中92%的翻譯需求來自於美國以外的地區。此外,據百度內部的統計,目前在線翻譯貢獻了超過5%的用戶訪問流量。

有人稱機器翻譯是自然語言處理領域的皇冠明珠。實際上,機器翻譯歷史與計算機的發展歷史差不多悠久。1949年美國洛克菲勒基金會自然科學部門的負責人Warren Weaver發表了一份以《翻譯》為題的備忘錄,標誌著開啟了機器翻譯研究的歷史性一頁。特別是最近十多年,統計機器翻譯技術快速興起,通過從大量的雙語數據中自動學習翻譯知識,一套翻譯系統可以在三五天甚至一天內訓練完成。因此,以統計機器翻譯技術為核心的翻譯產品越來越受到工業界的青睞。從翻譯性能來看,與通過其它技術構建的翻譯系統相比,統計機器翻譯系統的性能更優。

隨著科技和社會經濟的快速發展,全世界的互聯互通已經成為不可阻擋的發展趨勢,首當其沖的便是正在不斷深化的跨語言信息連通,我們正在以前所未有的速度從單語世界(國內)轉向多語世界(國際化)。小到出國旅遊翻譯或者技術資料翻譯,大到基於互聯網的在線電商、旅遊、外貿活動、O2O、租車、金融等服務的國際化市場推廣,一個無法避免的痛點在於面臨多語種語言翻譯問題。網絡上的海量和動態變化的多語言信息,如何通過低成本和快速的翻譯實現有效交流?基於人工翻譯來解決這個難題是不可想象的,唯一的解決方法就是充分利用機器翻譯技術提供智能自動翻譯服務。

近十幾年來,在各國政府和產業界的大力支持下,機器翻譯研究和產業化取得了快速進展。美國政府早在2009年就把自動翻譯列為最具影響力的未來十大技術之一;中國政府也把包括機器翻譯技術在內的自然語言理解研究列入到國家中長期科技發展規劃綱要中。也正是看到機器翻譯所蘊含的巨大產業價值,各大互聯網公司都在積極進行機器翻譯技術和產品的研發。

筆者曾與多位從事專業翻譯的朋友以機器翻譯的應用為話題做交流,五年以前得到的反饋基本上都是“唱衰”的負面觀點,認為機器翻譯根本無法與人工翻譯相提並論。但近兩年,翻譯界,尤其是翻譯公司對機器翻譯的評價發生了很大變化,逐漸開始接受機器翻譯可用性的結論,甚至還有相當一部分人害怕機器翻譯,擔心丟飯碗。從當前機器翻譯技術的成熟度來判斷,在可預見的將來,機器翻譯還不可能完全代替人工翻譯,但代替一些水平較低的翻譯新手已成為可能。如果針對某個特定領域構建一套專業的機器翻譯系統,那麽它會具備很高的價值,能夠為國內近四萬家翻譯服務企業和400萬專業譯員提供非常好的輔助翻譯幫助。

在實時語音翻譯方面,谷歌、百度等互聯網巨頭利用語音識別/合成和機器翻譯技術開發了手機版的語音翻譯APP。只要攜帶安裝該APP的手機,就可以在不同語言間進行自由交流,這種工具特別適合於普通大眾出國旅遊之用,真正實現“一機在手,走遍全球”。微軟在2014年5月的Code Conference上也演示了Skype實時翻譯技術演示中,微軟副總裁帕爾通過Skype利用實時翻譯技術與微軟的另一位員工進行了對話,前者使用英語,後者使用德語,演示內容顯示,Skype順利完成了兩者對話時的實時翻譯。

2014年“雙11”購物狂歡節,在阿里巴巴平臺上,全球總共有217個國家和地區參與了這次搶購。跨境電商讓“買賣遍全球”已經成為所有電商的共識。利用機器翻譯技術解決買方、賣方以及電商平臺提供方的跨語言溝通問題,eBay已經走在了前列。據科技博客網站TechCrunch報道,eBay已經在2013年開拓俄羅斯市場的時候嘗試了機器翻譯。俄羅斯用戶輸入俄語搜索關鍵字的時候,也能返回與關鍵字匹配、用英語描述的商品。國內的阿里巴巴也有自己的機器翻譯研究團隊,已經研制出了英語和俄語、英語和葡萄牙語之間的多套機器翻譯系統。機器翻譯技術也可以在電商服務的其它方面有所作為,比如將多國語機器翻譯雲平臺與基於互聯網在線服務的人工客服系統連接在一起,就可以提供多語言智能自動翻譯服務,幫助客服人員與國外客戶進行友好交流。

如果將翻譯雲平臺與聊天平臺相結合,就可以實現來自不同國家的朋友們進行基於文本/語音/視頻的友好交流,可為社交平臺、網遊平臺等提供語言溝通服務,比如目前微信就正在提供漢英、漢德等21種語言間的機器翻譯服務。今天智能設備產業化非常火,與集成語音識別/合成的穿戴式設備和智慧芯片類似,集成機器翻譯技術的穿戴式設備和智慧芯片,隨著4G通信技術的成熟,相信將來也有很酷的想象空間。

此外,在當前火爆興起的在線教育市場上,包括Mooc在內的各種大型開放式網絡課程平臺受到了數千萬學習者的熱捧,但是,對於一個只懂中文的學習者,如何能夠通過在線教育平臺聆聽來自Harvard教授的真知灼見?通過機器翻譯技術,我們可以把全球最優質的教學資源分享給全球數以億計的學習者,讓每個人超越語言的隔閡,真正都擁有平等的、最好的教育機會。

另外值得重點一提的,我國是統一的多民族國家,語種多,文種多。民族語文工作是鞏固社會主義民族關系和開展民族工作的重要內容,開發面向少數民族語言的多語言智能翻譯系統,可以進一步推進少數民族語文在雙語教學、成人掃盲、新聞出版、互聯網等領域的運用,對國家穩定和促進民族地區經濟建設、政治建設、文化建設和社會建設,具有深遠的意義,為此國家正在給予大量的人力和資金支持。

在以上提到的各種機器翻譯應用中,最核心的部分是多國語機器翻譯雲平臺的構建。最簡單的解決方案是基於互聯網公有雲模式提供在線翻譯服務,如Google翻譯、bing翻譯和百度翻譯。通過使用在線翻譯API進行二次開發,可以基本滿足機器翻譯的大眾化使用和要求較低的企業級應用,但前提是翻譯訪問量不能太大(很多API的翻譯請求次數有限制),對翻譯結果要求不能過高(上述系統為通用領域翻譯,不支持個性化定制服務)。還有一個最大的實際問題,就是數據翻譯安全性問題,這是包括很多國際化企業、政府部門以及國家安全情報部門非常關註的問題。如果翻譯需求量很大,而且數據翻譯需要的安全級別很高,那麽比較好的解決方案是通過本地構建多國語機器翻譯私有雲平臺,幫助用戶突破這些限制。為此,很多對此有需求的公司自己組建翻譯團隊利用開源系統如Moses和NiuTrans來搭建機器翻譯私有雲平臺;對於其它企業用戶來說,SDL的企業級翻譯服務器和NiuTrans Server都能夠提供專業化的多國語機器翻譯私有雲服務。

綜上所述,我們有充分的理由相信,在單語世界到多語世界的發展潮流中,機器翻譯技術正在改變人們的工作和生活方式。也許三五年之後,如今在很多人眼中仍屬於“高大上”的機器翻譯會走下神壇,不斷融入大家的日常生活中,造福社會,機器翻譯產業必將帶來新的一輪產業浪潮。


本文為i黑馬版權所有,轉載請註明出處,侵權必究。

PermaLink: https://articles.zkiz.com/?id=127803

Next Page

ZKIZ Archives @ 2019