蘋果公司智能語音工具推出漢語服務之前,以科大訊飛為首的本土公司大刀闊斧搶佔市場份額,語音產業鏈雛形初現。但是他們無一不是「摸著石頭過河」,盈利模式尚不清晰。
「我餓了。」
「餓了就趕緊吃東西啊。」
「不知道吃什麼好。」
「這個嘛,那我就推薦你吃一兩塊黑巧克力,它能迅速緩解飢餓感呢。」
「我不愛吃巧克力。」
「此題甚好,我卻不會,待我加緊學習了再來答你。」
這是在手機上安裝一款名為「訊飛語點」的國產智能語音應用軟件後進行的一段「人機對話」。你發出聲音指令後,它便可以幫你發短信和微博,定鬧鐘、查詢天氣航班、推薦附近好吃的餐館,甚至可以講故事、陪你聊天。
蘋果公司iPhone4S手機最大或說唯一的亮點,便是Siri這一智能語音工具。它讓機器彷彿擁有了思考能力。調戲Siri也一度成為網絡上的熱門遊戲。
但是過去兩年Siri並未給中國用戶帶來直觀的使用體驗,因為它一直以來只接受英語對話,且不能查詢中國大陸的各種服務信息,直到2012年6月蘋 果公司才宣佈將推出漢語服務。這便給了一批中國本土公司絕佳的成長空間。在國內,訊飛語點、蟲洞語音助手、小i機器人、小唐龍、快說語音助手、 Ciriis語音助理、智能360、戀愛機器人柳柳等一批類Siri產品紛紛面世,欲跑在蘋果公司之前分得一杯羹。
2012年7月,訊飛語點因進入蘋果在線應用商店(Apple Store)不順暢而成為業界關注的焦點。看似簡單的「進店」問題,打開了中國智能語音市場暗戰的「潘多拉魔盒」。
尷尬的盈利模式
訊飛語點的開發者科大訊飛公司日前向外界大倒「苦水」:2012年6月20日,其向蘋果公司正式提交了訊飛語點iPhone版申請,15天後,蘋果 給出了明確的「Rejected」(拒絕)回應,理由是缺少具體應用的演示視頻。科大訊飛對媒體表示了他們的擔憂:將於2012年秋季推出中文Siri的 蘋果公司,似乎對類Siri產品的審核設置了障礙。
蘋果公司官方沒有回應這種猜測,也未回覆南方週末記者的採訪請求。不過據多位開發者稱,在調整了審核規則後,蘋果商店的審核期限普遍有所延長,從原來的7天增加到兩週左右。2012年7月9日上午,科大訊飛再次提交審核申請,目前正等待蘋果的回覆。
雖未有定論,但這款本土智能語音產品,在爭論中以「中國版Siri」之名迅速為公眾所知。「有一次開會碰到劉永好(新希望集團董事長),他看了我的名片後第一句話就說,訊飛口訊(另一款語音產品)是不是你們做的?」科大訊飛副總裁徐景明說。
科大訊飛創立於1999年,9年後在深圳創業板上市,招股書稱其佔據國內智能語音市場六成以上的份額。2010年它開始佈局移動互聯網,並發布了智 能語音云,簡單來說就是一個融合了各種語音技術的開放端口,免費提供給開發者使用。訊飛語點只是科大訊飛使用了第二代開發平台的核心技術開發的一個示範產 品。
而語音云平台的推出,使一條語音產業鏈逐步形成。根據科大訊飛向南方週末記者提供的數據,目前,免費使用其平台的開發者達到四千餘家。「蟲洞語音助理」的開發者們就是訊飛開放端口的使用者。蟲洞的機器語言甚至提供了四川話、粵語、東北話、湖南話、陝西話等方言版本。
「除了相互開放端口,我們還有一些深度合作。」蟲洞軟件創始人王向一對南方週末記者說,但其拒絕透露具體內容。
開放端口不僅培育了產業鏈上的草根創業者,一些早已成熟的互聯網產品,則把智能語音技術當作一個必備「插件」,融合到已有產品中。
「我們在整合二十餘種主流的應用,比如人人網、去哪兒網、大眾點評網、知乎、瓦力等,互相開放端口供對方使用。」徐景明說。
融入這條產業鏈的,並不侷限在移動設備。
2012年春節剛過,長虹就在其新品戰略上發佈了多款語音智能電視產品,這些最高售價近7000元的不同款式的智能電視,可以根據語音命令換台、調 整音量,長虹給它起了個山寨名字「Ciri」;2011年11月,三洋推出了全語音系列的微波爐產品,售價同樣接近7000元,按下語音鍵,發出命令「幫 我烤個牛排」,微波爐便開始運轉。這些廠商均是訊飛的合作夥伴。
雖然看起來很酷,但科大訊飛的盈利模式也有許多尷尬。眾彩電廠商和科大訊飛均是「一錘子買賣」,即一次性購買語音軟件或芯片,前者推出的所有應用皆為免費,只是智能產品本身的售價有一定幅度的提高。
而對於開放的語音云平台,開發者們也有一種擔心。「科大訊飛將來如果收取高額的使用費,對我們這種創業公司來說會是不小的壓力。」王向一說。
巨無霸公司來爭食
一些本土的巨無霸公司也正加入到智能語音市場上來。「我們和投資人聊,被問得最多的就是,如果百度騰訊做了這款產品,你們怎麼辦?」王向一說。
百度語音項目技術負責人在接受南方週末記者採訪時稱,百度剛成立了多媒體部,組建了幾十人的語音團隊,目前的產品有語音搜索、語音輸入法等。騰訊亦然,其QQ輸入法和搜索已嵌入語音功能。
不過與科大訊飛不同,這些大型互聯網公司沒有專業的智能語音技術專利,他們採取的是技術開發者合作的發展模式。在國內,提供核心智能語音技術的研究 機構數量並不多,基本分成三類,一類是依託於中國科技大學的科大訊飛,一類是依託於中科院的中科信利等,此外便是北大清華的一些研究機構。百度和騰訊選擇 的合作者是訊飛的競爭對手——中科信利。合作方式是由中科信利提供核心技術,再由百度、騰訊在此技術上包裝成產品。
在科大訊飛2011年報中,「能否吸引和培養高水平的人才隊伍」被列為公司今後發展的主要風險,訊飛為此正制定具有競爭力的薪酬體系和股權激勵機制。
競爭者並非只有本土企業。
早在1999年訊飛成立時,IBM、微軟、摩托羅拉、英特爾等就已經在中國成立了專門的語音研究基地,2004年才開始涉足語音領域的谷歌,在2009年11月發佈了中文語音搜索服務。本輪智能語音熱潮,成為國外企業再次搶灘中國市場的絕佳時機。
對科大訊飛等技術提供商而言,更大的威脅可能來自那個站在Siri身後的技術提供商——Nuance。Nuance成立於1992年,Siri的出現讓其從幕後走向台前。
在全球語音技術市場,Nuance佔據了2/3的市場份額,並為三星、諾基亞、摩托羅拉、HTC、福特等公司提供語音技術。2009年2月,其在上海建立了語音技術開發中心。
值得關注的是,Nuance於2011年11月推出針對中國市場的移動開發者項目(NMDP),這給了蟲洞等草根開發者更多的選擇空間。目前,Nuance已與一些國內企業達成合作,例如四維圖新計劃於新版地圖上就將採用Nuance的語音技術。
不過,擁有技術和人才優勢的Nuance,進入中國市場後也面臨諸多「不適應症」。2011年其剛推出語音識別搜索軟件——聲龍搜索(Dragon Search)時,合作夥伴為谷歌、Youtube和Twitter,而這些產品因為眾所周知的原因在中國根本無法使用。
Nuance大中華區總經理鄭裕慶日前在接受南方週末記者採訪時稱,為解決用戶體驗問題,優酷網、淘寶網、新浪愛問、大眾點評網等中國公司也已成為其合作夥伴,但南方週末記者的試用結果並不理想。
浪潮和泡沫
眾多競爭者的加入,讓智能語音應用日益普及。而這實際上僅是一個開始。
科大訊飛2011年的營收是5.6億元人民幣,依此推算,目前中文智能語音市場的盤子在10個億左右。
「這個盤子並不大。」中科信利語音識別實驗室主任顏永紅對南方週末記者說,「每隔五到十年,智能語音產業就會迎來一波熱潮,但事後都沒能有突破性進 展。」而由Siri帶動的此輪「面向移動終端」的智能語音是又一輪浪潮,盈利能力還有待觀察。「整體而言,現在的泡沫有些嚴重,在核心技術還有待提高的背 景下,語音產業短期內大規模提高營收並不現實。」
對以智能語音為主的新創企業,顏永紅同樣不樂觀,「語音技術的進步,需要漫長的時間週期,百度和騰訊有主要的收入來源,資金和技術的投入對他們不是太大的問題,但創業企業承擔不起。」
事實上,儘管科大訊飛不斷投入大量人力財力開發面向移動終端的產品,但目前這一塊的投入尚未給其帶來任何盈利,商業模式也還有待清晰。
目前科大訊飛的收入支撐,全部依賴企業和機構客戶,2012年7月9日,科大訊飛剛剛和公安部合作成立「智能語音技術公安部重點實驗室」,研發麵向 重點人員聲紋庫建設所需的各項核心技術。2012年一季度科大訊飛營收為1.3億元,淨利潤將近2000萬元,分別同比增長51%和36%,財報顯示其同 時將教育類產品(智能語音教具等)作為發展重點,這也是科大訊飛為尋找新利潤增長點「軟硬(軟件+硬件)兼施」的信號。
對於整個智能語音產業而言,真正面向大眾,才能獲得革命性的發展,而這面臨著技術和習慣的雙重挑戰。
「最難的還是使用習慣的建立。」王向一說,「調侃一下Siri可以,但大量依靠語音來完成工作,恐怕心裡還是不放心,目前的技術也不能完全做到。」
人們紛紛猜測,蘋果公司即將在秋天揭開真面目的Siri漢語語音服務,會帶來中文智能語音市場的又一次集體興奮嗎?