ZKIZ Archives


誰是中國Siri

來源: http://new.iheima.com/detail/2013/1218/57237.html

「你是屌絲嗎?」

「如果我是屌絲,你一定是猥瑣大叔。」

「才不是,我是高富帥。」

「你是高腐衰。」

這段對話來自百度語音助手與韓國Simsimi公司聯手推出的「小黃雞」,你可以與它對話、提問,並下達指令,「小黃雞」自上線起就被視為「宅男解悶利器」。事實上,國內與「小黃雞」類似的語音助手還有很多。

2011年Siri的出現讓語音技術滲透進人們的生活,也將語音識別帶入了新紀元。此前,「人機交互」一直只是個虛擬概念。這裡所說的語音技術,主要是指將語音轉換為文字,嚴格意義上的語音技術還包括語義分析和信息集成,即如何分析並滿足用戶需求,從邏輯上看是層層遞進的關係。

這種特性決定了語音識別產業鏈分工相對明確。國內的語音識別領域,科大訊飛、云知聲是提供底層服務的代表者,在此基礎上衍生出的各類語音助手則更專注於語義分析和信息集成,也更貼近用戶真實的生活場景。其中,已經在深交所上市的科大訊飛是產業鏈的龍頭。2008年5月12日,科大訊飛上市第一天就被炒到30.31元,比12.66元的發行價翻了一倍還多。目前,國內許多語音助手都採用了科大訊飛的技術。

不過,Siri的火爆並沒有帶來國內市場的繁榮。蟲洞語音助手創始人余志晨回憶,2011年產品上線後,眼見社交應用火了一撥又一撥,語音助手卻始終不溫不火。經過反思,余志晨認為語音產品本身的形態決定了它不是一個爆發性的產品,用戶的使用習慣需要從零培養。

很快,中國開發者們改良了語音技術。與Siri枯燥的對話相比,國內語音助手做得更生機勃勃,用戶可以用語音操控手機(如打電話、發短信)、查詢信息(天氣、交通、預訂餐館),以及語音問答(與機器對話、相互調侃)等等。這看上去與搜索引擎的功能類似,不過語音助手最實際的意義在於解放了用戶的雙手。其中的典型代表有智能360、蟲洞語音助手、快說等小型團隊的作品,也不乏百度、搜狗等巨頭推出的產品。

未來,語音識別成為手機的基礎功能已無異議,每部手機都將配有一個語音識別模塊,通過這一模塊可以隨時調用任何功能和應用,就如同現在的GPS一樣。對於開發者而言,單純開發語音技術很難賺到錢,基於語音輸入的應用服務,才是最具想像力的領域。

從戰略角度分析,科大訊飛、百度等大公司都希望將語音輸入變得集成化、一體化,以最終形成語音服務的閉環。短期來看,產業閉環會使服務效率提高,實現無縫對接。然而長遠來看,集成化、一體化的服務也讓巨頭頗顯為難。2012年搜狗立項做語音助手時曾希望覆蓋全產業,打通從語音識別到信息集成的通路。不過很快,搜狗就放棄了自己開發語音識別技術,轉而與云知聲、科大訊飛進行合作。

眼下,各家語音助手都有短板。以搜狗為例,後端龐大的資料庫使其在資源整合上擁有絕對優勢,但前端的語音識別技術則相對薄弱,即便組建專門的研發團隊,在識別準確度上也無法與科大訊飛、云知聲等積累了十幾年經驗的專業團隊相比。語音識別的技術門檻相當高,後台支撐需要靠經年累月的數據積累。這些依靠算法、爬蟲獲得的信息,短時間內難以獲得,且價值呈逐年遞漲趨勢。

據《創業家》記者瞭解,在過去兩年,市面上常見的語音助手類應用普遍獲得了金額不菲的融資,動輒百萬美元級別。儘管如此,語音助手們的盈利模式依然不清晰。相比較而言,Siri更像是一種功能,國內的語音助手們才是一款產品。蘋果並不依靠Siri賺錢,但國內開發者們則不同,無論是技術層面還是產品創新層面,每一個環節都還有巨大的提升空間。以智能360、蟲洞為代表的語音助手都已擁有幾百萬用戶,但還遠沒達到盈利的臨界點。

值得關注的是,微信語音的出現改變了用戶的行為習慣,用戶開始敢於在公共場合與手機對話,並逐漸形成了基於互聯網的語音習慣。這個習慣一旦成熟,也將有利於語音助手的普及,提高用戶的接納度。

對於偏語義分析和數據挖掘的團隊,早期第一位的還是用戶體驗。如果只做通用型的語音助手,恐怕難以做精,切入垂直領域是個不錯的選擇,如旅遊、酒店、機票預訂等。切准細分場景更有助於這些應用快速獲得用戶、實現商業化,當用戶積累到一定數量後,也有做競價排名和內容推薦的可能。現在,已經有語音助手切入細分領域實現差異化競爭。從今年下半年起,這種趨勢將會愈發明顯。

PermaLink: https://articles.zkiz.com/?id=85231

Next Page

ZKIZ Archives @ 2019