ZKIZ Archives


被互聯網女皇看好的語音,將成為巨頭爭奪的下一個焦點

來源: http://www.iheima.com/zixun/2016/0606/156332.shtml

被互聯網女皇看好的語音,將成為巨頭爭奪的下一個焦點
羅超羅超

被互聯網女皇看好的語音,將成為巨頭爭奪的下一個焦點

語音即將成為最重要的交互方式之一,語音技術從量變到質變的引爆點已經到來。

KPCB合夥人、享有“互聯網女皇”稱號的瑪麗·米克爾的互聯網趨勢報告在近日發布。毫不誇張地說,這份報告是互聯網行業分析的“超級碗”,它用200多頁的Keynote濃縮了全球龐大而複雜的互聯網發展現狀和趨勢,是互聯網從業者、投資人以及想要窺見互聯網風貌的外界人士不可多得的參考資料。

有人說,今年報告亮點不多,在我看來,亮點卻非常之多:不僅覆蓋了手機、電商、社交、廣告等基本面,還點名了移動營銷、網絡直播、智能汽車諸多正在崛起的所有新興領域。與IDC等機構報告不同的是,女皇報告更側重於行業現象概括和行業趨勢展望,事實證明,她對未來趨勢的評判準確率相當之高。而今年報告最大亮點在於:語音。213頁的Keynote,23頁給了語音,篇幅遠遠超過汽車、直播等領域,僅次於每年的重頭戲即“營銷”的31篇。

女皇認為麥克風正在取代鍵盤

瑪麗·米克爾認為,語音正在被重塑,成為人機交互的新範式,在過去75年里,每10年就有一次人機交互的重大革新,人類對機器的操作,從物理手柄按鍵,到物理鍵盤鼠標,再到觸摸屏,而現在語音成為了重要的交互方式。

2016年互聯網女皇報告zh版_000114 

在其看來,語音交互相對於傳統交互而言具有以下特點:輸入更快速,人類每分鐘可說出150個單詞,打字卻只能完成40個單詞;使用更簡單,不需要用手和眼,時間更及時,不需要任何學習;更加個性化,機器可基於上下文、環境、位置、語調等大環境更好地理解人類的需求。從技術角度來看,語音計算具有成本低、尺寸小的特點,特別適合物聯網。

為何語音現在會爆發?瑪麗·米克爾認為:

1、技術成熟是核心原因之一。如果語音識別準確率從95%提升到99%將從量變引發質變,即“爆發點”到來,語音識別準確率已從2010年的70%上升到今年的90%,百度、谷歌、Hound等平臺的語音識別準確率已超過90%,針對戶外嘈雜環境和講話者特性的語音識別是下階段的攻克重點。

2016年互聯網女皇報告zh版_000119

2、語音交互應用正在日益變多。語音搜索正在蠶食搜索份額,百度、谷歌的語音搜索在近十年來均取得了數十倍的增長,其中安卓、百度和必應語音搜索比例分別達到20%、10%、25%;以Siri為代表的語音助手正在快速普及,美國用戶使用這類工具的比例,已從2013年的30%增加到2015年的65%。因為語音能夠解放雙手和眼睛,人們越來越多地在車里、家里和隨身使用語音。相關數據顯示,從2014年到2016年間,全球API調用百度語音識別以及文本轉語音(TTS)的每日使用量急速攀升,百度語音在百度產品中使用率快速增長。

2016年互聯網女皇報告zh版_000125 

3、語音吸引更多第三方開發者。開發者擁抱語音大幅增加了支持語音交互的軟件和硬件,女皇重點闡述了Amazon眼下炙手可熱的硬件:Echo。其內置了Amazon Alexa語音助手,目標是占領家居、汽車、手機的麥克風,還能智能購物。這款產品銷量已突破400萬臺。女皇更是大膽指出:語音拐點已經到來,在2015年智能手機銷量下滑之後,Echo銷量或將騰飛。

2016年互聯網女皇報告zh版_000129 

英雄所見略同。在瑪麗·米克爾預測語音會成為核心交互方式的同時,科技巨頭早已在這一領域大力投入。2014年百度世界大會上李彥宏預測:五年內語音和圖像搜索比例有可能突破50%。百度在人工智能上一項顯著的進展便是基於深度學習的Deep Speech在噪音環境下的語音識別效果超越了谷歌,這一研究成果在瑪麗·米克爾的報告中被提及,該項技術已成功應用到百度語音搜索上。

目前,百度語音搜索已通過人工智能做到了“聽”和“說”,而且還嘗試完成人類複雜的行為——溝通。集成語音識別、語義理解、深度問答、知識推理、多輪對話、智能摘要、情感分析、語言生成、語音合成等能力於一身後,相較於鍵盤輸入,百度語音搜索已經能夠滿足用戶的多種複雜需求,引領人機交互邁入聽說時代。

此外,不久之前的谷歌I/O大會上,最亮點產品是類似於Echo的Google Home,其內置了Google Assitant語音助手。而在即將召開的蘋果開發者大會WWDC上,iOS 10最大亮點很可能會是Siri。語音是下一站,已成全球共識,“麥克風+觸摸屏”取代“鍵盤+鼠標”,已是大勢所趨。

語音正在多個領域全面開花

“女皇報告”重點提到了語音的三大典型應用:搜索、助理和Echo,一個重要事實是,語音不只是在這些領域發揮作用,在許多領域,它都比鍵盤越來越有存在感。

1、語音搜索:移動搜索的重要分支

谷歌、百度、Bing,全球主流搜索引擎的語音搜索比例都在逐步增加,麥克風圖標變得跟搜索框一樣重要。搜索引擎來自移動端的搜索流量均已超過50%,人們在自帶麥克風的移動設備上使用語音更方便,而在移動場景下打字並不方便。有報告指出,百度語音搜索的整體用戶量在2015年增長超過3倍,用戶中的90後和00後的人群占比接近50%,百度語音搜索已經成為眾多年輕人移動互聯網生活的標配,優勢在於省去了中英文輸入法切換的繁瑣、支持口語化多輪交互、能夠提供貼心的語音播報和有聲搜索。

2、語音助手:不再是被調戲的玩具

幾年前,Siri這是一個被調戲的玩具。現在,它可以理解很多命令,比如設置鬧鐘、添加日歷,打開App等,語音助理已完成從玩具到工具的蛻變。除了Siri之外,Windows內置的Cortana、Google Now升級而來的Google Assitant,以及百度、搜狗、科大訊飛等公司均推出了自己的語音助理軟件。

以百度推出的度秘為例,已經接入到手機百度APP,用戶可在手百端直接調用,使用語音對話的形式享受點餐、購物、路線、訂票等多項生活類服務。可見要做好語音助理並不容易,除了語音識別和語義理解之外,它必須要能“完成任務”,而這需要獲取其他設備和應用的控制權,而這一點只有巨頭才能做到,創業型玩家基本已經消失。

3、語音通訊:不再是昂貴的溝通

微信能夠成為超級App,一大重要原因在於它支持語音通信,類似於對講機的語音交互,給了人們在傳統手機通訊下前所未有的體驗。需要流量,但相對於傳統電話而言已很廉價。事實上,傳統電話也已被互聯網化,有信等網絡電話App的崛起表明,人們未來只需要為語音通訊花很少的錢。女皇說,語音是最有效率的交互方式。除此之外,語音還是最自然、最簡單和最有效的溝通方式,免費的語音通訊將會成為大勢所趨,運營商正在被逼著依靠販賣流量謀生。

4、語音內容:不再是冷門的形式

微博剛剛興起時,許朝軍做了一個啪啪,要做語音版的微博,後來發生的事情大家都知道了。不過,語音內容正在卷土重來。最近在行做的“分答”十分火爆,這款App集合了語音、打賞、共享經濟諸多新興模式,讓知識分享前所未有的有趣。而在去年,喜馬拉雅等網絡電臺崛起了。

這些現象均表明,“聲音”依然會是十分重要的一類內容形態,人們不會浪費耳朵這個重要器官,在許多場景下,“語音消費”都更適合,比如開車時,高德地圖與林誌玲等明星合作的語音導航就取得很好的市場反饋。在許多垂直領域,例如教育,語音技術同樣在體現其重要性,比如通過語音技術做口語訓練。就是說,不只是“麥克風”變得重要了,“喇叭”也在變得重要。

1464577593220 

5、語音硬件:隨時待命的助理

“女皇報告”說,Amazon Echo將要起飛。除了Echo之外,Google 已推出Google Home硬件,擁有Siri的Apple很可能會發布類似產品。為何“語音助理硬件”會普及?為什麽不直接用手機上的Siri等助理呢?因為手機是個人設備,並不適合家庭成員共享;而當前的語音技術,讓手機支持“隨時待命可被喚醒”會很耗電,基於Echo等家用設備不需擔憂這個問題。

正是因為此,類似於Echo的產品將成為接下來的爆點,國內巨頭同樣在布局,京東已推出叮咚智能音箱,阿里巴巴聯合科大訊飛推出了“飛兒”,語音技術成熟的百度近日推出的度秘實體機器人也成功入駐肯德基,通過多輪交互和語音語義理解等技術為用戶完成智能點餐的過程。除了專用的語音助理硬件,語音與電視、與汽車等硬件的整合也會加速,國內的“Echo”大戰即將爆發。

正如女皇報告所指出的那樣,語音即將成為最重要的交互方式之一,語音技術從量變到質變的引爆點已經到來。除了交互之外,語音還將在搜索、內容、通訊和硬件等領域全面開花,“麥克風”變得重要,“喇叭”亦將變得重要,關於聲音的戰爭已經拉開序幕。

(本文為投稿文章,作者羅超,微博@互聯網阿超,微信:luochaotmt )

語音巨頭
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=199003

Next Page

ZKIZ Archives @ 2019