——“我要去機場。”
——“T1還是T2?”“出發還是接人?”
這是手機用戶在使用搜狗語音交互的一個場景。
8月3日,搜狗正式對外發布了語音交互引擎——知音。搜狗CTO楊洪濤對包括第一財經在內的媒體透露,此前,不少語音識別停留在“能聽會說”的階段,借助人工智能,現在搜狗的語音識別還具有“能理解會思考”的能力。
而在楊洪濤身側的PPT大屏幕上,同步了搜狗語音識別對他演講內容的文字,第一財經記者看到,同步速記雖然偶有錯誤,但大意基本正確。
楊洪濤對媒體介紹,搜狗的“知音”引擎可以做到識別速度更快、糾錯能力更強、支持更加複雜多輪的交互以及更加完善的服務能力。
具體而言,在技術上,“知音”解決了用戶在說話過程中因語速過快而導致的吞音問題,語音識別錯誤率相對下降30%以上,語音識別速度提升3倍。
此外,“知音”能夠在語音交互的過程中支持用戶修正錯誤的識別結果,用戶可以使用自然語言即可修改之前的輸入文字。例如,說出“把(男)他改成女字旁的她”、“弓長張換成立早章”等,輸入法便可以馬上理解並正確執行指令。
在支持多輪對話上,“知音”能夠處理更複雜的用戶交互邏輯,用更自然並且用戶更容易接受和理解的方式進行交互,更好地感知用戶語音請求背後的真正需求,從而提供更為便捷的人性化服務。例如,當用戶說我要去首都機場,它會問T1還是T2,當用戶確定航站樓後,它會問是出發還是接人。
而在這背後,搜狗借助的是多年來的數據和技術積累。
楊洪濤介紹,搜狗從12年開始研發智能語音技術,並在13年開始進行深度學習,目前搜狗的智能語音技術已經成功應用到搜狗的全線產品中。
數據顯示,搜狗搜索日均語音搜索次數增長超過4倍,搜狗手機輸入法日均語音輸入超過1.4億次。
楊洪濤透露,自然交互和知識計算是搜狗在人工智能領域的兩大戰略方向,目前搜狗在AI領域的研發已經全面展開,並在智能語音領域取得了重大突破,“知音”引擎就是搜狗在自然交互方面的重要成果。而未來隨著搜狗在自然交互與知識計算方面的不斷完善,“知音”將會在更多場景為用戶提供服務。
在搜狗CEO王小川看來:“搜索本身就是一種AI,隨著人工智能時代的到來,搜狗將不斷增強自身技術實力的積累。搜狗目前已在語音識別領域取得了重大突破,未來一方面將通過與清華合作進行人工智能領域前沿技術研發,另一方面也將在自然交互與知識計算上不斷完善自身產品與服務。”
而在商業化方面,根據搜狐剛剛發布的截至6月30日的2016財年第二季度財報顯示,搜狗第二季度非美國通用會計準則下凈利潤達到2.2億元人民幣,同比增長30%;收入達11.5億元人民幣,同比增長27%。