📖 ZKIZ Archives


從語音到視頻 山東高速聯手賽維安訊開發第三代導航系統

從語音提示到可視視頻,山東高速與山東賽維安訊近日簽署協議,共同出資打造這一服務平臺。

記者從山東高速股份有限公司獲悉,日前,山東高速通過投資基金正式完成對國內第一代車聯網系統出品方山東賽維安訊有限公司的投資,增資後該公司註冊資本提高到1億元。山東高速出資4700萬元,與山東賽維安迅並列該公司第一大股東,雙方分別持有47%的股份。

資料顯示,山東賽維安訊成立於2014年7月,是一家專註於車聯網應用、視頻CDN技術的科技創新型互聯網企業,擁有中國唯一的移動式多點直播平臺技術專利。目前,山東賽維安訊以Soooner車聯網雲平臺作為後臺技術支撐,以“路爸”APP的推廣、運營為主營業務。

山東賽維安訊總經理楊濤告訴記者,CDN是一項具有極高技術含量的技術,在國內,能夠達到賽維安訊雲平臺能力的視頻平臺不超過10家,分別是騰訊、百度雲、阿里雲、搜狐視頻、樂視視頻、中國網絡電視臺、優酷視頻、愛奇藝視頻、網宿CDN。在直播方面,賽維安訊的平臺一直處於領導者地位。賽維安訊服務的客戶包括中國電信、華數、天翼視訊、鳳凰網,土豆,百度奇藝、樂視、搜狐、PPLive、新華社、PLU、奇虎360、騰訊等知名品牌。

據介紹,山東賽維安訊主打產品為“路爸”APP項目,該項目是基於賽維安訊視頻雲分發技術平臺基礎上,開發出的基於移動設備與地圖結合的多點視頻/圖片上傳技術,多點視頻直播/點播/回看技術及App技術。

楊濤表示,“路爸”應該是繼車載導航、手機地圖導航APP之後的第三代地圖導航系統,也是真正意義上的車聯網路況導航系統。

“路爸”最大的優勢在於其移動狀態下的視頻直播功能和社交功能。相較於目前以顏色來呈現路況相比,“路爸”APP通過大量的視頻采集車可以獲取實時道路狀況視頻信息並及時上傳,車主可根據視頻信息確定前方道路擁堵狀況及原因,並根據該信息選擇出行路線。強大的移動視頻技術還可以支持車主進行移動直播,分享實時路況和路上風景。此外,“路爸”支持車主間社交功能,也使其成為一個移動社交平臺。

楊濤表示,近兩年,山東賽維安迅將發展13.25萬輛車作為信息采集終端。根據規劃,賽維安訊將在目前山東省城市內路況布局的基礎上,利用山東高速的路網優勢充分連接城市間路網體系,打造全國樣板市場,並快速實現業務模式複制,未來兩年將覆蓋包括北、上、廣、深及十五個沿海省份與高速公路的可視化交通數據平臺。

PermaLink: https://articles.zkiz.com/?id=232081

華為開發自主語音助手服務 挑戰蘋果Siri

2月16日據彭博社消息,華為正計劃開發自主語音助手服務,瞄準蘋果Siri、亞馬遜Alexa和Alphabet谷歌助手,涉足競爭激烈的語音助手市場。

其中一名消息人士稱,由逾100名工程師組成的一個團隊,在深圳開發語音助手服務,開發工作還處於早期階段。該人士表示,華為語音助手支持中文,面向國內用戶,華為在海外市場將繼續與谷歌和亞馬遜合作。

近幾個月來,華為一直在加緊與蘋果,三星和其他主要智能手機廠商的競爭。在擺脫小米成為世界第三大智能手機制造商之後,華為已經把目光投向了蘋果公司,自己的語音助手可以幫助把它分開。

華為消費者業務CEO余承東曾表示,該公司希望在2021年成為世界上第一大智能手機制造商。為此,華為將需要進入美國市場,這是它還沒有做到的。

華為目前沒有與美國四大運營商的運營商協議,使得客戶很難購買華為智能手機,但是華為的高管們正在努力改變這一現狀。

PermaLink: https://articles.zkiz.com/?id=235598

谷歌華為搶裝語音助手

五個月前谷歌推出了首款手機語音人工智能產品,現在它希望與安卓合作夥伴分享更多功能,與蘋果Siri競爭,從而把iPhone的用戶引入自己的平臺。

在安卓的兩個最新版本的軟件中,目前已經能夠使用谷歌的語音助手完成回答問題、播放音樂等任務。不僅如此,谷歌還計劃將英文版人工智能率先推向美國更多的安卓手機。在世界移動大會(MWC)開幕前,LG推出的最新款智能手機G6就使用了谷歌的語音助手。很多手機廠商都趕在蘋果10周年旗艦手機發布前推出手機,以拔得頭籌。

研究機構IHS移動部門高級總監Ian Fogg對第一財經記者表示:“谷歌希望把智能助理安裝到盡可能多的手機中是非常自然的舉措,因為人工智能已經發展成為谷歌的核心戰略。支持谷歌人工智能系統的是機器學習,越多人使用谷歌的智能助理,它就能變得越聰明。”

 

谷歌去年10月推出的智能手機Pixel是目前唯一搭載其語音智能系統的手機。谷歌負責人工智能助手項目的Gummi Hafsteinsson表示:“在項目最初階段,專屬性能夠讓該系統做到極致,這是一開始的首要任務。就好像一個嬰兒需要非常精心的呵護一樣。但我們的最終目標是想把我們的人工智能系統推向世界的每一臺安卓手機。”

目前全球85%的智能手機使用安卓系統,根據研究機構IDC的預估,如果谷歌能把智能助理推向安卓設備,那麽將使得其份額大幅增長,未來三分之一的安卓手機都將使用谷歌的人工智能助理。其中就包括使用安卓最新版本軟件的LG智能手機。

LG在MWC開幕前發布了一款超薄無邊5.7英寸屏之智能手機,屏幕比iPhone 7更大,但手機整體大小比iPhone 7小。這款手機也配置了雙攝像頭和高清顯示屏,性價比不輸競爭對手華為新出的P10和谷歌Pixel。

盡管LG和Pixel是競爭對手,LG還是選擇使用谷歌的人工智能系統,LG稱谷歌是“亦敵亦友”。根據彭博的數據,截至去年第三季度,LG智能手機份額占全球的3.7%。

三星和華為都在選擇自主開發人工智能系統。去年三星收購了人工智能語音公司Viv Labs。Viv是由Siri前員工創立的,三星希望借助Viv的技術在今年稍晚時推出第一款搭載Viv語音系統的智能硬件。

華為也被曝出已經組建了100多人的技術團隊,開發語音技術,不過該項目尚處於早期。華為所要瞄準的正是谷歌的語音助手,以及蘋果的Siri和亞馬遜的Alexa。

谷歌安卓軟件的發明者Andy Rubin也創立了自己的公司,致力於智能手機硬件的開發。Andy Rubin此前對第一財經記者表示,他的手機將更多地關註人工智能軟件的開發,提升用戶黏性。

上海威盛電子語音交互部門研發總監張國峰對第一財經記者表示:“現在最大的問題是,用戶拿了語音助手,出於好奇心會玩一下,但缺乏黏性。谷歌會不會讓安卓手機用自己的語音助手對其他廠商影響不大,現在關鍵是要把用戶使用語音助手的習慣培養起來。”

目前語音助手最常見的使用場景還是在車內。由於一些國家交通法規嚴格,不允許在駕車時打電話,因此在車內使用語音導航和語音撥號功能的用戶較多,但離開這一環境,幾乎很少人會使用其他功能。

因為現有的語音助手無法帶來令人滿意的用戶體驗,才給了新進開發者同等的機遇。尤其是在中國市場,由於中文語言的特殊性,更是能夠給像華為這樣的企業發展的空間。

華為語音助手的優勢在於,安卓手機雖然在中國取得主導地位,不過谷歌的很多服務並不能進入中國。

此前,華為已經宣布將在美國發售的Mate 9智能手機上使用亞馬遜的Alexa的智能語音系統,而非競爭對手谷歌的語音系統。與華為一樣,聯想也在MWC上宣布今年晚些時候即將發布的Moto Z系列手機將搭載Alexa語音系統。這讓谷歌語音助手已經丟失了一部分中國安卓手機的份額。

谷歌也在考慮未來在更多第三方安卓手機中預裝谷歌智能助手。最新的安卓7.0版本搭載的谷歌智能助理目前還僅支持英語,並且僅在美國可用。谷歌表示,下一步語音助理將會推廣至澳大利亞、加拿大、英國等英語國家,而未來還將推出多種語言版本,但沒有說是否包括中文。

PermaLink: https://articles.zkiz.com/?id=237167

美的攜庫卡機器人亮相 未來智能廚房由語音控制

這不再是一場單純的家電發布會,會場前面庫卡機器人自動開啟啤酒瓶蓋、把啤酒倒入玻璃杯的一幕,顯示美的從家電企業向科技型企業、從本土企業向跨國公司開始轉變。

在2017AWE(中國家電及消費電子博覽會)開幕前一天的3月8日,美的集團首次攜手庫卡機器人在國內公開亮相。在發布會上,美的還展示了可用智能語音控制的未來廚房。

會後,庫卡CEO Till Reuter在接受第一財經獨家專訪時透露,人工智能(AI)也將是美的與庫卡合力推進的方向,庫卡在B2B領域和美的在B2C領域剛好可以實現優勢互補。

智能家居是中國家電業的發展潮流和方向,但是說了幾年概念,消費者真正““埋單”的並不多,場景化成為當前智慧家居“落地”急需解決的重點。美的把廚房作為智慧家庭實施的突破口,打造“未來廚房“先走一步。

美的集團副總裁胡自強展現了未來廚房如何在40分鐘內,智能愉悅地準備一頓健康豐盛且針對個性化需求的聚會大餐。同時,利用AI技術,通過健康雲平臺展現了對健康管理的全過程。他認為,智慧生活的構想正逐步成為現實。

“未來廚房不只讓烹飪變得有趣便捷,關鍵在於讓智能為用戶的健康服務。未來廚房是美的智慧家居落地的重要成果,升級用戶生活方式同時,也可能重塑廚電產業的生態鏈和商業模式。”胡自強說。

美的的未來廚房,一方面在硬件上著力,如推出了一款可以自動進水、自動洗米、精確米水配比、一鍵全自動操作的智能電飯煲;另一方面在軟件上布局,智能廚房助手“小美”可以讓用戶對廚房的智能電器,進行語音控制與信息交互,揭示了美的在人工智能、大數據以及健康雲方面的後發優勢。

除了智能家居,美的“雙智戰略“的另一翼是智能制造。今年年初,美的集團完成了對全球四大機器人企業之一德國庫卡公司的收購,便是它在智能制造領域發力的強列信號。

收購庫卡,美的不僅在於加快自身智能工廠、智能物流的建設,還著眼於在家電產業之外開辟“第二條跑道“,找到業務新的增長點。美的集團副總載顧炎民在接受第一財經專訪時表示,暖通空調的全球市場規模一年1200億美元,而全球機器人與自動化市場規模一年1800億美元,且中國企業占比不高,因此,美的順勢向B2B領域延伸。

美的希望在內部形成”化學反應”,原來旗下的生產伺服電機的威靈電機、專註於自動化物流的安得物流,與新收購的庫卡機器人及以色列科技企業”高創“一起,全面打通包括機器人、自動化生產、自動化物流、工業服務等全產業鏈,形成智能制造解決方案,並向B端(Business)用戶輸出,為用戶降低成本,提高生產效率。

Till Reuter向第一財經記者表示,借助美的在中國市場的資源,庫卡希望在中國機器人市場成為最大的供應商,下一步庫卡與美的將攜手共同開拓人工智能、服務機器人的新領域,最終讓庫卡實現2020年在中國市場取得10億歐元營業收入的遠景目標。

美的集團董事長兼總裁方洪波今年年初曾在內部說,“美的人的市場化、開放性和分享精神是我們能夠在全球範圍內成功實現企業並購的原因,這些成功的並購開啟了我們美的真正全球化經營的新旅程”。借此,美的逐步從全球化家電企業向全球化科技集團轉型過渡。

PermaLink: https://articles.zkiz.com/?id=238684

腦洞大開的語音面具Hushme 讓公共場合打電話不再尷尬丨端點

吵鬧的火車站里,打電話時只能提高音量;安靜的圖書館里,突如其來的電話也讓你左右為難,想接又不能接。現在,那些重視隱私或者害怕打擾別人的人們終於可以在公眾場合自由地打電話了,一款語音面具就能輕松實現這個目標。

這款產品名為Hushme,被稱為全球首款為手機設計的語音面具。這個面具設計成環狀,佩戴時正好可以遮住嘴部,不僅可以讓你“靜音”,防止別人聽到你們的對話,內置的麥克風也可以保證通話對方能清楚地聽到你的聲音。

當然,設計師也貼心地設計了第二種使用方式,面具內的揚聲器可以讓使用者播放各種背景音:風聲、雨聲、海浪聲;鳥鳴、猴叫、松鼠聲;此外還有《星球大戰》里阿納金·天行者、R2D2、以及小黃人的聲音。

不過唯一的顧慮就是,帶上這款酷炫的面具後,跟《蝙蝠俠:黑暗騎士崛起》里的大反派貝恩意外地相似。雖然路人不會因為你打電話而註意到你,但是百分百會被這新奇的樣子吸引。

據報道,Hushme的定價約為249美元,計劃於今年五月進行眾籌,並於今年年底前開始商業生產。

PermaLink: https://articles.zkiz.com/?id=242861

三星S8攜語音助理Bixby亮相 能否挽回市場?

北京時間3月28日深夜11點,三星Galaxy S8正式發布。三星發布了兩個尺寸的S8旗艦機型(5.8英寸S8和6.2英寸S8 Plus),並且加入了語音助理功能,希望憑借這款手機贏得與蘋果的競賽,並挽回去年Note 7給公司形象帶來的損害。

高端手機群雄逐鹿

公開資料顯示,三星使用了曲屏無邊超大屏幕,屏占比高達84%。為了獲得更大的屏占比,三星甚至取消了正面指紋識別的設計,將指紋識別移到了後置攝像頭右側。後置1200萬像素攝像頭,前置800萬攝像頭,前置攝像頭還支持智能自動對焦和人臉抓取對焦。去年就已經爆出的三星雙攝方案並沒有在這一代上運用,可能今年的Note 8會進一步更進。

三星一些基本的功能特性也在這一代有所延續,諸如IP68的防水防塵,虹膜識別和人臉識別技術以及Knox安全防護技術等。S8有多種配色發布,包括謎夜黑、煙晶灰、霧嶼藍和綺夢金。

三星歐洲移動部門企業副總裁Jean-Daniel Ayme表示:“高端大屏手機的市場正在不斷增長,但是現在手機廠商面臨 問題是人們換機的周期變得更長了,因此,需要一種全新的顛覆性設計,讓人們的體驗往前帶進一大步。”他還表示公司將采取更加嚴厲的質量管控流程,以確保手機的品質。

S8可以說是三星近幾年來發布的最重要的一款機型,尤其是在高端手機市場競爭日益激烈的背景下,中國的華為手機也在爭奪高端用戶的市場份額。CCS Insight研究總監Ben Wood對第一財經記者表示:“S8毫無疑問是一款強勁的產品,但是三星必須吸取去年的教訓,做到萬無一失的發布。如果這樣,S8的定位將會變得更加有利。”

今年註定是智能手機創新進入新的里程碑的一年,蘋果也將於今年下半年發布iPhone十周年旗艦機。因此手機制造商都會賦予智能手機最為創新的元素,以贏得消費者的青睞。蘋果在前不久還在中國發售了中國紅iPhone 7和iPhone 7 Plus。

S8最大的看點是語音助理Bixby,這也是三星對蘋果Siri的公開叫板。Bixby能夠操控手機內的所有功能,並智能識別操作場景、深度學習自動優化判斷。不過三星也指出了和Siri的區別:比如提高了入口優先級,Bixby可以通過特定的實體鍵一鍵調出,通過語音、圖像識別、提示通知、卡片聚合等接口,更智能地提供服務。

三星還發布了Samsung Connect,用戶能供通過一個App,控制所有三星的智能設備,包括家里的電視和冰箱。目前Bixby的語言是美式英語和韓語,未來三星還將與合作夥伴共同開發更多Bixby能夠控制的應用軟件和硬件,比如與亞馬遜合作,就能直接在冰箱上添置缺貨的食品,等等。

研究機構IDC歐洲手機部門研究總監Francisco Jeronimo表示:“如果Bixby的使用比Siri更加簡單方便,能給用戶更好的體驗,那麽三星在人工智能方面可能比蘋果更具有優勢。語音是最容易與手機互動的工具,誰能提供更好的體驗,誰就能勝出。”

研究機構Counterpoint Research的報告則指出:“三星非常小心地強調Bixby不僅僅是語音助理,更是一個人機交互的界面,因為S8也同時支持谷歌的語音助理。但兩者分工不同:Bixby提供了一個與機器交互的語言環境,而谷歌人工智能助理則註重外部的搜索和發現。”

S8中國前景難測

三星Galaxy S8將於4月21日起全球開售。S8的海外版售價750美元(約合人民幣5166元),S8 Plus的售價則為850美元(約合人民幣5854元)。Counterpoint分析師閆占孟對第一財經記者表示:“S8在歐美成熟市場受Note 7爆炸的影響不大,但在中國S8的銷量前景還不好說。”但他預測,三星會借勢S8的發售,在中國推動更多中低端產品的銷售。“這是三星一貫的策略。”閆占孟說。

根據Counterpoint Research的預估,S8上市後一年的出貨量預計在6000萬臺,好於S7。Counterpoint研究總監Peter Richardson在一份最新的報告中預測:“S8第一年的銷量預計會比S7高出10%以上。”根據研究機構IHS預計,今年S7和S7 Edge出貨量約為4800萬臺,三星智能手機總出貨量將達到3.31億臺,同比增長6.8%。

Counterpoint還預計三星將於今年三季度發布Note系列智能手機產品,不過三星的競爭對手仍然不可小視。蘋果iPhone 8同樣會采用OLED曲屏,而LG即將發布的G6的售價將比S8略微便宜,因此也會成為S8的主要競爭對手。

與S8同時發布的還有諸如三星DeX的配件,通過DeX,用戶可以在顯示器上得到一個完整的類似於Window的PC電腦頁面,還可以通過VDI可以遠程操作綁定的電腦,更好地操作Adobe,office系列等軟件。

此外,三星認為未來的社交趨勢會由現在的視頻向全息視頻過渡,因此還發布了新一代Gear 360攝像頭和Gear VR頭盔。其中,Gear 360將支持4K錄制,以及PC端和移動端的社交直播。Gear VR則新增遙控器,同時在外觀上新增灰色版本,內容上Gear VR與Netflix、discovery、BBC earth、Disney、NBA等內容提供商合作。

Ben Wood對第一財經記者表示:“攝像頭和VR設備一起發布,說明三星很想提升消費者對於S8作為一個整體生態產品的感知度,不僅有硬件的支撐,還有內容的提供。這些要素將一起影響消費者對產品的體驗。”

PermaLink: https://articles.zkiz.com/?id=243612

普強信息何國濤:瞄準語音大數據分析和車載,做語音識別就是要快、準和專註

來源: http://www.iheima.com/zixun/2017/0425/162800.shtml

普強信息何國濤:瞄準語音大數據分析和車載,做語音識別就是要快、準和專註
黑智 黑智

普強信息何國濤:瞄準語音大數據分析和車載,做語音識別就是要快、準和專註

2015年,普強切入車載場景,聯手四維圖新和騰訊,共同開發出“雲+端+芯片”的智能車聯網大數據系統。

本文系i黑馬原創 首發黑智(VR-2014)作者:趙雪嬌

語音識別是“最具前途”的領域

從北京大學和美國費城大學分別獲得計算機系碩士學位後,何國濤曾在HP、Aruba等公司從事Opencall、Voice XML、無線網關等產品的研究和開發,HP多媒體服務器的語音識別技術,就是他所在的小組研發的。

而也就是在Aurba,何國濤結識了蒲瑤。後者本科畢業於中國科技大學,是科大訊飛CEO劉慶峰同系校友,同樣也是從事語音識別相關產品的研發。

2008年,科大訊飛上市,一度壟斷國內語音識別市場的半壁江山。但那時的語音識別創業領域,還是一片待開發的處女地。後來被蘋果收購的Siri也成立沒有多久,而何國濤卻動了創業的念頭。

“我剛畢業時,根本還沒有人會說自己是學人工智能相關的。因為那意味著失業。”何國濤說。“也有很多人質疑,總是說這個方向不對,那個技術不好。而我們就決定,自己出來,在這個領域做一些事情。”

何國濤和蒲瑤最終還是決定,在語音識別領域做下去。“創業,我認為一是要有技術壁壘,二就是要有能夠賺錢的市場。我在惠普接觸了客戶需求,也懂得應用,我認為,語音識別仍然是最具前途的領域之一,而當時,其他人要進入這塊領域,也並非容易。”為了解決核心算法,何國濤還“挖”來了自己的師弟——IBM Almaden研究中心的李全忠博士。後者一直從事數據庫及雲計算研究,還獲得過IBM發明成就獎。

於是,普強信息最初的創始團隊形成了。何國濤擔任CEO,負責公司運營;李全忠博士任CTO,負責核心算法的研究;蒲瑤(普強信息VP)負責產品。2009年,普強信息在美國加州矽谷成立,並獲得了EDA之父黃炎松博士的100萬美元A輪投資。第二年,普強信息設立了中國運營公司,在矽谷和中關村都設有技術研發中心。2013年,普強獲得戈壁領投500萬美元B輪投資,2016年獲得四維圖新領投的近億人民幣的C輪融資。

目前,普強研發團隊占公司人員的80%左右,其中博士、碩士以上學歷者超過30%。

挑戰語音大數據分析

何國濤對公司的發展方向有長期的思考。“小公司做事要專註,現在普強一百多人只做垂直領域,包括車載和電話信道語音識別,而且要做到最好。其實這很簡單,就集中優勢力量做好一個小事情。”

普強在自身的語音識別和語義分析技術基礎上,就鎖定了兩個方向:語音大數據和車載

當前,由於智能設備的大量應用,大量數據,尤其是呼叫中心等領域,大部分數據都是語音和圖像等非結構化數據。普強力圖提供語音大數據分析能力,為企業解決非結構化數據分析的需求。

2010年,普強面向呼叫中心推出了“千語語音識別引擎系統”和“千語千尋語音分析系統”。

據介紹,普強已經為金融、電信、保險等多個行業,提供了準確度較高的電話信道的ASR(語音識別)引擎。針對呼叫中心座席與客戶的對話,千語千尋系統的算法和模型接入後,能將不同地域口音的來電轉換成文字,還能根據不同的系統用戶需求,標註出關鍵用詞。

李全忠博士向黑智(VR-2014)介紹,“千語語音識別引擎系統”開發應用了深度神經網絡技術,通過語音切分技術和對識別結果的算法,進行語速探測、情緒識別等,以及對講話對象、時間邊界等進行分割,不僅提高了語音識別結果,也可以輔助企業進一步挖掘和分析海量語音數據。

當坐席和客戶通話時,接入了普強的千語千尋系統模型,不僅能將不同方言的來電轉換成文字,還能根據不同的系統用戶需求,標註出關鍵用詞,並針對其進行統計和專業化分析,挖掘客戶需求;對客戶流失進行預警分析,挖掘客戶投訴原因,進行幹預;或者替代人工質檢。何國濤舉例說,例如某保險公司就有2萬左右名保險銷售,管理者需要知道如何提高銷售成功率,客戶投訴的是什麽問題,客戶購買保險服務的原因是什麽等。“千尋”把這些問題都細化成文字,以解決客戶的需求,提升公司工作效率和營銷轉化率。

進行語音大數據分析,最基本的一點就是數據。李全忠表示,普強在呼叫中心電話線領域積累了十多年的數據,對電話語音數據處理和標註的積累,在業內是首屈一指的。

而對語音分析,最關鍵的比拼點,則是“快”和“準”。“準確度和識別速度往往要平衡,在不損失精度的前提下,我們可以做到最快,系統的全文識別率可達85%以上,關鍵詞識別率達95%以上。”李全忠博士說。他表示,千語千尋語音分析系統目前中文語音分析速度,是國內最快的。它擁有的文本分析引擎和索引處理技術,能夠實現分析操作在秒級以內完成,而業內多數語音公司的產品則要半小時甚至更久,千語千尋比之,要高出一個數量級。

除識別引擎及分析系統外,與國內外廠商相比,普強的優勢是擁有多年呼叫中心工作經驗的專家們所組成的專業咨詢團隊,以及完整的識別設備和工具,來協助客戶進行定制化應用服務,以保障企業最高的投資報酬率。

而據何國濤對黑智(VR-2014)透露,目前普強在業界公開招投標的項目中,始終保持著最高的中標率。

聯手四維圖新,切入車載場景

經過十多年的發展,四維圖新已成為國內數字地圖內容、車聯網和動態交通信息服務、基於位置的大數據垂直應用服務主要提供商之一。其數字地圖一直主導中國前裝車載導航市場,獲得大量、東風日產、北京現代等主流車廠的訂單。而和四維圖新的聯手,顯然加快了普強切入車載場景,迅速滲透車廠和車機系統集成商,積累大數據的步伐。

2015年,普強聯手四維圖新和騰訊,共同開發智能車聯網大數據系統 WeDrive。其中,四維負責導航,騰訊負責內容,普強主攻前裝。

微信圖片_20170425190505

這套智能車載語音系統,是由“雲+端+芯片”組成的。普強自主研發的是離線、在線的兩個聲學模型,其他的為集成。

陣列麥克風可抑制噪音回音,進行聲源定位。車載降噪DSP芯片可進行車載降噪去回聲,這也是普強的投資方——美國的一家芯片公司提供的。“他們只做芯片,花了大概一億美金做了十年,這就是壁壘。”

“從前端麥克風技術,包括硬件的DSP處理三到四個麥克風,到後端的雲端,整個一條脈絡已經打通了,基本上這個解決方案是最優的。”李全忠說。

另外,普強還可以做嵌入式識別,車機識別的系統直接在車機里面做,不用跑到雲端。車載需要保證穩定性、安全性,對嵌入式識別壓力非常大。普強會針對不同的系統和車機本身的噪音特性,分低中高端方案,量身定制識別算法。“把這些都優化進去,才能做到最佳,當然也要滿足用戶識別率的需求。”李全忠表示。

目前,普強車載語音系統已經被集成進多家國內主流車廠。普強最近也把嵌入式的算法嵌到四維收購的公司傑發科技,後者占後裝市場的70%,大幅提高了市占率。

用戶需求優先的“田忌賽馬”戰術

在何國濤看來,“專註”還有另外一層含義,即要準確理解用戶的需求。而對人工智能創業公司而言,算法並不是唯一,更重要的是,理解用戶的產品需求。從產品、界面、工作流到用戶層面的交互設計,都要圍繞它進行。比如,對車載產品而言,車速變化時,會影響到語音識別的準確率;車開得快,根本不會出現車旁邊有個人在走路的情況;車開得慢,就要小心旁邊打球的小孩……

針對用戶對產品的強需求出發,何國濤為普強提出了“田忌賽馬”的戰術。“算法肯定有最快的,但是在語音交互領域,準確率相差一兩個點並沒有本質差別。原來從 GMM 跳到 DNN,相對準確率增加了20%到30%,是很大的提升。可是現在大家使用的都是神經網絡,準確率達到95%或者96%,對用戶有什麽區別?我們沒有必要做20個系統功能,都保證96%的準確率。”

在車載領域,普強重點做的是導航、電話、音樂這幾個系統功能。“在車里人機交互的時候,一般用戶50%以上%的需求是在導航上,40%以上是打電話,還有10%是聽音樂、聽收音機、查股票等。如果把這3個主要需求都做到近100%的準確率,那麽整個系統的準確率就能超過90%。如果大家都只有100人,別人每個功能5個人,普強的3個功能每個都有30個人並且做到最好,這就是所謂的田忌賽馬。”何國濤說。

中國一年生產約2700萬輛新車,如果人機交互的系統每輛車收取一百塊,市場規模能達到27億。如何能在這片藍海中切到大塊蛋糕?按照何國濤的設想,未來普強會將多種交互方式融合,讓車像人一樣具備視覺、聽覺等多種感知能力。比如人可以用手勢調節聲音大小、調控座椅位置。要把這些技術很順暢地切到場景里面,這些工作更多是需要工程師來實現。“算法是第一步,剩下10%的事情,需要再花90%的時間做好。”

微信圖片_20170425190632

語音大數據 車載
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=246784

那個每天堅持60秒的胖子,不再發語音了

來源: http://www.iheima.com/zixun/2017/0518/163176.shtml

那個每天堅持60秒的胖子,不再發語音了
小馬宋 小馬宋

那個每天堅持60秒的胖子,不再發語音了

其實羅輯思維公號的語音也曾有過一個改版,只是估計大部分人沒有註意到

來源 | 小馬宋(ID:zhongguowenlian)

文  | 小馬宋

不知道你發現沒有,以前那個每天都會發一個語音條過來的公號“羅輯思維”,不再直接發語音了。

不知道你註意到沒有,他們公號文章也發生了很大變化,每篇文章的運營策略也跟之前不同了。

timg

連續觀察了改版後的羅輯思維10天之後,我整理了一套羅輯思維公號的變化和運營套路給大家,這並不是我作為羅輯思維顧問伸手要來的,而是自己分析整理的。

1、之前是每天發60秒語音,然後語音里告訴讀者今天的回複關鍵詞,讀者如果感興趣再回複關鍵詞看文章。現在是直接推送圖文文章了。

2、其實羅輯思維公號的語音也曾有過一個改版,只是估計大部分人沒有註意到。最早的60秒語音是在語音最後說出回複關鍵詞,後來改成語音開頭就說出關鍵詞。這可能是因為有人抱怨,突然想看哪篇文章了,但是找關鍵詞就找好久,還要把語音聽完才行。

3、羅輯思維曾經有過這樣的觀點:一個連關鍵詞都懶得回複的讀者,我們也不指望他能給你貢獻什麽。不過事實證明這個觀點未必對,消費者行為其實完全可以被設計出來,否則也就不會有《行為設計學》這門學問了。因為我曾經聽不止一個朋友驚訝的跟我說,原來羅輯思維除了語音還有文章呢?

4、改版後的文章內容發生了極大變化。除了改版第一天的文章是預告001號知識發布會,5月12號周五是上新商品的文章,其他所有文章都采用了同一種寫作形式:清單體。

例:

5月9日《清單|拿下目標職位的16個必殺技》

5月10日《關於防止孩子沈迷手機的清單》

5月11日《關於如何點出一桌好菜的清單》

5月13日《關於用朋友圈管理個人形象的清單》

……

5、60秒語音放在了第二條,一般每天三條輔文,另外兩條輔文都是商品廣告。

微信圖片_20170518102402

6、主文開篇即介紹主要內容,第二部分是作者介紹,清單體一般文字不多,大概需要5分鐘就能讀完。但是文末沒有羅輯思維這個公號的簡介,此處公號運營扣分。

7、你會發現近期8篇主文作者,有3篇是羅輯思維CEO脫不花,1篇是羅輯思維電商負責人VP李倩,另外4篇分別來自得到APP訂閱專欄作者DR魏、李笑來、熊太行、熊逸。

8、主文評論區的管理非常好,常常用評論區完成一些主文沒有顧及到的信息傳遞。比如改版後首篇文章《001號知識發布會:向終身學習者致敬》,文中就沒還有解釋為什麽叫001號知識發布會。但是評論區中羅胖的一條評論上墻,就解釋了001號的意思:001號的發布會內容已經準備完畢。現在開始想002號發布會的內容

9、評論區只放有料的評論,純粹的叫好和吹捧都被忽略了。而且每篇主文一般放出15條左右的評論,放太多就會顯得文章過長,給讀者壓力。

10、羅輯思維高管們對評論區利用率很高,脫不花、快刀青衣和羅胖時常上墻。這與那些特別關心本公司公號閱讀量,卻從來不關心公號內容是啥的公司老板們形成了強烈對比。

timg (1)

11、對評論區的管理,實際上是在暗示讀者:我們喜歡什麽樣的評論,倒不是要贊揚,但是希望你通過思考來寫評論。這也是一種消費者行為引導,在運營中,你鼓勵什麽,你就會得到什麽。如果你放出來的評論都是那些贊美之詞,那讀者就會更偏向寫這種評論。

12、清單體文章把公號主文的生產形式固定化了,不僅降低了生產難度,還能形成固定的讀者認知,是在用做產品的思維做內容

13、據說羅輯思維內部高層們掀起了寫清單體文章的高潮,牛逼的培訓公司高管們都是講課高手,牛逼的內容公司高管們也應該是內容高手,至少也應該試圖讓自己成為一個內容生產者,否則他們怎麽知道怎麽才能做好內容呢?這個對做產品的公司也是同理。

14、自從直接發圖文後,目測閱讀量比原來提升了一倍以上。一般10萬+文章的閱讀量可以通過點贊數*200推測出來。

羅輯思維 脫不花
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=249704

阿里迎戰智能音箱,一夜之間智能語音終端成為“紅海”了?

來源: http://www.iheima.com/zixun/2017/0706/163972.shtml

阿里迎戰智能音箱,一夜之間智能語音終端成為“紅海”了?
黑智 黑智

阿里迎戰智能音箱,一夜之間智能語音終端成為“紅海”了?

就在同一天,百度DuerOS開放平臺和阿里音箱,走到了開發者面前。

文 | 楊潔

編輯 | 黑智

阿里做消費級AI硬件了,第一款產品,是款智能語音終端設備,名字叫做“天貓精靈X1”。

智能音箱這片江湖,對於吃瓜群眾而言可能還略有陌生,但隨著阿里的進入,卻頓時有了“血海”的架勢。

而就在同一天,百度的AI開發者大會上,百度發布了DuerOS開放平臺,並稱之為“人工智能時代的安卓”,打造基於百度DuerOS為入口的智能語音生態鏈。

搭載了智能語音助手的智能家居,尤其是智能音箱市場,在2017年,也陡然變得熱鬧。從海外的亞馬遜、谷歌、微軟、蘋果,到國內的BAT,短短幾年內,在這個看似狹小的領域內,迅速集中了幾乎所有的互聯網巨頭,同時,包括到創業中小公司,再到傳統音箱廠商、家居制造商,連內容提供商們,也忍不住要來分一杯羹。大大小小數百玩家,頓時讓本來略顯沈寂的家用智能設備領域,變得擁擠起來。

只需499元,智能音箱抱回家?

阿里的智能音箱是什麽樣的?

這是一款比亞馬遜Echo、蘋果HomePod體積更小也更輕的智能音箱,直徑只有83毫米,高度126毫米,擺在家里顯得更為不“顯眼”。底部設計了一圈隱藏指示燈,會通過聲音來判斷用戶方位。在配置上,X1 采用了業內首顆 SmartAudio專業處理芯片,阿里方面表示,比此前市面上的主流芯片,處理效率提升25%,功耗降低32%。X1搭載了6麥克風環形陣列,能夠在家庭環境下實現5米範圍語音識別。

微信圖片_20170706075444

阿里人工智能實驗室負責人淺雪發布天貓精靈X1

和Echo一樣,天貓精靈X1目前可實現智能家居控制、語音購物、手機充值、叫外賣、充話費、查快遞、音頻音樂播放等功能。

而類似Google Home,天貓精靈內置了聲紋識別,可以識別用戶對象,成為“你的語音設備”,並針對用戶的淘寶賬號進行購物和支付、充值。據阿里人工智能實驗室透露,一款設備,可以實現對6個不同對象的聲紋識別。而這款音箱,只需要499元。

與此同時,作為阿里智能音箱的主導機構,阿里巴巴人工智能實驗室也終於露出了真容。阿里表示,人工智能實驗室(A.I. Labs)成立於2016年,負責阿里巴巴集團旗下消費級AI產品的研發,其使命是“探索人機交互新大陸”。阿里人工智能實驗室負責人是淺雪(陳麗娟)。而淺雪,也是當年阿里智能生活事業部的總經理,曾經和其他廠商合作推出過智能音箱產品“小飛”和“MA1/3/5”。據媒體傳聞,該實驗室直接向CTO張劍鋒(行癲)匯報,而在發布會當日,張劍鋒也來到了現場。

淺雪當天還表示,天貓精靈X1內置了由阿里人工智能實驗室研發的第一代中文人機交流系統AliGenie語音助手和開發者平臺。而AliGenie開發者平臺,主要面向四種類型的開發者,包括內容開發者、應用開發者、智能家居開發商和硬件生產商。通過AliGenie開發者平臺,開發者可以鏈接到阿里生態體系中的數億消費者和海量的生活和商業場景。

而這,不由得讓人聯想到百度發布的DuerOS開放平臺,開放了百度17年來在語音識別、深度學習、自然語言處理技術、多輪對話技術、搜索技術等上面的積累。同時,百度宣布將全資收購KITT.AI,並將智能設備語音喚醒和自然語言處理等核心能力免費開放。更有趣的是,百度還現場演繹了智能設備開放平臺的便捷性:一名工程師,通過十七行代碼,用1分鐘的時間,將百度DuerOS的能力接入搭載Alexa的Anker音箱,讓原本只會英文的音箱變得能夠聽懂中國話。

景鯤-百度度秘事業部總經理_副本

百度度秘事業部總經理景鯤發布DuerOS開放平臺

 語音助手和智能音箱,成為巨頭們必爭之地。

為什麽是智能音箱?

這場戰事肇端於大洋彼岸,也是海外的科技巨頭們,最早將它推向了高潮。

今年5月9日,亞馬遜發布了新款帶觸屏的Echo Show;就在次日,微軟和哈曼卡頓合作、搭載了語音助手Cortana的智能音箱invoke正式面世;Google I/O 大會上,Google Home的全新功能亮相;6月的2017年WWDC上,蘋果的Siri音箱HomePod壓軸推出。至此,亞馬遜、谷歌、微軟、蘋果等巨頭,已然在智能音箱市場正式會師。

initpintu_副本

天貓精靈、蘋果HomePod和Amazon Echo

基於亞馬遜智能助手 Alexa 的Echo點燃了這片市場。到了2016年11月,Echo問世兩年後,根據消費者智能研究機構 CIRP的報告數據,這一系列產品在美國的銷量已經達到了 510 萬臺。整個2016年,Amazon Echo 賣出了超過 650 萬臺。

Echo之於亞馬遜的意義,自然也不僅是一款家用的音樂播放器。它讓大眾感受到的,是基於語音交互的硬件時代的體驗;作為家庭設備中樞,Echo連接了家用智能設備、互聯網服務以及數據,為亞馬遜建立起了數據和算法的壁壘,同時,也擴展了更多的設備和應用接入亞馬遜Alexa語音識別平臺。

電腦的圖形交互第一次改變了世界,而智能手機的多點觸控,把移動互聯網時代和PC時代徹底區分開來。在更多的設備可以聯網時,除了觸屏,語音就是被寄予厚望的下一代核心的入口級產品。智能語音助手的意義,在於連接起各種互聯網服務,無論是手機還是音箱,不過是載體不同而已。

從微軟到蘋果,每一個站在時代頂端的企業,都是交互時代變革的引領者。

因此,我們就可以理解眾多玩家們的選擇。對於巨頭們而言,是要建立新的生態平臺,承載原有的內容和服務,拓展新的市場;對於中小創業者而言,在這個轉折點來臨、用戶亟待教育、巨頭剛剛入局的時刻,需要搶占垂直細分領域場景化賽道,在技術和硬件上占據先發優勢。

在這個變革時代前奏響起的時刻,沒有一個巨頭,願意放棄這個賭註。在智能機時代一步行差的諾基亞,就是最好的前車之鑒。

盡管Echo已經占據了海外80%的智能音箱市場,Google Home則占了10%。但是,對於中國用戶而言,這毫無影響:除了最新發布的蘋果HomePod有此可能外,它們並不能進入國內市場。這就為中國玩家們,提供了更多廣闊的空間。

2015年,百度就推出了語音助手“度秘”。2017年CES上,度秘研發的開放式人工智能操作系統DuerOS亮相,今年4月,搭載了DuerOS的小魚在家家庭機器人對外正式開始發售。7月5日,百度發布DuerOS開放平臺。

今年4月,騰訊推出了智能語音助手“騰訊叮當”。6月22日,騰訊雲的智能服務系統騰訊雲小微推出;就在日前,騰訊公司執行董事劉熾平在接受外媒采訪時透露,騰訊正在研發一款智能音箱。

在語音助手和智能音箱領域,BAT三巨頭再次齊聚。除此之外,今年5月,聯想正式推出智能音箱。語音領域的另一巨頭科大訊飛早在2014年就曾發布了交互式訊飛智能音箱X1,2015年,京東和科大訊飛成立了靈隆科技,推出了叮咚智能音箱。

“已經是紅海了。對於BAT而言,它們最重要的就是布局。”出門問問創始人李誌飛曾對黑智如此表述。

但這,仍然沒有擋住人工智能領域創業公司們的腳步。2017年,出門問問推出虛擬個人助理,發布問問智能音箱Tichome。“音箱是語音交互很重要的一個使用場景。如果我們的目標是要推動語音交互在消費場景下的落地,我覺得這就是一個不可缺失的場景。我一定要做這個東西。”李誌飛對黑智說。

2014年,離開阿里M實驗室的祝銘明(Misa)創辦了Rokid,今年6月8日,Rokid的第二代智能語音機器人Pebble全渠道上市。還有一個有趣的事情是,據Misa透露,他當初從阿里離任之際,向集團引薦的繼任人選正是淺雪。而當年也曾在阿里無線事業部和智能生活事業部負責阿里語音和圖像算法團隊的翟魯峰,也創辦了問之科技,推出了智能音箱麥寶。阿里,隱然成為國內智能音箱行業的“黃埔軍校”。

rokid

Rokid第二代智能語音機器人Pebble

既然是款音箱,那麽滿足用戶對音樂的需求才是最重要的。因此,作為內容提供商,酷狗音樂潘多拉和喜馬拉雅FM小雅音箱的入場,就也容易理解了。值得一提的是,為小雅音箱提供語音交互系統的,是由獵豹傅盛投資的AI公司獵戶星空。

還未真正搶占用戶的客廳,這個領域,就已滿滿地彌漫了硝煙的味道。“深圳南山區一公里以內就有112家公司做語音智能。”據喜馬拉雅硬件總經理兼副總裁李海波說。

而一個終極的問題是,究竟誰才能真正占領中國用戶的客廳?

這場戰爭的打法上,百度向左,阿里向右。

學習Google和亞馬遜?關鍵是開發者

既然是要搶占用戶空間內的交互入口,成為IoT生態核心,那麽,成為“平臺”無疑是眾多公司的野望。

相比之下,蘋果更為註重“音箱”的定義,HomePod秉承了蘋果一向高調表示的“高品質、高價位”,並且其音樂主要是依靠Apple Music的4000萬首曲庫內容支撐。

而在百度和Google身上,我們則可以發現更多的相似之處。盡管百度目前並沒有硬件產品,但是,Google Home,同樣也並不被認為是Echo的強力競爭者。它的市場占有率還遠不及Echo,但在Google的開放生態下,Google Assistant已經覆蓋了超過1億臺設備,並且集成了Google Lens的圖像處理能力,越來越多的接入終端,提供的龐大數據,正將Google Assistant不斷培養成強大的AI服務平臺。

在7月5日的百度AI開發者大會上,DuerOS成為其中的核心產品之一,百度度秘事業部總經理景鯤表示,DuerOS就是“人工智能時代的安卓”。DuerOS的目的就是要讓每個開發者,都能夠以低門檻打造屬於自己的智能語音交互設備。甚至搭載了亞馬遜Alexa這樣語音助手的海外設備,也能通過接入DuerOS輕松入華。

依托17年來積累的數據和AI技術,以及AI大牛們的貢獻,百度是準備在此基礎上,打造基於百度DuerOS為入口的智能語音生態鏈。

而谷歌和百度的選擇,或許也有無奈之處,那就是,它們不具備亞馬遜Echo模式的基因——它們天然並沒有產品和服務可以直接接入音箱。

至於Amazon Echo的路線,在技術方面,其關鍵的7個麥克風陣列,控制在1.5秒內的反應時間,以及接近成本的定價策略,都構成了亞馬遜獨特的壁壘。

要想挑戰Echo,更難複制的,則是亞馬遜圍繞自己生態建立的商業模式。作為全球最大的網上零售商之一,亞馬遜在渠道和硬件產業鏈、銷售、品牌等方面積累起了全方位的優勢,Echo在應用上,則可以和亞馬遜其他產品和服務相結合,比如,接入亞馬遜電商業務以及Kindle和Amazon Music等。基於亞馬遜本身產品的頻繁的應用場景,增強了Echo用戶的黏性,使其成為家庭設備的控制中心。Alexa的開放態度,帶來了更多第三方廠商的合作。

而同樣作為電商和雲計算巨頭,阿里無疑是有這個成為中國版“Echo”野心的。

天貓精靈上,同樣是接入了阿里的購物、支付、阿里智能聯盟的硬件設備等,在開發平臺策略上,也更類似Alexa。AliGenie同樣是走開放平臺路線,和第三方服務對接。在這個平臺上,阿里更強調的,是產品未來所能提供的服務能力。和Alexa放在AWS上一樣,AliGenie也運行在阿里雲上。基於阿里雲和YunOS,為智能硬件提供服務,占領家庭控制中心,是阿里一貫以來的想法。

智能語音交互終端雖然已經成為紅海,但是語音識別和自然語言理解技術還亟待提高,應用場景還需要更多挖掘,用戶使用習慣更是需要培養。前方的坎兒還很多。如何讓AI技術和產品在更多的場景里落地,打造更大的生態聯盟?阿里和百度選擇的,都是走第三方路線,讓開發者們,提供更多的可能。

但平臺不是你想做就能做的。產品能力、技術底蘊和公司基因,是個很大的影響因素。而阿里在語音識別技術和硬件上的能力,也還有待考驗。

李彥宏在AI開發者大會上演講時說,百度內部在討論收購事項時,他的同事擔心有競爭對手會同時出手,但李彥宏說:“我說,不會的,我們的競爭對手不會收購技術公司,他們只願意為產品和用戶量付費,只有百度願意為技術付費。”姑且不論其指向誰方,但其中的意思卻是很明顯的。

語音交互之爭,前方還是個未知數。第三方服務商和開發者,已經成為這場未來戰鬥的重要決定者。

黑智簽名檔

阿里 智能音箱 百度 天貓精靈 DuerOS
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=253941

一個用戶和地圖“全語音”交互的時代來了?搜狗地圖智能副駕發布

來源: http://www.iheima.com/zixun/2017/0718/164196.shtml

一個用戶和地圖“全語音”交互的時代來了?搜狗地圖智能副駕發布
黑智 黑智

一個用戶和地圖“全語音”交互的時代來了?搜狗地圖智能副駕發布

地圖產品正在進入“全語音”時代。

地圖行業也全面進入人工智能時代。

7月18日,黑智獲悉,搜狗地圖發布智能副駕,將語音交互技術應用到了日常出行領域之中。相比起目前的部分語音導航產品,搜狗地圖智能副駕支持用戶全程進行語音交互,要將駕駛員的“手”和“眼”完全解放出來。

搜狗地圖

搜狗地圖負責人孔祥來

目前,幾乎所有的互聯網企業,都將布局人工智能作為當下的戰略重點。而對於人工智能的應用落地,卻是大多數公司仍在探索的方向。據負責人孔祥來向黑智介紹,在搜狗地圖進行用戶調研時,在超過1萬份有效問卷中,有61%的用戶需求,都是和駕駛相關。基於此,搜狗地圖在人工智能的落地應用嘗試上,首先落在了駕駛領域。

不同於傳統導航產品,搜狗地圖智能副駕能夠全語音支持車內垂直場景的對話,並且實現了全程多輪語音交互。用戶通過搜狗智能副駕,可以語音查詢地點、發起導航,並且支持個性化地址和意圖表達,能夠適應用戶的口語表達。同時,搜狗智能副駕支持多項服務,包括語音設置途徑地點、設置路線、查詢路況、沿途搜尋周邊、語音操作地圖等。

例如,當用戶說出“我要去奧森”,搜狗智能副駕會進一步交互“您是去奧林匹克森林公園南園還是北園?”當確定了南園或者北園之後,智能副駕就會規劃出路線,並且給出路徑計算以及預計到達時間。在導航過程中,當用戶問出“前面是否堵車”時,搜狗智能副駕也會給出前方是否為緩行路段的提示,如果用戶臨時更換地點,也可通過純語音交互快速重新規劃路線。而當用戶問到“奧森附近是否有停車場”以及“是否有好吃的地方”時,智能副駕還會根據用戶的需求推薦附近的停車場和餐廳,並且告知價格、距離等,通過智能分析對比反饋給用戶合適的選擇。而且,搜狗智能副駕的全部反饋均可通過語音表達,並精煉語言播報結果。

“搜狗地圖能夠實現全程多輪語音交互這一突破,主要得益於搜狗在語音識別、語義理解、智能糾錯、智能搜索、意圖分析等方面綜合技術能力的緊密結合。”孔祥來說。據悉,搜狗每日有2.4億次語音請求量,積累了大量的語音語料數據。目前,搜狗地圖針對地理位置專門優化後語音識別正確率已達97%,考慮到車內環境噪音可能會影響語音識別效果,搜狗地圖還定制了車內環境降噪方案,包括風噪、回聲、兒化音過濾以及語音糾錯等功能。搜狗智能導航全程人機對話支持超過10萬的語義網絡,能夠細分場景,精細處理對話需求,理解用戶意圖。

據孔祥來介紹,搜狗地圖智能副駕在為用戶提供手機APP應用之外,也為車機廠商提供雲服務與語音助手定制服務。目前,搜狗地圖已經和福特、博世等車企開展了合作,搭載搜狗地圖導航產品的全新車型也即將面世。

地圖產品正在進入“全語音”時代。這或許不僅能夠推動地圖行業的技術革新,也讓語音交互成為地圖領域一個全新的應用方向,讓智能語音技術步入更大的服務空間。

黑智簽名檔

 

搜狗地圖 人工智能 語音助手
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=254825

Next Page

ZKIZ Archives @ 2019