📖 ZKIZ Archives


訊飛:打開語音新世界

http://content.businessvalue.com.cn/post/6032.html

一個大學裡的語音實驗室,如何成長為一股影響移動互聯網產業的力量?

在美國熱播劇《生活大爆炸》中有一集十分有趣:宅男Raj手持一部iPhone 4S,愛上了其中的語音助理Siri,雖然後者只是一種發女聲的手機功能,但Raj深陷其中不能自拔。他會詢問Siri附近的咖啡館在哪兒,並想像自己去 那裡與它約會,甚至會讓Siri給自己放首歌,深情地邊聽邊說:「只有你最懂我。」

雖然劇情誇張,但起碼這從一個側面證明,手機語音功能的普及讓普通老百姓也開始能接受這樣的笑料,也證明了在移動互聯網時代,語音技術正在成為一種流行的、全新的人與手機的交互方式。

在微軟創始人比爾·蓋茨眼中,未來影響世界的三個技術領域——語音、觸摸和視覺中以語音居首;而蘋果公司更是在新一代iPhone中直接將語音助理Siri作為了其最大賣點之一。

擁有語音技術的公司成為大眾熱點,也成為移動互聯網的行業焦點,這使得一家在公眾視野蟄伏了10年的中國本土公司逐漸浮出水面。

訊飛立足點

1999年春節前夕,安徽合肥,現在的科大訊飛董事長、當時的中國科技大學在讀博士生劉慶峰實際上正面臨兩難選擇。他所在的中國科技大學的語音實驗 室一直與一家福建企業合作,可對方因為種種問題資金遇上了困難,連實驗室的基本工資都發不出。作為這個實驗室的負責人,他要麼「事了拂身去」,出國並繼續 他的博士學業——這樣整個團隊勢必會解散;要麼留下來牽頭帶領這幫一起幹的夥伴們繼續前行。

據科大訊飛副總裁江濤回憶,「慶峰其實只需要把實際情況跟大家說清楚,跟自己就半點關係沒有,但他還是不動聲色地以個人名義借了錢回來給大家發工資」。

「當時我還是有點過度樂觀吧。」劉慶峰說,「我們下決心產業化,當時的信心和現在一樣,認為未來每一部手機、轎車、家電、玩具,語音都將成為一個基本需求點,而且以我們的技術能力,有可能成為行業領導者。」

在此之前,實驗室參加「863計劃」的比賽剛剛以3.0的高分奪得第一名。中科大的學生當時會聚了全國精英,而在團隊裡還有一些外面的技術高手,劉 慶峰認為解散太可惜。資方並不懂技術,較為急功近利,經常進行研發方向的調整,把團隊折騰得夠嗆,劉慶峰決定站出來解決這一切。「本來我們的夢想是成為類 似美國貝爾實驗室的存在,我就當個總工程師挺好,可形勢的發展讓我不得不站出來當CEO。半年之後,感覺還不錯。」他說。

這就是科大訊飛的成立故事,從裡面不難看出這家公司的一些特徵:技術驅動、對語音未來的篤定以及濃濃的校園風格。這使得它和美國硅谷一些知名技術公司擁有相似的氣質。

可是語音到底什麼時候能夠產業化並且獲得收益?沒有人心裡有譜。

其實早在20世紀70年代,世界各國就有很多組織開始研究語音技術,包括語音識別、文本朗讀、指令判斷等。到20世紀80年代,語音就開始被稱為 「未來5年的技術」,可過了一個又一個5年,它卻似乎永遠站在遠方,離普羅大眾的距離從未真正接近過。在國內,20世紀80年代「863計劃」也扶持了很 多語音實驗室進行相關研究,中科大、清華、聲學所、語言所等均在其列,只是研究的側重方向各有不同。

為什麼語音技術難以產業化?因為語音技術說白了就是機器對人聲音的識別、判斷與輸出,涉及到不同國家、不同口音的人和大量聲學、語言學、數字信號處 理知識。作為一項基礎技術,它不僅考驗語音聽和寫的能力、搜索能力、語音合成能力,還有複雜得多的與電腦相關的數據庫等後台能力。

在單機時代,光是辨別語音所需要的龐大數據庫存儲和計算能力就讓人頭疼。要想語音識別準確,就必須有海量數據庫進行匹配,還要通過算法來讓它實現快捷高效,這幾乎是一件不可能完成的任務,硬件的門檻將無數研究者阻擋在技術商用化的門檻之外。

可是從20世紀末開始,一切似乎正在發生變化。互聯網的興起讓這樣一種模式成為可能:大量的存儲計算放在服務器端(云端)來完成,而前端的電腦則只需要採集聲音和給出反饋就可以了。只不過網絡帶寬的限制以及電腦麥克風當時並不普及,語音技術還沒獲得生根發芽的土壤。

此時的科大訊飛,在拿到第一筆投資、還未能盈利之前,就做出了一項「風險很高」的決定:以企業的方式,與中國在語音研究領域領先或有特色的院校建立聯合實驗室形成了「產學研」結合的雛形。

它的邏輯很簡單:語音技術未來一定很值錢;各個院校擁有不同細分領域的語音技術,融合起來才能具有威力;能將中國最好的做語音研究的人才儘可能網羅到一起。這筆「技術投資」,為訊飛今後的發展提供了堅實的基礎,這也是訊飛從技術核心出發的第一項重要決定。

從B到C

心氣高、兵馬壯的訊飛,幾乎在做第一個產品時就遭遇了挫折。「當時我們做了一個面對消費級PC市場的統一輸入法,你可以用語音、手寫等各種方式輸入中文,可產品辛苦研究出來卻沒有人買賬。」江濤說。

對當時的訊飛來說,消費級市場實在是一個難以跨越的坎,因為它意味著要為產品建立一個全國的銷售網絡、服務網絡,光服務成本就入不敷出。再加上 2000年初,「統一輸入法」這樣的產品並沒有市場,消費者根本沒有對於語音的認知,而鍵盤和鼠標已經足以滿足他們在PC上簡單的輸入需求。

這時候,劉慶峰做出了第二個重要決定:砍掉辛苦努力了很長時間的B2C業務,專注於B2B企業級服務。

在之前1999年中國國際高新技術成果交易會上,科大訊飛只有幾平方米見方的展台上迎來了幾位客人,他們對訊飛的產品表現出不同一般的興趣與瞭解。 這是華為的人,作為移動通訊設備廠商,他們看到了語音對於移動通信產業的意義。雙方幾乎一拍即合,華為採購語音引擎,訊飛則成為其技術供應商。

好的技術總會有價值,與消費者相比,企業客戶更專業、理解力更強,這讓幾乎全技術班底的科大訊飛不用再去做那些不擅長的事,將精力聚焦在了語音技術本身和運營服務中。

客戶接二連三地來,訊飛也終於擺脫了剛開始的茫然,進入有序發展,並接連引入了聯想投資、復星資本等投資方。「聯想和復興的風格完全不一樣,前者對 我們工作很細緻,幫助我們建立了管理體系;後者則完全信任,給了我們更強的信心。」2004年依靠B2B,訊飛實現了盈虧平衡。

已經有了一定實力的訊飛開始將目光再次瞄向最終用戶,可它卻用了一種由企業到用戶的曲線方式。它向自己的電信運營商客戶如中國電信提出了一項要求:希望從只提供技術引擎,變為自己來直接做運營與維護。這樣來與用戶發生接觸。

與此同時,它還發現了另一個「金礦」,那就是教育市場。學習不過是「聽說讀寫」,其中很多層面涉及語音,通過提供這一垂直場景的帶讀、朗誦語音評測等技術功能,訊飛已有斬獲,基本上對教育市場(學習機)形成了近乎壟斷的優勢。

2008年,科大訊飛上市。在企業級市場上技術加實幹,為它贏得了極大空間,可上市之後幹什麼?訊飛將目光重新投注在了其初衷上。

當時做統一輸入法為什麼失敗?「不是模式錯了,而是模式沒有適合當時的背景。」劉慶峰說。而現在,背景環境似乎已經轉向。

新基礎服務提供商

2007年開始,移動互聯網迅速發展。iPhone手機和Android系統的發布讓智能手機迅速開始普及,移動帶寬到3G時代得到了明顯提升,而手機天然的隨身性和麥克風等硬件所賦予的良好交互性,為語音類產品發展提供了天然機遇。

訊飛一方面深入語音研究,對技術最前沿能做到什麼樣心裡有底,另一方面,與數千家合作廠商日復一日的密切接觸,能讓它對產業引爆點的判斷更加精準。

傳統語音技術,無外乎語音合成、語音搜索、語音聽寫三類,在準備了很長時間之後,2010年末,訊飛推出了自己的「語音云」平台,將語音能力提供輸 出接口,讓很多移動互聯網創業者能由此為自己的應用引入語音能力。而在此之外,訊飛則選擇擅長的領域做一些「示範應用」,在第一代語音云上,示範應用是訊 飛語音輸入法和互聯網電視語音搜索。

這是另一片戰場,國外谷歌等互聯網公司也有提供類似服務,但訊飛在技術上有著過硬的功夫。2006年到2011年,訊飛連續6年獲得英文語音合成國 際大賽(Blizzard Challenge)第一名,2008年獲得國際說話人識別評測大賽(NIST)第一,2009年則又拿下高難度混淆方言測試指標冠軍。

到2011年末,一年時間訊飛語音云用戶總數超過1000萬,而之後三個月,用戶總數超過了3000萬,合作夥伴超過3100家,每天服務請求量超過700萬次。這是一個驚人的數字。

2012年3月22日,訊飛在北京國家會議中心舉辦新一代「語音云」發佈暨語音開發者大會。聯想控股董事局主席柳傳志來了,創新工場董事長兼CEO 李開復來了,小米公司、大眾點評、知乎等互聯網公司也來了,現場人數達到2300人之多,場面火爆。所有人的目的都只有兩個字:語音。

新一代語音云增加了自然語言理解、個性化語音識別、口語評測等新能力特性,而其示範應用,則是一款名為「訊飛語點」的工具。

在試用過程中,訊飛語點雖然還有一些小Bug,但總體表現出了很強的辨識度和易用性。比如當你念出「把張三的手機號碼發短信給李四」,語點就能自己 識別出人名、指令,並完成相關操作。除此之外,它還能設置日程提醒、手機導航,還能查詢天氣、股票等信息,甚至可以做算術、講笑話。這一應用將新的語音云 平台能力展露無遺。

毫無疑問,經過10多年發展之後,訊飛有了兩塊最具價值的資產,那就是語音云和相關技術,再往上,各個實驗室是「正在下金蛋的雞」,而產業合作還在將這些金蛋換成金錢。

據《商業價值》瞭解,考慮到新一代語音云平台多出了很多新的特性,不僅增加了指令和個性化學習,而且還大幅提升語音識別準確率,訊飛今年年初曾面臨兩個選擇:一個是獨享自己的語音云平台,基於它推出新的創新產品,二是直接將升級版的語音云平台向整個行業開放。

在思索一段時間後,訊飛還是決定選擇後者,因為作為一種基礎能力,開放的語音技術力量將能支撐整個行業用更快的速度前行。

現在,訊飛的想法是自己做10%。「我們做開放平台跟訊飛的特點有關。語音應用無處不在,在每個領域都有前景,能力要和應用場景深度結合才有用,這是一條漫長的路。」劉慶峰說,「我們有最好的嘴巴和耳朵,還有基本思維,可是需要大家一起教育它。」

而相關的應用場景,最主流有三類:手機基礎操控類,比如打電話、發短信、設置日程等;助理類,訂酒店、問路、問天氣等;還有行業夥伴在各個行業的產品中增加聽說功能。這已經是一個相當大的佈局,訊飛正在向著新一代移動互聯網基礎服務提供商的位置前行。

有人覺得,科大訊飛的幾個發展點都踩得很正,並且符合語音技術產業化的成熟節奏:成立後不久就找到了華為、中興等移動設備商作為客戶,用穩定的收入 站穩了第一步;後來又在合適的時間點與移動運營商合作,同時發現教育市場這片金礦,成為其中語音最有影響力的技術產品提供商;2008年上市後,開始從企 業級往移動互聯網消費端滲透,做訊飛語音輸入法並獲得一定成功,第一版語音云平台也擁有了3000多個合作者,未來機會很大。

這確實是科大訊飛比較重要的三個發展階段,但它遠遠不是全部。

劉慶峰認為,訊飛走的是一條「彎曲的直線」,朝著正確的方向,但中間也有很多不為人知的失敗,「我們不是剛好踩到點,只是很多踩不到點的地方大家都看不到而已」。

對他而言,訊飛目前的成果經過了幾代人的努力,核心技術持續突破,到如今才真正達到了大規模實用的門檻。而訊飛一直在朝著既定目標前進,那就是讓語音真正成為所有人身邊能使用的產品。


PermaLink: https://articles.zkiz.com/?id=32682

【每日一黑馬】云知聲:創立一年的公司如何挑戰科大訊飛

http://www.iheima.com/archives/41876.html

來源:i黑馬 作者:石海威

【導讀】云知聲近期的頻頻亮相令其頗受關注。3月27日,在「錘子ROM」發佈會上,云知聲與老牌公司科大訊飛一起,同時入圍了錘子科技的語音解決方案。

云知聲的出現,打破了長久以來科大訊飛在語音識別領域的壟斷地位。

羅永浩「錘子ROM」發佈會於2013年3月27日如期舉行,當晚云知聲擊敗科大訊飛成為「錘子ROM」語音解決首選方案,成為發佈會一大亮點。儘管由於環境噪音干擾,老羅永浩羅現場幾次多次現場演示語音控制均告失敗,但云知聲創始人事後樑家恩對i黑馬錶示,依然很感謝老羅「把云知聲帶到了國家會議中心的大屏幕上。」。

一個多月後,在5月7日樂視超級電視的發布會上,云知聲掙回了面子。這台超級電視集成了云知聲的語音交互技術。外界評價稱,「從現場演示效果看,識別準確度和識別效率方面都具有很高的水準。」

除了錘子ROM和樂視超級電視,云知聲的合作方還有搜狗語音助手。云知聲借助自己的本地語音識別、云端語音識別,以及語義分析等技術為它們提供服務。

而云知聲做為繼科大訊飛後的語音黑馬,一夜之間備受關注。

中科大畢業後,梁家恩在中科院自動化所進行了五年深造,之後加入盛大創新院。2011年,隨著Siri的爆發和人工智能的普及,梁家恩覺得創業時機已經成熟。從2001年起梁家恩開始接觸語音識別技術,中科院自動化所也是國內最早進行語音識別的研究機構,擁有絕對的技術權威,國內許多語音技術創業者均來自於中科院。

事實上,梁家恩與科大訊飛創始人劉慶峰也師出同門,二者都畢業於中國科學技術大學。梁家恩記得很清楚,當年科大訊飛拿到第一筆錢的時候他還在讀本科,2008年中科大五十週年校慶時,劉慶峰再度做為創業明星被校友們津津樂道,不過那時梁家恩並沒料到,自己有一天會在技術上與科大訊飛抗衡。

梁家恩表示,儘管語音識別看上去只是將語音轉換成文字這麼簡單,但從前端的語音識別到後端的語義理解其實需要龐大系統的支撐。專業領域將人們說話的不同發音在專業上稱之為聲學模型,不同的人說話的內容不一樣,詞序也不一樣,語音識別就是要從中尋找到最具共性的東西,並加以描述,然後與跟模型做快速有效的比對,來滿足需求。

語音技術這種研發最終將需要累積起一個非常龐大大的數據累積庫。,國外從上世紀50~60五六十年代起就開始了這方面進行語音識別的研究,而國內則從80年代起才開始起步有統計的識別。梁家恩很清楚其中的差距,他從2001年起接觸語音識別技術,

中科大畢業後,在國內語音技術的搖籃——中科院自動化所進行了五年深造,之後加入盛大創新院。

2011年,隨著Siri的爆發和人工智能技術的進步,梁家恩覺得創業時機已經成熟,於是離職單幹成立了云知聲。目前,除了語音識別技術外, 云知聲目前的核心服務除了語音識別技術外,另一項核心技術是是云計算平台技術。其中,公有云主要針對普通一般開發者,降低使用門檻,用標準化的服務解決技術問題,並此類服務採取免費策略。;私有云主要針對企業客戶,可根據企業的特殊需要提供定製化的SDK和接口調用。服務升級,包括一些定製化的開發以及適配。對客戶需求場景進行優化,包括語料庫的練習。引擎部署在客戶服務器,收取專利費和服務費。

雖然語音識別已成為巨頭們瞄準卡位的關鍵領域,但梁家恩並不擔心自己公司的技術實力,他本人就在語音領域積累了十幾年的研究經驗。眼下,他的擔憂主要在於技術型創業公司如何實現商業化。

科大訊飛的很大一部分收入構成很大一部分來自傳統行業,包括政府和運營商,而梁家恩設想云知聲未來的收入比重將更多的偏向互聯網。現階段,云知聲沒有切入垂直化的產品,而是專心做平台,讓開發者基於云知聲的技術去做個性化的產品。梁家恩認為,互聯網的廣告平台、遊戲平台都能賺錢,語音識別將是下一個盈利平台。

不過梁家恩認為,未來只靠技術服務收費是不具備持續性的,讓開發者受益又免費才是長久之計。因此現階段云知聲並沒有切入垂直化的產品,而是專心做好平台,把高門檻的技術轉化成更便捷的服務,讓開發者基於云知聲的技術去做相對個性化,隨心所欲的產品。在梁家恩的設想中,互聯網中廣告平台、遊戲平台都能賺錢,語音識別將是下一個盈利平台。

眼下樑家恩的擔憂主要在於技術型創業公司如何實現自己的商業化。儘管,語音識別已成為巨頭們紛紛瞄準卡位的關鍵領域,但對於從事十幾年語音識別研究的梁家恩來說,巨頭在技術上的追趕他並不擔心。相反,他也梁家恩坦言,云知聲多是碩博以上的高學歷的研發人員員工,但絕大多數人並不瞭解互聯網和商業。如何將技術轉化變成商業,再到公司化運作,梁家恩和他的整個過程自己和團隊也都還在摸索之中。

北京云知聲信息技術有限公司

創始人梁家恩
成立時間20126
所在地區北京
員工人數30
主營業務語音識別及語音處理技術研發
2012年營業收入暫無
融資狀況已獲天使投資
PermaLink: https://articles.zkiz.com/?id=56395

不斷給人驚喜的訊飛輸入法 財智力量

http://blog.sina.com.cn/s/blog_62004f950102e9f1.html
使用訊飛語音輸入法已經接近兩年的時間了。
一開始只有手機版。但是我已經驚詫於它的識別的準確率。這兩年的時間裡,我的很多長文章的是在手機上用訊飛語音錄入的,然後再拷貝到電腦上的。原來需要一個小時才能手寫或是輸入的文章,一般只用十分鐘就足夠了。這還包括其中思考,和小修小改的時間。這對辦公效率是一個巨大的提高。當時我就在微博和博客上,大聲呼籲大家使用訊飛輸入法。

而且熱切地期盼訊飛輸入法pc版的出品。大約半年前,訊飛輸入法的PCwindows版本終於出品了。得知這個消息後我馬上下載試用。果然不錯,雖然沒有手機上的錄入法那樣識別準確,但也大大提高了輸入的速度。具體識別不准的原因,我想可能是pc的麥克風的降噪功能稍弱。

令我想不到的是,時隔不久的現在,訊飛輸入法又出了「訊飛麥克風」。可以利用手機作為電腦的輸入語音麥克風。我剛剛下載試用,識別率超高。帶給我巨大的驚喜。

能夠不斷創新不斷改進,是用訊飛令我極為欽佩的地方。讓我為我的同胞能夠研製出這麼好的產品而自豪。

如果不是訊飛極高的估值,我一定會成為它的股東。
PermaLink: https://articles.zkiz.com/?id=82059

科大訊飛的語音生態夢想

來源: http://newshtml.iheima.com/2015/0131/149042.html

黑馬說:讓機器能聽會說、能理解會思考是未來人機交互的發展方向,語音作為最被看好的人機交互方式,可進入我們生活的每個角落,有人類活動的地方就有語音需求,科大訊飛能實現其語音生態夢想嗎?
 
\ 
口述/劉慶峰  科大訊飛創始人、董事長
整理/崔婧
編輯/蒲鴿


現在互聯網行業有個說法是,做平臺才會生生不息。我覺得,做生態和做開放平臺是差不多的意思。就我的理解,科大訊飛(下稱訊飛)生態架構應包括以下三方面內容:

第一,語音的特點決定了語音產業需要構建更好的生態。這是因為,語音可進入社會生活的每個角落,有人類活動的地方就有語音需求,甚至未來機器和機器通話也需要語音,從能聽會說,到能理解會思考。語音不是單一產品,圍繞它能夠衍生出很多應用。
 
第二,必須搭建平臺,以讓更多人通過自我創新從中獲益,因此未來構建的應該是一個合作共贏的生態體系。基於此,我們已將訊飛語音雲平臺開放出來,為平臺上近5萬個創業者提供核心技術,提供雲端各種資源存儲以及後臺分析能力,甚至把之後的變現能力也已開放出來。要打造的生態,必須具備可觀的成長空間,能夠為合作夥伴帶來全新價值。

第三,構建一個生態,就像培育一株大樹,樹的根系很重要,而訊飛,希望在語言和語音產業中扮演發動機的角色,不斷創造出全新技術。從語音合成,到訊飛語音雲,到聲文識別,到口語評測,到翻譯,到自然語言處理和圖像人臉識別技術,每一步都已證明,訊飛勝任產業發動機這一角色。


語音生態圈包括這樣一個鏈條:硬件研發—軟件研發—語音方案研發—集合方案後的產品制作—面向C端用戶的軟件開發—C端用戶的使用,同時C端用戶的使用又把信息從產品導向了語音,繼而導向軟件,再導向硬件。整個參與過程,因有了信息的流動,價值得以產生。價值何來呢?這就是訊飛語音雲平臺目前在做的事,即對用戶數據進行分析,為用戶畫像,以此指導訊飛的商業化。這是一個縱向生態鏈。
 
我覺得,在中國各產業發展過程中,未來一定要有一批自主創新企業在生態體系中掌握價值鏈主導權,這樣我們的產業才能持續健康成長。我希望,未來的訊飛能夠主導價值鏈關鍵環節,通過持續不斷的源頭創新,將這一生態做大。
 
最優化核心技術
 
訊飛對整個產業生態的貢獻,首先是iFly inside,即為廣大To B客戶提供最好的技術支撐。中國電子企業百強前10名中,有8家在用訊飛的技術。放眼各領域,目前國內已有2000多家龍頭企業在用訊飛的語音技術。
 
創業初期,我們也曾走過彎路。那時,我們下了很大功夫,開發出了一款電腦桌面軟件“暢言2000”,試圖把手寫輸入的隨意性、鍵盤輸入的準確性和語音輸入的高效性完美結合起來,然而產品叫好卻不叫座,市場反饋不如人意。之後,我們又嘗試用語音合成技術解決海量動態信息,並找到當時異常火爆的合肥及上海的168聲訊臺,成功進行了試點,結果仍是產品沒有辦法銷售出去。
 
屢遭挫折後,我意識到,訊飛直接做消費者市場有些理想化,於是重新調整了思路——讓有渠道、有市場、有技術的大公司去直接面對消費者,我們準備像Intel一樣,專註做好iFly inside。換言之,訊飛只負責開發引擎、語音合成和語音識別芯片,而應用集成則由下遊的開發商或客戶自己完成。
 
2000年初,訊飛順利通過了華為的技術測試,成為後者語音合成技術供應商。不久後,來自中興、鑫泰、神州數碼等大型企業的語音技術服務訂單接踵而至。這是訊飛企業發展史上的里程碑式事件。自此到當年年底,訊飛迅速發展了近50個穩定的TO B客戶。
 
之後,我們通過跟美國的Nuance公司合作,又切入到了語音識別技術領域。後來,我們感覺,訊飛自主研發的技術可逐漸超越對手,因此在2006年,我們告訴Nuance公司,不跟它合作了,因為我們要自己獨立研發。2年後,訊飛該領域技術已超越Nuance。
 
那時候,我們更多的是在技術上支持企業。基於用戶打電話訪問自己賬戶信息的情況,多家銀行陸續推出了電話銀行業務,但隨著客服成本越來越高,銀行希望用戶的一些簡單查詢能夠以機器答複替代人工,以減少坐席人員投入。國內最早有此需求的是中國工商銀行總行。當時訊飛的技術滿足了該行要求,成功中標。
 
為了推廣技術,我們還搞了一個語音應用行業峰會。我們把金融、證券、運營商等行業代表以及行業內信息化專家都邀請過來參加論壇。這個論壇一般圍繞兩件事情來進行, 一是討論當前語音技術發展處於何種階段,一是為使用我們語音技術的企業(比如工總行、中移動)提供一個介紹經驗的場合,讓其他同行業夥伴了解我們的語音技術在這些企業應用的情況,這些企業也挺樂於分享基於語音技術推出的一些創新型項目。
 
在行業內傳播開來後,我們也定期印制期刊寄給這些企業,主要內容包括訊飛的應用案例,語音技術處於什麽狀態,語音技術在哪些行業已經產生了哪些新應用等。這些企業的老板看到信息化專家的觀點之後,就會琢磨:我這個行業是不是也可以使用訊飛語音技術降低成本、產生價值,或者創造一些新的效益呢?
 
我們的客戶主要定位在中大型企業,因為訊飛提供的技術往往有較高門檻,企業需要先花費高額資金購買訊飛的技術,才能再去開發自己的應用。
 
在構建訊飛生態系統時,我們更為關註用戶使用習慣和技術匹配度。技術到哪一步,能夠打動什麽樣的用戶群,這需要有一個非常切合實際的認識並不斷進行摸索。當然,真正難突破的是源頭技術的創新,之後才是應用的創新。這就好比,如果沒有3G、4G等基礎通信技術的發展作為支撐,就不會有現在移動互聯網對傳統產業模式的顛覆。但很多人都不去想未來創新的真正源頭到底在哪兒。
 
順勢搭建平臺
 
在提供核心技術的基礎上,我們又進了一步,搭建了雲平臺,為所有創業者提供開發平臺。
 
這是有原因的。自2007年開始,互聯網應用逐漸興起,我們陸續收到了來自中小企業和開發者的很多反饋,他們很想使用訊飛的技術,但使用成本太高。
 
這也不難理解。一般而言,企業開發應用前,需要先花30萬元買硬件,花30萬元買平臺,再加上其他成本,沒有100萬元預算,根本沒辦法開展業務,但這一投入對於中小企業和開發者來說,過於高昂。
 
1年後,我受到了如下啟發:用戶擰開水龍頭,就可以接到水,但他不見得非要自己建個小型自來水廠。有了這樣一個思路,訊飛借助互聯網搭建了一個雲平臺。在使用核心技術外,該平臺可降低創業者初始開發門檻,產品開發出來後,他可直接依托訊飛語音雲平臺對外提供服務,免去了前期在服務器上的資金投入。
 
對於我們自己來說,通過雲端,可以自我學習和進化,後臺數據越多,我們的識別準確率越高。建這個平臺的時候,我們也不知道用戶數可以達到目前的近6億,下載量可以達到目前的9億多。
 
2010年底,我們正式發布了訊飛語音雲以及語音輸入法體驗版。站在發布會現場進行演示時,我很緊張,擔心出岔子。因為當時我們的團隊對於做平臺還沒有太多經驗,輸入法性能不太穩定,在發布會之前,已出現過網絡超時等問題。不過,好在我們平臺技術人員為此熬了四五個通宵,這通宵沒有白熬,當天的演示很成功。
 
發布會後,訊飛用戶數增長非常快,這是我沒有想到的。但過了幾天,用戶流失率開始直線下降,突然間幻覺破滅了。我開始擔心用戶不再關心語音,開始懷疑該產品能否被用戶一直使用。後來我們分析了原因:用戶很可能只是覺得好玩才下載的。從讓大家覺得好玩到讓大家覺得好用,對我們來說,是一個很大的跨越。我們開始註重產品的實用功能,比如打電話、發短信、聽音樂等。此後,用戶每天使用量開始慢慢提升。
 
訊飛是一家傳統的TO B企業,主要客戶是中興、華為、聯想等電信設備商和終端商,缺少對互聯網用戶的開放經驗,語音雲發布之後相當長一段時間都沒有多少用戶,半年只積累了100萬用戶,而我最初的預期是,一天就可以有幾萬的用戶增長,落差非常大。為此,我們去調研,結果很多用戶反映,輸入法的識別率根本不行,看到網絡不停地轉,但數據結果就是出不來。
 
這是語音技術準確率的問題。在網絡通暢的情況下,比如在試驗室內或特定衍生場景下,語音識別效果很好,但大規模應用時,準確率如何保障,我們缺乏經驗,沒有對移動網絡狀況予以優化。這對我們是一個技術上的折磨,當時很受打擊。
 
但我相信,語音應用一定是未來手機交互最重要的方式,所以我們一步步對產品進行了優化。一段時間後,用戶跟我說,訊飛的產品效果比以前要好很多,我聽後特別高興。
 
在過去的10年,通過iFly inside,我們發展了2000多個開發者,通過語音雲,在2年內已發展合作夥伴5萬多個,訊飛正從一個單一的核心技術提供商向基於雲端的開放平臺型企業轉變。
 
合作分享以共贏
 
平臺搭建完成後,訊飛將平臺向上下遊開發者開放,所有擁有核心技術的開發者都可以把自有技術放到這一平臺上來。
 
比如圖像識別技術。通過和香港中文大學教授湯曉鷗以及他的研究團隊合作,我們將人臉識別技術應用到了訊飛語音雲上來,使之識別準確率提高到了99%以上,比肉眼識別更精準。湯曉鷗是該領域頂級專家,精準人臉識別技術,實況人口流量狀況技術、照片自動人臉設備分類技術等,均為湯曉鷗及其團隊的科研成果。
 
我們還和哈爾濱工業大學合作了自然語言處理技術,推出了“哈工大訊飛語言雲”。哈工大“語言技術平臺LTP”是為開發者提供包括中文分詞、詞性標註、命名實體識別、依存句法分析、語義角色標註等自然語言處理技術服務的平臺,已經被500多家國內外研究機構和企業使用,其中百度、騰訊、華為、金山、中國科學技術信息研究所等多家大型企業和科研機構為付費用戶。目前它已成為國內外最具影響力的中文處理基礎平臺。
 
我認為,人工智能是未來真正可出現顛覆性產品的領域。我對這一領域的發展時刻保持著警惕,所以2014年,我們專門啟動了“訊飛超腦計劃”。該計劃聚集了來自語音及語言國家工程實驗室、清華大學、加拿大約克大學等10多位人工智能領域頂級專家。在實現了讓機器能聽會說之後,我們夢想是,讓機器能理解、會思考,而它的知識不是人類灌輸的,而是自己通過不斷學習獲得的。
 
事實證明,合作夥伴的先進技術可以對訊飛雲平臺的核心技術進行補充。開發者基於這一平臺可以不斷推出各種新應用,而他們之間,也借此得以相互關連。我們每月召開的訊飛語音雲沙龍都會邀請一些創業者來做經驗分享。
 
比如教育領域。現在,每天有7000多萬師生在用我們的教學產品。老師們的課件內容可以分享給訊飛,其他創業者可以在該平臺上共享使用。2013年底,我們和外研社合資成立了北京外研訊飛教育科技有限公司。外研社擁有國內大學英語教材60%以上的市場份額,在它將英語教學應用面向大學生推廣後,老師、學校、出版社以及更多第三方推廣教學應用的機構都可以在這個平臺上使用。
 
音樂領域亦然。目前全國唯一打通三大運營商的音樂搜索和音樂發布平臺就是訊飛做的,時下用戶已達9千萬,其中收費用戶上千萬。黃梅戲等地方戲曲,可以通過我們的音樂平臺推銷給各大運營商。而做音箱、玩具等其他產品的合作夥伴,可直接將該黃梅戲放到自己的個性化產品中使用。在我們的平臺上,大家可以相互促進、合作共贏。

聚焦爆發點
 
在上下遊開發者都已加入生態體系後,我認為,我們有必要在該體系中打造幾個近期可以引爆的重點領域:
 
第一,智能手機領域。我們除了自己主導的產品訊飛輸入法、靈犀助手之外,還形成了以訊飛、運營商、手機廠商為核心的生態體系。我們希望能有更多人加入進來。手機平臺是用戶根據宣傳引導沖動性消費的平臺,我認為,訊飛與中移動、各手機廠商的戰略聯盟會拿到最大份額。我們語音雲的用戶規模和創業項目數量都在行業中遙遙領先。訊飛輸入法排名在2013年就已超過QQ輸入法,2014年又已超過百度輸入法。根據最近12個主要應用商店語音助手下載量排名,前5名中,我們一家超過了另外4家的總和。
 
第二,教育領域。我們和基礎教育出版行業的龍頭——人教社合作,正在進行教學平臺、網絡學習、電子書包等一系列數字化產品的聯合開發和應用推廣工作;我們與北京師範大學合作,共同創建了基礎教育質量檢測協同創新中心,並推出了教育評價雲。總之,我們和出版社、大學都已形成很好的合作體系,這個體系也已開放給老師、第三方夥伴以及創業者。
 
第三,智能家居領域。我們跟北京、廣東等地方廣電,三大運營商,海信、長虹、TCL等國內前六大電視機品牌商都有合作。我們不光是讓用戶通過語音更為方便地看電視,還要向創業者開放,他們可以在上面開發兒童學習、故事頻道等應用。訊飛與中移動聯合推出的智能語音助手靈犀3.0,已可操控智能家居設備。年輕人裝修房子買家具時,只要按照我們建議的型號完成空調、微波爐、窗簾、電飯鍋等物品的采購,那麽他家里所有物品都可以用手機操控,甚至在路上就可以打開電飯鍋,提前把飯煮好。
 
基於中移動無線音樂基地大量正版音樂資源,我們與之聯合推出了訊飛智能音箱。不過,目前發展得如火如荼的智能家電產業,廠商產品存在接口不一等問題,沒有明確統一的行業標準,如果產品來自不同品牌,則很難建立完整的智能家居體系。未來,語音將進入到智能家居的各種各樣的設備中,如果能把設備、語音以及大數據相關的接口都打通,創業者就能共享一個統一的平臺,否則他就會被層層壁壘擋在創新門外,而這對整個產業生態體系的建立是非常不利的。
 
2014年,訊飛重要工作之一就是推動中國智能語音行業標準的落地。早在3年前,我們就已牽頭成立了語音產業聯盟,和運營商、電視機廠商、科研單位、語言技術研發企業以及各高校共同搭建了一個產業上下遊交流的平臺,得到了工信部的大力支持。
 
第四,車載領域。比如,奔馳汽車在時速超過100公里時,噪音很大,這時只有訊飛的技術能夠流暢使用。目前我們已和奔馳、寶馬、一汽等國內外汽車廠商,國內外多媒體廠商、導航廠商,甚至是整車廠商形成了一個體系,以加速推動智能語音在車載終端的深入應用。
 
本文不代表本刊觀點和立場。
 
 
 
 


本文為i黑馬版權所有,轉載請註明出處,侵權必究。


科大訊飛劉慶峰:萬物互聯的產業機會將十倍於無線互聯

來源: http://www.yicai.com/news/2015/09/4684240.html

科大訊飛劉慶峰:萬物互聯的產業機會將十倍於無線互聯

一財網 秦夕雅 陳洪傑 2015-09-11 08:25:00

互聯網領域的創業創新遠遠沒有到達天花板,而是在逐漸趨於理性後迎來更大的機遇。我認為,下一個最大的風口是萬物互聯。未來穿戴設備,包括手表、眼鏡、桌椅、臺燈等都會是聯網交互的。未來,萬物互聯孕育的產業機會,將是當前無線互聯網的十倍以上。

夏季達沃斯擇海而居。

在海濱城市大連舉行的這場論壇,吸引了全球900多名商界領袖、逾290家全球成長型公司參加。科學變革、被顛覆的行業、中國新常態等議題被廣泛關註。

9月10日,科大訊飛(002230.SZ)董事長劉慶峰在世界經濟論壇2015年新領軍者年會的現場,接受了《第一財經日報》記者的專訪,論及未來機器人產業發展、互聯網創業降溫等熱議話題。

第一財經日報:目前,市場有觀點認為,互聯網創業不缺錢的時代已經過去了,投資人正在等待價值回歸。你如何感知當下的互聯網創業環境?

劉慶峰:任何產業的發展,特別是新興產業,都有概念導入期、發展跟風期、穩定成熟期。

從近一段時間看,純粹用互聯網概念去創業和融資確實變得越來越難,因為公眾已經逐步了解“互聯網+”的關鍵在於疊加之後能不能創造獨特的社會價值、能不能為消費者提供全新的體驗。互聯網不是魔法,不是點石成金,在這一情況下,投資降溫、回歸理性反而對互聯網和移動互聯網的發展而言是積極的。

但是互聯網領域的創業創新遠遠沒有到達天花板,而是在逐漸趨於理性後迎來更大的機遇。我認為,下一個最大的風口是萬物互聯。未來穿戴設備,包括手表、眼鏡、桌椅、臺燈等都會是聯網交互的。未來,萬物互聯孕育的產業機會,將是當前無線互聯網的十倍以上。

因此,未來圍繞互聯網的創業創新會有更大機遇將湧現出來。互聯網和萬物互聯的對接會帶來全新的產業風口。

日報:在全球化布局上,訊飛正在做、將要做什麽?科大訊飛目前在支付、手機、智能家居和教育領域都有布局,可否描繪一下未來的業務版圖?

劉慶峰:目前中國是訊飛的主要市場,當全球公司都在爭奪這一最大市場時,訊飛沒有理由不抓住。但是訊飛語音的核心技術已經突破了多語種,做了27個語種。

從全球看,一方面訊飛把這些多語種技術提供給各領域的開發夥伴,支持共同發展;另一方面,訊飛將選擇在教育、車聯網、移動支付等典型領域,向全球提供整體解決方案。但第一方面甚至可能占到99%以上,就是讓創業者和訊飛共同成長。

語音在社會生活的每個領域都有應用空間,而訊飛作為一家語音技術的平臺級廠商,將語音合成、語音識別、翻譯、人工智能等技術提供給全行業的創業者和開發夥伴,推動整個行業向前推進,未來,這仍然將是訊飛主要的定位。

現在基於訊飛語音技術的創業者有7萬多家,而在今年3月1日到7月1日短短4個月間,每天的新增創業者翻一番,從104家增加為197家;其中,智能硬件的創業者增加了300%。

日報:移動互聯網發展到萬物互聯,會給科大訊飛帶來哪些機遇和挑戰?

劉慶峰:在萬物互聯時代,沒有屏幕,設備離我們很遠或者移動狀況下,難以靠鍵盤和觸摸解決,語音會成為移動互聯網向萬物互聯發展過程中最重要的交互方式。以語音為主,鍵盤和觸摸為輔的時代將到來。

我們可以設想一個場景,聲音是線性的,當一個硬件設備沒有屏幕的時候,使用者一定要求設備有最準確的反應,因此,後臺的理解和預測是剛需。

這就是為什麽訊飛啟動了人工智能“超腦計劃”,未來將為醫療、客戶服務很多領域所利用。下一步如何讓機器人從能聽會說,發展到能理解會思考,是我們面臨的最大機遇和挑戰。

日報:如何看待機器人行業的發展,以及訊飛在這一行業中的定位?

劉慶峰:我們非常看好未來機器人行業的發展。從工業機器人看,未來誰是全球GDP總量最大的國家,不是依靠人口,而是依靠機器人擁有量。同時,服務機器人的機會和空間更大。

機器人產業中,訊飛能做什麽?一是交互、二是後臺的大腦。目前,機器人創業公司在北京和廣東最多,而這兩地幾乎所有的家庭服務機器人都在用訊飛的語音雲平臺做交互。目前,在語音雲7萬多個創業項目中,機器人領域已經有幾千家了。我們對機器人產業要做非常重要的布局。

編輯:李秀中

更多精彩內容
關註第一財經網微信號
PermaLink: https://articles.zkiz.com/?id=159804

一文讀懂人工智能第一股——科大訊飛的AI商業版圖 | 公司調研

來源: http://www.iheima.com/zixun/2016/1020/159318.shtml

一文讀懂人工智能第一股——科大訊飛的AI商業版圖 | 公司調研
愛分析 愛分析

一文讀懂人工智能第一股——科大訊飛的AI商業版圖 | 公司調研

科大訊飛擅長的,不僅僅是語音,還有人工智能的商業應用。

老羅的錘子手機發布會,火了科大訊飛的會議語音轉寫系統,幾乎一字不差的識別效果贏得了全場經久不息的掌聲。有人為訊飛叫好,也有人看著它剛剛發布的第三季度財報憂心忡忡。不過,要看一家企業如何,不能單純看產品,也不能揪著暫時的盈利收窄不放,尤其對於科技企業來說,最重要的是看它過去、現在、以及未來的技術實力和商業布局。

而訊飛擅長的,不僅僅是語音,還有人工智能的商業應用。

作為國內人工智能第一股,科大訊飛不僅擁有行業領先的人工智能核心技術,還在教育、政府、電信、金融、汽車等領域實現了AI技術的成熟落地和持續發展。

了解科大訊飛,對於我們探索人工智能技術的應用方向以及商業模式具有重要借鑒意義。本文將對科大訊飛的發展歷程、財務表現、技術水平,以及以教育、政府、汽車三大領域為代表的行業應用情況進行詳細介紹和分析。

科大訊飛:營收增長強勁,人工智能技術行業領先

科大訊飛成立於1999年12月,由畢業於中國科技大學語音方向的一群碩博研究生創建。2000年以前,中國大陸語音技術發展很遲緩,在中國大陸設立語音研究基地的多是微軟、IBM、摩托羅拉等跨國企業,訊飛的成立填補了國內語音技術研究和應用的空白。

9年時間,訊飛從0做到了2億營收、5000多萬利潤,中文語音合成技術市場占有率一直保持70%左右,語音技術在電信、金融、政府、教育等領域都得到了廣泛應用。

2008年5月,科大訊飛在深交所掛牌上市,如今市值已達379億。2016年上半年,訊飛實現營收14.62億,較上年同期增長47.7%。從2012年至今,訊飛的營收一直保持40%以上的高速穩定增長。

數據來源:科大訊飛年報

強勁增長背後,一方面靠的是訊飛多年研發和積累的智能語音和人工智能核心技術,另一方面得益於訊飛不斷拓展技術的商業應用領域。

技術方面,訊飛在感知智能和認知智能多項技術上全球領先。感知智能方面,訊飛從最早的中文語音合成做到了如今的27種語言,多項指標全球第一;高噪音下的語音識別準確度保持業界領先,超過美國語音龍頭企業Nuance。認知智能方面,支持遠場識別、全雙工、多輪交互等特性的AIUI是智能車載、智能家居、智能機器人領域的關鍵核心技術。另外,訊飛已經實現了中英文作文自動評測,由訊飛牽頭的類人答題機器人項目正在努力讓機器人在未來三到五年內考上一本。訊飛每年研發投入20%以上,技術人員占比67%,堅持底層核心技術研發是訊飛多年來持續高速發展的力量源泉。

表1 科大訊飛在人工智能各項技術領域研究成果, 數據來源:科大訊飛年報

應用方面,訊飛目前已經將語音和人工智能技術應用到了教育、政府、電信、金融、汽車、移動互聯網、智能家居、大數據等多個領域,並逐漸由2B、2G向2C拓展,積極構建各個產業的生態體系。

本文將著重對教育、政府、汽車三大占比較高、增長潛力較大的領域進行分析,並簡要介紹其他幾項業務的應用及財務表現。

教育:2B、2C雙輪驅動,內生外延構建教育生態體系

教育是訊飛最早涉足的市場之一,也是訊飛的重要戰略方向。十幾年來,訊飛的教育投入從建校舍、修運動場等硬件設施,到“三通兩平臺”、班班通、校校通的信息化基礎設施建設,再到現在主抓應用,通過數字化校園、智慧課堂、教育語音平臺、口語考試與練習等,構建動態、可持續的教育教學生態體系。

在教育領域,訊飛采取2B、2C雙輪驅動的策略。

2B領域主要包括面向教育部門和學校的教育平臺、教學軟件以及考試系統等。目前,訊飛的智慧教育整體解決方案已經覆蓋15省、20地、8000萬師生;2016年收購的訊飛皆成和樂知行等智慧課堂軟件,也已經與39家出版社合作,超過7000萬師生、18個省份得到應用。

2C領域,訊飛2015年推出了面向學生的個性化教與學平臺智學網,通過從學校端大力推廣,截止2016年6月,智學網已經累計獲得千萬用戶,月活60%以上,覆蓋30個省份7000所學校。訊飛希望用2B驅動2C,將資源平臺從學校和老師轉向家長和學生,全面實現教學、考試、測驗、練習和作業等教與學過程性動態大數據的常態化采集和分析,以及個性化學習推薦。

在整個教育信息化生態體系的搭建上,訊飛選擇內生外延相結合。訊飛主要從兩大塊發力,一塊是底層平臺,例如用戶賬號體系管理、內容自動審核和檢測等。另一塊是入口端,主要獲取學生過程化學習的數據,並對數據進行自動分析和比較。而對於內容,訊飛選擇和有優勢的內容廠商合作,比如與外研社、北師大出版社等,一方面通過成立合資公司,把優質的內容在訊飛平臺上讓用戶使用,另一方面也開放給其他的沒有資本紐帶關系但有戰略合作的夥伴,搭建教育生態。

從財務數據來看,2014 年、 2015 年、 2016 年上半年,訊飛教育行業業務收入分別為 6.62 億元、 7.61億元、 4.15 億元,同比增長 49.44%、 14.95%、 28.05%,占總營收37.26%、30.41%、28.40%。

訊飛的教育業務包括兩大塊,一塊是教育產品和服務,另一塊是教育教學。教育教學收入來自科大訊飛2012年在蕪湖創辦的安徽信息工程學院,收入包括學費和住宿費等,這塊業務在總營收中占比4%左右,本文主要分析訊飛的教育產品和服務業務。

下表是訊飛2012年到2016年上半年,教育產品和服務業務在總營收中的占比、增長率以及毛利率情況。

表2 科大訊飛2012年到2016年上半年教育產品和服務收入各項指標, 數據來源:科大訊飛年報

可以看出,訊飛的教育產品和服務業務占年度總營收的比重基本維持在25%以上,毛利率超過40%,近三年平均增長率也有30%。不過近兩年,由於訊飛開始在教育領域廣泛布局2C市場,將原本可以銷售的產品和服務以免費形式進行了大規模推廣,因此三項指標相較往年都有一定程度的下降。

目前,訊飛關於2C產品的盈利模式尚不明朗。以智學網為例,訊飛投入大量人力、財力免費進行軟硬件推廣,並提供上門培訓服務,就是希望老師用掃描儀將作業數據傳到雲端,通過機器進行診斷分析,把握學生學習、練習、考試的過程化數據,進而挖掘其中的商業價值。

盡管目前這些數據的變現方式還不明確,但數據是未來的新能源,訊飛抓住了學生學習數據的運營權,也就抓住了教育市場的重要燃料。

未來,教育信息化市場空間廣闊,加上“十三五”期間政府政策大力支持,以及訊飛在教育領域多年積累的技術、產品應用以及資源整合優勢,隨著C端產品不斷推廣,用戶數據逐漸積累,訊飛在教育領域的優先布局優勢將會逐步顯現出來,教育產品和服務業務營收有望保持高速增長。

政府:用人工智能助力智慧城市和公共安全

訊飛在政府領域主要有兩條業務線,一個是公共安全,一個是智慧城市。

公共安全主要是對海量音視頻進行處理,該業務屬於涉密領域。作為國內上市公司,訊飛全資子公司訊飛智元已經優先獲得了國家涉密信息甲級資質,因此能夠獲得諸如公安、人口等涉密數據。

智慧城市主要通過人工智能提升政府服務效率,目前主要產品是社管雲平臺,該平臺旨在打通不同政府部門之間的數據,用智能語音和人工智能技術,一方面將大量非結構化數據變為結構化數據,另一方面將個人照片和文字進行清晰比對,節省人工審核時間,提高政府工作效率。目前,訊飛社管雲平臺已經在蕪湖試點,並在全國幾十個城市推動。未來,訊飛要讓社管雲平臺真正實現數據打通,成為圍繞數據的智慧城市關鍵應用。

從財務數據來看,2014 年、 2015 年、 2016 年上半年,訊飛政府行業業務收入分別為 1.52 億元、 2.48億元、 1.57億元,同比增長 101.93%、 63.04%、 64.41%,占總營收8.56%、9.91%、10.71%。

表3 科大訊飛2012年到2016年上半年政府業務收入各項指標, 數據來源:科大訊飛年報

可以看出,政府業務比重逐年上升,已經在2016年上半年突破10%,增長率近四年也維持在60%的高速增長。另外,和教育行業相比,政府業務毛利率水平明顯更高,整體超過80%。2016年上半年有所下降,主要是由於智慧城市項目從純軟件向軟件+硬件的方式轉變,硬件產品毛利較低拉低了整體毛利水平。

當然,智慧城市的搭建並不是一朝一夕之事。由於每個城市具體情況不同,特別是數據打通還涉及到原來很多管理流程的優化,所以盡管訊飛與全國多個省市有戰略合作關系,但是要真正將智慧城市項目推廣到全國,還需要很長一個過程。不過,一旦基礎設施搭建完成,這將是一個持續運營和服務的商業模式,並在未來給訊飛帶來更高的業績增長。

汽車:瞄準前裝市場,用人機交互奠定車載語音領先地位

車載領域將會成為智能語音和人工智能重要的應用市場。無論是無人駕駛汽車,還是智能輔助駕駛系統,汽車都會成為移動辦公和移動娛樂的平臺,車內語音應用由於其方便性和場景適應性,將會成為汽車市場的剛需。

但是,由於車內環境相對嘈雜,人機交互存在一定距離,因此除了語音合成、識別以及語義理解外,對遠場識別、噪聲消除等語音技術要求很高。另外,由於車內使用場景偏服務,因此智能語音也需要具備成熟的對多輪對話技術。

訊飛在這方面具有明顯技術優勢。在2015年3月的寶馬中文評測以及2015年6月的奔馳中文語音雲效果測評中,訊飛無論是在語音合成、語音識別、語義理解,還是使用體驗等方面都以顯著優勢奪得第一。

訊飛在車載領域選擇了和傳統車廠合作的前裝跑道,已經與奔馳、寶馬、大眾、豐田、雷克薩斯、上汽、一汽、長城、吉利等國內外汽車品牌開展合作,搭載訊飛語音技術的轎車前裝出貨車型達到31款,前裝出貨和在研車型近百款,行業市場占有率第一。

商業模式方面,以技術開發和軟件授權為主,同時提供軟硬一體化的車載語音交互解決方案,並積極探討增值服務收入。另外,車載應用作為車聯網的主要入口,未來積累的用戶數據將會蘊含巨大的商業價值,這也是訊飛在汽車市場的一個重要戰略方向。

當前,我國汽車產業已經進入穩步發展期,全球車載信息系統市場也正處於成長期,發展潛力巨大。根據德勤報告,預計到2020 年,全球車載信息系統的市場規模將超過800 億美元,並且具有較高利潤率,兼具成長性和盈利性。我國作為全球最大的汽車產銷市場,未來車載信息系統市場將有廣闊的發展空間。

2016年上半年, 訊飛人機交雲產品和解決方案實現收入 8498.83 萬元,同比增91.28%,其中超過90%來自車載語音市場。這塊業務雖然目前占比只有5.81%,但是毛利率高達77.09%。未來,得益於廣闊的市場空間以及先進的人機交互技術,車載語音業務無疑會成為訊飛新的業績增長點。

其他:高毛利傳統業務穩步增長,新興領域加速布局

除了教育、政府和汽車市場,訊飛的技術應用還涵蓋客服、信息工程、互聯網、電信、金融、安防、大數據、智能硬件等眾多領域。訊飛在2016年半年報中,各項業務進行了重新梳理和分類,愛分析對各項業務的金額和指標進行了整理、統計,如下表所示:

表4 2016年上半年科大訊飛主營業務收入構成及各項指標, 數據來源:科大訊飛年報

客服業務主要面向電信運營商和銀行、保險等金融機構,提供智能客服系統和呼叫中心產品和解決方案,實現了高達30%的人工分流率。目前,訊飛全面占據三大電信運營商市場,金融領域市場占有率80%以上,其他企業級領域由於對語義理解、售後服務以及定制要求較大,訊飛會有選擇地進入。

2016年以前,訊飛在年報中將涵蓋客服、車載、智能家居、智能玩具等語音支撐軟件的業務都算在一起,整體營收占比15%左右,整體毛利率在85%以上。分開計算後的客服業務毛利率甚至高達97%,並且實現了47%的高速增長。未來,客服業務會在已有行業優勢基礎上繼續穩步增長,企業級領域的應用也有望創造更大的營收增長空間。

與客服業務一樣具有高毛利的,還有電信增值業務。同樣依靠三大電信運營商,訊飛可以長期獲得穩定的收益分成。另外,訊飛的酷音鈴聲APP也在報告期內獲得了快速發展,成為業界口碑最好、用戶增長是最快的手機鈴聲產品,成為電信增值業務新的營收增長點。

互聯網產品和增值運營業務中的其他兩類營收占比較低,一塊是訊飛輸入法收入,毛利率高達100%,另一塊是智能硬件收入,主要來自訊飛的“叮咚”智能音箱。相比軟件產品,硬件毛利率較低,只有21.63%。

與教育業務比重相當的還有系統集成業務,其中的信息工程是訊飛相對傳統的一塊業務,這塊業務主要是一些工程運維項目,毛利率只有16.95%。從近幾年的增長率來看,這塊業務的增速在逐漸放緩。

除了營收中涉及的業務,訊飛還積極探索在生物識別、醫療等領域的應用。生物識別方面,訊飛推出人臉識別和聲紋識別相結合的綜合生物識別解決方案,主要應用於公安、金融等領域。醫療方面,訊飛已經和衛生部展開合作,並開始在安徽試點,使用語音技術解決醫院電子病歷問題。

結語

今年是人工智能的爆發年,除了谷歌、百度等提早研發和布局人工智能的科技巨頭,眾多AI領域的新興公司也紛紛進入大眾視野,應用行業涉及教育、金融、醫療、汽車、家居、新聞、法律、廣告、物流等各個領域。不過,大多公司的產品和服務都還處在探索和試驗階段,商業模式尚不明朗。

對於訊飛來說,教育、電信、政府行業優勢明顯,背靠中科大和安徽省,與多個省市政府以及遍及全國的眾多學校合作,中國電信、中國聯通以及最大股東和客戶的中國移動也持續不斷地為訊飛貢獻著營收,如此高的資源壁壘高,競爭對手很難打破。在相對欠缺的領域,訊飛也可以憑借雄厚的資金實力投資、收購一些公司來完善行業生態體系。

但是,訊飛在2C領域經驗相對缺乏,無論是市場推廣、用戶基礎,還是產品設計,都與大型互聯網公司存在差距。如何通過市場推廣贏得客戶,如何從產品功能和體驗上留住客戶,如何找到C端產品可持續的盈利模式,都是訊飛接下來要著重攻克的難題。

科大訊飛 人工智能
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=219706

訊飛幻境發布VR教育解決方案 將開放C端市場

來源: http://www.iheima.com/zixun/2017/0308/161752.shtml

訊飛幻境發布VR教育解決方案 將開放C端市場
i黑馬 i黑馬

訊飛幻境發布VR教育解決方案 將開放C端市場

通過和優勢資源的開放式合作,訊飛幻境將構建以 VR、AR 技術為主的教育平臺和教育體系。

i黑馬訊 3月8日消息 今日,VR教育應用服務商訊飛幻境在京發布了訊飛幻境教育VR解決方案(簡稱“訊飛VR”)。

訊飛幻境是一家虛擬現實技術VR教育應用服務商,專註於為教育方向的VR教學研發解決方案。本次發布的訊飛VR由VR課程、FLY•VR教室、VR硬件三部分組成,通過三種服務形成訊飛幻境FLY•VR教室體系,幫助學校實現VR教育一體化方案。“訊飛幻境通過調研發現,教育信息化使用率逐年上升,由原來的不到10%升到現在的近30%。”訊飛幻境CEO閆宏偉表示。

據了解,訊飛幻境的兩百多項VR課程產品將為基礎教育、職業教育、高等教育等提供系統性教學方案;FLY雲教室則通過應用商店、備課系統、數據存儲等體系,讓學校學習互聯網化;VR智能硬件則包括Q-fly輕沈浸VR一體機、T-fly多人互動重沈浸VR平臺和One-fly輕沈浸AR一體機,可通過VR、全景全息和3D技術,實現教學演練、方案展示、方案設計、模型修改操控等虛擬教學實踐內容。

為了讓老師和學生更好地應用 VR 技術,訊飛幻境還開發了一套基於自身產品和內容的 SaaS 平臺。這套系統具備教師備課、課上管控、學生自學以及數據反饋等功能。

對於未來的戰略規劃,閆宏偉表示,訊飛幻境將堅持教育行業為主業,同時涉及和教育相關的設培類、培訓類行業。商業化模式方面,訊飛幻境將先以To B為主,並逐步開放To C市場。“我們的目標是通過和優勢資源的開放式合作,構建以 VR、AR 技術為主的教育平臺和教育體系。” 閆宏偉說。

訊飛幻境 VR教育
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=239070

一財點睛丨長安汽車攜手科大訊飛 智能汽車迎風口

長安汽車(000625.SZ)3月14日晚間公告,公司與科大訊飛(002230.SZ)在長安汽車工程研究總院簽署戰略合作協議。雙方將在智能語音與大數據分析、車聯網運營平臺三大方面開展戰略合作,包括共同建立聯合實驗室,進行智能車載語音技術和大數據分析領域、圖像識別領域、車載終端產品及車載應用平臺的相關研究。

汽車已逐漸成為和手機一樣成為互聯網新入口,疊加人工智能的快速發展,都讓智能汽車商機無限。目前包括谷歌在內的互聯網及人工智能巨頭以及特斯拉、寶馬等汽車巨頭,還有大量的創業公司都加入了智能汽車大風口的角逐。

長安汽車表示,此次公司和科大訊飛的強強聯合,旨在提升長安車載終端產品競爭力,夯實公司在智能化領域的實力地位,推動公司加快從傳統制造企業向現代制造服務型企業轉型。這將為用戶在用車、出行和生活方面提供便捷、經濟的服務和愉悅、美好的體驗。

除國內長安汽車與科大訊飛展開合作外,3月13日晚間,英特爾宣布153億美元溢價近50%收購以色列ADAS(高級駕駛輔助系統)廠商Mobileye。據報道,Mobileye是世界最早也最大主攻自動駕駛技術的公司,因為提供特斯拉自動駕駛服務而聲名鵲起。Mobileye還是沃爾沃、寶馬等國際一流汽車公司的技術供應商。

受近來國內國際一系列消息影響,智能汽車或已站上風口。A股市場中,榮之聯(002642.SZ)、亞太股份(002284.SZ)、雙林股份(300100.SZ)等相關個股近期市場表現搶眼。

 

今日《點睛》您可滿意?還有更多精彩等著您~請前往App Store、安卓商店搜索“第一財經”或掃描下方二維碼下載第一財經客戶端,好內容為更好決策。

PermaLink: https://articles.zkiz.com/?id=239620

科大訊飛: “人工智能”在醫院能幹啥

來源: http://www.infzm.com/content/127788

(新華社/圖)

病人進入醫院,在大廳里可以通過機器人來咨詢要掛哪個科;醫生在跟病人的問診過程中,系統可以自動將問診語音轉化為文字,並通過自然語言理解技術轉化為結構化的電子病歷;同時,人工智能系統將給出醫生診斷和治療的建議;病人去做影像檢查,人工智能系統會輔助醫生閱片。

這是科大訊飛構建的智慧醫療醫療場景,其中智能語音電子病歷、機器人、移動APP以及影像輔助診斷等產品已經在全國數十家醫院落地。

2017年8月20日,由科大訊飛、安徽省立醫院聯手打造的“安徽省立智慧醫院(人工智能輔助診療中心)”(下簡稱“輔助診療中心”)在合肥正式掛牌運行,旨在為基層特別是邊遠不發達地區的醫務人員提供高水平的診斷輔助,提高醫務人員診斷水平。

輔助診療中心已與安徽省醫學影像雲平臺、安徽省立醫院醫聯體遠程會診平臺完成對接,在已接入的41家縣級醫院,人工智能輔助診斷系統將為它們提供胸部CT和乳腺鉬靶影像的智能輔助診斷及質檢服務。此外,該醫院對口幫扶的西藏山南地區人民醫院也已接入該系統,未來該平臺將服務於安徽省全省105個縣。

科大訊飛智慧醫療事業部副總經理鹿曉亮對南方周末記者表示,過去大家做互聯網+醫療,並沒有真正解決醫療的痛點。比如互聯網+零售,零售端的供給方產品、服務很充足,但醫療的問題在於供給側欠缺,不可能通過連接來提升效率。人工智能可以幫助醫生診斷,幫助解決醫療供給側的問題。

科大訊飛成立於1999年底,前身是中國科技大學電子工程系人機語音通信實驗室,當時科大訊飛的創始人劉慶峰在該實驗室讀博士二年級,他和十多名同學一起創辦了安徽科大訊飛信息科技股份有限公司,主攻語音。

科大訊飛副總裁杜蘭稱,科大訊飛認為醫療可能是未來爆發的一個點。比如電子病歷、語音輸入寫成病例,圖像識別通過一個個病例突破,讓機器人來總和診斷,比如TB(肺結核)機器診斷的準確率可能是94.9%,人類可能只有70%左右,在這一點上,機器是超越人類的。

2011年左右,科大訊飛曾醞釀進軍醫療行業,當時主要規劃是把雲音技術引入醫療行業,但是技術和配套環境成熟度不高,隨後該項目擱置了。

語音+醫療,是科大訊飛切入醫療最便捷的一個場景。在科大訊飛華南總部的展廳里,有一處口腔門診語音電子病歷系統的場景演示,展示的是北京大學口腔醫院門診中,一位醫生一邊為患者檢查,一邊以口述方式將患者病情錄入病歷的過程。病歷按照主訴、現病史、家族史、身體狀況、檢查情況、診斷、治療計劃、處置等分欄,根據語音內容自動錄入。最後,醫生只需要核對簽字即可。

另一款產品是超聲科智能語音助理,與前面的牙科類似,可以幫助超聲科醫生邊讀取信息、邊錄入。

如果說語音輸入解放了門診醫生的手,醫學影像輔助診斷系統則減輕了醫生閱片壓力,前面提到的輔助診療中心,就是其真正落地。簡單來說,醫學影像輔助診斷系統的工作原理是:醫生專家標註影像(正常和病竈),人工智能通過神經網絡算法建模,機器通過大數據自主學習,在輸入病患影像資料之後,可以幫助醫生標註出病竈區域,提示其重點關註,減輕工作量。

2017年8月7日,科大訊飛以92.3%的平均召回率,打破國際權威肺結節檢測大賽LUNA16記錄,獲得世界冠軍,獲得LUNA評測第一名。

權威肺結節檢測大賽LUNA16,其實也是一種輔助診療。主辦方整理了幾千例肺部CT影像,給參賽團隊回去訓練,然後拿新的數據去做測試,各參賽團隊公布成績排名。數據集是限定好了的,主要比拼準確率,基於深度學習的圖像識別技術。

相對於傳統的自然場景等圖像識別,醫學影像識別任務難度更大、要求更高。以LUNA評測中的肺結節檢測任務為例,其特點是輸入信息量“大”、待檢測目標“小”:例如一例1.25mm層厚的CT一般包含200多張影像,每張影像大小一般為512x512像素,而小的肺結節直徑僅有4個像素。

醫學影像識別任務的另一個難點在於標註錯誤很難完全避免,即使是LUNA評測所采用的精標數據集,也存在漏標註等現象,數據標註錯誤會直接影像識別的性能。為了降低標註錯誤帶來的影響,科大訊飛還提出一種有效樣本挖掘策略,該策略能夠通過在線學習過程自動過濾可疑錯誤樣本,大大提高系統的檢出效果。

鹿曉亮對南方周末記者表示,科大訊飛自從2006年開始關註深度學習,2010年起投入做了很多創新工作。深度學習的底層是一樣的,針對不同行業的技術上的遷移,對科大訊飛來說不算是很大的挑戰。難點在於尋找行業專業人才。

2017年3月,科大訊飛從美國約翰霍普金斯大學引入陶曉東博士,擔任科大訊飛智慧醫療事業部總經理一職。陶曉東研究方向為醫學影像,曾在美國通用電氣公司(GE)從事醫學影像研究,並在飛利浦醫療放射解決方案部門擔任首席架構師。

目前科大訊飛醫療團隊一共150人左右,主要由研發、醫療、產品三塊構成,其中研發占60-70%。鹿曉亮解釋說,醫療專家團隊有一些全職醫生,但是目前讓醫生離開醫療體系很難,科大訊飛大部分醫療專家合作是兼職。

他的計劃是團隊人員數量到年底要翻番,達到250-300人左右。

2017年8月26-27日,科大訊飛的人工智能機器人要參加全科醫生考試。鹿曉亮對南方周末記者表示,如果考試通過,意味著機器具備了全科醫生所需知識,但是要真正把這個技術產品化,還有很多工作需要做。

鹿曉亮最後強調說,AI雖然發展快,有些方面比人類強,但AI還處於弱人工智能階段,不具備通用性功能,比如阿爾法狗只能下圍棋,不能下象棋。機器可以幫助閱片,但最後影像報告,還是要醫生簽字。

PermaLink: https://articles.zkiz.com/?id=257147

高管打人,市值縮水,十八歲的科大訊飛有點喪

來源: http://www.iheima.com/zixun/2017/1119/166058.shtml

高管打人,市值縮水,十八歲的科大訊飛有點喪
方正一姐 方正一姐

高管打人,市值縮水,十八歲的科大訊飛有點喪

近日,網上一段“男子高鐵打人”視頻曝光,打人男子自稱科大訊飛高管,又讓其陷入了輿論風波。

頻繁募資員工暴增,現金流萎縮,業務轉型面臨挑戰……圍繞科大訊飛的質疑越來越多。被業內人士稱為“股市上的大公司,財報上的小公司”的科大訊飛,水逆期似乎過得有些漫長。

“高管打人”陷輿論風波

這則“男子高鐵打女人”的視頻讓原本低調的科大訊飛上了次頭條

從視頻中可以看出,在高鐵上,男子與女子發生激烈爭吵並大打出手。女子倒地後該男子仍對其拳打腳踢,車廂內多人圍觀勸阻,視頻中還可以清晰聽到有小孩子的哭喊聲。

據悉,事件發生於從南京到合肥的G7657高鐵上,打人男子自稱是科大訊飛高管,目前案件由合肥南高鐵站派出所辦理中。

17日下午,科大訊飛官方微博回應稱,涉事男子確系科大訊飛員工,為公司基層銷售管理人員,並非網傳的公司高管。

微信圖片_20171119090814

科大訊飛聲明稱:

經核實,涉事人員系科大訊飛員工林某,2016年5月加入公司,為公司基層銷售管理人員,並非高管。11月14日,該員工從杭州出差返回合肥,乘坐該班次動車。據警方對雙方當事人的初步調查核實,糾紛為林某禮讓不及時導致女性乘客言語及肢體沖突,隨後林某做出過激行為等。因此,無論警方最終如何界定事件責任,該員工行為已違背公司價值觀,我們將依據員工管理條例嚴肅處理此事,絕不姑息縱容!”

“打人事件”持續發酵,網絡上還出現一篇自稱被打女子所發的帖子,帖子中該女子描述了事件經過。

兩人因不及時禮讓而發生沖突,男子座位位於過道邊,女子需要帶小孩進去就坐,便讓男子讓開,男子並不理會。

女子便推著孩子進去坐到座位上,男子則說“想叫別人讓你就去頭等艙或者一等艙呀,不需要別人讓呀。”

微信圖片_20171119090819

兩人隨即發生口角,男子對女子進行了辱罵,女子推了男子並質問其為何罵人,男子當即對女子面部進行毆打,隨後又將女子頭發拽出猛敲多次後腦,並用腳將女子踹到在地,繼續進行毆打,女子則感到呼吸困難根本無法起身。

該男子在打人過程中仍對女子進行辱罵,面對孩子不要打其母親的哀求,甚至稱其活該,並揚言“我今天就是要打女人。”

帖子中還寫道,“打人者在派出所沒有道歉及意識事情的嚴重性,還在派出所里裝的高高在上,並說自己職位怎麽高尚了。”

據悉,已有媒體聯系了合肥高鐵警方,警方表示,該案件正在處理中,但因為兩方都稱自己受了傷,警方先安排各自治傷,待傷好後再按照相關的程序處理。

警方表示,涉事打人的男子可能是科大訊飛公司某銷售部門的負責人。警方已連夜就此展開調查,該怎麽處理就怎麽處理,有了處理情況會及時向社會通報。

伴隨錘子走入大眾視野的科大訊飛

公開資料顯示,科大訊飛成立於1999年。主要專業從事智能語音及語言技術、人工智能技術研究等業務的企業。2008年在深圳證券交易所掛牌上市。最初主要面向B端為教育、法律、政府等領域提供中文語音技術解決方案。

微信圖片_20171119090825

科大訊飛最初的火爆源於一場發布會。去年10月,錘子發布會過後,其輸入法在幾天內下載量過千萬。這也是科大訊飛在C端用戶市場第一次引起巨大反響。

此前,科大訊飛一直走的是悶聲發大財的路線,面向B端,是眾多互聯網公司背後的技術公司。據《財經》報道,2010年,公司推出了訊飛語音雲平臺,向開發者開放語音識別的底層技術,供後者開發應用,騰訊QQ、高德、攜程等,都曾是科大訊飛的客戶。

客戶變對手

但是,隨著語音智能技術日益重要,以及語音處理業務需求越來越多,谷歌、蘋果、微軟等國際巨頭以及以BAT為代表的國內互聯網巨頭也在不斷開發智能語音市場。據易觀報告,在語音生態系統方面,百度宣布語音識別技術及能力全面開放,騰訊、搜狗語音開放平臺也相繼上線。這對科大訊飛過去的商業模式提出了嚴峻挑戰。

為了應對市場變化,科大訊飛近幾年開始布局面向C端用戶的業務,但是,這不僅失去了B端客戶,還成為了與BAT站在同一賽道的對手。未來,在To C領域經驗不足,遠無法比擬BAT的科大訊飛將面臨巨大壓力。

正如在三季度報的投資者交流會上,有人質疑:“BAT等過去的客戶紛紛變成對手,科大訊飛的商業模式不得不從To B向To C調整”。

對於搶占BAT賽道的質疑,科大訊飛回應稱,BAT在語音和人工智能方面均有多年投入,一直有競爭。此外,BAT每年也還在向科大訊飛買語音產品,訊飛來自BAT的收入並沒減少。過去3年,來自BAT的收入占比平均僅有0.2%,今年1-9月來自BAT的收入提升到了0.32%。

但是,在ToC方面,科大訊飛要找到強剛需的應用場景,這無疑將對多年來一直走To B路線的科大訊飛提出巨大挑戰。

今年10月,科大訊飛披露了財報,2017年前三季度實現營業收入33.87億元,同比增長58.16%;凈利潤1.69億元,同比下降39.45%,再次出現了“增收不增利”現象。而在此前,科大訊飛股價已經連續暴跌,10月16日、10月17日、10月18日分別下跌4.18%、5.47%、3.7%,累計下跌7.09元,市值蒸發近百億元。

科大訊飛董事會秘書江濤解釋稱,上半年凈利潤下降主要系兩個因素影響所致:一是公司在人工智能重點應用領域持續加大核心技術研發、渠道建設和產業布局,費用增加總計達3.6億元,超過新增毛利3.28億元。二是公司2016年收購參股公司訊飛皆成部分股權,在合並報表中按財務準則實現投資收益1.17億元,該部分收益導致2017年科大訊飛非經常性收益比2016年同期大幅減少。

微信圖片_20171119090831

近幾年人工智能概念火熱,BAT公司也紛紛入局。阿里巴巴布局達摩院,三年投資千億,在量子計算、機器學習、基礎算法、網絡安全、視覺計算、智聯網、金融科技等多個產業領域發力;騰訊於2016年低調成立AI lab(騰訊人工智能實驗室),其掌握了國民級應用QQ和微信,在AI的應用和場景上的優勢不可小覷;百度更是重壓人工智能,在今年的百度世界大會上李彥宏宣稱人工智能車明年實現量產,推出百度智能雲,打造完整的AI應用生態。

AI領域新秀商湯科技也在11月宣布獲得了全球通信巨頭高通的戰略投資,致力於“算法+芯片”的創新融合。

作為備受關註的人工智能概念股,科大訊飛也曾紅極一時。股價一路上漲,還在8月28日創出歷史最高價64.77元,漲幅超過110%。但受投資人追捧的同時也飽受質疑,8月29日,著名學者薛雲奎質疑科大訊飛存在巨大風險,業績跟不上近千億的市值,盡管經營面快速增長,但含金量不高,還定義其為“股市上的大公司,財報上的小公司”。

前有BAT巨頭搶占,後有新秀趕超,內部又面臨“增收不增利”的尷尬,被夾擊的科大訊飛能否走出困局,找到自己的定位,是個值得思考的問題。

科大訊飛
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=259054

Next Page

ZKIZ Archives @ 2019