來源:i黑馬 作者:石海威
【導讀】云知聲近期的頻頻亮相令其頗受關注。3月27日,在「錘子ROM」發佈會上,云知聲與老牌公司科大訊飛一起,同時入圍了錘子科技的語音解決方案。
云知聲的出現,打破了長久以來科大訊飛在語音識別領域的壟斷地位。
羅永浩「錘子ROM」發佈會於2013年3月27日如期舉行,當晚云知聲擊敗科大訊飛成為「錘子ROM」語音解決首選方案,成為發佈會一大亮點。儘管由於環境噪音干擾,老羅永浩羅現場幾次多次現場演示語音控制均告失敗,但云知聲創始人事後樑家恩對i黑馬錶示,依然很感謝老羅「把云知聲帶到了國家會議中心的大屏幕上。」。
一個多月後,在5月7日樂視超級電視的發布會上,云知聲掙回了面子。這台超級電視集成了云知聲的語音交互技術。外界評價稱,「從現場演示效果看,識別準確度和識別效率方面都具有很高的水準。」
除了錘子ROM和樂視超級電視,云知聲的合作方還有搜狗語音助手。云知聲借助自己的本地語音識別、云端語音識別,以及語義分析等技術為它們提供服務。
而云知聲做為繼科大訊飛後的語音黑馬,一夜之間備受關注。
中科大畢業後,梁家恩在中科院自動化所進行了五年深造,之後加入盛大創新院。2011年,隨著Siri的爆發和人工智能的普及,梁家恩覺得創業時機已經成熟。從2001年起梁家恩開始接觸語音識別技術,中科院自動化所也是國內最早進行語音識別的研究機構,擁有絕對的技術權威,國內許多語音技術創業者均來自於中科院。
事實上,梁家恩與科大訊飛創始人劉慶峰也師出同門,二者都畢業於中國科學技術大學。梁家恩記得很清楚,當年科大訊飛拿到第一筆錢的時候他還在讀本科,2008年中科大五十週年校慶時,劉慶峰再度做為創業明星被校友們津津樂道,不過那時梁家恩並沒料到,自己有一天會在技術上與科大訊飛抗衡。
梁家恩表示,儘管語音識別看上去只是將語音轉換成文字這麼簡單,但從前端的語音識別到後端的語義理解其實需要龐大系統的支撐。專業領域將人們說話的不同發音在專業上稱之為聲學模型,不同的人說話的內容不一樣,詞序也不一樣,語音識別就是要從中尋找到最具共性的東西,並加以描述,然後與跟模型做快速有效的比對,來滿足需求。
語音技術這種研發最終將需要累積起一個非常龐大大的數據累積庫。,國外從上世紀50~60五六十年代起就開始了這方面進行語音識別的研究,而國內則從80年代起才開始起步有統計的識別。梁家恩很清楚其中的差距,他從2001年起接觸語音識別技術,
中科大畢業後,在國內語音技術的搖籃——中科院自動化所進行了五年深造,之後加入盛大創新院。
2011年,隨著Siri的爆發和人工智能技術的進步,梁家恩覺得創業時機已經成熟,於是離職單幹成立了云知聲。目前,除了語音識別技術外, 云知聲目前的核心服務除了語音識別技術外,另一項核心技術是是云計算平台技術。其中,公有云主要針對普通一般開發者,降低使用門檻,用標準化的服務解決技術問題,並此類服務採取免費策略。;私有云主要針對企業客戶,可根據企業的特殊需要提供定製化的SDK和接口調用。服務升級,包括一些定製化的開發以及適配。對客戶需求場景進行優化,包括語料庫的練習。引擎部署在客戶服務器,收取專利費和服務費。
雖然語音識別已成為巨頭們瞄準卡位的關鍵領域,但梁家恩並不擔心自己公司的技術實力,他本人就在語音領域積累了十幾年的研究經驗。眼下,他的擔憂主要在於技術型創業公司如何實現商業化。
科大訊飛的很大一部分收入構成很大一部分來自傳統行業,包括政府和運營商,而梁家恩設想云知聲未來的收入比重將更多的偏向互聯網。現階段,云知聲沒有切入垂直化的產品,而是專心做平台,讓開發者基於云知聲的技術去做個性化的產品。梁家恩認為,互聯網的廣告平台、遊戲平台都能賺錢,語音識別將是下一個盈利平台。
不過梁家恩認為,未來只靠技術服務收費是不具備持續性的,讓開發者受益又免費才是長久之計。因此現階段云知聲並沒有切入垂直化的產品,而是專心做好平台,把高門檻的技術轉化成更便捷的服務,讓開發者基於云知聲的技術去做相對個性化,隨心所欲的產品。在梁家恩的設想中,互聯網中廣告平台、遊戲平台都能賺錢,語音識別將是下一個盈利平台。
眼下樑家恩的擔憂主要在於技術型創業公司如何實現自己的商業化。儘管,語音識別已成為巨頭們紛紛瞄準卡位的關鍵領域,但對於從事十幾年語音識別研究的梁家恩來說,巨頭在技術上的追趕他並不擔心。相反,他也梁家恩坦言,云知聲多是碩博以上的高學歷的研發人員員工,但絕大多數人並不瞭解互聯網和商業。如何將技術轉化變成商業,再到公司化運作,梁家恩和他的整個過程自己和團隊也都還在摸索之中。
北京云知聲信息技術有限公司
創始人 | 梁家恩 |
成立時間 | 2012年6月 |
所在地區 | 北京 |
員工人數 | 30人 |
主營業務 | 語音識別及語音處理技術研發 |
2012年營業收入 | 暫無 |
融資狀況 | 已獲天使投資 |