銀泰網CEO林琛：重塑商圈的O2O交互價值

Random Tags

灣大瓊戀海控又抄 1761 路煮盤閃萬卷晨人倖免褻瀆複從華街鳥年擬製鑄開壽保壓人撕唔 Fricsay 即墮凱寶 Dirty 夠畀先出大啲裕程任工敬明至實壩壩讓跨高惹強苑暢貨戲唔女與玩埋止痕汛期為更爆姊緊難特一秀看房反通縮帽見務代理林琛

銀泰網CEO林琛：重塑商圈的O2O交互價值

http://new.iheima.com/detail/2014/0402/60095.html

談到今天的線下百貨市場，其實可以用一個詞來形容——「糟糕」。線下實體百貨公司其實活得非常糟糕，非常難受。這其中的原因有很多，比如百貨業本身可能存在問題，過去我們弱化了百貨賣場把它作為零售的一種渠道。當然，還有一種很容易猜到的原因——來自電商的衝擊。

什麼在變?

現在，人們並不是非要到百貨商場才能買到成衣，通過電商渠道，他們同樣可以買到。這種業態的改變觸發了更多的百貨商家進行自我革新。

用戶消費行為的改變不僅僅是單純的成交手段變化，還伴隨著成交決策路徑以及售後行為等一系列的改變。面對這樣的改變，實體百貨業已經開始思考尋找新價值的所在。

實體百貨業的價值體現包括四個關鍵詞：價值、客戶、匹配、交互。

在面臨現狀的時候，去思考新的價值所在，我們會很快得到一個結論：只有給用戶提供了價值，才能在整個行業鏈條裡面找到實體百貨業的生存空間。所以我們把新的價值定義為客戶。舉個例子，在銀泰百貨裡，這種價值定義為「以客戶為先」。其中包含兩方面內容：我們將重點服務於某些類型的客戶，另外我們服務於線上線下、線上的線下行為以及線下的線上行為。

用戶在做購買決策、售後決策的時候是一個跨渠道的行為，他可能會收到我們的優惠券，在優惠券的激發下到實體門店去體驗，覺得這個商品不錯，然後掏出他的手機用支付寶支付。如果支付完了之後，他覺得很累，不願意拿著回家，那可以用快遞送到家裡面去。使用了之後，他覺得商品不錯，可以通過微信或者微博的方式去關注這個品牌，來反饋他對商品的意見。

這裡有一個定義叫泛渠道。我們發現用戶行為多樣化了，面對用戶的多樣化，我們不能固步自封，認為做傳統零售的只做傳統的，而不去觸碰線上，這個思路可能會違背基本的商業法則。

銀泰的WIFI 玩法

在銀泰的架構體系中，主要分兩塊：云端的匹配和交互端的交互界面。我們把這些交互界面上的用戶數據和交互數據拿出來放到云端匹配邏輯中去，這樣的結構會有什麼好處呢?

當同一個用戶ID在不同交互界面裡面漫遊的時候，我們就知道他以往購物的記錄，就可以對這個用戶進行精準定位。當我們新開一個交互界面的時候，比如開一個新的shopping mall的時候，就可以用云端的交互邏輯去匹配這個新的交互界面裡面的品牌構成以及客戶構成。

云端最基本的邏輯就在於人、貨、場三角關係。在這裡人和貨是最直接的關係，場我們可以認為是一個環境變量。但實際上這個場或者促銷方式，它在面對不同的品類或者不同人群的時候，也會有一些特性發生。

仍舊以銀泰百貨為案例，杭州西湖文化廣場店已經佈置好了WIFI，去年所有的門店都裝上了WIFI系統，可以直接和智能手機進行交互。當用戶持有智能手機進入WIFI系統的時候我們就知道用戶是誰，知道他們以前的交易記錄以及關心的品類。

通過WIFI系統我們可以知道用戶在哪個區域停留時間最長，知道消費者最喜歡什麼品牌，當然，WIFI不是最合適的方式，但卻是目前最容易被接受的方式。因為我們測試的時候，發現30%的入店用戶會主動打開WIFI接入我們的系統中去。

比如，用戶連接到商場的WIFI後，系統自動識別，根據一些關聯詞，推一些我們自己做的促銷活動、特價信息，或者根據用戶喜歡的品類推出一些相應的促銷活動。

商圈：是交互不是交易

我們發現，今天作為一個零售的百貨賣場，我們已經不能把所有工作熱點認為是交易。在完成交易的前提下，我們必須要跟用戶交互。所以有句話叫無交互就無交易，我們認為所有的賣家和PC都是我們交互的界面。

百貨零售價值重塑的前提在於當我們研究目標用戶並滿足他們的需求，才能找到我們自己新的價值定位。對於用戶的需求來講，第一步一定要瞭解他的需求，第二步要滿足他的需求，第三步要誘發他新的需求。在這三個不同階段，實體百貨都應在數學、模型以及對應的行動準則上有不同的工作內容。

PermaLink: https://articles.zkiz.com/?id=94937

語音搜索是人機交互的未來嗎？

來源: http://www.iheima.com/space/2016/0324/154852.shtml

導讀 : 跟機器說話，聽起來好酷！

人工智能成為熱門話題，在如今這個科技飛速奔進的時代，不知你是否想過，也許可以換一種智能化的方式完成搜索——比如，跟機器說話。

語音搜索技術——很好理解，通過語音完成搜索行為。

不同於其他人工智能技術的亦真亦幻，語音搜索是那種直覺上理應擁有的技術，它在幾十年前就是科幻作品中的標配。然而作為人類思維和知識的基本載體，語言（尤其漢語）的獨特讓其成為AI歷史上最困難的方向之一。不難理解，從戰勝李世石便知，機器無比擅長邏輯與程序性的單一任務，但人類自然語言並非形式語言，長久以來，機器無法分辨人類語言——甚至許多時候唯有母語使用者才能體察到的奧妙，這也讓語音搜索變得艱難。

但它必須進步。無論如今智能手機的井噴亦或未來整個IOT產業的崛起，人們都在企盼一種與機器更自然的交互方式，而語音搜索是最佳入口。這個世界上的科技巨頭無一不在強化語音技術的研究，谷歌某位資深工程師就曾表示，人工智能下個里程碑就是自然語言理解。

嗯，語音搜索並非“語音+搜索”1+1式的簡單串聯；語音技術，自然語言理解以及智能搜索的結合意味著一種趨向於完美的搜索樣態，它將帶動更龐大的搜索和服務生態。

更好的溝通：機器理解人類背後的智能技術

先來說說這項技術。

語音搜索是一項集成了語音識別，多輪理解，語義分析等在內的複合型人工智能，其實現過程要比封閉式規則的圍棋艱辛許多，它要求機器從思維，對話，情感等維度探尋人類充滿不確定性的複雜行為——溝通。

語音識別簡單講，即是針對複雜多變的語音搜索場景，通過深度挖掘大規模用戶行為數據，利用深度學習技術，理解用戶的表達，同時針對漢語一音多義的獨特性，結合用戶個性化信息及語義環境在同音候選中優選更可能為用戶需求的結果。

除此之外，人類正常溝通中無法避免的信息折損，也使得機器必須掌握多輪理解——在語音搜索中讓人與機器基於上下文語境多輪交談。具體而言，基於語義結構理解，指代消解等技術，理解用戶會話的上下文信息，實現對話的補全與替換，從而真正理解用戶需求。

當然，除了多輪理解，為了貼近更自然的對話方式，語義理解技術就變得頗為關鍵，這要求語音搜索必須包含對需求的理解和對數據資源的整合。這意味著機器可以完成某種推理和對於推理的驗證。譬如，當你發出“我要吃飯”的語音時，機器可以自動領會意圖，直接進入與餐飲有關的界面。機器精準理解語音背後的含義頗為不易，而也尤為重要，唯有突破了語義理解的門檻，機器才能進一步理解人類真實意圖，從而完成更為友善的交互。

更好的未來：人與機器高效與人性化交互

確實，每個心向未來的人，都在渴念人工智能的盡早落地。語音搜索這種非物理接觸式的人機交互方式，究竟意味著什麽？從最基礎的方面，它可以讓那些不會打字、不愛打字，甚至不屑打字的群體用比打字更迅捷自然的方式獲取信息與服務，數據顯示，使用文本輸入速度為1s/字，而使用語音搜索輸入速度為100ms/字。

可以肯定，應用場景的變化無常無疑會讓語音搜索將日趨成為主流。根據百度提供的數據，語音搜索的整體用戶在2015年增長超過3倍，而早期嘗鮮用戶一旦用上語音搜索，其後產生的黏性非常之高，而在粘性用戶當中，有60%的搜索需求都會使用語音進行表達。

毫無疑問，年輕用戶的搜索行為正在向語音靠近，尤其對於生長在移動屏幕之中的90後和00後用戶，與機器“對話”稱得上是某種天經地義。就像成年人驚訝地發現，兒童和嬰兒對於iPad等屏幕毫無違和感的本能觸碰，當語音技術日趨成熟，90後與00後也將與機器的交談視作生活本身——因為他們知道，無論是知識還是娛樂，只要你說出來，就能迅速找到想要的一切，何樂不為？

趨勢：順應人性的智能化生活

拋去技術不談，至少在現階段，不少成年用戶對語音搜索的本能排斥大概可歸為兩點：擔心隱私（理性角度）以及感覺“怪怪的”（感性角度）。關於第一點，技術就可以解決，語音搜索技術完全可以讓用戶在公共場合用只有自己才能聽見的微弱音量與機器對話。我想重點講一下第二點：觀念。

在許多特定的技術和觀念拐點，年輕人永遠站在正確的方向，倘若你對一代人的集體行為滿懷不解，那麽只有一個原因：你out了。技術革新與人類所謂的“主流觀念”之間的撞擊聲，簡直是科技進程之中的副本。每一項革新技術的誕生，似乎都是一次對過往主流觀念的更新。譬如微信普及之前，對著機器說話經常被視作怪咖；而手機能拍照之前，人們經常對自己會被陌生人錄像而敏感，但從敏感到無感，人們只用了短短數年。因此完全可以想象，語音技術的“破冰期”將無比短暫，因為年輕族群早已習慣於此。

哪怕從客觀角度，趨勢也擺在那里。智能手機只是未來的一小部分，新湧現出來的科技將讓更多人“被迫”轉向語音搜索。智能設備日趨豐滿，無論智能硬件，智能家居，無人汽車，還是智能機器人，不太可能指望全部通過文字與之溝通，而語音搜索能提高效率，以更順應人性的方式體驗智能生活。

縱觀整個人機交互的歷史，一個清晰可見的脈絡是：主流計算設備的每次形態改變，必然伴隨著人機交互難度下降——就像鼠標和Windows 圖形界面之於個人電腦，電容觸摸屏和iOS（及安卓）操作系統之於手機，語音搜索作為一種革命式的人機交互方式，在很大程度上消減了人類與機器之前的隔閡。

而從某種感性層面來說，倘若語音搜索有朝一日成為主流，那麽它勢必將人與機器的交流鍍上一層情感色彩，它會加劇人類對於機器的依偎。人與機器共同進化以聽懂彼此語言為前提，我堅信，以語音搜索技術為開端，人類終將打造出《星際迷航》那般終極意義上的移動設備。

還是那句話，在技術領域，未來十年將會令過去的十年黯然失色，而相信語音搜索技術的普及，即是通向那個更美好未來的重要一瞬。

標簽語音搜索未來交互

PermaLink: https://articles.zkiz.com/?id=190307

搜狗發布語音搜索引擎“知音”：支持複雜多輪的交互

來源: http://www.iheima.com/zixun/2016/0803/157875.shtml

搜狗發布語音搜索引擎“知音”：支持複雜多輪的交互

鞏二龍 2016-08-03 16:33

搜狗發布語音搜索引擎“知音”：支持複雜多輪的交互

搜狗發布語音搜索引擎“知音”，開啟人工智能在搜索領域的重要一步。

i黑馬訊 8月3日消息，搜狗公司今日正式發布了語音搜索引擎——知音，不僅動動嘴就可以識別、輸入文字，還具有識別速度更快、糾錯能力更強、支持更加複雜多輪的交互等功能。

據搜狗方面介紹，“知音”引擎解決了用戶在說話過程中因語速過快而導致的吞音問題。語音識別錯誤率相對下降30%以上，語音識別速度提升3倍；同時，“知音”能夠在語音交互中支持用戶修正錯誤的識別結果，用戶可使用自然語言進行改錯。比如，用戶可以說把“張”改為“章”。

此外，“知音”還支持多輪對話，處理更複雜的用戶交互邏輯，用更自然並且用戶更容易接受和理解的方式進行交互，輔助用戶更好的進行決策。

據悉，搜狗從2012年開始研發智能語音技術，並在2013年開始進行深度學習。目前，搜狗的智能語音技術已經成功應用至搜狗的全線產品中，未來將應用到物聯網、車聯網和人工智能等各個方面，並嘗試接入更多的終端。

[本文作者鞏二龍，i黑馬原創。如需轉載請聯系微信公眾號（ID:iheima）授權，未經授權，轉載必究。]

搜狗人工智能搜索引擎知音

贊(...)

文章評論

匿名用戶

發布

PermaLink: https://articles.zkiz.com/?id=208405

搜狗推出 “能理解會思考”的語音交互引擎

——“我要去機場。”

——“T1還是T2?”“出發還是接人?”

這是手機用戶在使用搜狗語音交互的一個場景。

8月3日，搜狗正式對外發布了語音交互引擎——知音。搜狗CTO楊洪濤對包括第一財經在內的媒體透露，此前，不少語音識別停留在“能聽會說”的階段，借助人工智能，現在搜狗的語音識別還具有“能理解會思考”的能力。

而在楊洪濤身側的PPT大屏幕上，同步了搜狗語音識別對他演講內容的文字，第一財經記者看到，同步速記雖然偶有錯誤，但大意基本正確。

楊洪濤對媒體介紹，搜狗的“知音”引擎可以做到識別速度更快、糾錯能力更強、支持更加複雜多輪的交互以及更加完善的服務能力。

具體而言，在技術上，“知音”解決了用戶在說話過程中因語速過快而導致的吞音問題，語音識別錯誤率相對下降30%以上，語音識別速度提升3倍。

此外，“知音”能夠在語音交互的過程中支持用戶修正錯誤的識別結果，用戶可以使用自然語言即可修改之前的輸入文字。例如，說出“把(男)他改成女字旁的她”、“弓長張換成立早章”等，輸入法便可以馬上理解並正確執行指令。

在支持多輪對話上，“知音”能夠處理更複雜的用戶交互邏輯，用更自然並且用戶更容易接受和理解的方式進行交互，更好地感知用戶語音請求背後的真正需求，從而提供更為便捷的人性化服務。例如，當用戶說我要去首都機場，它會問T1還是T2，當用戶確定航站樓後，它會問是出發還是接人。

而在這背後，搜狗借助的是多年來的數據和技術積累。

楊洪濤介紹，搜狗從12年開始研發智能語音技術，並在13年開始進行深度學習，目前搜狗的智能語音技術已經成功應用到搜狗的全線產品中。

數據顯示，搜狗搜索日均語音搜索次數增長超過4倍，搜狗手機輸入法日均語音輸入超過1.4億次。

楊洪濤透露，自然交互和知識計算是搜狗在人工智能領域的兩大戰略方向，目前搜狗在AI領域的研發已經全面展開，並在智能語音領域取得了重大突破，“知音”引擎就是搜狗在自然交互方面的重要成果。而未來隨著搜狗在自然交互與知識計算方面的不斷完善，“知音”將會在更多場景為用戶提供服務。

在搜狗CEO王小川看來：“搜索本身就是一種AI，隨著人工智能時代的到來，搜狗將不斷增強自身技術實力的積累。搜狗目前已在語音識別領域取得了重大突破，未來一方面將通過與清華合作進行人工智能領域前沿技術研發，另一方面也將在自然交互與知識計算上不斷完善自身產品與服務。”

而在商業化方面，根據搜狐剛剛發布的截至6月30日的2016財年第二季度財報顯示，搜狗第二季度非美國通用會計準則下凈利潤達到2.2億元人民幣，同比增長30%;收入達11.5億元人民幣，同比增長27%。

PermaLink: https://articles.zkiz.com/?id=208432

估值2.1億元，搶跑VR電影的蘭亭數字這次要試水VR交互 | 每日黑馬

來源: http://www.iheima.com/zixun/2016/0805/157922.shtml

估值2.1億元，搶跑VR電影的蘭亭數字這次要試水VR交互 | 每日黑馬

張曉軍 2016-08-05 09:33

估值2.1億元，搶跑VR電影的蘭亭數字這次要試水VR交互 | 每日黑馬

下一步，蘭亭數字將重點發展VR直播和泛娛樂領域，包括VR電影、VR綜藝、VR真人秀等。

近來，VR內容創業成了創投圈的新寵，VR電影更是給人十足的想象空間，張藝謀、高群書等導演先後宣布將涉足VR內容領域。不少人認為，在沈浸式VR電影的沖擊下，傳統電影將喪失魅力。

蘭亭數字就是國內首部VR電影《活到最後》的制作方。今年3月，蘭亭數字獲得了華策影視、康得新和百合網的3150萬元Pre-A融資，估值2.1億元，這也是目前國內VR視頻領域創業公司里最高的估值。

這家成立不到兩年的公司在VR內容方面一直都在吃螃蟹。“除了《活到最後》，包括國內首部VR版MV《敢不敢》和國內首部VR版對戰真人秀《榮譽之戰》等都是我們推出的，公司有喜歡挑戰的基因。”蘭亭科技聯合創始人莊繼順說。

目前，蘭亭數字形成了“交互程序員+硬件工程師+導演編劇+影視後期”四位一體的團隊組織構架。團隊現已積累了180°3D、VR斯坦尼康硬件研發、影視專業級VR相機以及後期制作軟件二次開發等技術，年產出作品達到150 多部。

莊繼順對i黑馬表示，VR視頻是一個很綜合性的行業，需要軟硬件、交互和內容的深度結合。現在行業標準尚未統一，市面上的硬件和軟件都滿足不了PGC（專業生產內容）的使用，所以蘭亭數字非常註重團隊的自主研發與密切溝通，這樣才能形成真正的作品生產能力。

918217986454460453

蘭亭數字團隊

在運營模式上，蘭亭數字選擇的是B2B2C，即先打通終端和平臺，目標是直接用戶。通過“立項-策劃-編劇-制片-攝制-後期-分發”的標準化制作流程，蘭亭數字將主要精力放在了內容的生產制作上，為VR頭顯和平臺提供優質作品，並不參與用戶層的分發。

目前，蘭亭數字主要營收來源，是依靠銷售內容版權和播放權收費，以及承接廠商的定制化內容需求，內容購買方包括視頻平臺、VR硬件商、線下店、品牌方等。莊繼順坦言：“由於VR終端數量不足、行業標準未成形、缺乏標桿產品，VR內容領域現在還沒有較為清晰的盈利模式和時間點，現在大家比拼的更多是看誰能堅持下去。”

在《活到最後》之後，蘭亭科技也一直沒有推出新的VR影片。

“我們在做第一部電影的過程中發現了非常多的問題，而每個問題我們在短期內都無法解決。”莊繼順說。在VR電影方面，國內創業公司仍然還面臨著發展中的種種阻礙。但莊繼順表示，現在VR影視行業，誰能第一個探索出能夠應用的VR的鏡頭語言和導演邏輯，誰就可能在這個領域一飛沖天，成為這個領域中國版的好萊塢。

縱觀整個VR內容行業，未來的市場狀況尚不明朗，面臨著多重問題，但蘭亭數字的野心依然很大。莊繼順表示，下一步，蘭亭數字將重點發展VR直播和泛娛樂領域，包括VR電影、VR綜藝、VR真人秀、VR演唱會等。目前，蘭亭數字已經具備大型體育賽事虛擬現實直播系統，積極突破360度3D技術，試圖在虛擬現實的這條道路上探索新的可能。

黑馬檔案

公司：北京蘭亭數字科技有限公司

創始人：孫文博，莊繼順

所在地區：北京

所處行業：虛擬現實

融資狀況：3150萬元pre-A輪融資

[本文作者張曉軍，i黑馬原創。如需轉載請聯系微信公眾號（ID:iheima）授權，未經授權，轉載必究。]

VR電影蘭亭數字

贊(...)

文章評論

匿名用戶

發布

PermaLink: https://articles.zkiz.com/?id=208956

百度少帥顧嘉唯已離職負責人機交互與智能硬件

8月9日上午，接近百度的人士對第一財經記者確認了百度IDL(深度學習實驗室)主任研發構架師/首席設計師顧嘉唯離職的消息。另有消息人士透露，離職後，顧嘉唯將加入東方網力任副總裁。

百度IDL官網顯示，顧嘉唯是百度少帥，負責人機交互和智能硬件。

百度深度學習研究院(Institute of Deep Learning，IDL)是百度歷史上首個正式成立的前瞻性研究機構。IDL目前在北京、深圳和矽谷都有研發團隊。

百度董事長李彥宏對它寄予厚望：“希望百度IDL會成為像AT&T-Belllabs、Xerox PARC這樣的頂尖的研究機構。”

顧嘉唯所在的人機交互組是一個橫跨計算機科學、交互設計、工業設計和心理學的多學科交叉融合團隊。百度在官網中介紹，人機交互組旨在創造並開發下一代自然交互技術和模式，去提升日常生活、工作和娛樂。百度通過快速叠代交互和硬件原型來驗證多通道多語義自然交互的可行性，並綜合深度學習、大數據分析、3D視覺、圖像識別等算法，幫助百度的技術迅速落地成為有價值且受歡迎的人性化智慧型產品。

在這一領域，百度現階段的研究和創新方向主要包括：智能可穿戴設備、智能交通、智能家居、機器人以及一些基於圖像和人工智能的軟硬件產品。

百度百科詞條顯示，顧嘉唯的重點研究領域為新型用戶體驗和智能化(包括可穿戴設備、智能交通、智能家居、機器人和物聯網)，在萬物互聯到萬物智能的發展進程中，為基於深度學習和大數據分析的人工智能(百度大腦)創造自然的用戶界面和新穎的人機互動方式，領導項目包括：百度智能眼鏡Baidu Eye和百度智能自行車DuBike、盲人智能助理DuLight、實時變臉APP應用臉優。

他在百度帶領一支由設計師和原型開發工程師組成的快速原型驗證創新突擊隊，進行交互式軟硬件原型驗證和設計開發，通過基於上述領導項目在智能產品的研發，在人工智能和人機交互技術創新和應用創新層面進行相關發明專利、實用新型專利、外觀專利的創造和儲備，獲得一級發明專利和創新項目獎等七十余項成果。

加入百度前，顧嘉唯在微軟研究院從事人機交互研究，通過設計下一代微軟產品的過程把定性和定量研究技術結合起來創造可穿戴嵌入式互動產品，包括Xbox Kinect、Surface鍵盤和Windows 10。他擁有囊括硬件和軟件的22項美國發明專利，120項國內專利，是美國斯坦福大學ME310國際創新課程的客座和監事。

不只是顧嘉唯，此前百度IDL團隊多人或創業或加入其他互聯網公司。IDL創始人兼前常務副院長余凱離職創辦地平線機器人，百度深度學習研究院(IDL)主任架構師黃暢加入地平線機器人。百度無人駕駛汽車團隊前負責人倪凱離職加盟樂視。

特別是伴隨著AlphaGo引發的人工智能熱，業內人士預計，在互聯網技術領域，創業者的春天要到了。

PermaLink: https://articles.zkiz.com/?id=209360

谷歌語言交互新突破能更逼真模擬人聲

谷歌DeepMind研究實驗室昨天公布了在計算機合成領域的最新成果WaveNet，該語音合成系統能夠模仿人類的聲音，生成的原始音頻相比現有的技術與人類聲音的差異縮小了一半。

DeepMind在周五發布的一份博客中稱：“該技術已經通過了美國英語和中文普通話的盲測，聽眾認為WaveNet產生的語音聽起來比谷歌現有的語音技術產生的語音更加自然。不過DeppMind表示，目前這種技術還沒有被應用到谷歌的任何產品中，而且該系統需要強大的計算能力，近期還不會應用到真實世界的場景中。

讓人類和機器自由交談是人機交互研究領域長久以來的夢想。過去幾年，深度神經網絡的應用大幅提升了計算機理解自然語音的能力。然而，運用計算機生成語音仍然主要依靠語音合成或者拼接式TTS文本到語言(text to speech)。需要人們先錄制單一說話者的大量語音片段，建立一個大型數據庫，然後將語音片段合成完整的話語。這種語音合成方式的缺陷在於很難對聲音加以修飾，無法表達情感。

為了解決語音合成的這一難題，研究人員嘗試運用一種參量改頻式TTS(parametric TTS)。在這種TTS系統中，生成數據所需要的所有信息被存儲於模型的參數中，語音所傳達的內容以及語音特征可以通過模型的輸入信息得以控制。不過現有的參量改頻式TTS生成的語音通常是將輸出的信息交給信號處理算法去做處理，從而生成音頻信號，因此聽起來還不如拼接式的TTS生成的語音自然。

WaveNet的突破在於改變了這種利用信號處理器轉化生成音頻信號的範式，直接使用音頻信號的原始波形建模，這項技術基於人工智能神經網絡，能夠模仿人類大腦的功能，比如對於大量信息庫數據的處理，因此不僅能夠模仿任何人的聲音，還能生成音樂。在測試中，WaveNet已經通過分析古典音樂生成了鋼琴曲。

上海威盛電子語音交互部門研發總監張國峰對第一財經表示：“通過語音特征來生成波形的方式是比較早期的一種技術，它的原理是語音識別的逆過程，采用的技術和識別也比較接近。從描述上來看，DeepMind應該是基於深度神經網絡波形生成的語音。這一點和現在的技術有所不同。深度神經網絡的一個重要訓練方法就是輸出結果經過逆網絡後重現輸出，也就是自我複制神經網絡。”

DeepMind表示，WaveNet還不能馬上做商業化應用，因為該系統還需要獲得非常強大的計算能力，每秒鐘需要采集信號的次數多達16000次或者更多。而且對於采集到的每一個信號，它都要基於前一個信號的樣本，分析預測下一個聲波會是什麽樣子。DeepMind研究人員承認這是一個非常大的挑戰。

盡管如此，科技公司仍然對DeepMind此次在語音合成方面取得的進展予以極大關註。人機交互已經成為人們與他們的移動電話和汽車取得溝通的重要途徑。亞馬遜、蘋果、微軟和谷歌都在個人數字助力的研發上投入大量資金，希望有朝一日能夠實現人類和機器自然地對話。芝麻科技創始人CEO朱智對第一財經表示：“智能設備的發展註定了機器與人溝通的方式越來越重要，它說話說得越順，與人交流就越深入，學會說話了，就意味著它像孩子那樣長大了。”

谷歌2014年斥資4億英鎊收購了總部位於英國的DeepMind公司。此後DeepMind就一直從事與人工智能相關的研究。Google Play國際事業部總監Mark Bennett上周在倫敦的一場開發者會議上表示，谷歌移動端語音搜索的比重已經占到20%。

不過在機器對人類語言有了更強的理解能力的同時，他們開口說話的能力並沒有跟上。DeepMind希望WaveNet能夠成為公司的下一個人工智能主打產品。DeepMind此前因AlphaGo打敗韓國圍棋大師李世石而一鳴驚人。

截至目前，谷歌依然對人工智能的應用守口如瓶，最近以此谷歌公布人工智能成果在於其對谷歌數據中心的能耗節省方面做出的貢獻。這也令谷歌能把節省下來的高達40%的能源開支用於人工智能的研發。

PermaLink: https://articles.zkiz.com/?id=214388

人類首次！太空腦-機交互實驗將在“天宮二號”上進行

據央視新聞報道，世界首套在軌腦-機交互及腦力負荷等測試系統日前隨“天宮二號”飛上太空。待“神舟十一號”和航天員到來，“天宮二號”將開啟人類史上首次太空腦-機交互實驗。此實驗可將航天員的思維活動轉化為操作指令，並監測航天員的腦力負荷等狀態。

腦-機交互將是未來人-機交互的最高形態。航天員在太空環境，完成複雜作業任務受到極大的限制，腦-機交互可以不依賴外周神經和運動系統，將航天員的思維活動轉化為操作指令，同時又能監測航天員的腦力負荷等神經功能狀態，實現人機互適應，減輕作業負荷，是最為理想的人機交互方式。即將開展的太空腦-機交互實驗，就是對這一技術在軌適用性的最為關鍵的驗證。

PermaLink: https://articles.zkiz.com/?id=215823

辣椒快打張普：交互模式的落後是客廳娛樂的悲哀

來源: http://www.iheima.com/zixun/2016/1013/159209.shtml

辣椒快打張普：交互模式的落後是客廳娛樂的悲哀

麻策 2016-10-13 11:08

辣椒快打張普：交互模式的落後是客廳娛樂的悲哀

“我一直強調我們是做交互的公司，希望打破目前客廳人機之間的剝離和障礙。”

i黑馬訊 10月13日消息，辣椒快打昨日在京舉辦新品發布會，宣布與美國EA旗下知名遊戲發行商Chillingo簽約合作，並發布經營類電視遊戲“家有富翁”。

辣椒快打CEO張普在活動中做了主題演講。他談及了目前電視遊戲行業的困境、客廳娛樂的痛點，以及辣椒快打的願景和希望在行業中發揮的作用。

以下為張普演講內容（部分內容結合專訪速記編輯整理）：

目前，客廳娛樂是存在的，但一直不火。前段時間一篇文章寫得不錯，現在客廳娛樂處於什麽狀況呢？它的任督二脈沒有打通，一個擁有很強內力的人，但它的經脈不通造成很高超的武藝使不出來。我認為這樣的形容相當恰當。如何打通客廳娛樂的任督二脈呢？

首先，交互模式要改變。當你回到家里，你和電視機之間無論是娛樂還是交互最常采用的模式是什麽呢？不用說，一定是遙控器。現在遙控器可以用2.4G以及另外的方式去做，但它的信號所承載的操控指令相當弱，而且延時也很長，這使得遙控器在客廳娛樂里根本沒有什麽發揮的空間。

我以前也是通訊行業的一員，到前年為止，我看到在IPTV里的遊戲應用還是老面孔，並沒有什麽新的進展。我們認為，這是交互模式帶來的一種瓶頸和阻礙。其實，現在IPTV機頂盒處理能力已經很強了，不比手機弱，但沒有足夠的運營模式消耗它的運算力。這是IPTV領域甚至家庭娛樂領域的一種悲哀。

我們為了這個交互擴展了專門的通信協議和算法，使得在用戶手機和智能設備之間搭起一條高速公路，它的業務承載能力相當強，可以通過智能手機對另一個智能設備進行操控和交互。

一句話來說，辣椒快打在這個領域，我們希望自己是一個客廳娛樂最後3米的解決方案供應商，而且是軟件解決方案供應商。我並不希望我們用戶在上面承擔更多額外的成本，所以我們是免費的軟件來解決最後3米，這是客廳里機頂盒、電視機到用戶之間的最後3米。

我們根據遊戲的玩法做動作上的定義，同時，也提供一個用戶工具，可以讓用戶自己參與到玩法定義上來。比如開槍時，我是右手拿著手機去射擊，但有人喜歡用左手，他可以自己定義左手模式。這種玩法和交互將更加豐富，比如手機的重力感應、陀螺儀、光感和麥克風。比如下中國象棋，你可以說馬二進三，我說車五橫六，我們可以通過聲音識別或語音識別技術，通過指令傳到電視端後，做出相應的指揮動作。這種玩法是遊戲史上不多見的。

現在的痛點是什麽？卻少內容。我們不奢望那麽多的遊戲開發商專門為電視開發遊戲，畢竟智能電視這塊平臺也是方興未艾，還沒有形成真正的產業規模。現在讓更多投資或開發商直接往這里面殺，成本會非常之高。我個人建議，不要太急於去做針對電視遊戲的過多更改，基本還是拿現有的產品放到電視機平臺上。因為你對這個遊戲內容是否能火還無法判斷，敢說它一定會火或成為爆款。

把路鋪通，是為了基於IPTV、機頂盒、客廳娛樂的承載能力，當有了更強交互模式的時候這種業務承載能力就更強了。很多遊戲CP都知道，和我們合作的特點，遊戲根本不用改，通過我們所做的方式，針對遊戲做適配，使它們在大屏上煥發了全新的玩法和青春，在電視屏幕上以一種新的模式和面孔出現。

我們不光解決遊戲內容，還要解決支付的問題。阿里巴巴如果沒有支付寶，它就是一個簡單的移動平臺，但有了支付寶立刻就不一樣了，就是全新的壟斷電商模式，而且是收複級的壟斷模式。我們的概念並不是如此，只是想盡量給客廳娛樂提供全新的現金流解決通道。除了用戶賬戶扣款模式，我們現在可以使得機頂盒這一端所有的支付指令轉到手機上，手機是個支付錢包。用戶對手機支付比較信任，也確確實實這種支付模式是比較安全的。所以，打通這一通路，我相信無論是上遊的合作還是服務運營商都能夠從里面獲得更多的增值空間。

縱觀每一次交互模式的改變都帶來一個產業翻天覆地的變化，可能年齡大的人有些印象，最早我們接觸PC使用鍵盤交互，操作系統是DOS，之後有了鼠標，於是應運而生的Windows等就完全取代了DOS。而在Windows里的應用程序到現在為止是一種什麽狀態？依然欣欣向榮。也就是說，鼠標的交互模式出現使得PC有了一次飛躍式發展。十年前發生了一件事情，就是蘋果重新定義了觸摸，使得現在傳統功能手機變成了一個智能手機，促成了質的飛躍，從而培養了更多的業務提供商，應用提供商。

我們希望通過上述三方面的努力，可以把客廳娛樂的任督二脈打通，之後形成一個武林高手；希望辣椒快打這種交互模式也可以像鼠標、觸摸一樣引領客廳娛樂的一次全新變革。

現在手遊行業不是很景氣，確實很多優秀的人才流失了，我們覺得挺可惜。我們希望在這個過程中，讓他們嘗試找一些新的方向，尋找一些新的贏利點。畢竟從電視遊戲上，大家都還蠻有信心的，它一定會成為下一個紅海，但現在還是藍海。只不過目前看誰還能堅持，看誰試錯成本低。

而且對於我們來說，遊戲只是第一個臺階，先用遊戲培養用戶習慣，下一步做增值服務，所以不僅僅局限於遊戲，以後包括教育、唱K這些圍繞客廳的業務都可以。我一直強調我們是做交互的公司，希望打破目前客廳人機之間的剝離和障礙。

[本文作者麻策，i黑馬原創。如需轉載請聯系微信公眾號（ID:iheima）授權，未經授權，轉載必究。題圖由辣椒快打提供。]

辣椒快打張普客廳娛樂遊戲

贊(...)

文章評論

匿名用戶

發布

PermaLink: https://articles.zkiz.com/?id=218607

手勢交互技術：換個姿勢玩VR | 前沿

50歲的老寧站在一家商鋪前，好奇地看著一塊大屏幕。

屏幕上的遊戲雖然叫不出名字，可他還是熟悉的：蘋果、香蕉等水果依次飛出，等待一道凜冽的寒光把它們劈成兩半，用他的描述就是“切水果的”。

不過，更吸引他的是不遠處玩遊戲的四五歲的小男孩。孩子佩戴著一個頭盔，上面的一根線有點限制他的活動範圍，或許是頭盔太大、太重，那孩子一只手扶著頭盔，另一只手拿著手柄在空中賣力地揮舞，可惜更多的水果還是飛出了刀鋒之外。回家後，老寧模仿小孩子的動作給老伴兒看，兩個人都哈哈大笑。老伴兒告訴他：那叫VR(虛擬現實)遊戲，那根線據說是為了保證畫面清晰度，電視上看見覺得很有趣，沒想到玩起來卻這麽費勁。

如果再等兩年，VR遊戲玩起來會更輕松，不少公司已經在尋找新的解決方案了，比如用手勢進行交互，或者讓虛擬的空間不完全與現實隔離。

這要歸功於深度攝像頭的應用還有芯片的計算能力升級。事實上，已經有不少商家開始進行探索。

3Glasses就提供了一款觸碰氣球的小遊戲，可以體驗在虛擬環境下進行現實的交互。在你的視野里，能看到“手”的樣子，雖然略顯粗糙並帶有鋸齒邊緣，但是當噴射出來的氣球觸碰到你的“手”輕輕彈走並改變運動軌跡的那一刻，感覺還是很奇妙。如果你保持靜止不動，氣球也可能在你的手上飄浮——這太神奇了，因為你明明知道你的手上什麽都沒有。

玩家做出扣動扳機的動作擊中遊戲中的僵屍

這要歸功於雙目深度攝像頭的應用，也對算法提出了非常高的要求。深圳市虛擬現實技術有限公司技術支持工程師吳楚熊告訴第一財經記者，光線、鏡頭的分辨率、有無遮擋都會對遊戲體驗產生影響。

深度攝像頭有幾個關鍵技術規格，一個是檢測範圍，看最大檢測距離;第二是檢測精度，看誤差多少;第三是檢測角度，看鏡頭的視角多大;第四是檢測速度，每秒能刷新多少次。在具體應用時，模塊大小、功耗高低也是重要的選擇參考。

“手勢交互的開發需要很大的投入，所以現在各家出的還只是demo(模型)，沒有正式的產品推出，這個市場還沒有發展起來。”吳楚熊告訴第一財經記者。這是一次VR輸入設備的大變革，盡管人該如何在虛擬現實中發出指令和進行操作還沒有十分主流的意見，可是在聲控、眼動、操作桿之外，手勢識別成為了最輕松的方法。通過對手指的關節動作進行識別，並賦予指令在遊戲中的具體意義將讓遊戲進行得更加順暢。現在，手勢識別已經可以做到識別23個自由度，也就是確認23種不同的手勢了。

浙江大華技術股份服務有限公司展示的一款頭盔則提供了一種MR（混合現實）的解決方案。比如在遊戲里有不斷自由飄動的彩色水母，你可以伸手去抓它的觸角，並把它任意拖拽到指定位置。在進行遊戲的同時，也可以借助深度攝像頭影影綽綽地看見從你身邊經過的人，而不會完全與外界隔離開來，這樣就不必擔心誇張的遊戲動作會誤傷到身邊看熱鬧的圍觀群眾。

這也意味著可以順帶解決VR存在的其他問題，比如確認安全的活動範圍。目前在VR體驗館，要有專人負責協調玩家的位置避免相撞，甚至對同一空間內的玩家數量進行限制。

虛擬現實產品線項目管理部產品經理金吉祥在向第一財經記者介紹該項技術時提到，作為提供安防運營服務上市公司，他們進行了一系列機器視覺、無人機、遠程視頻會議系統等創新業務，VR也是方向之一。“我們在新業務的投向方面會側重考慮與公司原有的視頻核心技術有較強的關聯性。”

他表示，如果想把這項業務進行商業化，B端是一個不錯的選擇。舉例來說，在汽車仿真部門，可以更好地幫助汽車工程師進行放大局部，通過手勢交互，也免去了外帶設備使用時的笨重。

然而提到C端，商業前景並不明朗。“這和國外還不一樣，主動購買設備並進行嘗鮮的消費者在國內很少。作為擁抱新社會、新技術的代表，通過行業應用讓消費者進行體驗是可以的，這顯然還需要一個漫長的時間才能推廣到消費者端。”金吉祥說。

VR正在進一步走進人們的生活，從互動到社交也成為一個更加值得期待的方向。

微鯨科技CEO李懷宇接受第一財經記者采訪時也談到VR與互聯網電視的結合。他表示，從娛樂、內容、互聯網技術上都看到VR有非常強的延伸性和聯動性，VR社交的潛力將與電視非常匹配。

“微鯨正在VR上做一個社交的東西。比如現在在開發電影院，未來我們的VR已經實現了一個雛形，兩個人在不同的地方同時看電影，感覺就坐在身邊，你戴著VR眼鏡的時候就能看到另外一方。我們現在做足球的VR直播，提供一個功能，就是你可以選擇你的夥伴，他可以坐在你身邊，目前這個夥伴還是一個造型、一個符號，未來我們會給大家賦予真人的能力，你就可以感覺到你跟家人、朋友坐在一起看一場電影或者看一場比賽。”他這樣描述設想的VR社交場景。

無論是交互還是社交，顯然，目前的VR設備將會迎來一場升級。

PermaLink: https://articles.zkiz.com/?id=244250

📖 ZKIZ Archives

Random Tags