ZKIZ Archives


沈向洋:搜索還有2次洗牌機會

http://www.yicai.com/news/2012/09/2092605.html

沈向洋:我看了你那篇《江湖人眼裡的3B大戰》。你可能忽略了官府對於江湖的作用。江湖人殺人,還是被官府抓起來不少。百度和360可能都有第六張牌,官府牌。

程苓峰:確實故意忽略掉這張牌。可意會卻難以言傳。官府也是江湖,也有幫派。江湖上也有各個幫派的把柄,制衡無處不在。你對中國的江湖豪傑瞭解嗎?

沈向洋:馬化騰和周鴻禕的產品感覺好。李彥宏是技術型。在這個社會環境下能做到今天,真的不容易。

程苓峰:搜索已經十多年了。必應還有戲嗎?

沈向洋:第一階段戰鬥基本結束。也就是web graph,網頁圖譜。但至少還有兩個新階段有機會彎道超車。一個是social graph,社交圖譜,下一個是entity graph,實體圖譜。

Social graph我們領先。必應跟Facebook和Twitter有合作,可以抓到十幾億真實用戶創造的東西。谷歌被排在外面。比如搜一個朋友,必應能把這個人在Facebook上的照片給你。搜一個產品,必應能把好友的評價給你。在Facebook裡搜索,必應會把外部結果整合給你。

程苓峰:Social Search已經足夠好了嗎?我的感受還不強烈。

沈向洋:數據還不夠多。在網頁搜索時代一個搜索引擎要先抓到幾百億以上的信息量,搜索結果才開始有點道理。這是個基礎門檻。Facebook有9億用戶,每個人每天都在產生幾個page的內容。估計還要5年social search會有相當的力量。

程苓峰:Entity Graph呢?

沈向洋:web graph把網頁連接到一起,social graph把人連接到一起,接下來就是把實體連接到一起。比如這個酒店和那個高爾夫球場是什麼關係?跟這個咖啡杯是什麼關係?要搞清楚關係就要借助屬性,酒店的位置、星級、住過的人、辦過的會議。如果能把這些實體相互聯繫起來,那會具有怎樣的力量?

谷歌和百度控制了web graph。誰控制了social graph和entity graph,誰就控制了未來。

程苓峰:舉個現實的例子吧。

沈向洋:今天想在AppStore裡找到合適的應用,效果不好,為什麼?一個原因是這些APP沒有建立相互的聯繫。APP裡有什麼內容,有什麼人的名字,用戶使用它的基本信息。如果把這些東西打通,建立關聯,就能通過搜索找到最相關的應用。再把這些數據開放返回給開發者,他們就知道如何能寫出更好的內容和應用。

程苓峰:這是個好想法。現在很多人都覺得APP是獨立的,是反互聯網的。而你在反覆在使用一個詞:聯繫。

沈向洋:相互聯繫,是互聯網最了不起的地方。 搜索的大廈是建立在三件事的基礎上:第一,人寫了很多東西放到互聯網上。第二,互聯網把它們都聯繫在一起。第三,每個人每天都在點擊這些東西,給出反饋。現在又有了第四件事,越來越多的人每天都在like這些東西。

搜索是一個human competing。是人在幫搜索做得越來越好。所以你想要玩這個遊戲不能閉門造車,一定要把產品推出來讓人來用。

程苓峰:你們準備得如何了?

沈向洋:必應的基礎有了。在美國必應有16%的份額,再加上雅虎的搜索後台也是我們在做,加在一起30%,谷歌是65%。在這個基礎上就能做social 和entity的擴展。最近亞馬遜的kindle fire也把必應作為默認搜索。

程苓峰:看來合縱連橫的策略在哪裡都有效。谷歌太強大,於是亞馬遜、雅虎、Facebook、Twitter都成了必應的夥伴。這讓我又想到了江湖。美國的互聯網業是個江湖嗎?

沈向洋大笑:美國沒中國那麼長那麼豐富的歷史,沒武俠小說,山高皇帝遠的地方比較少。美國的西部片裡描述的狂野西部的歷程其實也不長。他們有仇就是拔槍決鬥,幾分鐘解決。感覺算不上江湖。

程苓峰:美國就完全沒有像江湖的地方嗎?

沈向洋:有人覺得美國政界像江湖。我剛看一本書,採訪了在監獄裡的黑幫大佬,發現黑幫管理和分享利益的機制跟大公司神似。


PermaLink: https://articles.zkiz.com/?id=37679

微軟全球副總裁沈向洋:要讓“機器人”能講出圖像背後的故事

來源: http://www.yicai.com/news/2016/01/4740024.html

微軟全球副總裁沈向洋:要讓“機器人”能講出圖像背後的故事

一財網 江旋 2016-01-17 16:23:00

人工智能不僅僅是計算機科學,它是一門交叉學科,包括了心理學、社會學、哲學、腦科學等等。對圖像的識別則是人工智能發展中的一個重要分支,重量級的互聯網公司都在該領域發力。

人們都喜歡“看圖說話”,而人工智能(AI)的研究者們希望未來計算機能像人類一樣識別圖片,理解圖片背後的故事。但這一領域的頂尖研究者卻認為,要達到這個層次,人工智能研究的任務並不輕松。

微軟全球執行副總裁沈向洋1月17日在“未來論壇”上談及人工智能中計算機視覺的最新研究進展時表示,在圖像處理的問題中,對圖像的理解是一個前沿性的問題,或許還有“漫漫長路要走”。

沈向洋稱,人工智能已經發展了50余年時間,真正要把人工智能做得像人類智能一樣的程度,首先要感知,然後是認知。人工智能不僅僅是計算機科學,它是一門交叉學科,包括了心理學、社會學、哲學、腦科學等等。

對圖像的識別則是人工智能發展中的一個重要分支,重量級的互聯網公司都在該領域發力。

以Google推出的GooglePhotos的為例,GooglePhotos不僅僅是相冊,也具備了智能的圖片識別技術:它可以將相冊中同一個人物的照片整合在一起,比如回顧一個嬰兒從小到大的成長軌跡。其“訓練”過程是:AI具有30層神經網絡,每一層對應著不同的抽象程度,比如最低層次能識別光線、色彩,下一層次能識別圖片的邊緣等等。這樣一層層的“訓練”需要大量的數據。每一層都能提取出更高層次的細節,而最後一層會決定AI對圖片的理解。

去年年底,微軟亞洲研究院視覺計算組在一項比賽中,對深層神經網絡技術又進行了突破:目前普遍使用的神經網絡層級能夠達到20到30層,此次比賽中該團隊應用的神經網絡系統實現了152層。

據悉,微軟的聊天機器人小冰已經整合了微軟在圖像識別上的技術,不僅能識別圖像類型和要素,還能進行人性化的描述。

不過,人工智能在對圖像進行處理時,雖然目前的識別技術已經非常先進了,但並非每次都很靈光。一些實驗就表明,研究員給出的相似、相近或是較複雜的圖像,往往能夠騙過計算機,使其得出錯誤或是不那麽精確的結論。

對於這些問題,沈向洋談到,圖像識別可以分為三個問題:一是對圖像的分類,二是對圖像中的要素的察覺,三是像素級別的區分。目前對這三個問題研究的進展都很迅速,但應該再向前一步對圖像理解進行深入研究。

“比如Howold,MicrosoftSelfie這些軟件,對圖像的理解到底能做到什麽地步?一張照片來了之後,能不能解釋這張照片到底是什麽,能不能挖掘背後的故事。怎麽讓這個過程變得更加有趣。”沈向洋說道。

微軟把這些功能集成在小冰聊天機器人身上。沈向洋在論壇現場展示的一張圖片顯示,一張照片中有大小兩只貓,如果僅僅是按計算機視覺來做,會得出“這張圖里有兩只貓”的結論,而小冰卻可以說出“看這貓的眼神兒太犀利了”,從而讓聊天過程變得更有趣。沈認為,這種人性化的描述通過計算機識別無法達到,只有通過人類交互才能達到。

這種更為複雜的交互方式是AI發展的一個重要方向。“人工智能是近幾年來最火的研究領域,但是當我們真正走向人工智能的時候,就算是在機器視覺的這樣一個分支上,都還有漫漫長路要走。”沈向洋說道。

編輯:邊長勇

更多精彩內容
請關註第一財經網、第一財經日報微信號

PermaLink: https://articles.zkiz.com/?id=182702

Next Page

ZKIZ Archives @ 2019