來源: http://newshtml.iheima.com/2014/1207/148214.html
淘寶搜索算法現狀
來源: http://newshtml.iheima.com/2015/0318/149361.html
淘寶搜索排序的目的是幫助用戶快速的找到需要的商品。從技術上來說,就是在用戶輸入關鍵詞匹配到的商品中,把最符合用戶需求的商品排到第一位,其它的依次排在後續相應的位置。為了更好的實現這個目標,算法排序系統基本按三個方面來推進:
一.算法模型
當用戶輸入關鍵詞進行搜索的時候,系統依據算法模型來給匹配到的每個商品進行實時的計算,並按照分數的大小對商品進行排序。
對於好的算法模型,首先需要考慮我們能夠有哪些特征因子可以應用。比如在網頁搜索中,算法模型基本就是按網頁的重要性和相關性給網頁計算一個分數,然後進行排序。這里的相關性,和重要性就是網頁排序模型中兩個重要的因子。具體來說相關性因子是指搜索關鍵字在文檔中出現的度數,當這個度數越高時,則認為該文檔的相關程度越高。重要度因子比如Google的Pagerank,可以理解為一個網頁入口超級鏈接的數目:一個網頁被其他網頁引用得越多,則該網頁就越有價值。特別地,一個網頁被越重要的網頁所引用,則該網頁的重要程度也就越高。
考慮淘寶搜索的時候,有些特征因子是很容易能想到的,比如:
A.文本的相關性: 關鍵詞和商品的匹配,匹配的程度,是否重要詞的匹配,匹配詞之間的距離等,都可能影響相關性。比如搜索“小鴨子洗衣機”的時候,一個商品的中心詞是洗衣機的要比賣洗衣機配件商品的相關性高,小鴨子連在一起的相關性要比“小”和“鴨子”分開時候的相關性高等。文本相關性最基本的計算方式可以參考BM25等。
B.類目熱點: 淘寶數據的一個重要特質是每個商品都掛靠在類目屬性體系下面,每個商品都做了一個很好的分類。在搜索過程中,同一搜索詞的大量用戶行為數據很容易聚焦到相應的熱點類目,比如“手機”的搜索行為會集中到手機類目,而不是配件類目。
C.圖片質量: 圖片是電子商務網站非常重要的一個數據,圖片是否精美吸引人,圖片上是否有各種各樣的“牛皮癬”,和商品匹配度等都很大程度上影響著用戶的點擊和購買決策。
D.商品質量: 每個商品都有不同的質量,商品的描述真實性,是否物美價廉,受人歡迎的程度等。
E.作弊因子: 類似於全網搜索有關鍵詞堆砌,link spam,網頁重複等等作弊的問題,電子商務搜索也面臨同樣的問題,比如商品關鍵詞堆砌,重複鋪貨,重複開店,廣告商品引流等等,也有商品特有的問題如價格作弊,交易作弊等,需要利用統計分析或者機器學習來做異常行為,異常規律的發現和識別並運用到排序中。
F.公平因子: 淘寶的商品很豐富,每個搜索詞下都有足夠多的商品在競爭,需要在相似質量的情況下讓更多的商品和賣家有展示的機會,而不是像網頁搜索一樣是一個基本靜態的排序,照成商品點擊和展示的馬太效應。
類似的商品,賣家,買家,搜索詞等方面的特征因子有很多,一個排序模型就是把各種各樣不同的特征因子組合起來,給出一個最終的關鍵詞到商品的相關性分數。只用其中的一到兩個特征因子,已經可以對商品做一些最基本的排序。如果有更多的特征參與到排序,我們就可能得到一個更好的排序算法。組合的方法可以有簡單的人工配置到複雜的類似Learning to Rank等的學習模型。
那麽如何衡量不同算法之間的優劣呢?
二.線下評估
算法模型的評估一般分為線下的評估和線上的評估,線下的評估很多都體現在搜索中常用的相關性(Relevance)指標。相關性的定義可以分為狹義相關性和廣義相關性兩方面,狹義相關性一般指檢索結果和用戶查詢的相關程度。而從廣義的層面,相關性可以理解為用戶查詢的綜合滿意度。當用戶在搜索框輸入關鍵詞,到需求獲得滿足,這之間經歷的過程越順暢,越便捷,搜索相關性就越好。
在淘寶搜索衡量狹義相關性的時候,一般是使用PI(Per Item)測試的方法:
A.抽取具有代表性的查詢關鍵詞,組成一個規模適當的關鍵詞集合
B.針對這個關鍵詞集合,從模型的產出結果中查詢對應的結果,進行人工標註(人工判斷為相關性好、中、差等), 對人工評測的結果數據,使用預定義好的評價計算公式比如DCG等,用數值化的方法來評價算法模型的結果和標註的理想結果的接近程度。
利用人工標註數據來計算相關性的分數,來判斷模型的好壞;在這個過程中人工不可避免的會有主觀的判斷,但綜合了多人的判斷結果還是可以獲得一個有統計意義的結果,另一方面標註數據也可以幫助我們找到一個算法表現不理想的地方,有針對性的提升。
廣義的相關性線下評測比較困難,受人工主觀因素的影響更大,一般使用SBS(Side by Side)的評測方法,針對一個關鍵詞,把兩個不同算法模型產出的結果同時展示在屏幕上,每次新模型和對比模型展示的位置關系都是隨即的,人工判斷的時候不知道哪一邊的數據是新模型的結果,人工判斷那一邊的搜索結果好,以最終的統計結果綜合來衡量新模型和老模型的搜索表現。
線下評測的方法和指標有很多,不同的搜索引擎會關註不同的指標,比如以前Yahoo的全網搜索引擎比較關註RCFP(Relevance,Coverage,Freshness,Perspective)等,淘寶搜索線下評測時候一般統計DCG和SBS的指標。
線下的評測方法從統計上有一定的指導意義,能從一定程度上區分模型的好壞,但要真正驗證算法模型的好壞,還需要接受真實的流量來驗證。
三.線上測試
為了真實驗證一個算法模型的好壞,需要有一個系統能提供真實的流量來檢驗。淘寶搜索實現的BTS(Bucket Testing System)系統就是這樣的一個環境,在用戶搜索時,由搜索系統根據一定的策略來自動決定用戶的分組號(Bucket id),保證自動抽取導入不同分組的流量具有可對比性,然後讓不同分組的用戶看到的不同算法模型提供的結果。用戶在不同模型下的行為將被記錄下來,這些行為數據通過數據分析形成一系列指標,而通過這些指標的比較,最後就形成了不同模型之間孰優孰劣的結論。只要分組的流量達到一定的程度,數據指標從統計意義上就具有可比性。
不同的BTS系統會關註不同的數據指標,在淘寶搜索,有一些重要的指標是很多算法模型測試的時候關註的:
訪問UV成交轉化率 :來淘寶搜索的UV,最終通過搜索結果成交的用戶占比。
IPV-UV轉化率 :來淘寶搜索的UV,有多少比例的用戶點擊了搜索結果
CTR :搜索產生的點擊占搜索產生的PV的比例
客單價 :每個成交用戶在淘寶搜索上產生成交的平均價格
基尼系數 :基尼系數是一個經濟學名詞,考量社會財富的集中度;如果社會財富集中到很少一部分富人手中的時候,基尼系數就會增大,社會的穩定性和可持續發展性就會出現問題;淘寶搜索借用了這個概念來衡量搜索帶給賣家的PV展示,和點擊的集中度,在保證用戶體驗的前提下,給更多的優質或小小而美的賣家展示的機會。
大部分時候我們都有好幾個模型和功能在線上測試,我們用BTS的方式來觀察測試的情況,如果提升穩定就逐漸開放給所有用戶,如果沒有提升,我們也能從中獲得經驗幫助我們更好的理解用戶。
作者介紹:青峰,淘寶搜索算法總監。
為了激勵作者們寫出更多、更好的文章,您可以掃下面二維碼給黑馬哥適度打賞,金額有8.8和88元!
版權聲明:本文全部為原創,i黑馬版權所有,未經授權嚴禁轉載,如有疑問請聯系微信heimage0001。
如果你對更多創業幹貨 感興趣,請加微信heimage0001 ,註明“姓名+公司名+職位 ”,否則黑馬哥不會把你拉入創始人雲集的微信群。
歐盟正式指控谷歌搜索涉嫌壟斷 將調查安卓系統
來源: http://www.infzm.com/content/109043
在以色列特拉維夫的谷歌辦公室門上的公司標誌。 (新華社/路透/圖)
谷歌內部備忘錄回應:購物搜索未破壞競爭
谷歌又攤上事兒了。
4月15日,據經濟參考報 消息,歐盟委員會15日對美國谷歌公司發出告知書,指控谷歌其在搜索引擎市場上的主導地位,讓自己的購物比價服務優先出現在搜索結果網頁上,違反了歐盟的反壟斷法,損害了消費者和競爭對手的權益,同時扼殺創新。
歐盟委員會可判處的罰金最高可達企業全球營業額的10%,若以谷歌2014年660億美元的銷售額計算,罰款有可能超過60億美元。
歐盟委員會表示,已經向谷歌公司發出一份“異議聲明”,谷歌公司需要在10周時間內作出答複,也可要求召開聽證會說明公司的營運情況,歐盟委員會將在聽取谷歌意見後作出結論。
依照歐盟法律,如果認定企業濫用市場優勢地位,歐盟可以要求企業徹底改變運營方式。美國軟件巨頭微軟公司和世界最大芯片生產商英特爾公司就因這一罪名分別於2004年和2009年接到歐盟數億美元罰單,被要求停止不正當競爭。
對此,谷歌在其官方博客中發表聲明,列舉了競爭對手購物網站在德國、法國和英國的訪問量,反駁歐盟對其的指控。
據新浪財經 ,網上泄密的一份谷歌內部備忘錄顯示,谷歌目前的辯護策略是弱化自己的領先地位。谷歌制作了多張圖表並用數據說明,該公司在歐洲購物搜索市場受到了亞馬遜、eBay和本地競爭對手的激烈競爭。此外,Yelp在移動搜索領域也在迅速發展,有超過40%的流量直接源自移動應用。
谷歌試圖證明,在購物和旅行等垂直領域,谷歌並不具備像搜索市場一樣的領先地位。
谷歌在備忘錄中說:“競爭只是點擊一下鼠標的事情——競爭越來越激烈。人們可以使用必應、雅虎、Quora、DuckDuckGo,以及蘋果Siri和微軟Corana等一系列搜索助手,還有亞馬遜、Idealo、Le Guide、Expedia或eBay等更加專業的服務。另外,用戶越來越開始利用Facebook和Twitter等社交網絡尋找新聞和推薦——包括到哪里吃飯,看什麽電影。”
歐盟已對谷歌反壟斷調查5年 將調查安卓系統
值得註意的是,在歐洲市場占據90%搜索市場份額的谷歌,其早在5年前就開始遭遇歐盟的反壟斷指控。
據公開資料 顯示,2010年12月,歐盟開始提出谷歌涉嫌違反自由競爭的相關法規。2011年3月,谷歌被發現在搜索結果中過濾歐洲三家網站內容,其中包括比價網站、購物網站和一家法律服務網站。
2013年4月,谷歌給出解決方案,保證在未來五年中改善搜索結果,在鏈接中加入競爭對手的網站。隨後,谷歌的解決方案被駁回,歐盟要求谷歌做出更多讓步。
2014年2月,歐盟委員會專員阿爾穆尼亞(Almunia) 接受谷歌提議,雙方保持對立但不直接發生沖突。但歐盟不接受Almunia的解決方案,同時開始重新評估谷歌整改時間,目標在年內結案。
11月,瑪格麗特·韋斯塔格(Margrethe Vestager) 取代Almunia成為歐盟委員會競爭專員,歐盟議會強烈要求搜索引擎解除捆綁,以促進行業競爭。
自此,歷經5年的調查後,歐盟於2015年4月15日正式對谷歌提起反壟斷訴訟。
據騰訊財經 消息,相對於美國,歐盟監管部門對科技巨頭的態度更強硬,並降低了判斷壟斷行為的標準,和解方案可能要求谷歌對搜索業務進行調整。對此,有業內人士認為,除了谷歌的搜索廣告收入會被影響外,這一訴訟可能還將導致大筆律師費,同時,與歐盟的糾紛會牽扯谷歌高管們的大量精力。
此前曾接到歐盟罰單的微軟高管表示:“我們學到了經驗,你不應對抗歐盟委員會,而是最好讓他們支持你。”自2012年以來,微軟已向歐盟委員會繳納了超過15億美元的罰款。
前述經濟參考報消息,熟悉此前歐盟反壟斷案的專業人士表示,谷歌的最佳選擇是和解,且越快越好。考慮到谷歌在全球市場的主導地位,許多其他國家和地區很可能會效仿歐盟的做法。
歐盟15日還表示,已正式開始調查谷歌是否利用安卓操作系統迫使智能手機廠商優先對待谷歌的服務和應用,排擠競爭對手。歐盟稱,還將繼續進行另外三項針對谷歌的調查,即涉嫌複制對手的網頁信息、獨家廣告制度和對廣告商的不恰當限制措施。
百度退出日本搜索市場 轉向移動先行
來源: http://www.yicai.com/news/2015/04/4607692.html
百度退出日本搜索市場 轉向移動先行
一財網 劉佳 2015-04-19 12:17:00
Baidu.jp搜索引擎的關閉並不意味著百度放棄日本市場,據悉百度仍保留了日本辦公室,並推廣其Simeiji應用,這是一個用於日文輸入的iOS和Android鍵盤應用。
在進軍日本市場多年之後,百度做出了關閉百度日本搜索引擎Baidu.jp的決定。
有媒體援引百度一名發言人的話,確認百度日本搜索引擎已關閉。不過該發言人表示:“並不排除,未來我們重新推出該服務,或是通過日本的其他平臺推出搜索服務的可能性。”
未撼動日本搜索格局
公開資料顯示,2006年百度宣布其國際化戰略,並以日本市場為出擊首站:2007年3月,百度日本站開始測試,2008年1月23日百度搜索正式在日本上線。
對於百度海外首站為什麽是日本,百度董事長李彥宏曾解釋道:“日本市場的競爭並不是那麽激烈,日本市場的格局多年來沒有變動,就是Yahoo和Google這兩家非日本公司在做,我覺得從日本消費者的角度來考慮的話,多一個選擇是有好處的。”
當時李彥宏曾發表文章說:“一直提醒自己不要把百度進軍日本的行動看成國際化,如果非要用“化”來說事的話,應該叫本土化。進入一個新的市場,需要前面多年來在技術、人才、產品、運營上的經驗,同時也需要當地人告訴我們什麽是那里的人需要、看重並且能看懂的。百度在中國的成功是因為我們更懂中國,並更願意懂中國;在其他國家成功,也需要願意懂那些個國家。”
他曾暗示進軍日本並不容易。他說:“站在東京都市中心酒店的窗戶前,看著160公里以外雪白的富士山山頂,很容易超脫出大都市的繁華,讓自己的心平靜下來。當然,也許這只是大戰前夕的平靜。”
時隔多年之後,百度相關發言人承認:“很明顯,百度日本搜索引擎從未吸引到大量用戶。隨著我們於2013年停止搜索編目,過去一年多時間里,搜索用戶數並不是很多。”
不過,Baidu.jp搜索引擎的關閉並不意味著百度放棄日本市場,據悉百度仍保留了日本辦公室,並推廣其Simeiji應用,這是一個用於日文輸入的iOS和Android鍵盤應用。
百度發言人表示,這一商業決策基於百度全公司的戰略,即專註於成為一家移動優先的公司。“這意味著在適當的時間和地點進一步專註於移動和O2O。尤其在日本市場,這樣做很合理。日本的智能手機滲透率已經超過70%,而這是一個被iOS主導的市場。截至2014年12月,iOS設備在日本的市場份額超過60%。我們的iOS輸入應用Simeiji非常熱門,擁有超過1400萬用戶,並在日本蘋果App Store中排名前列”。
國際化“時不我待”
在關於國際化方面,百度董事長李彥宏曾在2014年的一封內部郵件中稱,加速百度國際化“時不我待”。
在更早的2010年,他曾撰文指出國際化很可能是一個比較長期的工作,而且需要比較大的投資,但是總有一天會看到這種投資是值得的。百度內部已經設立了這樣一個目標——下一個10年,要讓百度這個名字在全球一半以上國家成為家喻戶曉的品牌。
但和以搜索業務直接進軍日本市場不同,百度的海外策略逐漸變成了繞開搜索技術,例如在越南、泰國、印尼、馬來西亞、巴西等國家,利用hao123、貼吧、知道、殺毒、瀏覽器等一系列工具類應用先行,再為日後推出搜索引擎建立基礎。
2013年“兩會”期間,身為全國政協委員的李彥宏透露,“在埃及、泰國、馬來西亞、巴西等國家,我們有當地語言的服務,每月大有大約3000多萬海外用戶在使用百度。”
公開資料顯示,此前百度的阿拉伯語(埃及)、葡萄牙語(巴西)、泰語(泰國)版的搜索服務已經正式上線,旗下Hao123目前全球有8種語言的10個本土化版本,2013年的月活躍用戶數3500萬。
而百度的泛安全產品安全衛士、百度殺毒、Spark瀏覽器業務已經擁有泰語、印尼語、葡萄牙語等多語言版本。
在巴西市場,百度此前公布的數據稱,Hao123桌面端用戶突破3000萬、百度衛士用戶也超過千萬;百度瀏覽器等多款移動產品已擁有了數百萬用戶。2014年7月,百度葡語版搜索在巴西正式上線提供服務,百度不僅通過自己的技術和產品為巴西提供優質的互聯網服務,還與巴西政府的國家級重大項目對接,為巴西互聯網科技業務研發創新性解決方案,推動巴西互聯網科技創新;還將在巴西建立世界級的技術研發中心,致力於培養當地互聯網科技專業人才,為巴西培育創業公司提供支持。
很快,在2014年10月百度入股巴西最大團購網站Peixe Urbano。從發布葡語搜索,到投資巴西本土互聯網公司,這也意味著,在用戶搜索習慣已經完全養成並且保持著每年30%以上高增長的巴西搜索市場,百度正在展開更多“本地化”深入探索。
編輯:邊長勇
更多精彩內容
關註第一財經網微信號
不放过每一个机会:通过搜索人事变动进行筛选重组股 大多数与极少数
http://xueqiu.com/7808614258/41600481
不放过每一个机会:通过搜索人事变动进行筛选重组股 有些粉丝了,哪天有空了写篇通过搜索公告关键字加人肉寻找即将停牌股的方法,两三千只股票,总有些类似明牌的捡钱机会,特别是重组较热的这两年牛市。
4.22更新
大家都知道,重组前的人事变动是个很重要的信号,但重组前不一定发公告,发人事变动公告不一定会重组。此方式需要花费大量精力,需要很强的对信息的搜集及判断能力,再结合技术面等去分析,成功率要看个人。
另外,即使选对了你也不一定受得了洗盘,即使忍受住了洗盘也不一定会重组成功,即使重组成功后大涨,重组期间的时间损失也不一定划算。合不合算,要不要“赌”,还要看自己的选择。
这种方法相信很多喜欢数据挖掘的早就试过了,雕虫小技,嫌没营养的还请嘴下留情。本人水平有限竟然还有人关注,相信其中新韭菜也不少,如果有人看了有些收获,也算没白写。
以下很简单:
工具 :雪球、东方财富股吧,按内容搜索。另外改天有空了聊下对股吧的看法,在有些人眼里它是散户发泄的地方,但如果用好了,它就是一个发挖金库的工具。
关键字 :“辞职、离职”,再细化“董事长/董事/董秘/高管辞职、离职等”
花费时间 :搜索并找出近期辞职信息的股票代码并记录,花费15分钟。
简单筛选出不适合或者正常人事变动的股票,靠经验判断,花费1小时
从中细选,挑出极个别可能性极大的并进行深入分析,花费N小时
这需要对有重组预期的股票的特征有了解,不断的对所获取到的有价值的信息进行加分或减分,然后做出自己的判断要不要入手。
简单的两个例子,
$黑化股份(SH600179)$ 14年11月底董事长、总经理辞职,两天后停牌。
当看到辞职公告的时候停牌的可能性有多高呢?我认为是相当高的,源于我认识的一位经常推荐重组票的高手曾经多次推荐过它,这是很高的加分项,另外股东户数14年大幅减少,又是一个很高的加分项,再深挖下基本面,有重组预期,又是加分,市值较小,又是加分,高度控盘,经常不随大盘走势,加分!。。。等等
现在又来了一个董事长辞职公告,我认为这事成了。
下面几个例子。
$新嘉联(SZ002188)$ 搜到去年8月份董事辞职的公告,市值比较小,且有强烈的转型预期。留着深挖。
深挖了一整天。
其中的一条:11月份新进董事有一位叫帅曲的,新浪微博搜索帅曲,竟然是用的实名,微博介绍,
专注PE及重组领域 (大意,12月初的时候给他发了条玩笑私信后没多久已被修改),看到这,这事基本成了,不过庄比较恶,停牌前洗的较凶。能坚持下来的相信会有厚报。
$成商集团(SH600828)$ 三四月份高管辞职,上周停牌。
也有些是停牌后才放出的辞职公告,这就没办法了,如现在的
$南华生物(SZ000504)$ 。 当然,它在13年底也有一次董事长辞职公告,之后跌了不少,4个月后才停牌,坚持到现在的铁粉也有三倍收益了。
上面这些停牌已经买不到了,有没有还没停牌的呢?
年初,
$*ST锐电(SH601558)$ 高管相继辞职。。。。基本面怎么样?股价稍高还是在山脚下?自己判断。
再说个更近的,本月,
$申达股份(SH600626)$ 董事辞职、
$深中华A(SZ000017)$ $*ST三鑫(SZ002163)$ 。。。
写的很简单,很多细节都记不太清也懒得回忆了,另外,分析的时候,要从哪几个方面深入分析?哪些是加分项哪些是减分项?这些全靠个人经验,这点也是最重要的。
欢迎大家挖掘并交流。
用搜索思維做O2O,百度能成變量嗎?
來源: http://www.iheima.com/news/2015/0909/151897.shtml
百度世界大會最受矚目的當屬“度秘”智能機器人秘書,它與用戶語音對話,接收指令後幫助用戶訂咖啡、訂餐廳、買電影票……這些可被歸納為獲取線下生活服務。這是其與其他語音助手最大的不同。這些服務來自於百度糯米的整合,如果度秘未來能夠像李彥宏期待的那樣“無處不在”,向搜索框一樣滲透在各個App和設備的話,百度糯米將獲得更多流量來源,無疑是一大利好。秘書機器人的引入讓百度糯米看上去又多了些技術含量。從本次世界大會來看,百度做O2O的思路已經非常清晰:用走搜索引擎的思路來做O2O。
有了 200 億百度做 O2O 依然不想燒錢
今年李彥宏宣布未來三年將投資200億元到糯米,這意味著百度糯米擁有可觀的營銷預算,擁有了“燒錢大戰”的子彈——O2O行業都在燒錢是事實。百度糯米對此並不排斥,百度副總裁、百度糯米總經理曾良在百度世界大會提出一個“螺旋式增長”的概念:O2O平臺和電商平臺推進業務時,通過燒錢造節,拉高GMV(交易額)到一個峰值,之後會回落,但依然會比造節之前高(這點非常關鍵),不斷造節、不斷提高,最終螺旋式增長。嘗到甜頭的糯米在2015年造了近10個節,最近的七夕單日流水已達到4.5億,占了整個O2O行業單日交易額的50%以上。
不過,與其他平臺過度依賴燒錢補貼不同,百度更希望將其作為一種營銷之“術”,而且是暫時性的。骨子里百度是抵制這種粗暴的競爭手段的。曾良坦然表示,今天看上去糯米有200億去花但其反而壓力更大了,因為他必須思考如何把這些錢賺回來(這是正常的商業邏輯)。而李彥宏之前已明確表示百度做O2O要走技術路線,O2O行業技術含量太低,太依賴燒錢補貼。
燒錢補貼模式簡單卻又粗暴,市場野蠻增長的同時存在諸多弊端,大家都想跳出來,只不過大都“欲罷不能”,補貼對於用戶、對於商家、對於市場、對於平臺很容易成為“鴉片”。許多啟動燒錢模式的玩家都抱有這樣一個期望:熬死對手,自己活下來就是勝利,競爭變弱燒錢自然會終止。但在針尖對麥芒,平臺實力相當時這種期望並不現實,所以滴滴和快的最後只得走向握手言和,燒錢的無底洞就算阿里再壯大10倍也無法撐下去。所以很悲哀的是很多O2O平臺“窮得只省下錢了”,太依賴燒錢的後果就是缺乏人無我有、可持續的競爭力。
百度對於燒錢模式更加警惕。一是因為百度近年來在人工智能等研發上已經在大筆投入;二是百度本身做的是高效率連接人與信息,並不喜歡粗放式的業務,做O2O必然會走精細化道路;三是百度擁有大數據、人工智能這些得天獨厚的優勢,這是它在O2O業務上的“勝負手”。說到底,百度走向人與服務的連接,做O2O依然希望通過“高效率”的方式來做,這決定了整個公司在價值鏈中的環節。在PC時代百度處於最具話語權的入口位置,在後移動互聯網時代,百度想保持這樣的話語權。
百度 O2O 頂層設計像極了搜索引擎
過去各大O2O平臺本質上是淘寶模式,一方面撮合服務商入駐,一方面想方設法獲取用戶流量,然後將這些流量轉售給服務商,說白了,O2O平臺都是在做電商,只不過售賣的東西從商品變成了服務,而百度做O2O則是以搜索引擎的思路來做。
網頁搜索引擎分為三個關鍵部分:爬蟲用來抓取全網內容,索引用來標簽化內容,即建立關鍵詞與超鏈接之間的配對,搜索部分則負責處理用戶需求、排序和過濾等結果呈現事宜。發展到後面,搜索引擎做了三個事情:1 、“聯盟”,讓第三方站長可以展現廣告,與搜索引擎流量互通,形成一個開放式的流量平臺;2、自建內容,百度先後推出貼吧、知道、百科等頻道;3、內容被動接入,作為爬蟲的補充,第三方站長可以主動提交內容到搜索引擎,即百度阿拉丁計劃。而所有這些都與百度今天在做的O2O形成了一一對應關系。
百度世界Robin介紹“度秘”時,提到百度索引真實世界的三層架構,與網頁版搜索引擎是一一對應的:第一層是連接3600行,它對應到爬蟲和阿拉丁計劃,解決“內容聚合”,主要通過插件等方式讓服務商接入;第二層是全網挖掘,給服務打標簽,這對應到搜索引擎的“索引(Index)”;第三層是度秘,與消費者溝通,服務的呈現,它對應到過去的搜索子系統。
與此同時,百度糯米推出“糯米+”生態體系三大部分,夥伴聯盟指在所有應用中接入百度服務內容,對應到“百度聯盟”;服務聯盟則是百度過去的“中間頁戰略”,讓洗衣、票務、出行等領域的垂直O2O平臺可以與百度共享流量和用戶;而“會員+”則對應到百度鳳巢,是百度糯米與服務商家之間的對接方式。所以說,百度做O2O的頂層設計像極了搜索引擎,只不過索引對象變為真實世界,做的是實體服務搜索。這就意味著,百度做O2O必然會處處走技術路線,技術成為其核心競爭力。
技術正在成為 O2O 市場的關鍵變量
O2O是苦活、臟活和重活。很多項目不是很有技術含量,比如送外賣、送咖啡、送鮮花、上門按摩之類的獨立App,開個微信公眾賬號就開幹了,技術從來都不是問題,推廣才是老大難。百度擅長技術,“拿著錘子看到什麽都是釘子”,給O2O融入技術是不是有些一廂情願?我認為不是。在燒錢大戰結束之後,技術會成為各大平臺的硬實力,可以說技術才是O2O市場的變量。
1 、用戶端需要技術來提升體驗。
百度世界大會推出的“度秘”是一種非常理想的服務獲取體驗,國外Magic等玩家也在進行類似嘗試,這種秘書機器人的方式很適合O2O消費的許多場景,其用到了語音識別、語義理解、NLP(自然語言處理)、多輪對話、大數據挖掘等技術。其他O2O平臺可以調用第三方API來做語音識別,但很難實現語義理解、大數據挖掘、服務獲取這些環節的智能化。這些技術百度獨具優勢。
O2O通過技術還可以進行更好的“推薦”,根據用戶的位置、習慣、搜索偏好進行個性化的推薦,降低用戶服務選擇的成本,抓住“懶人經濟”,其需要大數據挖掘和LBS等技術,以及用戶數據的不斷積累。百度擁有1億日活躍用戶,百度地圖活躍用戶超過3.7億,日均定位100億次,具備大數據實力。這一點,百度與阿里和騰訊打個平手(百度有LBS數據,騰訊有社交數據)。
2 、服務端需要技術來提升價值。
商家端期望獲得更多訂單,更好地管理和理解用戶,進而改進服務和營銷。未來還將走向C2B即反向定制模式,根據用戶需求反過來定制服務,所有這些都離不開大數據技術。要獲得更多訂單需要調整推薦策略來提升轉化率,要幫助商家理解用戶則需要大數據,宏觀層面了解群體特征、商圈人流預測,微觀層面精準監控用戶何時到店、個人偏好畫像等等。
百度糯米可提供用戶檢索、瀏覽、購買、定位軌跡等高價值數據,對此進行大數據分析,了解用戶偏好和實時狀態,幫助商家實現智能營銷。在這一點上,基於百度地圖,百度LBS數據和技術具有明顯優勢。百度搜索業務則幫助百度可以更好地了解用戶當下的需求。
3 、產業端需要技術來做生態。
互聯網巨頭都想做生態,一個共同點是大家都有雲平臺,給開發者提供各種自己所擅長的技術服務。如果平臺想做O2O的生態,連接用戶、服務商、開發者、垂直服務平臺、第三方O2O服務中介(位於傳統服務商家與線上平臺之間)諸多角色時,就必須在連接價值之外提供所擅長的技術服務,走平臺化的路線。
首先,服務商需要類似於輕應用、直達號、地圖插件這類雲端接入方式,快速將服務線上化並且接入平臺,這一點百度與騰訊打個平手,後者有微信公眾賬號;其次,垂直服務平臺需要定位、語音、圖像、大數據諸多門檻高的技術,這一點百度優勢明顯,李彥宏還說度秘未來會像搜索框一樣融入到第三方App中。最後,普通開發者需要類似於百度聯盟這樣的平臺去接入服務實現變現,這需要廣告聯盟相關的技術(大數據、反作弊等等),百度糯米+戰略的夥伴聯盟對應到此。
從不同維度來看,O2O都非常需要技術,智能交互、大數據營銷、雲計算這些技術是O2O平臺的核心競爭力。正如前文分析,O2O平臺的本質是一個“實體搜索引擎”,而搜索引擎本身又是技術活兒,所以O2O最終會成為技術活兒,進入精細化階段,當前營銷推廣驅動的燒錢大戰不是長久之計。這樣看來,百度做O2O主要競爭對手其實是騰訊和阿里,因為只有這兩者在大數據、雲計算這些技術上有所積累,不過它們並沒有百度全面,例如語音、圖像、LBS這些技術就是百度所長。可以預見阿里和騰訊未來都會加大技術投入,它們都想分O2O市場一杯羹,並且知道O2O本質是技術活兒。
版權聲明:本文作者羅超,微博@互聯網阿超。文章僅代表作者獨立觀點,不代表i黑馬 觀點與立場。
消滅搜索框的多媒體搜索,路在何方?
來源: http://www.iheima.com/news/2015/0909/151895.shtml
2015年百度世界展出了語音和圖像為代表的多媒體搜索技術,這並非其首次亮相百度世界大會,多媒體搜索已成為百度的重頭戲,與連接人與服務戰略、人工智能戰略一起構成百度的“三駕馬車”。
多媒體搜索越來越重要
各大搜索引擎在搜索框之外,迎來兩個新圖標:話筒和相機,分別對應到語音和圖像搜索。通過向搜索引擎說一段話發號施令,或者直接拍攝生活中的實景,表明搜索意圖更加簡單和自然。讓機器“聽”和“看”,是人類一直孜孜不倦的追求,這也是人類獲取信息最重要的兩種方式。
鑒於未來的搜索引擎不再是回答問題的“百科全書”,而是幫助人們解決生活中各類需求的“智能助手”,所以它必須越來越聰明,接近人類的智能。一個重要的改進方向便是交互,搜索引擎必須能聽、會看,才能實現真正的智能。所以,在後移動互聯網時代多媒體搜索會成為主流,依賴鍵盤輸入的文本搜索比重將越來越小。李彥宏對此早有斷言,他認為未來超過一半的搜索將來自語音和圖像為代表的多媒體交互。
語音和圖像搜索並非新技術,90年代IBM便推出了語音輸入軟件,2008年Google 就推出了Voice Search以及“以圖搜圖”,百度在PC時代也有過類似嘗試。移動互聯網時代語音和圖像搜索才進入真正意義上的商用階段。移動互聯網帶來了語音和圖像搜索的使用場景,帶來了具備麥克風、喇叭和攝像頭的智能設備,語音搜索和圖像搜索技術也迎來飛速發展,量變產生了質變,語音和圖像搜索正在走向大眾化,與文本搜索一樣舉足輕重。
百度猛攻語音和圖像搜索
多媒體搜索有廣泛的涵義,除了文本之外的“富媒體”搜索都算多媒體搜索,例如語音、圖像、體感、位置、社交關系、物質解析(百度筷搜)等輸入內容。不過,最重要的兩類搜索是語音和圖像搜索。在去年百度展出了通過拍照搜索識別動態衣服的技術,基於圖像搜索技術的百度EYE以及小度機器人,2015百度世界重點展出了語音和圖像搜索技術的進展,百度在語音和圖像上依然還在大力投入和不斷改進。
Siri為代表的語音助手普及,培養了人們通過語音與機器交互的習慣,在家里為代表的安靜場景、在車內為代表的雙手不空閑場景,在步行為代表的打字不便場景,語音都有很大的施展空間。而且語音不需要學習,包含情感色彩,能夠傳遞更多信息。倘若技術達到應用標準,語音交互技術爆發是必然事件。
語音交互與搜索引擎的結合正在日趨緊密,不久前Siri與百度達成合作引入百科等內容,百度在今年則陸續將語音與搜索、外賣等業務整合,百度做語音的底氣來自於兩點:一是技術上應用深度學習大幅提升了識別準確率;二是百度擁有豐富的後端內容和服務。這意味著百度語音和圖像搜索的發展對百度連接人與服務戰略有很強的支撐效果,百度強調要做更具技術含量的O2O,例如支持通過語音點外賣。
圖像搜索受益於二維碼的普及,不過二維碼是結構化的圖形,機器的最終目標是像人眼一樣去認識世界。人類90%的信息來自於視覺,“看”在信息獲取上是主要方式。上傳一張圖片讓機器識別並不是很自然,但如果機器都擁有攝像頭和快速識別能力,其理解世界的方式將非常自然。將圖像識別與後端知識庫和各類服務打通的圖像搜索,是一種所見即所得的自然搜索。
百度在這塊進行了大量探索,例如識別一張圖片中的物體並與廣告內容結合,識別圖片中的文字進行翻譯,識別文本化的題目並解答,識別藥品並介紹療效以及導入藥店……這些基於百度深度學習等後端人工智能技術,以及海量的圖片數據庫和內容知識圖譜。
對於百度而言,語音和圖像搜索的投入是站在交互角度來突破移動搜索現有形態。鑒於使用場景的特性,多媒體搜索對於百度連接人與服務戰略將形成很強的支撐作用。服務搜索主要來自於移動搜索,而移動搜索未來將走向多媒體搜索。除了連接人與服務,百度還有一個戰略是人工智能等前沿技術的布局,語音和圖像搜索的基礎正是來自於深度學習、大數據等技術成果的轉化。所以語音和圖像搜索成為百度將人工智能等研發成果轉化到連接人與服務實踐的“橋梁”。
多媒體搜索未來走向何方?
多媒體搜索依然還在起步階段,遠遠沒有文本搜索這樣成熟,這意味著還有很多創新空間。從多媒體搜索探路者百度的動作來看,多媒體搜索在未來有以下發展趨勢:
1、不同類型搜索相互結合。 現在語音是語音、圖像是圖像,未來語音、圖像、位置、文本乃至視頻,各種形式的搜索會融合在一起,就像人與人的對話一樣,你理解對方的意圖即要聽、又要看(環境、表情、手勢……),可能還會結合上下文,總之是綜合多類搜索來理解的。未來多媒體搜索同樣會語音、圖像等並用,例如你可以拍照之後問百度一句話,“這張圖片中的狗是神馬品質”,模擬人與人的交互。
2、多輪對話式搜索興起。 語音搜索現在大都是用戶問一句,搜索引擎給出一個答案,圖像搜索同樣只能進行“一輪”。但人與人之間的對話是有“上下文”聯系的,兩人之前談的內容,會影響之後雙方的理解。因此語音、圖像搜索未來會更傾向於“多輪”,即搜索引擎可以記住之前的多次交互過程,並結合此理解用戶的語音或圖像,例如用戶可以先問“廣州的天氣怎麽樣”再問”那邊有什麽好吃的”,這樣搜索引擎就可以理解“那邊”是指代廣州。百度已為此申請“多輪交互專利”,語音交互可進行需求引導,根據上下文和大數據分析智能糾錯;Siri則初步實現了某些Case的多輪交互,比如語音調用聯系人之後的二次選擇。
3、解析速度決定用戶體驗。 語音和圖像搜索過去受限於計算速度以及網絡速度,有一定延遲,隨著雲計算、大數據相關技術的成熟,識別速度得以快速提升。4G和WIFI的普及、帶寬提速也逐步消除了網絡障礙。不過識別速度依然還有提升空間,如果問人一句話,給人看一張圖,要等幾秒才有答案還是讓人不爽,近期某手機廠商主打離線語音助手提升識別速度就反映了這個問題。搜索引擎正在通過離線識別等技術來提升解析速度,百度語音識別采取動態解碼技術,實現了僅幾十毫秒延時的快速識別。
4、基於場景的搜索服務能力。 語音和圖像搜索在複雜的場景中進行,搜索發起的時間不同,地點不同,用戶的習慣、情緒有別,意味著背後有不同的需求,因此搜索引擎必須去識別用戶所處場景,與其位置、環境、個人畫像等數據結合起來分析,甚至嘗試根據語速、語調去分析用戶情感。同時整合豐富的服務對用戶需求進行滿足,比如當用戶在外面搜索“麥當勞”應該首先推薦周邊餐廳,在家里和辦公室則優先推薦外賣服務……基於場景去滿足用戶的搜索需求。
5、無處不在的語音和圖像搜索。 現在百度語音圖像搜索主要存在於網頁版百度、手機百度、百度HD版等百度系產品中,但同時要註意的是百度已經通過開放平臺開放其語音和圖像搜索技術。這意味著許多應用和設備都有機會用到語音和圖像搜索,它是一種開放能力,例如智能音箱可以用語音搜索歌曲並播放,汽車廠商在車內預裝語音助手,智能電視通過語音操控和搜索節目……就是說,未來語音和圖像搜索是無處不在的。
版權聲明:本文作者羅超,微博@互聯網阿超。文章僅代表作者獨立觀點,不代表i黑馬 觀點與立場。
以色列大牛預言:“搜索+人工智能”將替代微信
來源: http://www.iheima.com/news/2015/1130/153009.shtml
導讀 : 11月29日,創業家黑馬學院以色列遊學第四期的學員走入希伯來大學,拜訪了《創業的國度》一書作者辛格(Singer)。
i黑馬 王冀 11月30日特拉維夫報道
在中國移動互聯網領域,微信正在變成一個前所未有的巨無霸應用,它真的能一統天下,並長久維持這種優勢嗎?
11月29日,創業家 黑馬學院以色列遊學第四期的學員走入希伯來大學,拜訪了《創業的國度》一書作者辛格(Singer)。辛格長期關註科技創新,他以觀察家的角度,闡述了他對中國移動互聯網的看法。他表示,微信已經成為Facebook等美國巨頭學習的對象,但“搜索+人工智能”可能會在未來替代微信的作用。此外,他還認為,中國移動互聯網在應用層面已經超過美國。
以下是辛格的精彩觀點摘錄:
“商業模式+科技創新”將成為主流
在過去5年,我去過中國6-7次。根據我個人的觀察,中國也是一個創業與創新的國度。許多中國朋友都說中國不夠有創新力,但實際上不是這樣。以色列內部也有許多討論:為什麽以色列雖然是創業的國度,但不能出現類似中國的巨頭企業?實際上,不同國家有不同國家的特色,不見得每個國家都要變成以色列這樣。
創業企業和成熟企業,最大的不同的創新力和執行力的對比。創業公司更具有創新力,但欠缺整合與組織能力,而成熟企業剛好是反過來的。所以,以色列作為創業國度的底層代碼就是許多青年創造出創業企業,到一定階段就把企業賣給大企業以獲得退出,這種做法就是他們的生意經。
比如,Facebook、IBM、谷歌等大公司都在以色列有超過10宗的並購案例,它們通過這種方式把創業公司與大公司擁有的資源進行整合,以實現母公司的營收增長或技術的更新叠代。而中國的阿里巴巴、小米、百度等公司現在在做的事情(並購),正是美國公司在十幾年前所做的。
中國的創業公司更喜歡在商業模式創新的基礎上加入一些科技元素,這種做法未來會在全世界都成為主流,而非純粹靠科技創新驅動。以小米和微信為例,小米是全球兩家估值超過500億美元的創業公司之一,另一家是Uber;微信則是一個集成了各種功能的平臺,這兩家都是非常有創新力的公司。
中國移動互聯網應用已領先美國
在移動互聯網領域,中國已經領先美國半步,比如電商、020的各種場景應用等。中國消費者可以輕易在一些電商網站上購買生鮮水果、蔬菜,並且很快可以送到。但在以色列,我的蘋果手機除了能交停車費,其他什麽也幹不了,所有交易都需要在線下完成,這在美國也是一樣。因此,中國移動互聯網的應用開發能力已經領先其他國家,包括美國。
辛格對黑馬學員闡述他對未來科技創新的看法
實際上,Facebook下一步的戰略就是要模仿微信,以聊天為基礎,接入其他生活應用,這不就是微信目前在做的事情嗎?在我看來,Facebook就是想變成美國版的微信,它為什麽要以190億美元的價格收購WhatsApp?就是想把聊天應用置於其核心位置。
互聯網巨頭的戰略都是想成為平臺,然後在平臺上提供所有服務。比如,谷歌和百度基於搜索,阿里巴巴基於電商,它們想做的就是基於已有的服務再延伸出其他服務,充分滿足用戶需求,以增強用戶黏性,構築起自己的圍墻。
“搜索+人工智能”可能替代微信
但是不要忘了,除了微信,還有谷歌和百度,未來它們如果將人工智能嵌入到搜索之中,也是有可能在未來的競爭中勝出的。人工智能發展到一定程度,就相當於有了另外一個大腦來幫你解決所有的事情,你只要發布命令就行了。如果真是這樣,類似WhatsApp、微信這樣的應用就沒有用了,因為你要做的事情,人工智能都幫你解決了。所以,不要小看搜索這個入口。
如何理解人工智能的應用場景?我舉一個例子。比如,Mobileye(i黑馬註:以色列一家研發無人駕駛技術和產品的公司)就是用人工智能來實現輔助駕駛以及未來的無人駕駛,它采用人機交互的方式來實現這個功能。它的芯片是個中央處理器,能感應路況進而提醒駕駛。下一步,Mobileye將在駕駛者身上安裝攝像頭,你用手勢就可以操控車輛,實現完全的自動駕駛,這就是一個人工智能的場景。
設想一下,如果屆時還只是單純地輸入信息,而沒有人工智能來幫你分析場景、提供決策信息,這樣的服務就顯得太單薄了。
雖然我無法預測未來,但有三個產業可能發生顛覆式的變化。第一個產業是教育,第二個產業是醫療,第三個產業是城市交通(涉及出行方式的改變)。哪個國家能在這三個領域中有傑出表現,就可能在未來的競爭中勝出。雖然許多技術源自以色列,但能把這些技術應用得最好的國家,才能獲得未來的勝利。就此而言,應用能力強的國家,未來要比單純發明技術的國家更為重要。
如果你也想參與以色列遊學活動,請點擊 http://hmy.iheima.com/zhuanti/ct/baoming.html
Next Page