3月2日,據工信部網站消息,2017年2月28日晚8點39分,百度移動端搜索發生故障,搜索請求無法顯示結果,至晚9點21分恢複,歷時42分鐘。據估計,故障期間導致手機用戶上億次的搜索受到影響。3月1日工業和信息化部相關司局立即緊急約談百度公司,了解相關情況。據初步分析,故障原因是由於百度公司的軟件更新中存在BUG(漏洞),導致服務器停止服務。故障發生後,百度公司緊急處置並恢複服務,目前該軟件問題已得到修複。
針對以上情況,工業和信息化部責令百度公司立即對本次故障進行深入調查,提出切實有效的整改措施,堅決防止類似問題的再次發生,3日內向工業和信息化部提交書面報告。同時,下發緊急通知,要求阿里巴巴、騰訊等各重點互聯網企業吸取教訓,舉一反三,采取各項有力措施加強安全防範,尤其要做好全國“兩會”期間的業務服務保障,確保各類重要系統和業務平臺安全穩定運行,為廣大網民提供良好的信息服務。一是認真落實工業和信息化部相關要求,對現有業務系統進行全面的風險排查,及時消除故障隱患,尤其是對軟件升級更新要在發布前進行全面徹底的測試驗證,做好充分的風險評估和安全防控,堅決避免出現系統性、全局性的大面積故障。二是科學預判業務訪問需求,合理增加線路帶寬和服務器資源,采取重要業務系統“雙活”或“多活”架構以及負荷分擔、自動倒換等措施,增強安全保障能力,確保關鍵系統穩定運行,業務功能服務正常。三是調集精幹運行維護人員加強一線維護保障,密切監控業務運行情況,在進行各主要業務系統的配置修改或數據調整時審慎操作,避免影響系統安全運行。確保用戶投訴受理渠道暢通,及時解決用戶所反映的問題。四是提前做好應急預案,出現突發故障要及時妥善處理,盡快恢複服務,盡量減少影響的範圍和程度,並第一時間向工業和信息化部應急值守人員報告。
搜索引擎是如何一步一步變得如此強大,而它接下來又會往哪個方向進化呢?
本文由微軟研究院AI頭條(微信ID:MSRAsia)授權i黑馬發布,作者 。
當你有問題需要解答的時候,你通常會選擇去問誰呢?如今在不知不覺中,很多人的選擇已經變成了搜索引擎。天氣、交通路線、圖片、視頻、作業答案等等,搜索引擎能夠回答人們日常生活中遇到的許多問題。甚至對很多人來說,如果在搜索引擎上找不到答案,那可能這個世界上就沒有對這個問題的現成答案了,才需要我們自己去探索。
這麽看來,搜索引擎仿佛是一種最強大的人工智能,它從二十年前就開始生活在我們的身邊。搜索引擎是如何一步一步變得如此強大,而它接下來又會往哪個方向進化呢?這篇文章就簡單的從搜索引擎的發展歷程開始進行解讀。
搜索引擎的誕生與發展
搜索引擎的誕生,來源於早期人們對高效尋找互聯網上信息的需求。采用傳統的圖書館信息檢索技術的早期搜索引擎並不能滿足大家的需求。無論是網頁排序的準確度,反應速度和索引網頁的數目都不能滿足互聯網用戶的需求。新需求下,產生了目前常見的幾個大通用搜索引擎:谷歌、微軟必應、雅虎(Yahoo采用微軟必應作為其搜索技術的提供商)和百度。它們大都創立於2000年左右。在這些搜索引擎誕生之初,大數據,機器學習,分布式系統這些詞就和它們緊密相連。
首先,現代搜索引擎充分利用了互聯網數據的特點。網頁之間的超鏈接,網民自發的在網頁上留下的足跡,比如商品評論、點贊等,都成為搜索引擎更好的對網頁進行排序的依據。同時搜索引擎的系統設計也將其變為一個可以不斷自我學習和改善的系統。搜索引擎根據用戶對相關結果的點擊行為,進行評估自己算法的好壞。
微軟基於機器學習算法的排序系統不斷的學習,以及總結不同用戶對搜索引擎的反饋,於2005年提出了一系列使用神經網絡、決策樹等為基礎的網頁排序算法:RankNet, LambdaRank 和LambdaMART。這些算法以大規模機器學習系統為基礎,將搜索引擎的排序精度不斷的提升。同時,機器學習算法也有其他多個方面的應用,例如檢測垃圾網頁、提高搜索廣告相關性等等。
除了上述算法上的進步以外,系統層面的不斷創新也為搜索引擎的進步添磚加瓦。谷歌在創始之初,就開創性的提出了盡量將所有的網頁信息保存在計算機內存而不是磁盤上的系統革新,這樣可以將回答用戶問題的時間從秒級減少到毫秒級。
微軟必應搜索引擎在2008年開始,針對固態硬盤的特點,重新設計了網頁索引結構。新的多級索引結構不僅能保證和全內存系統相當的查詢速度,單臺機器支持的網頁數目及查詢吞吐量得到了幾十倍的提升,這樣保證搜索引擎可以索引和服務互聯網上更多的網頁。
大數據系統更是和搜索引擎的發展緊密相連。為了更方便的存儲和處理網頁信息,谷歌推出的MapReduce, BigTable, GFS等著名分布式系統,掀開了大數據時代的簾幕。與此同時,微軟公司也部署了Cosmos, Dryad, Scope, Kirin等系統。其中Dryad和Scope系統由於其更加前瞻的設計理念,成為新一代大數據處理系統的參考設計範本。
更人工智能的搜索體驗
機器學習算法的不斷進步,搜索引擎巧妙的人機交互設計,分布式系統的革新讓搜索引擎在不知不覺中成為人們生活中不可或缺的一部分。同時,隨著人們新需求的不斷湧現,搜索引擎也沒有停下變革的步伐。一方面,搜索引擎嘗試以不一樣的形式展示在你面前,比如Cortana, Siri, Google Now這類對話式的智能交互技術背後都離不開搜索引擎的支持。同時它也在不停的擴展它新的能力。
如果你夠細心的話,你可能會發現當下的搜索引擎可以更加直接的回答你搜索的某個具體問題。比如在搜索結果頁面的右邊,會有和你搜索相關的其他相近實體的信息。在頁面的頂部,某些結果(例如天氣,航班等信息)會以更豐富的形式提供答案。最近,一個更加引人關註的變化是,對很多知識性的問題,搜索引擎開始嘗試給出直接的答案,而不是某幾個網頁鏈接。比如:當你問如何做一份美味的節日點心,如何安裝某個新的軟件時,微軟必應搜索都可以直接給出答案。
搜索引擎是如何做到這一點的呢?要回答這個問題,就不得不提到過去一段時間以來深度學習領域的研究進展。搜索引擎通過大量的數據,利用DNN/RNN等新算法來更加充分的理解網頁內容和用戶問題之間的關系,從而可以幫助用戶在網頁中直接找到和問題相關的答案。微軟最近收購的由著名深度學習專家Yoshua Bengio 指導的深度學習創業公司Maluuba也旨在加強微軟在深度閱讀理解領域的實力。而在深度文本理解方面,微軟的研究小組也都處於領先位置。
隨著算法的發展,搜索引擎的後臺也在飛速進化。為了支持以深度學習為代表的新一代機器學習算法,GPU,FPGA以及定制的ASIC芯片已經逐漸走入搜索引擎的數據中心。索引和排序服務系統也在進一步進化以滿足算法對處理能力的要求。為了更加實時的處理更大規模的數據,超低延遲網絡也正被廣泛應用。
智能搜索引擎的下一個目標
以上提到的所有這些努力,都是為了更好的滿足人們對搜索引擎的需求。但是搜索引擎真的能完全理解人類的所有知識體系嗎?它下一步的任務是什麽?
顯然,目前搜索引擎已經能夠較好的總結互聯網的信息用於滿足大家的搜索請求,可以直接回答一些常見問題。但是搜索引擎是否能夠真正理解這些信息的內在含義,是否可以創造性的解決以前從未出現的問題,以及能否高效的進行自我推演,還不得而知。但是有一點是肯定的,更富創造性的機器學習算法,更加強大的計算能力,以及創新性的人機交互是一切的基礎,這些也是工業界和學術界共同努力的方向。
“小程序”之後,微信動作頻繁。
昨日,微信團隊發出一封內部郵件,稱將成立“搜索應用部”,將目前已有的微信搜索業務獨立出來。
第一財經記者就此詢問微信團隊,相關部門人士對記者表示,該部門是為了優化用戶體驗而成立。“因業務發展需要,微信事業群內部架構作了一些調整,包括在原有的組織人員基礎上成立‘搜索應用部’。實際上,微信內部一直有搜索業務來支持平臺的發展,我們希望通過架構調整將內部的團隊作更好的整合,給用戶帶來更好的搜索體驗。”
在此之前,騰訊就對搜索業務表現出了不小的興趣,但去年收編的搜狗在搜索上的表現不溫不火,作為旗下流量最大的社交應用,微信將搜索作為獨立部門不僅是內部競爭的衍生物,或許也會成為騰訊叫板百度的一把利劍。
為小程序導流
布局搜索業務,對於騰訊而言並不是新鮮事。五年前,騰訊進行事業群制升級之時,就將搜索列為其中六大業務之一,馬化騰在內部郵件中明確了“聚力培育搜索業務”的目標。而去年,騰訊收購搜狗45%股權,成為搜狗最大股東,進一步擴大搜索業務版圖。
從目前微信所支持的搜索功能來看,主要還是集中包括微信公眾號文章、聯系人等內部內容的搜索上,而對於外部內容搜索暫時沒有涉及。
結合之前對於“小程序”搜索功能的優化,此次張小龍成立“搜索應用部”,最大的動力是利用搜索功能對“小程序”進行導流。由於小程序沒有特定的入口,用戶首次進入單個產品的小程序必須要通過搜索渠道。
根據騰訊旗下企鵝智酷發布《微信2017用戶研究和商機洞察》指出,目前主動搜索是用戶觸發小程序的第一渠道。根據調研,過半數的受訪小程序用戶使用小程序是基於功能需求,在微信內搜索,或通過朋友分享接觸到小程序。優化搜索功能能夠通過優化小程序用戶體驗提高用戶量。
除了給小程序導流,艾媒咨詢CEO張毅認為此次微信將搜索業務交給單獨成立的部門承載,很有可能是向市場釋放微信具有足夠大的內容庫的信號。“微信主要的突破重點還是在中小企業廣告投放和用戶粘性。”而這種信號增加了微信手中的籌碼。
根據騰訊財報,截至2016年12月底,其中披露微信和WeChat合並月活躍用戶數已達8.89億,QuestMobile 2016年12月數據顯示,微信APP人均月度使用時間在2016年12月達到了1967分鐘。
在搜索技術上的積累加上龐大的用戶體量以及用戶粘性,微信進入搜索領域不過是順水推舟的事情。
“騰訊收購搜狗之後,搜索技術對於騰訊來說不是什麽問題,與別的搜索引擎不同,微信搜索以社交為入口,這降低了搜索的導流成本,使得其搜索業務幾乎沒有門檻。” 張毅對第一財經記者說道。
劍指何處?
對於被騰訊收編的搜狗而言,微信進入搜索領域,暫時尚不構成壓力。
在財報分析會上,搜狗CEO王小川表示與騰訊達成了合作的共識。“關於騰訊目前做的搜索,我們之間有一些共識,騰訊的搜索業務不會進入搜狗的領域,如果進入,也將是我們之間的合作進入,搜狗外購的流量占整體移動流量的三分之一。”
但對於百度而言,騰訊近兩年間大舉進入搜索領域,被外界解讀為對其地位的挑戰。
在PC端上,騰訊無法超越百度多年來的技術沈澱。但依賴其QQ、微信等產品優勢,從社交領域進入不熟悉的搜索領域能為騰訊建立起移動端搜索功能的優勢。而移動端的搜索業務也並非百度強項。
從蘋果應用商城的下載量看來,百度搜索APP下載量並不多,有效評價只有600份左右,這個數量對比微信的8000份評價來說並不多。即便與旗下其它商品如百度地圖相比,下載量也遠遠不足。
百度在移動端搜索的優勢漸漸流失,但移動搜索卻是未來的一大趨勢。根據CNNIC的報告顯示,截至2016年12月,我國搜索引擎用戶規模達6.02億,使用率為82.4%;而手機搜索用戶數達5.75億,使用率為82.7%。
與此同時,微信卻在移動端積累了足夠的內容產品。“微信在一些產品,比如朋友圈、QQ空間積累了比較豐富的內容源這些競品是別的軟件所不具備的,這會成為其搜索內容的門檻。”張毅同時指出,在專業領域搜索上,百度多年來在搜索技術上的沈澱,目前還是無法被超越。“對於用戶來說不僅僅搜索一個方面的東西,還是希望搜索比較全面信息,這是百度強項。”
而對於微信而言,搜索業務是一枚硬幣兩面,優化該項功能的同時也必然帶來負面效應。“本身搜索引擎是獨立比較重的產品,這個對用戶終端負擔非常重,現在手機一般用戶每月電量、流量80%左右流量用在微信上,如果加入搜索功能,那麽可能占據用戶90%以上,對於用戶來說使用太重。”張毅說道。
騰訊會不會完全用微信搜索取代搜狗,這也是個未知數。而在這之前,搜狗還能給微信多大支持?
本文由俊世太保(微信ID:lijun_taibao)授權i黑馬發布。
4月24日,微信悄悄在內部宣布了最新的組織架構調整,其中有一個重要的調整那就是成立搜索應用部,周顥將擔任微信事業群搜索應用部負責人,直接向張小龍匯報。在經過一系列猶抱琵琶半遮面的布局之後,微信終於將搜索這一戰略公開了。
獨立微信搜索,背後是張小龍的三重焦慮
從搜索聯系人、聊天記錄、朋友圈到可以搜索微信公眾號的文章、朋友圈熱文,再到現在可以搜索站外的新聞和資訊,支持微信小程序模糊搜索,不久前,微信又上線了 “微信指數”。微信搜索的功能可以說一直在不斷完善中。而所有一切都表明,張小龍對於微信搜索的重視,但這背後更多還有焦慮。
1、下半場用戶使用時長的爭奪,微信並不占優
在微信之外,騰訊用類似今日頭條的推薦引擎將信息主動推薦給用戶,這其實是移動端搜索的另一種形態,但微信卻並沒有為用戶提供一個中心化的流量入口,在微信公眾號打開率逐漸下滑,朋友圈又存在過多的社交雜音時,可以說我們通過微信獲取信息的效率正在不斷下滑。
在昨天企鵝智酷發布的《2017微信用戶&生態研究報告》中,截止2016年12月,微信及WeChat合並月活躍用戶數達8.89億。而根據中國信息通信研究院此前披露的數據,2016年中國網民數量達7.31億人,其中手機網民數達6.95億人,占比95.1%。
微信用戶增長潛力基本已經消失,對微信來說接下來最重要的就是用戶時長的爭奪,而以今日頭條為代表的內容分發平臺的崛起,很大程度上壓榨了微信的使用時長。這也是為何我們看到微信搜索框在不斷演進的一個原因,因為只有位於一級入口的搜索框才能讓用戶獲取信息的效率提升。
2、 不具備搜索基因,但微信又必須得做
騰訊龐大的帝國中能夠產生內容的平臺其實有很多,微信下的微信公眾平臺、朋友圈,企鵝媒體平臺下的騰訊新聞和天天快報,以及QQ瀏覽器、QQ閱讀等一系列產品,但如何將這些內容和用戶連接起來是一個問題。
「騰訊這一兩年戰略做了很大的調整,我們把搜索、電商都賣掉之後更聚焦核心,就是以通信和社交為核心平臺,以微信和QQ為平臺作為連接器,我們希望搭建一個最簡單的連接,連接所有的人和資訊、服務。第二個事就是內容產業,就這麽簡單,一個是連接器,一個是做內容產業。」
在2015年兩會期間,騰訊CEO馬化騰在接受媒體采訪時說出了這樣一段話。擁有微信和QQ兩大超級社交平臺,兩款產品的月活都超過了8億,可以說騰訊已經很好的做到了連接“人”。但真正能實現人和信息的連接的產品,最適合的產品形態其實還是搜索。
在早前,騰訊並不是沒有嘗試過搜索引擎,但搜搜的失敗讓騰訊直接選擇了放棄,社交平臺和搜索引擎畢竟是兩碼事,這可能是張小龍的無奈之處。
3、光憑“掃一掃”,無法承載騰訊連接一切的野心
在連接內容之外,連接服務對騰訊來說可能更加重要。小程序就是微信能提供的服務,不需要下載且觸手可及,很顯然,微信希望通過小程序讓用戶可以在微信里快速找到需要的服務。
最近一段時間關於小程序的調整,其實就是微信在不斷優化用戶發現服務的路徑。而其中很關鍵的一環就是:開放模糊搜索。在移動互聯網通過智能手機將我們與線下如此緊密連接在一起時,面向未來的搜索顯然需要一種連接線下的能力。
簡而言之,微信並不是單純想做個簡單的搜索引擎,如果真是那樣的話,那直接交給搜狗來做就好了。微信搜索承擔的核心功能是將人、內容和服務連接起來,然後進行線下服務的分發,這不僅僅是一個場景需求,更是出於戰略布局的需要。
在微信連接一切服務商上,線下場景我們通過掃描二維碼已經很好的解決了,但線上場景如何找到我們想要是服務?答案,還是搜索。
微信搜索連接一切,但眼前的難關不容忽視
微信如今的月活高達8.89億,這是一個極其龐大的基數,作為使用頻度最高的社交工具,無論是用戶粘性還是使用時長,微信都具備其它平臺無可比擬的優勢。基於朋友圈和公眾平臺所產生的海量內容,這也將成為微信進軍移動搜索領域最強大的護城河。
不過對絕大多數人來說,微信仍然還只是一個溝通工具,真正的使用場景中,有多少用戶會主動通過微信搜索是看內容、找服務?我們不得而知,但通過微信群、公眾號和朋友圈被動接受信息和服務仍然會是主要方式。
毫無疑問,張小龍對微信搜索寄予了厚望,因為這是小程序連接線下服務不可缺失的一環。但從萬眾矚目到被業界唱衰,小程序真的會是連接線下服務最適合的形態嗎?這是一個很大的疑問。
隨著人機交互技術的發展,搜索框作為進入互聯網最重要的入口,很有可能有一天會被語音識別輸入所替代。試想一下,當你想要獲取服務時,只需對機器人助理說出你的需求,然後它就會幫你完成任務,這或許是比小程序更值得研究的方向。
而在谷歌、百度、微軟等主流搜索引擎服務商都在嘗試這個領域,Facebook 也已經在Messenger里加入了人工智能助手 M時,作為天然擁有諸多語音輸入場景的微信,卻更多是在選擇探索一條不確定的路徑。
巧合的是,在微信宣布內部架構調整之時,剛好搜狗發布了截止3月31日的2017財年第一季財報。財報顯示,搜狗整體搜索流量較一年前增長26%,移動搜索流量增長50%以上,而其最大的優勢主要就在於能夠獨家檢索千萬微信公眾號產生的內容。
在此之前,微信搜索中有大量來自搜狗的內容,例如搜索“張小龍”,排在搜索結果最前列的就有來自搜狗百科的內容。要知道搜索引擎是一項複雜的工程,微信搜索在短時間內很難真正建立起諸如:百科、問答、貼吧之類的內容護城河,這個時候還需要借助搜狗的能力。
但一旦微信搜索真正發力,這也意味著搜狗在移動端的優勢可能將會消失,在失去微信之後,搜狗的市場份額想要繼續增長,將面臨不小的問題。而更重要的是,對意在IPO的搜狗,失去了「騰訊系唯一搜索引擎」這個想象空間後,在資本市場能講的故事恐怕會失色不少。
更進一步講,假如哪一天微信搜索真正大成,騰訊會不會完全用微信搜索取代搜狗,這也是個未知數。而在這之前,搜狗還能給微信多大支持?
5月11日消息,百度今日就賬號實名傳聞進行了說明回應,稱為配合6月1日起施行的《中華人民共和國網絡安全法》,百度在內的網絡服務提供方,都必須在此日期之前,配合完成用戶享受相關服務前的實名認證過程。
百度方面稱,近期部分用戶在使用多個百度產品時,看到了建議進行賬號實名認證操作的提示,這是根據即將於6月1日正式施行的《中華人民共和國網絡安全法》第二十四條的規定要求實施的:“網絡運營者為用戶提供信息發布、即時通訊等服務,在與用戶簽訂協議或者確認提供服務時,應當要求用戶提供真實身份信息。用戶不提供真實身份信息的,網絡運營者不得為其提供相關服務。”
根據這一要求,包括百度在內的網絡服務提供方,都必須在此日期之前,配合完成用戶享受相關服務前的實名認證過程。不過,百度方面也表示,目前已經有很大部分的百度用戶已經完成了實名認證的操作,並享受到更有保障的網絡服務。而針對少數尚未滿足實名認證要求的用戶,百度會在用戶登錄百度相關平臺進行相關服務使用操作時,清晰地引導用戶通過手機驗證等便捷的方式快速完成實名制認證。
此外,百度還著重強調了3點:
1、百度搜索服務,並不強制要求在登錄百度賬號的情況下使用,因此這項要求不會對網民使用百度搜索帶來直接影響。
2、為了大家在多個百度產品平臺間轉換時能更便利地獲得服務,建議用戶在實名認證後也在登錄狀態下使用百度搜索,以獲得更個性化、更安全、更高效的網絡服務。比如為用戶個性化定制的首頁資訊服務,以及在登錄後才能享受“百度網民權益保障計劃”的保護。
“百度網民權益保障計劃”由百度與中調協聯合發起,網民登錄百度賬戶點擊搜索推廣或帶有V標識的結果,如因假冒官網、資質或釣魚欺詐而蒙受經濟損失,網民可向百度申請保障。
3、用戶在賬戶實名認證後將享受更高等級的安全保護。百度表示,將通過敏感數據加密存儲、監控多層防禦等技術手段和代碼層面多重審計、安全測試等服務規範確保百度用戶個人、企業信息得到有效保護,守衛您的信息安全。
值得註意的是,如果用戶在6月1日前未完成實名認證操作,在後續使用百度部分產品中發布信息、評論等相關功能時將可能受到限制,為確保繼續獲得優質的服務體驗,百度建議用戶盡快完成實名制操作。
百度的優勢在於,終於把搜索的優勢發揮出來了。這種優勢首先是流量,即百度信息流應用完全可以利用好這塊寶地,而不必再弄個新聞客戶端去和今日頭條們廝殺;其次,無論是搜索還是信息流,本質都是內容分發,都是滿足用戶的信息獲取需求,二者不僅有很好的融合,還能協同賺錢,這是最難得的。
來源 | 接招(ID:itakethat)
文 | 方浩
昨晚,李彥宏在中國科學院大學出席了一場活動。在提問環節,主持人問他如何看待過去半年百度的變化,李彥宏說百度始終是一家具有較強技術基因的公司,「我不關心股價,只關心技術」。
當時距離百度發布第三季度財報只有不到10個小時。看得出,李彥宏狀態很好,與學生們談笑風生。今天早上的財報也證實了這一點:第三季度百度營收235億人民幣(約合35.3億美元),同比增長29%;凈利潤79億人民幣(約合12億美元),同比增長156%。
百度上一季度的凈利潤是44.15億人民幣,等於現在環比又有近一倍的增長。事實上,過去三個月,百度市值已經增加了近300億美金,約相當於一個網易的市值。
而就在半年前的一段時間里,媒體還曾熱衷討論「京東還差幾個小時就能市值超過百度」這樣的話題。從夏天到秋天,不過一個季節的轉換,對百度來說猶如「天上人間」。
對於一家互聯網上市公司來說,股價上漲、市值增加,很多時候就意味著做好了兩件事:當下很滋潤,未來很美好。
先談未來。無論是對話式人工智能操作系統DuerOS,還是聚焦智能駕駛的「阿波羅計劃」,都是百度對AI的下註。
未來可以撐起市值,但短期內不能貢獻利潤。華爾街對質地優良的互聯網上市公司的要求是,不僅能貌美如花,還能賺錢養家。應該說過去半年,AI領域的戰略布局讓百度重新回歸到了「技術驅動型科技公司」的大眾認知軌道,也讓華爾街看到了這家公司的未來,股價和市值的「逆襲」也就不足為怪了。
但光有「市夢率」還不行,華爾街同樣需要真金白銀。今年第一季度,百度的凈利潤還不到18億人民幣,同比下滑近11%。而就是這個春天,BAT中的另外兩家:騰訊和阿里的市值先後摸頂至4000億美金大關,而百度還要面臨身後京東和網易的隨時趕超。風聲鶴唳。
但從第二季度開始,百度的利潤突然暴增:44億的純利幾乎是第一季度的三倍,而最新第三季度的純利又幾乎是第二季度的將近兩倍。可以預見的是,百度第二、第三兩個季度的利潤同比增幅,極有可能超過同時期的AT。
這是華爾街最喜歡的增長模式:不僅未來可期,現實也很殷實。百度的現實,分為兩塊:一塊是傳統業務收入,這是存量市場;一塊是新業務收入,這塊是增量市場。所謂傳統業務,就是搜索業務,這塊業務過去幾年一直都是百度的核心利潤來源,但很穩定了,屬於基本面。
真正的變量來自於去年6月開始試水、今年全力推進的Feed流業務,也就是讓今日頭條、微博過去兩年風光無限的信息流。今年微博市值已經突破200億美金,今日頭條估值超過200億美金,很大程度上來自於廣告主對於信息流精準推送的認可。
在最新的第三季財報中,百度信息流業務以該季業績為基準的年化收入超過10億美金。也就是說,百度今年的信息流業務收入將達到去年今日頭條的收入水平。去年今日頭條的估值已經超過100億美金,這意味百度用一年多的時間,再造了一個估值過百億美金的今日頭條。
剛剛過去的第三季度,手機百度用戶使用時長比第二季度提升了15%,在國內DAU超過1億的頭部APP中,增速最快。
為什麽這麽快?其實百度不是簡單地再造一個「今日頭條」,在經過了百度新聞客戶端等一系列嘗試之後,百度終於發現,搜索+信息流才是正道。
在各個APP排行榜上,手機百度都是Top 5的應用,但一直都被僅僅視作搜索應用。相當於百度一直坐擁一塊風水寶地,但從來不敢建「新宅」。信息流的引入,改變了「手百」、「貼吧」等超級應用的價值空間。
搜索跟意圖有關,信息流推薦跟興趣相關,這是當下用戶獲取網絡信息的最主要的兩種方式。百度把搜索和信息流綁定在一起,本質是對用戶獲取信息方式的合並同類項。
這種模式的好處在於,通過意圖搜索的信息,也會出現在信息流當中;通過AI算法,百度實現了內容分發的二次留存。手機百度用戶停留時間變長,就是源於此。
更重要的是,這對廣告主來說相當於曝光率的「Double」。信息流對廣告主本來就意味著精準投放,現在又加上搜索的融合,把潛在消費者興趣的精準性和意圖的精準性合二為一。用戶喜歡什麽、用戶想要什麽,都能滿足,精準到底。
今年7月底,當百度信息流日收入達到3000萬人民幣的時候,谷歌也在自己的手機搜索應用上推出了信息流功能。可以說,自Facebook開始,無論中國的巨頭還是美國的大鱷,都在擁抱信息流,因為它確實能帶來真金白銀。
百度的優勢在於,終於把搜索的優勢發揮出來了。這種優勢首先是流量,即百度信息流應用完全可以利用好這塊寶地,而不必再弄個新聞客戶端去和今日頭條們廝殺;其次,無論是搜索還是信息流,本質都是內容分發,都是滿足用戶的信息獲取需求,二者不僅有很好的融合,還能協同賺錢,這是最難得的。
搜狐是本次搜狗上市的最大贏家。除了持股9.2%的張朝陽,搜狐持股37.8%,搜狐和搜狗員工持股3.8%。搜狐整體持股比例超過47%;而另外一大股東、持股43.7%的騰訊,也獲得了不菲的財務收益。
11月9日晚,搜狗正式登陸美國紐交所(NYSE:SOGO)。搜狗的開盤價為13.25美元。市值超過50億美元。開盤後一路上揚,很快突破14美元,升至14.7美元。
以月活躍用戶數計,搜狗是中國第四大互聯網公司。除了搜狗,再加上早就在2000年上市的搜狐以及2009年上市的搜狐子公司暢遊,搜狐又創造了一個紀錄——搜狐旗下擁有三家在美上市的公司。
搜狐公司董事局主席及首席執行官張朝陽說:“今天,搜狗要挑戰獨大搜索格局,而且要重新定義搜索,展現知識與智能對於人類的未來。”
張朝陽在美的第三次上市敲鐘
9日晚的國貿三期3層群賢宴會廳,人聲鼎沸,搜狗上市記者會正在這里舉辦,全國百多家媒體的記者聚集在此,現場連線正在美國紐交所敲鐘的張朝陽和搜狗CEO王小川。
搜狐是本次搜狗上市的最大贏家。除了持股9.2%的張朝陽,搜狐持股37.8%,搜狐和搜狗員工持股3.8%。搜狐整體持股比例超過47%;而另外一大股東、持股43.7%的騰訊,也獲得了不菲的財務收益。而且根據搜狐、騰訊和搜狗的投票權協議,搜狐有權在搜狗董事會指派超過半數的董事,而且搜狐與搜狗繼續合並財務報表。
張朝陽說:“搜狗整個團隊是技術特別牛的團隊。我們非常幸運的是,14年來精抓技術和產品,使得搜狗技術和產品做的很棒,符合今天的市場需求。搜狗輸入法的發明其實是一次重要突破。這個輸入法是把天下所有輸入行為和文字行為都用搜索引擎進行研究之後做的,這里面體現了大數據的應用。”
他還表示:“還有就是把搜狗拆分,創造出來這樣一個實體,小川團隊他們有創業精神,一直保持創業文化,包括後來騰訊加盟,他們也有很大資源的提供,貢獻了搜狗到今天的成功。希望基於人工智能的技術,搜狗能降低人機溝通成本,重新定義搜索的概念。
這其實是張朝陽第四次在美國敲鐘了,除了2006年那次納市邀請他給開市敲鐘,其他三次,都是張朝陽為旗下公司上市赴美敲鐘。
通過投票權和董事會席位 搜狐掌握搜狗控制權
搜狗雖然上市,但依然是搜狐的子公司,並且依舊在財報中合並報表。
張朝陽強調:“搜狐和搜狗,搜狐是搜狗的大股東,在財務上搜狗的上市和業績良好的表現將會直接反映到搜狐的財報里面,尤其是盈利。這對搜狐是一個利好的消息。”
搜狐仍牢牢掌握著搜狗的控制權。騰訊所持有的45,578,896股B類普通股的投票權,約占搜狗總投票權的15.7%,在上市後委托給搜狐,搜狐自己的投票權為44%,二者相加即上市之後搜狐的投票權為59.7%,騰訊的投票權是36.6%。
而在搜狗公司董事會的7個席位中,搜狐有權指定4名董事,騰訊有權指定2名董事,另外1名是搜狗的CEO王小川。
張朝陽一手挖掘和培養了王小川。2003年,碩士畢業的王小川加入搜狐做工程師。其後張朝陽將開發搜索引擎的任務交給他,這才有了“搜狗搜索”。
2004年搜狗成立,2005年,搜狗輸入法誕生,2008年搜狗瀏覽器誕生,一直到2010年,搜狗從搜狐剝離獨立運營。在搜狗成立後的幾年里,並沒有賺什麽錢,都是依靠搜狐在支撐。
有互聯網觀察人士評論:如果沒有搜狐和張朝陽,可能也不會有後來的王小川和搜狗。
王小川在開市之前的發言中也首先表示感謝張朝陽。“回想這14年,第一個感謝Charles,他是中國互聯網教父,離不開他的遠見和支持。”
每天4億人使用搜狗輸入法重新定義了搜索
搜狗搜索目前是中國第二大搜索引擎,業務增長迅速。而搜狗輸入法則是一款超級應用,每天有4億人在使用。
根據iResearch的數據,在2017年9月,搜狗輸入法擁有3.07億的手機日活以及8700萬的PC端日活。也是中國以DAU計的排名第二的PC端軟件,是中國以DAU計的排名第三的手機應用,僅次於微信和QQ。
與此同時,通過專註於自然交互和知識計算,發力人工智能的搜狗也在多個領域取得了突破性的進展,令搜索變得更加智能,某種程度上重新定義了搜索。通過業內領先的自然語言處理技術,搜狗持續推動搜索到問答的進化。比如在醫療搜索領域,搜狗開發的智能診斷系統,使用戶可以通過一系列問答,了解自己可能患了什麽病以及應該去什麽科室就診。
張朝陽說:“做一個比喻的話,從輸入對語音的識別、圖像的識別計算,相當於我們大腦的延伸,耳朵聽覺和眼睛視覺的延伸。搜索引擎AI技術帶來更加智能的回答和思考是大腦前額葉和海馬區的延伸,對自然語言和人類認知的挑戰是AI最為領先的。整個搜狗的輸入和搜索,以及我們要重新定義搜索,來重新使得我們人類的大腦獲得一個延伸。”
他還表示:“垂直領域這種結構化數據和大量數據存在,將會使得搜狗成為你的私人醫生、律師或者法律顧問。”
另外搜狗搜索業務還擁有兩大殺手鐧——完善的微信和知乎搜索。搜狗搜索也完整覆蓋了騰訊系產品,知乎的站內搜索,也交給了搜狗。
獨家優質的內容源以及人工智能賦能,極大地提升了用戶使用搜狗的體驗,成為用戶工作和生活不可或缺的好顧問。
募集5.85億美元 搜狗有望改變市場格局
iResearch數據顯示,截至2017年9月,搜狗搜索在中國移動搜索市場上占有17.8%的份額,較3月的15.2%和6月的16.9%進展明顯。與此同時,搜狗的移動搜索月活躍用戶人數亦從3月的4億7300萬,6月的4億8300萬增長至9月的5億1100萬。此外,從2014年9月至2017年9月,搜狗的總搜索頁面瀏覽量年化增長28.0%,移動搜索頁面瀏覽量年化增長71.9%。
根據搜狗發布的企業財報,從營收來看,從2014年Q1起,搜狗已經持續15個季度實現了規模性盈利,2016年的總營收達到了44億元,非美國會計準則下的凈利潤達6.4億元人民幣。而搜狗此前發布的2017年第三季度財報顯示,截至9月30日,搜狗第三季度總收入為2.57億美元,上年同期為1.66億美元,同比增長55.1%。第三季度凈利潤為3100萬美元,同比增長54.2%。
搜狗正在吃進百度的市場份額。搜索行業(百度)過去幾年平均增長率大概在10%,而搜狗連續三年複合增長率30%,以Q3為例,搜狗增長率達到49.7%。
搜狗本次募集資金將主要用於:研發,增強產品、人工智能和大數據能力;銷售與營銷,推廣產品,擴大用戶獲取渠道等。未來五年,中國搜索市場仍保持20%以上高速增長。上市後的搜狗將繼續對市場第一名發起強有力的挑戰,未來格局可能改變。
16日,2018年第一季度全國政府網站抽查結果顯示,各地區各部門共檢查政府網站11639個,總體合格率95%。
一季度,國務院辦公廳政府信息與政務公開辦公室隨機人工抽查各地區政府網站303個,總體合格率95%。其中,北京等21個地區政府網站抽查合格率為100%,北京、天津、江蘇、海南、四川、雲南、陜西連續四個季度抽查合格率達百分之百。
本次抽查對網站的在線服務和互動交流功能進行了專項檢查。2017年國務院辦公廳印發了《政府網站發展指引》,對政府網站信息發布、解讀回應、互動交流和辦事服務等功能提出了具體要求。
檢查發現,多個地區依托政府門戶網站,集中提供網上辦事服務。沒有集約化的政務服務容易存在明顯問題,比如江西省“九江市工商行政管理局”網,陜西省“永壽縣政務服務中心”網、寧夏回族自治區“中衛市教育局”網等多個服務事項辦事指南要素不全,缺少辦理依據、辦事流程、表格下載等。
通報顯示,部分政府網站搜索功能不好用,比如河北省唐山市“開平區教育局”網無搜索功能,廣東省“汕頭市公路局”網等網站搜索功能不可用。
大部分政府門戶網站都開設了互動交流欄目,及時回應公眾關切,但仍有部分政府部門網站未按《指引》要求開展互動交流。如浙江省“杭州普法網”、新疆維吾爾自治區“喀什特區信息網”等。
第一季度,“我為政府網站找錯”平臺,收到網民有效留言13542條,總體辦結率達99%。內蒙古、江蘇、青海、發展改革委、科技部等26個地區和部門留言按期辦結率達100%。
抽查發現了一些突出問題,比如一些政府網站存在逃避監管的現象,如西藏自治區那曲市“那曲物流中心管理局”網,每天新聞稿件頁面發布日期均顯示打開的當天日期;廣西壯族自治區玉林市司法局同時開設兩個網站,其中一個網站長期不更新,且未納入政府網站常態化監管;還有部分政府網站互動欄目長期不回應,如“內蒙古自治區節能減排網”等。
一季度,各地區、各部門進一步加強對不合格政府網站責任單位和人員的問責工作,196名有關責任人被上級主管單位約談,29人作出書面檢查,35人被通報批評,12人被調離崗位或免職。
國辦信息公開辦有關負責人表示,下一步,各地區、各部門政府網站要把“互聯網+政務服務”作為推動政府職能轉變的重點,立足為市場主體添活力、為人民群眾增便利,進一步創新政府網站管理,提升網上服務能力,加快建設整體聯動、高效惠民的網上政府。
通報稱,各地區、各部門要進一步規範政府網站開辦、整合、備案流程,深入做好查遺補漏工作,將各級各類政府網站納入統一監管。紮實開展常態化抽查,持續優化指標,嚴格考核問責,提升監管實效。整合優化在線服務功能,提供準確實用的網站搜索,不斷提升政務服務水平,暢通公眾網絡問政渠道,切實為群眾咨詢問題、建言獻策提供便利,完善網站安全保障機制,建立健全內容發布審核和用戶信息保護制度,加大對假冒政府網站打擊力度,維護人民群眾合法權益。
截至2018年3月1日,全國正在運行的政府網站23269家。其中,國務院部門及其內設、垂直管理機構政府網站1872家,省級政府門戶網站32家,省級政府部門網站2349家,市級政府門戶網站523家,市級政府部門網站14097家,縣級政府門戶網站2750家。
2017年全國政府網站共發布政府信息3億4千5百萬條,發布解讀稿件86萬余篇,回應公眾關切100萬余次。2017年全年政府網站收到各類網民留言3400多萬條,辦結率98%。
“沒有,從來沒有”。
百度高級副總裁、搜索公司總裁向海龍搖著手,對記者斬釘截鐵地說。
5月22日的一場媒體溝通會上,當第一財經記者提問他關於和陸奇是否有過提議希望取消部分垂直領域廣告的討論時,他予以否認。此前有傳聞稱,導致陸奇離開的導火索是其任職期間,曾提出取消百度搜索業務部分垂直領域如醫療、互金廣告,但遭到搜索部門反對。
“我是個比較理性的人,不在乎沒根據的話,更重要的是看長期。”向海龍這樣回應。他同時主動談及近期陸奇的離開,稱確實是家庭的原因:“但陸奇和李彥宏的私交非常好,未來還是會成為百度的顧問。”同時他也強調,自己在百度是陸奇的下屬:“這一年多,我們的溝通非常愉快。”
向海龍在百度工作已經有14年之久。他對記者說,因為性格的原因,十多年把精力放在工作和內部工作上,幾乎很少出面。但最近外界關於他離職的炒作有點勤。“再不說又要傳離職了。”
一個半小時的溝通會里,向海龍與百度副總裁、搜索公司CTO 鄭子斌、百度副總裁吳海鋒、百度搜索公司運營總經理曹越等一眾搜索業務核心高管,回答了關於陸奇離職與搜索公司的傳聞、AI如何驅動搜索業務、算法要不要有價值觀以及備受爭議的醫療廣告等熱點問題。
向海龍對記者表示,AI和百度搜索並不矛盾。現在大家把AI狹義地理解為是無人駕駛、人機對話操作系統等等, 但機器學習、大數據解決問題都是AI,百度成立的那一天就是一家AI公司,搜索與機器學習密不可分。
對於百醫療類信息監管問題,向海龍對記者表示,無論廣告還是搜索結果,真實性和權威性都是百度在意的。圍繞這一點,百度提出企業加V認證,以此希望真實企業發出的信息能夠迅速找到法律承擔責任人,產生威懾作用。另外,還將推動實地驗證實體醫院,以此保證提供內容的真實存在。
他還對記者透露,接下來搜索產品會做比較重要的升級,計劃把內容全部裝進熊掌號,熊掌號的概念就是百度希望檢索到的網站的結果都放到百度自己的服務器上,“因為現在有一個問題是,一家可能非常正規的企業做了一個網站,被百度收錄了,收錄這一刻沒有問題的,有可能中途篡改網頁,網頁會有一些誇大誘導(信息)還有網站被黑客黑了,放了一些違法信息最後檢索被網民搜了,出現了問題。”
他稱,希望熊掌號最先在醫療行業覆蓋,通過一兩年的時間,把醫療網站全部的放進熊掌號,保證整個搜索結果更加安全可靠。
以下是經過整理的溝通會實錄,略有刪節。
主持人:今天我們請來了百度高級副總裁、搜索公司總裁向海龍,百度副總裁、搜索公司CTO鄭子斌,百度副總裁吳海鋒,百度搜索公司運營總經理曹越。
向海龍:各位媒體朋友大家下午好,我加盟百度已經14年了,14年里的確我一直都是精力放在工作上面,很少對外溝通。這次公關部找到我,說海龍一定站出來說一下,你再不出來又要被傳離職了。其實我發現我這幾年每年都被傳離職,我不太介意這個東西,傳可能過一段時間,反正也沒有離職,過幾個月大家認為這是一個假消息有算了就過去了。
最近感覺到傳的有一點頻繁,整個公司管理層也發生了一個變化,昨天我們公司內部專門和員工開了一個溝通會,這前後評論我的人也很多。昨天看到陸奇,他自己做了一些說明,首先一點他不再做百度公司的COO的確是他個人和家庭原因,這個是他自己說的。第二,他其實跟李彥宏真的是20多年的交情,他會繼續當李彥宏的顧問。另外實際上自己說了,跟我們的高管團隊,包括跟他的下屬,我實際上是他(陸奇)的下屬,工作上面一年多來也是非常愉快的。
我在百度14年了,自己創業五年之後,百度把我收購然後進入百度,我一直都在搜索這個領域工作,從剛開始的時候負責營銷這一塊,後來到了商業產品,一直到最後的整個搜索公司。
其實我們搜索公司成立將近兩年的時間了,當時成立的時候就說是把這個全部放在一起,我們更好的從用戶體驗的角度來思考搜索產品怎麽樣給客戶帶來更多的價值,前幾年我們的一次張家界的那一次聯盟峰會的時候我們專門講了一個話題,用戶產品商業產品怎麽樣更好的融合,其實我們內部做了非常多的工作。
提問:很多人說百度all in AI了,搜索這個業務就變得不重要了,或者搜索這個業務現在整個百度體系居於什麽樣的戰略地位?
向海龍:有些場合我們有的百度別的高管也在講,百度all in AI。但是有一次李彥宏說我們沒有說過all in AI,大家感覺有一點矛盾,其實我覺得一點不矛盾,他想說大家怎麽樣理解AI,不要狹義地理解AI,就是百度實際上是成立那一天就是一個AI公司。大家講的AI往往片面的理解可能跟智能硬件的結合,實際上不是的,實際上我們百度搜索天生就是一個AI。通過整個機器學習,然後大數據能夠解決一些問題。
我們現在做的產品實際上也是AI,搜索公司的使命就是人找信息、信息找人,就是怎麽樣快速地找到信息,其實就是AI驅動的產品,百度可以來講all in AI也是對的,百度除了搜索業務未來新的業務都是基於AI做,並且發揮百度算法大數據上面的優勢。
提問:請從內容生態產品角度聊一下算法跟價值觀的問題。
吳海鋒:百度作為平臺型的公司,我們深知對於整個網民影響很大,既然影響大,我們必須承擔起這樣一種社會責任。百度去年更新了我們的使命:用科技讓複雜的世界更簡單,這樣的使命之下怎麽樣變得更加簡單,其實就是構建一個真善美的內容生態,我們把最優質量最優質不低俗的內容更好地放到用戶前面滿足用戶的需求。
因為我們的產品要讓人過的更好活的更美,所有這個問題之下,我認為我們不能簡單的去理解算法的價值觀的問題,而是要把算法跟這個算法所在的產品結合起來去把這個產品的價值觀導向做上去,對於百度而言實際上我們在這個方面做了很多工作。比如說我們最近和人民日報有一個聯合的項目,我們跟這樣的權威媒體一起從我們的內容源頭上來開始做一些工作,讓這個內容最低質的那部分怎麽樣越來越少,整體越來越幹凈。
在算法上面大家知道AI算法最原始的應用之一就是對於內容的理解和對內容的過濾,雖然它做不到百分之百,我們一個人看一張圖可以半秒鐘一毫秒可以反應了,但是機器需要一個準確率召回率,我們不斷的投入資源人力把信息過濾內容過濾做的更好但是它是一個無止境,永遠逼近理想,但是我們應該承認光光用技術距離理想還是有差異的,我們不斷地縮小差距。
當然我們不排除一些特定的領域一定要人工審核我們加入人工的力量,人工也好算法也好都是手段,我是這樣看待算法跟價值觀的問題。
提問:我想請曹越給大家介紹一下,究竟哪些提供醫療服務的機構可以在百度投放廣告?
曹越: 這個問題說一下,百度其實對於在百度做廣告的企業有一套非常嚴謹的審核機制,醫療機構也是一樣的,首先對於想在百度做推廣的醫療機構來說,要提供它的企業營業執照。同時,作為醫療機構還必須要有醫療機構的許可證,這兩點是來保證這個企業是在線下合規的、正常經營的醫療機構的必要要素。
與此同時,我們還會通過銀行打款的方式實現對公驗證,這個是保證合規的醫療主體以真實的身份在百度做推廣。這兩個是綜合保證了在百度所有做推廣的醫院,都是在政府的監管之下,以合規、正規的醫院身份進來的。
提問:在最近媒體報道里面,有提到是不是PC端、移動端的廣告是不同的標準,請解釋一下。
曹越:首先說一下移動PC上面廣告差別的情況,我們的所有廣告管理都是廣告主自己操作的,他可以在我們廣告後臺設置所要推廣的媒體的屬性,比如說我要在PC推廣還是移動上面推廣,究竟這個推廣的時段從早上八點還是晚上八點,還是全天24小時都在在線,包括需要什麽關鍵詞下面買廣告,這些都是廣告主自己的自主行為。
現在我們看到的PC和移動的廣告差異其實根源上來自於網民行為的差異,其實現在隨著智能手機的普及,百度50%以上的流量來自於移動端,所以廣告主無論是在百度的推廣還是其他的媒體推廣,一定都是追隨著網民行為的改變發生推廣行為的變化,所以在這種網民行為的變化之下,廣告主也會把他更多的預算、更多的流量傾斜到移動上面,獲取潛在的用戶群,這個也是大家看到的可能覺得PC上面廣告似乎少了一點,移動上面的廣告似乎更多了的根本原因,百度沒有差異化的標準或者主動引導客戶做什麽事情。
提問:搜三甲醫院這個結果結果不是這個醫院,有沒有李鬼代替李逵的情況?
曹越:到現在為止,百度已經積累了近兩萬個公立醫院的尋址類保護,第一位不允許出廣告的。我們做這樣的保護措施,但是仍然被媒體發現我們還有一些漏網之魚,我們自己也發現了我們的這個漏洞。以往百度更多依靠自己的能力挖掘這些漏網之魚,但是發現僅靠自己是不夠的,我們需要尋求更加廣泛的社會合作,與更多的社會機構、政府機構建立合作,希望可以讓公立醫院的信息搜集更加完整,同時不僅有精確的名稱,我們還會了解大家更加容易表達的一些簡稱,我們這些精確的名稱還有簡稱下面都能夠對尋址的結果進行保護,保護的結果就是我們希望我們第一條結果盡量是官網或者百科或者我們的一些智能聚合卡片,這些綜合給網民的結果就是要使搜索的第一條結果,最有效、最準確地滿足當前的尋址搜索需求。
提問:過去很多年,百度都在提升整個醫療類的信息搜索和廣告質量,包括背後投放的企業資質還有他們所提供的服務質量,以及我們本身所提供的信息質量。是不是給大家更加系統地分享一下最近在做什麽事情。
曹越:醫療其他行業不一樣,畢竟關註著人的健康和安全,所以政府和媒體也對百度承擔的社會責任有更高的要求,我們也非常理解,就像剛才所說的百度對於醫療行業的客戶引入一套嚴謹的標準,2017年我們發現企業在百度上違規宣傳的行為,我們拒絕下線了60多萬家的醫療推廣賬戶,基於百度的機器挖掘識別的方法,我們下線了五千多萬條的違規醫療廣告。
同時百度的風控體系里面,僅針對醫療行業的黑名單風控詞表就達到30萬左右,打擊醫療廣告百度任重道遠,所以不管人力投入還是技術投入上面,我們會繼續加強。
我們會更加清晰地標識出來某條信息是廣告,而不是自然結果。現在百度上面看到任何的廣告結果都會直接有廣告兩個字標註在後面,讓大家可以更好的進行區分。
在醫療整個行業,包括藥品、保健品、一些醫療機構的查詢、疾病治療方案的查詢需求結果里面我們都會進行必要的風險提示,也就是說,讓網民能夠引導網民,時刻提醒自己提高風險防控意識。
百度以往做的很多都是基於百度平臺上面的行為,比如說廣告主能不能百度上做推廣,百度上展現的廣告信息是否合規。我們發現了做到這一步其實還是不夠的,我們還是需要加強對於廣告點擊之後的這些行為的管控,包括對於廣告主落地頁的監管,我們現在已經嚴厲打擊通過軟文推廣這種落地頁上面的推廣行為,我們也會結合百度新的搜索生態能力,比如說熊掌號的能力,我們希望網民點擊廣告之後與這個信息的互動行為,可以適當的被監控。另外希望引導網民在百度的生態里面來提交對於這些醫療服務機構的評價和反饋的意見,基於這些廣告點擊後的行為,讓百度可以更好的了解我們所服務的醫療廣告主真實的醫療服務能力和誠信的情況,讓我們在廣告的排序當中有更好的一些判斷依據,同時也為百度已經經營多年的先行賠付機制積累更多的信息跟資料。
剛才講的這些都是廣告方面的,相信大家來百度除了商業結果,更主要的可能還是希望通過自然結果找到大家可信的信息,自然結果方面也是跟吳海鋒團隊一直商量,我們努力提高醫療結果權威可信度。第一,打擊的其實有一些不良的醫療機構他們通過搜索引擎優化,就是大家所熟悉SEO方式自然結果拿到一些不當的獲利,這個我們的會一起專項做打擊。自然結果方面我們也會更加開放的跟社會各界更多進行合作,包括一些知名的公立醫院,包括知名權威的醫療機構,包括一些科普的平臺,我們希望通過和他們的合作,能夠讓百度拿到更多的權威醫療信息,並且結合百度自身豐富的產品舉證能力,能夠全面的讓這些真實的醫療信息更廣的觸達網民,通過百度平臺讓網民更加便捷地獲得到真實可信的結果。
作為一個互聯網企業,一個肯定得承擔責任,我們與政府加大合作,比如說市場監督總局、食品藥品監督管理局,包括工商、工信部門,合作打擊醫療違規行為,以及線上的其他不良信息。
提問:目前究竟什麽決定我們的商業廣告的排序規則,然後這些年包括人工智能的引入還有深度學習還有類似於預估專業的詞都用上來了,你給我們講一下目前商業廣告的排序怎麽樣做的?
鄭子斌:商業廣告的排序很多時候媒體會說是競價排名,競價排名只是一個非常古老的產品名稱,是我們09年上線鳳巢系統之後叫的。一個廣告是由很多因素決定排序的,比如說廣告的內容跟用戶的搜索需求相關性這個是很重要的。
第二,還有廣告的質量本身。我們會通過人工智能的技術去做判斷,同時又有一個審核的團隊去確保廣告的質量。然後再加上廣告主的網站落地頁的質量,剛才曹越提了一些關於這個方面的監管工作。
還有就是我們對於用戶信息做個性化的推薦技術,所謂的千人千面。我們有一個非常龐大的機器學習系統去預判用戶會不會接受廣告信息,這個就是我們所謂的點擊率的預估信息。當然價格是其中的一個因素,綜合所有因素之後,我們決定怎麽樣更好的滿足用戶需求。
還有一點補充一下,就是剛才曹越提了很多關於企業的資質審核方面的工作,廣告主的企業信譽也是我們排序里面非常重要的因素,所以這個結合了人工智能還有我們的審核團隊整體的力量,我們一起去把這個排序達到最優的效果呈現給我們的用戶。
提問:再問一個比較細節的問題,百度搜索之後去到一個網站上面,或者訪問一個網站之後接到一個電話你是不是對於一個東西感興趣,這個東西正好是推薦推銷過的,接到一個電話你是不是感興趣,你怎麽有我的電話,電話的那個人說百度給我的,你在百度上搜過,這種情況里面其實網民里面並不罕見。您作為搜索公司的CTO解密一下什麽原因導致了個別網民接到這種騷擾電話推銷電話甚至個人隱私泄密電話?
鄭子斌:這是一個誤會,其實網民在搜索到網站內容的時候,百度中間沒有辦法通過技術手段,通過瀏覽器獲取網民的手機號的,這個是技術上無法做到的,這個情況發生的時候因為有黑色產業的行為,他們黑客到一個網站,布置一些不良違法的代碼,這個代碼使得他們通過一些運營商系統的漏洞,從而可以獲取到,到了這個網站之後的用戶手機號。我們過去花非常多的精力,百度部門還有公共安全部門相關機構一起去打擊黑產全鏈條,同時我們不斷的加強技術的手段,不斷的去找我們的自然結果也好,我們搜索爬到的網頁的信息也好,還有我們的廣告主的網站信息也好,確保這些網站是安全的沒有被黑客或者黑色產業去侵入去布置這些違法的代碼,這個是一個貓捉老鼠的遊戲,很多時候我們不斷的用機器資源抓黑產的行為,不過總有一些落網之魚而且不同的時間段改變行為,這個是持續的,我們百度安全部門也會持續不斷跟政府的相關機構做一些專項的打擊活動。
過去可能16年以來,我們跟公安多起重要的這些黑廠打擊的犯罪案中也把好幾十人都會落網逮捕,這個也是我們持續要跟政府機構一起努力的工作。
提問:百度的搜索產品為什麽一直都給外界感覺沒有創新?
吳海鋒:首先接受批評。大家因為每天都用百度搜索,可能覺得今天跟昨天長的一樣,明天跟今天似乎又一樣,但是當我們回過頭看看今年和五年前,今年跟十年前相比其實它真的長的不一樣了,聲音容貌都不一樣了。
首先搜索能力的角度來講,搜索誕生第一天來說就是一個人工智能的產品。大家可能作為用戶感知不太強烈,這里可以給大家分享幾個關鍵點,第一個點我們的搜索關鍵詞變得越來越長了,比PC上的搜索詞變長了起碼三倍以上,原來的是一個詞一個詞,現在是一個句話一句話,因為大家用語音搜索了。
有一個視頻現在很火,女孩子花點錢怎麽了?大家打開百度搜索,按住麥克風說一句女孩子花點錢怎麽了,會有意想不到的結果,這個都是我們資源理解能力有了臺階式的上升得到的。這個就是默默的讓搜索引擎越來越智能越來越懂這個世界跟這些人,這個是能力的提升大家可能感知不是很明顯。
第二,搜索場景的擴展。原來搜索只能 PC 上用,現在不一樣了。我們最近一個硬件產品小度在家,有的人說小度在家是音響或者iPad,我心目當中小度在家就是新一代的搜索產品,因為它的新內核就是搜索,能力就是搜索提供的能力,只不過長的很好看,他可能放在你家的客廳床頭他就是搜索,大家不覺得小度在家是搜索,但是我覺得就是搜索。
最後,我想說的是,大家如果手機里面可以試著去 AppStore 或者安卓市場搜一個簡單搜索的 App,融合了我們最新技術語音視覺技術圖像理解技術,融合了我們最新的產品理念,打造的一款新的搜索APP,這個是我們向理想向前走的一個實踐產品,我們不斷的在打磨他,以前大家可能不知道,簡單搜索未來它將成為充滿科技感炫酷能夠真的懂每一個人App 搜索產品.
提問:怎麽看假冒德邦快遞的事?
曹越:這個事情我們內部分析一下,百度不知道的李鬼我們當成了李逵把他推薦給了網民。其實德邦在百度有品牌保護的,德邦物流關鍵詞下面出現的商家必須德邦品牌授權,這個李鬼其實偽造了一份德邦品牌公司的一份授權書給到了百度,百度其實沒有能夠識別出來這個授權書的真偽我們以為是真的有授權的就讓他能夠出現廣告了。
這個事情發生之後我們也跟德邦品牌的擁有方進行了聯系,然後我們從他那邊拿到了真實的擁有德邦授權的企業的列表,對於在百度購買了德邦物流的這個關鍵詞下面但是不是真正的授牌企業我們做了全部下線處理,這個事情主動采取了網民保障措施,我們對於假的品牌授權廣告主欺騙的網民我們做了一些賠償措施,德邦是一個案例,這個案例暴露出來百度授權品牌機制上面有漏洞,我們被授權方提供了一個文件證明身份,這個真偽還是缺少文件自身識別的能力,我們從德邦開始包括陸續百度進行品牌保護的三萬多品牌商來說進行這些品牌擁有者上遊的直接的溝通,我們希望通過他們,從他們手里面拿到最真實,真正獲得他們品牌授權的企業相關信息,讓我們的品牌保護是更加真實有效的,不再出現這種李鬼的事件了。
向海龍:其實我們對於企業進行認證,的確是面臨著很多挑戰,最開始我們做的認證時候,認證企業真實合法性,這個企業是不是合規的企業而不是一個皮包公司,有沒有工商註冊,是不是有一個銀行帳戶做生意,我們也采用了非常多的方法,比如說工商部門數據庫的對接,我們一定查到,你給我一個營業執照我不信,我一定要到工商局網上查。
我們發現也有這種情況,有公司註冊了,但沒有開銀行帳戶,其實沒有經營,他可能是借了別人的一個銀行,他偷了別人的營業執照到我們這里推廣,實際上拿營業執照的人根本不知道,最後出現了這種情況我們再升級,我們升級成了銀行對公賬戶,我們把賬號打一個錢,必須告訴我那個錢多少錢,我們打的錢1.39元,你要告訴我,並且確認這個錢可以打到不會退回來,我們確定這個賬號一定是你的。
其實德邦快遞事件暴露的這個問題實際上已經到了很窄的領域了,是關於加盟店的授權,這個的確面臨著一個問題。我們給團隊講了,最好跟數據庫進行對接,剛才的情況你拿了一個授權我們看到授權是真的,其實我們應該是找到授權單位看你到底給多少人授權,不在這個名單里面統統不可以,我們其實加強了一些跟我們一些組織,比如說協會一些合作,我們拿了更多這樣的一個數據,在做推廣的過程當中保證了這個數據的有效性。
當然現在希望未來我們技術上面通過AI的手段來看他是不是撒謊的,比如說給了我們這樣的一個證之後,我們也要通過一種其他的手段可以看到這個證件是否是真的還是假的,這個上面我感覺到的確是我們在審核門檻上面不停的提升。
提問:第一個問題:醫療廣告廣受爭議,每年都會出現虛假醫療廣告問題,百度有沒有分析過背後的原因?是否取消某些垂直領域比如醫療廣告?第二個問題:昨天溝通會上面,提到了百度的搜索團隊出一款簡單搜索的App,能否介紹一下簡單搜索的情況還有目前的應用有什麽不同,背後有什麽創新。
向海龍:我認為整個互聯網廣告,真實性非常重要,這個其實我們在做整個搜索過程當中,我們不管是我們的廣告還是我們的自然結果,真實性、權威性對於我們來講都是非常非常重要的,這是用戶體驗的一個基礎。
所以,在真實性上面我們很早就提出了一個加 V 項目,針對一些企業我們必須要進行一個加 V 的認證,這個加 V 認證企業所發的內容在搜索結果一個標誌,我們希望一個真實的企業發的信息如果說是有問題的話 ,我們能夠很快的在法律上面找到這個承擔法律責任的人,這個也是相當於對他一定的威懾作用,所以我們之前做了這個比較重要的加 V 項目。
針對醫療加 V 工作大概介紹了下,我們要求更加嚴格些。我們剛才講了對公賬號的驗證,甚至一些資質的驗證我們完全是拿到官方的這個信息來驗證的,不是拿到他們給我們的一個紙面東西驗證的,這個非常嚴格。另外醫療這塊我們甚至要做到實地驗證,我們要派人到當地看看是不是這樣的一個經營場所,是不是這樣的一個辦公樓,或者這樣的一個實體醫院,通過這個方式我們想保證提供內容的實體單位是真實存在的。
當然剛才提到一個相關性的問題,相關性非常重要,我們現在實際上醫療上面有些人會說搜的過程當中準確性不夠,比如說中日友好醫院,有的人搜的是中日友好,得到的結果可能不是中日友好醫院,這個過程當中相關性的問題。相關性的我們也是想盡辦法更大的幅度提升,希望這個匹配更加準確,因為相關性其實並不是說匹配的不好找到了一個騙子醫院,其實醫院實際上也是合法正常的醫院,但是可能會對他有看法——就是誤導了我,我找的不是這個醫院,你給了是這個醫院,就算這個醫院正規醫院也有上當受騙的感覺。
這個是相關性的問題,相關性的問題也是技術上面需要提升的。
今天非常多的項目想方設法提到搜索結果的相關性,搜索結果有一個結果,這個就要從上到下排序的,我們給客戶的準確性相關性上面看到很多誤會。我們看到最近的一些報道,的確這個個人感覺醫療單位非法企業的問題實際上是一個相關性的問題。
我們現在也在想用另外的一個方法解決,我們在用一個聚合的卡片的形式解決,你搜的時候我可能猜的不是很準的時候給你一個卡片,你再進行一次選擇。這樣保證了你在看到選擇的這個結果當中,是你有一定的主動權的而不是被動的,這樣被誤導的可能性變少,我們希望在產品的交互上面采用更多的更好的這種研究的方法解決這個問題。
其實搜索結果不管自然結果還是說商業結果,我們未來都會在這兩個方面加強,我們希望用這種方式提升整個在這些垂直領域的這樣的一個用戶體驗,另外的一個就是我們的產品上面我們也會再做另外的一個比較重要的升級,就是我們把內容我們未來計劃全部裝進熊掌號,熊掌號的概念就是我們希望檢索到的網站的結果都到我們的服務器上面,現在有一個問題這個企業上面有可能是一個非常正規的企業他做了一個網站,他被我們收錄了,收錄這一刻沒有問題的,有可能中途篡改這個網頁,網頁會有一些誇大誘導(信息)還有網站被黑客黑了,放到一些違法的信息最後檢索被網民搜了,出現了問題。
為了避免這個事情發生,未來比較敏感危險的行業,我們會把它的服務器放到我們的服務器上面,放在我們的熊掌號里面去,這個里面只要網站發生任何改變我們全部知道,這樣保證網站上面的信息不容易篡改,這樣安全性也會很大的調整,所以今年其實我們做了一個技術就是我們希望熊掌號最先在醫療行業覆蓋,我們未來希望通過一兩年的時間,我們把我們的醫療網站全部的放進我們的熊掌號,未來有可能不在熊掌號里面搜不到了,這樣的可以保證網站被篡改的可能性。
否則我們對於資質服務驗證了,網站上面被人篡改了,或者有人故意篡改蒙蔽我們,也會杜絕掉這樣保證了整個搜索結果更加的安全可靠。
大家甚至還有可能看到里面沒有文字結果,現在沒有做到這樣。
提問:陸奇曾經想把一些垂直領域的推廣不做這個方面的商業推廣有其他人不同意,有沒有這個事情?
向海龍:沒有,從來沒有開過這樣的會。
在去年數博會期間,當公眾擔心AI威脅到人類安全時,百度公司董事長李彥宏稱請大家不要擔心。
到了今年數博會上一場“人工智能”高端對話論壇上,李彥宏稱自己不擔心AI會控制人類,但不是沒有擔心,他對AI安全有著擔心。
“對於我們來說,安全是自動駕駛最重要的方向 ,是自動駕駛技術第一天條,這個錯了,會使整個技術推進停滯一到兩年;人的安全是最重要的,不能容忍這方面錯誤。”李彥宏稱。
李彥宏同時還為百度新產品“簡單搜索”做了個廣告,幾天前百度對這款產生於2017年7月的產品作了宣傳,以沒有廣告作為主要賣點。李彥宏承諾稱,“大家都不相信不會有廣告,現在解釋一下,簡單搜索永遠不放廣告。”
無人車需要生態
今年兩會期間,李彥宏接受媒體采訪時稱,百度無人車將在7月份量產。
距離承諾的量產日期還有一個多月時間。李彥宏稱現在有期望、焦慮和擔心,不是擔心量產不了,而是擔心無人車是不是足夠安全。
“對於我們來說,安全是自動駕駛最重要的方向 ,是自動駕駛技術第一天條,這個錯了,會使整個技術推進停滯一到兩年;人的安全是最重要的,不能容忍這方面錯誤。”李彥宏稱。
無人車在高速等封閉道路上相對安全,但城市開放道路上有行人和各種各樣意想不到的事情,無人駕駛變成了很難的事情。
今年三月份,美國亞利桑那州發生一起車禍,一名優步自動駕駛測試車輛導致一名49歲的婦女死亡。這加劇了公眾對無人駕駛的擔心。美國優步公司也發表聲明稱,該公司將停止亞利桑那州自動駕駛汽車測試。
“百度不是造車的,百度是一個完全開放的平臺,技術、源代碼和數據完全開放。從代碼開放到後面量產,新增代碼50%專為量產項目中安全增加。”
李彥宏稱,無人駕駛在封閉環境中成功試行,是科研機構、汽車制造商、政府、傳感器(服務器/芯片)制造商、通信服務商、自動駕駛系統和出行服務商共同努力的結果。無人車是一個生態,需要方方面面努力。
“以前是車上雷達激光設備探測周邊障礙物。但如果在道路、基礎設施層面布置相應傳感器,車的成本、無人駕駛成本會大大降低。”李彥宏稱。
簡單搜索永遠不放廣告
李彥宏同時介紹了百度的新產品“簡單搜索”。在李彥宏看來,簡單搜索是AI改造傳統互聯網的產物,第1個特點為AI能力,對語音、圖像和自然語言有著更為精確的理解。
AI能力下,簡單搜索可以實現千人千面的搜索結果。如通過聲音識別用戶年齡,從而確定是成人模式、標準模式或是少兒模式,對應不同的搜索結果。
簡單搜索第二個特點為無廣告。這款產品上線於2017年7月,百度在5月下旬對這款產品進行了宣傳,以不放廣告為賣點。
但正如李彥宏所說,大家不相信不會有廣告。百度會在一個有AI能力的搜索引擎新品中放棄廣告嗎?
李彥宏重申,簡單搜索永遠不放廣告。
李彥宏同時分享了他對AI倫理原則的思考,稱AI的最高原則是完全可控;AI的創新願景是促進人類更平等地獲取技術和能力;AI的存在價值是教人學習,讓人成長,而非超越人、替代人;AI的終極理想是為人類帶來更多自由與可能。