📖 ZKIZ Archives


阿里巴巴大數據總動員

 
2013-05-13  NCW

 

讓公司“每個人都有運營數據的能力”,這是阿里巴巴正在探索的大數據路徑◎ 本刊記者 王姍姍 文如今,阿里巴巴集團管理層最常對員工講的一句話是: “你們不要總是躺在‘金山’上還要飯吃。 ”這座“金山”就是指“大數據” ,阿里巴巴內部正在進行一場“全民性的數據普及教育” ,要求每一位員工都要有運營數據的能力。

阿里巴巴多年前就對外宣稱,自己的未來並非電子商務公司,而是一個大數據公司。簡單想象一下當前的淘寶——集納數億消費者,一年實現交易流水超過10萬億元……這無疑是一個數據的海洋。 但從數據海洋到大數據“金山” ,這段距離並不那麼容易打通。2012年秋天,掌門人馬雲公開了對電子商務平台、金融和數據三大業務領域的框架設計。其中,電子商務平台經歷十幾年的深耕,業務發展已進入成熟期;小微金融服務集團於今年3月正式成立,標誌著第二產業板塊也已進入獨立發展軌道;而屬於 “三步走”戰略最後一步的大數據業務,目前仍歸屬平台集團,處於孵化早期。

2012年7月,阿里巴巴的數據分享平台戰略開始啓動,陸兆禧擔任集團首席數據官(CDO) 。繼而在2013年1月實施的組織架構調整中,數據平台事業部成為25個事業部之一正式組建。和其他垂直業務單元部門不同,數據平台事業部既是一個 “躺著”的部門,又是一個高于基礎的“智慧大腦” ,它的挑戰在於——如何接納或采擷從各個業務平台湧來的海量數據,從中挖掘商業價值,創造新的可持續的盈利模式。

躺在大數據“金山”上

阿里巴巴的這座大數據 “金山”到底長什麼樣子?

阿里巴巴首席商業智能分析師車品覺給財新記者畫了一張圖。一個互聯網企業所擁有的內部數據涉及兩大類:一類是財務數據、運營數據、市場數據等 “結構型數據” ;另一類是從產品運營角度抓取的用戶行為分析數據和移動應用數據。具體到阿里巴巴,淘寶平台重點探討的是影響用戶購買的多項數 據,即 “過程數據” ,這些數據伴隨著數億級用戶的瀏覽選購路徑,數據很深也很細分;而支付寶的數據雖然也針對 用戶行為分析,卻明顯是以購物結果為導向,且支付寶服務的商戶並非只有淘寶一家,若按其現有第三方支付市場份額計,支付寶已是國內消費類市場最大交易數據量的平台性產品。

巨量數據從四面八方湧來,一個最大的難題就是數據的標準不統一,這就意味著商業智能部門(BI)針對數據質量把關的工作量很大,他們需要給各種數據貼上屬性標簽。數據分析師們對數 據質量有一個形象的比喻——它好比一個城市水庫的上游水源,最重要的是水的純淨度。因為接下來負責進行數據挖掘的人首先假定“數據是乾淨的,數據的質量是好的” ,借此再針對某個命題得出精准的分析結果。而標簽管理,就是用來解決數據純淨度的問題。

車品覺告訴財新記者,基於解決問題的先後需要,目前阿里巴巴 BI 部門重點關注的數據是以用戶為中心,即終端消費者的行為數據和關係數據,看用戶群之間的傳播路徑是怎麼樣的。而大數據的魅力之一,就是利用周邊數據讓主題輸出更為精准。換句話說,數據量如果夠大,把其他碎片化參數不斷加起來,最終你希望解決的中心問題的答案會變得越來越清晰。

車品覺認為去年做得比較滿意的一個產品叫 “黃金策” 。這是一款針對消費者行為分析的數據產品,針對單一消費者加入了六七百個變量數據參數。通過這款分析工具,阿里巴巴的數據分析師可以很快告訴你很多問題的答案,而這些答案的準確度可以通過輔助參數的調整不斷提高。比如,從曾購買過母嬰類產品的消費者中判斷有多少是自己有小孩的,準確率是62%,如果再加一個分析參數,如用戶所在城市位置所呈現的適婚年齡情況,判斷準確率就能升到83%,然後當你再看這個人有沒有汽車,那麼準確率還可以增加到86%……不過,截至目前,淘寶、天貓平台上積累的大量社區數據(如用戶評價、賣家和買家的互動交流) ,以及數億級的商品種類(SKU)信息,都還是尚未開發的處女地。現在還沒動的理由很簡單——因為這座 “金山”實在太大了。

目標就是“投其所好”

正因為 “金山”太大,所以一開始需要很講究數據的挖掘邏輯。

數據服務最大的需求人群是成千上萬依附于電商平台的賣家。一位阿里巴巴內部人士對財新記者透露,目前淘寶平台上賣家人數的增長率已經高過買 家,淘汰率非常高。讓這些賣家嘗到數據挖掘的甜頭,是未來阿里巴巴大數據業務的商業模式核心。

數據服務的形式可能是定制化的數據產品,也可能是一個數據共享平台不管哪種樣態,數據挖掘的核心價值就是將複雜問題簡單化。如果用做產品的辦法來運營數據,邏輯就很簡單,只需思考誰用這個產品,他要解決什麼問題,而這個產品能不能解決他的問題。

據財新記者瞭解,在阿里巴巴大數據業務的長遠規劃中,除了做好局部的數據產品,更大的理想是建一個數據共享平台。但做一個平台跟做一個產品相比,前者的 “瞄準器”遠沒有後者那麼清楚。這意味著包含海量數據的平台要允許出現一個非常大的錯誤空間,平台的容錯能力要夠強大。

未來阿里巴巴的數據平台有可能是一張隱形的“天網” ,指導淘寶 “小二” (運營管理人員)和賣家的商業操作,目前仍無人能清楚概括出這張“天網”的邊界。阿里巴巴打算對外先拿出一個看得見摸得著的大數據分析成果——“千人千面”的商品呈現頁面就是通過研究每個用戶的消費習慣及個性特徵,再經過系統的自動智能優化匹配,從用戶登錄網站首頁的那一刻起在商品展示規律上,淘寶可以越來越精准地實現對用戶“投其所好” 。

幹掉 BI

與其他垂直類業務板塊相對獨立孵化的方式不同,阿里巴巴對大數據選擇了“全民普及教育”的模式,力圖傳導 滲透、培養全體員工的數據運營意識。

產品經理出身、後改行做數據分析的車品覺,形容自己是一個 “跨界分子” 。但正因有產品經理的背景,幫助他樹立了很強的服務用戶的意識,同時也很注重數據的產品化。嘗到跨界好處的車品覺認為,現在大多數企業的 BI 部門都存在一個嚴重的問題——數據分析員不懂得運營,這導致數據和運營之間有一道巨大的鴻溝。車品覺稱,他的理想就是要 “幹掉 BI” 。在他看來,一家企業最理想的數據運營狀態應該 是——“80% 是懂商業的人,拉了數據之後自己做分析,而20% 是做數據分析的人,要保障用數據的人有數據可用” 。

因此,對於阿里巴巴來說,當前數據化運營面臨的最大壓力就是人才的培養。

這場 “全民總動員”是否有先進的模板可循?為此,阿里巴巴曾派人去國外跑了一圈學習經驗,結果卻發現找不到一個成功的數據運營案例可以參考,因為全世界目前找不到第二個擁有像阿里巴巴這麼大數據量以及這麼多事業部的公司。

2013年年初,阿里巴巴成立了一個虛擬數據委員會,成員共有五人,分管商業分析、底層技術、無線數據、支付寶數據,以及一名數據科學家。在這個委員會之下,參與數據運營的角色還包括業務分析師和決策分析師。其中,業務分析師更多是服務于某一個垂直業務單元,針對某個具體商業運營環境,通過數據來幫助其改進業務細節;而決策分析師是橫向、全局性地看整個公司,解決一些偏宏觀的問題,比如聚劃算跟天貓或淘寶的關係是什麼?一個用戶去過聚劃算之後,會不會更活躍?還是他只不過是要買更便宜的東西才會去聚劃算?諸如此類的跨平台數據研究。

正是這“一橫一縱”構成了阿里巴巴內部至關重要的情報網。目前專職 數據分析的團隊已達800人,其中只有一部分人屬於數據共享事業部,更多的人以業務分析師的身份滲透于其他24個事業部,他們既要對自己相對應的事業部或集團負責人匯報,同時也要相互匯報。實際上,這800個人就是800個可以互動穿插的信息溝通結點。


PermaLink: https://articles.zkiz.com/?id=55570

Next Page

ZKIZ Archives @ 2019