當早年的爆款電商逐漸被這兩年的個性化網購趨勢掩蓋時,千人千面的商品推薦成為平臺標配,但眼下它只做出了一個雛形。
8月25日下午,亞馬遜前首席科學家、大數據與機器學習研究學者韋思岸(Andreas Weigend)在IEBE(上海)國際電子商務博覽會上接受第一財經記者專訪時稱,系統推薦本身不難,但如何評估推薦是一個難題,“當年我還在亞馬遜時,《哈利波特》出了新書,如果把這本暢銷書推薦給所有亞馬遜讀者,可能很多人都會買,但顯然這不叫推薦。”
這兩年,經常網購的用戶感受到個性化推薦的一個變化是,以前電商平臺總是推薦給我剛剛買過的同類商品,比如剛買了一個足球,再瀏覽頁面時廣告位上出現的還是足球;現在推薦系統變得聰明一些了,它會主動顯示球襪、運動背包、水壺等關聯產品。後臺算法對大數據的關聯分析發揮了一定作用,這其中要將某件商品的易耗程度與複購率特征數據考慮進去。
但和今日頭條的新聞推薦、Netflix電影推薦等模式不同,電商平臺上的商品數以億計,相比之下,作為個體消費者瀏覽和購買的商品很有限。這樣稀松的數據很難讓平臺十分精準地猜到你喜歡什麽,預測你可能要買的商品就更難。況且,電商平臺社區化戲份的不斷增加,很多用戶在手機上打開淘寶等可能只是漫無目的的閑逛,和線下逛商場走馬觀花並沒有太大差別,這更增添了後臺數據分析的難題。
據韋思岸介紹,亞馬遜的商品推薦包括5個數據維度,除了用戶點擊和搜索數據、用戶評價、基於LBS的環境數據(比如你在搜索某個商品時是在用餐還是在乘坐高鐵)之外,還包括朋友間的社交數據,以及後臺專家的人工調研與幹預。“過去我們更多的是關註某一個結點它本身的一些特性。現在我們更多的是關註結點之間互相的連接。每個人都是互相聯結在一起的。”
很明顯,社交數據對於平臺推薦算法的權重正在增加。以大眾點評、Yelp等餐飲類舉例,如果用戶在經過某地或主動搜索某區域的餐館時,系統顯示出其好友在某家餐館留下的到訪與評價數據,這對他的決策會產生很大影響。平時在線下選餐館時咨詢身邊朋友的意見,本身就是一個高頻而順暢的場景。社交數據用到電商中,系統會將你朋友買過的商品與你本人之間建立關聯。
對此,韋思岸打開自己手機上的Facebook,看到一串好友添加和推薦信息。“我可以看到某個推薦好友與我現有好友的關系,幫助我做出是否添加好友的決定,但在WeChat(微信)上是看不到其他人的好友關系的。”實際上,在中國最大的電商與社交數據分別被阿里和騰訊掌握,數據之間的開放打通並不容易。
眼下,不同用戶看到的手機淘寶首頁是不同的,用戶在手淘搜索時產生的頁面排序也因人而異。這其中既有後臺算法的大數據分析,也有對平臺流量去中心化的考量。2015年雙11,淘寶後臺頂住海量並發的大數據分析壓力,在手淘App用戶端實現千人千面顯示。某服裝品牌旗艦店店主陳迪稱,2014年和2015年的雙11都開設了千人千面會場,但他所經歷的2014年千人千面會場轉化率較低,到2015年轉化率明顯提升,背後的推薦邏輯得到優化。
除了搜索,店鋪內顯示也在向著個性化試水,以男裝品牌JACK & JONES為例,不同用戶進入旗艦店看到的頁面展示和商品推薦不同。不久前,天貓電器城負責人印井對第一財經記者透露,全網目前有超過200家店鋪嘗試店鋪內千人千面。用戶的搜索關鍵詞成為重要的分析數據,比如用戶在購買熱水器時搜索去噪音,表明其使用環境對安靜需求度高。
但總體上看,電商的個性化推薦現在仍處於起步階段,算法還遠未稱得上聰明。目前,谷歌會對某個用戶在某頁面上的停留時間進行分析,以猜測其偏好,大數據的獲取維度正在以幾何量級上升,但韋思岸認為,數據收集得越多,產生錯誤的可能性也會越大,也越考驗算法。這中間存在一個數據篩選清洗的博弈問題。