導讀 : 從不說謊的數據到“花刺子模信使”,這背後有哪些原因?

最近兩年,隨著互聯網行業競爭的加劇與互聯網創業熱潮湧起,宣傳過猛與包裝過度的行業數據時不時曝出,而基於某一產品領域的一哥之爭也讓數據亂象時而浮現,第三方數據由於統計口徑的問題引發“不服”,導致廠商之間口水戰頻頻開打的現象也屢屢發生。

從正常的邏輯來看,數據不會說話也不會說謊,但如果背後傳遞數據消息的人將拋出的數據修飾包裝過度,往往就會演變成互聯網行業的“花剌子模信使”事件。從不說謊的數據到“花刺子模信使”,這背後有哪些原因?

互聯網數據自說自話盤點:多數源於競爭加劇或融資困局下的焦慮心態流露 

我們從打車行業盤點起。早在2014,滴滴(當時還名為“嘀嘀打車”)迅速發展,當年年初嘀嘀打車公布了與微信支付合作後成績單數據,從2014年1月10日至2月9日,嘀嘀總微信支付訂單約為2100萬單。然而,在當年的2月7日,北京晨報記者收到騰訊的數據卻顯示:從1月10日起至今,嘀嘀打車微信支付訂單總量突破500萬單。業界質疑其數據:2月7日到2月9日,從500萬單增長到2100萬單數據存在太大水分。當時騰訊公關部表示,2月7日發布的數據是從1月10日到1月26日,由於表述方式不夠明確,引發了歧義和困惑。而在當時,打車行業湧進來的投資機構越來越多,砸廣告、瘋狂補貼擡高估值成了打車行業的一個共同的現象。日均訂單等數據開始成為投資人衡量打車行業前景的重要指標。

我們再看電商與O2O行業。貓眼去年發布的一份數據顯示:2015年 7月其電影單月交易額高達22億。而據國家電影資金辦的數據顯示,2015年7月中國電影票房高達54.9億元,46%來自電商票務,約為25.3億元。這約25.3億的電商票務市場主要被美團、百度糯米、淘寶、格瓦拉、微信、大眾點評等產品所瓜分。按照貓眼數據顯示,如果僅貓眼就占22億,其它票務電商共計僅有3.3億。這樣一換算,貓眼電影幾乎獨占九成,有業內人士當時慨嘆:這是把百度糯米、淘寶電影、微信、大眾點評、時光網、豆瓣網、網票網、格瓦拉和微票兒等電影在線售票平臺當成了空氣。當然這也與當時競爭環境白熱化,財大氣粗的BAT強勢入局打響補貼戰有關,貓眼電影早已感受到巨大壓力。

另外在O2O外賣行業也屢有數據說漏嘴的事情發生,去年7月,餓了麽聯合創始人康嘉透露,蜂鳥日訂單量為60-70萬單,是餓了麽平臺一半的交易量,按照這個數據推算,餓了麽的實際日訂單量為120萬至140萬單,這顯然與餓了麽此前宣傳的日訂單超200萬不符。業內分析認為可能是康嘉急於宣傳自身的蜂鳥配送系統,一不小心說了實話。而在這背後,則是自2014年5月拿到大眾點評8000萬美金投資後,張旭豪的餓了麽開啟了不斷瘋狂融資和不斷燒錢的旅途,餓了麽還在苦苦尋找下一輪融資。對於投資人來說,O2O外賣行業最重要的價值指標無疑就是日訂單量與用戶數。這是一個需要投資人砸錢輸血的遊戲,需要依賴靚麗的數據來拉升估值。

因為創業者投資者衡量一個互聯網項目,訂單量、融資情況以及用戶量無疑是硬性考核指標,創業者為了讓融資之路順暢的走下去,配合投資人的偏好有時候也是不得已而為之,這多半源於行業競爭加劇之後的一種焦慮心態的流露。去年尤為引發業內關註的則是一畝田交易數據疑造假事件。同樣在去年的7月下旬,多家媒體發文章稱,當時一畝田交易數據存在造假行為。以其“9小時前老板采購了1073741.8235噸洋蔥”的交易信息為例,單筆107萬噸的洋蔥采購量已經超過了洋蔥盛產地區西昌每年30萬噸的產量。而一畝田被曝運營數據造假與此前餓了麽被質疑6.3億美元的F輪融資“水分大”,顯然都與需要繼續融資燒錢息息相關,燒錢模式的創業公司,一旦投資人停止輸血,往往就會倒閉,手里有錢才能持續推動外界對其的想象空間,或者成功被巨頭收購成為其代理人與戰略性的棋子也不失為一種成功。

互聯網數據造假的先進性還體現在可以通過先進的代碼技術來實現。比如在去年11月,在移動音頻領域行業中的蜻蜓FM,被媒體曝光通過使用“普羅米修斯”、“宙斯”兩個強行自啟代碼,在用戶手機中後臺啟動無窗口透明界面,並傳給第三方數據統計公司,以此偽造DAU(日活躍用戶數)、廣告展示量和廣告點擊量,後來喜馬拉雅FM發布題為《四問蜻蜓FM:關於數據造假,敢不敢正面回應》的官方聲明,就蜻蜓FM反編譯代碼中的 “普羅米修斯”、“宙斯”兩大造假代碼向其提出質疑。蜻蜓FM當時發文回應,“不管誰在惡意攻擊,我們都不懼怕”。這背後則體現了目前移動音頻行業背後競爭惡化的狀況。

最新的數據存疑的例子還有地圖服務的用戶數。春節前夕,百度地圖在春節期間在湖南衛視投放的廣告中,提到了“5億人都在用的百度地圖”的口號, 1個多月以後,高德地圖也宣布截止到2016年1月底,高德地圖用戶數已超過5億。但是從多數第三方數據機構提供的統計上來看,高德的用戶規模、活躍用戶數據可能還存有疑問。從國內主流的安卓市場,如基於百度手機助手、應用寶、360手機助手、豌豆莢等多家應用市場的關於百度地圖與高德地圖的下載量應該可以反映出數據的大致基本面,我們采集了相關的數據來看:應用寶百度地圖的下載量是5億,高德地圖是2億;360手機助手顯示的數據是:百度地圖:4.62億,高德地圖是3.06億。而豌豆莢中顯示的數據顯示則是:百度地圖是1.6億人安裝,高德地圖是7893萬人安裝。

各個電子市場雖然用戶群體不一,但基本面已經反映出大致的趨勢,從各大電子市場的數據顯示來看,高德地圖5億用戶數的基數缺乏來源口徑的支撐。在iOS端,高德雖然是蘋果中國地圖數據的獨家供應商,但蘋果的用戶與高德地圖的用戶是不能直接劃等號的。更有意思的是,在高德地圖宣布“用戶數超過5億”之後,蘋果App Store在3月1日更新了高德地圖的新版,但在這個版本提供的產品介紹資料里,高德地圖仍然標明“3.2億用戶正在使用”。

互聯網行業為何被公眾質疑數據摻水事件頻頻發生?

當然,互聯網數據自說自話的現象還遠不止這些,包括二手車市場與在線旅遊市場等諸多案例,筆者在此不一 一例舉,其中歸根結底是對產品缺乏自信力。但我們同時看到,互聯網數據存疑的案例基本會發生在互聯網的熱門領域,比如O2O、電商、互聯網地圖、打車、在線旅遊等領域,互聯網行業被公眾質疑數據摻水事件頻頻發生,這里面有著多重原因。首先對於互聯網行業的公司而言,它們的業務基礎基本都建立在以用戶增長速度為基本的盈利模式與估值模式,日活躍用戶數與增長速度的快慢可以直接影響到公司融資估值。從傳統互聯網的最初階段開始,用戶註冊數、排名關註度,電商的銷售額、訂單數、轉化率、增長率等數據指標就成為衡量一家公司業務模式的健康程度與盈利模式的想象空間的基礎衡量指標,在移動互聯網時代,APP下載量與日活、打開率、存留率、交易量等成為核心指標,它們依賴這些指標來吸引投資,拉廣告,創造更高的收購價碼,而傳統互聯網時代,用戶註冊數,點擊率可以交給水軍,移動互聯網時代,無論是點擊率與或者APP排名本身也可以依賴水軍或者第三方刷單公司與服務方來做。可以說,互聯網企業造假與互聯網本身的基因即盈利模式與增長模式也息息相關。這是其一。

其二,部分創業公司需要誇大數據方便融資給投資人想象空間。近年來,互聯網創業大潮之下,眾多創業投資機構、孵化機構紛紛湧現,互聯網領域的創業全民關註生機勃勃。風投與投資機構對互聯網領域創業尤為青睞,從創業者角度來看,數據誇大之後,方便其更有利的融資,拉升上市的估值,被巨頭收購或者入股,相對來說數據是最有說服力的,這是拿錢有利的籌碼。但與此同時,當投資人也陷入到這個遊戲之中之後,基於本身的利益需求,方便創始人拉升估值並推動更多融資繼續燒錢,也方便自身在利益高點順利退出,投資人對數據造假也會睜一只眼閉一只眼。因為投資人也是往往或被動或主動的成為數據造假利益鏈當中的一環。

其次是互聯網企業的考核機制。在互聯網公司,基礎的KPI考核指標均需要運營數據來量化。企業內部的不同團隊、甚至一個團隊不同成員之間基於各自的利益訴求,一旦達不成需要實現的預期量化目標,就會開始在執行過程中嘗試貓膩的手法,比如部門之間、跨部門協作或者與第三方合作方之間均會涉及到彼此共同的KPI指標,在同一利益鏈上,互成默契對數據修飾與擴大將成為可能,與合作方一起結合第三方數據造假行為開始成為行業內默認的潛規則,數據註水往往也開始發展成為地下產業鏈的一環。不過前面提到,部分又涉及數據篡改的技術含量。總而言之,互聯網行業數據作假,線下用托,線上則可以用代碼等技術並於第三方數據機構以及使用傳播稿多線運作,其中少有漏洞,如部分網友所說,這相對體現了互聯網的“先進性”。第三方數據機構往往也可能被質疑為權力尋租的工具,比如去年底艾瑞與今日頭條的互撕。

一種就是巨頭之間的對抗賽,百度地圖與高德地圖的數據之爭就屬於這種情況。高德地圖並入阿里之後一直固守基礎功能,並砍掉原有的O2O業務,宣布"專註於地圖導航"。然而在2015年6月,高德地圖似乎是不願讓百度一騎絕塵將自己甩得太遠,也開始切入O2O領域。高德在這一年里在路線主義上反複糾結,團隊內部也倍感煎熬。而被收購的互聯網公司通過數據修飾大致也有幾重意圖,首先通過來避免在巨頭羽翼與架構中被邊緣化,同時可以獲取更多資源支持與資金輸血,隨著在線地圖愈加演變成用戶級市場上的征戰,用戶數成為重要流量渠道與O2O入口重要指標,否則難逃在諸多業務架構下的邊緣化宿命。

數據造假影響用戶認知:影響用戶、投資人對企業誠信評估與信任價值

數據造假受害者當然是用戶。用戶往往也會看企業的數據做出決策,也有著很強的從眾心理,比如在電商平臺,一旦公布成交規模,往往會影響用戶的購物意向,刺激用戶轉向該平臺消費,因此某種程度上,數據影響了用戶的判斷。當通過用數據不斷、日複一日的灌輸,消費者也會逐步認同這種認知,這也是洗腦的過程。而造假被揭露之後,必然也會面臨系列的業界質疑與投資人對企業的價值的重估,也影響用戶對企業誠信評估與信任價值。也將促使整個VC圈對於互聯網成長企業有更加全面的評判標準。互聯網行業操作數據、影響用戶判斷讓其利益受損的行為時而發生,這也與行業的惡性競爭相關,目前來看,互聯網各個領域的格局相對已經固化,新入局者很難出頭,人口紅利趨於用盡。全行業進入了目標市場相對成熟與有限增長空間爭奪戰的時候,市場競爭也越來越趨向陷入低水平的重複競爭與數據戰。

一旦當個別性的造假演變為集體性的造假,顯然不利於整個行業生態的健康運行。也催生了整個行業的泡沫。早前賽富亞洲投資基金首席合夥人閻焱就在一次論壇上吐槽表示,互聯網行業中間有大量的泡沫。我們所碰到的情況,就是創業企業在點擊率、在用戶數轉化率等數據方面全面造假,而且造假誇大已經成為中國互聯網常態。

避免數據誇大成互聯網常態:需中間態的機制來推動數據監測機構與企業達成制衡

關於如何杜絕數據造假,在目前可能是一大行業性的難題。有業內人士認為,讓會計師事務所介入到互聯網企業的數據服務可能更嚴謹一些,但無論是會計事務所的介入終究也是服務於企業,其中權力的尋租空間必然極大,所以由企業擔任的第三方機構的可靠性與第三方數據機構本質上並沒有什麽不同。有新的集團介入,必然會有新的服務於數據的產業鏈出現。

而政府的介入會呢?比如有消息指出,此前北京工商局就通過行政建議書等形式公布第三方商家售假信息,在各電商平臺之間建立起針對第三方商家的資質和信用管理體系。因為互聯網平臺本身缺乏信用認證體系,而許多平臺往往存在著多種數據操作手法與模糊的演算規則,在這種規則下,數據迷霧重重真假難辨,某種程度上說,企業數據造假到了互聯網公司,本質未變,但只是手段變了。但第三方尤其是有政府背書的權威第三方的認證是否能真正保持獨立真實也難說,因為缺乏監控與制衡機制,難免會產生灰色地帶與權力尋租空間,也有業內人士表示,對於如何判斷數據真假,通過綜合分發渠道,以某兩個渠道來反推他的新增和日活,也是一種相對有效的方式。總的來說,需要一種機制來推動數據監測機構與平臺企業達成制衡,也只有在第三方數據監控方與平臺之間的制衡才有可能監測企業發展過程中的一些真實有效的數據,給用戶正確的認知。

互聯網行業的“花剌子模信使”:掩飾不了用戶對劣質產品最真實的直覺

數據的修飾掩蓋不了業務發展本身的規律與產品功底的匱乏,許多VC也已經醒過來。互聯網數據造假難保不會推動新一輪泡沫與資本寒冬的助推手,這相對降低了投資者對行業的信任指數。許多投資人捂緊錢包,燒錢逐漸變少,對行業來講也有益無害,因為泡沫適度有利於行業熱度降溫,它讓行業回歸理性讓資本非理性熱捧的獨角獸回歸正常估值。數據的故事還可以繼續講,而摻水的運營和財務數據披露被曝光之後的負效應將會持續放大,對業務與品牌帶來沈重的打擊,並削弱整個公司的信任價值。

王小波當年在《花剌子模信使問題》一文中寫道:中亞古國花剌子模有一古怪的風俗,凡是給君王帶來好消息的信使,就會得到提升,給君王帶來壞消息的人則會被送去餵老虎。於是將帥出征在外,凡麾下將士有功,就派他們給君王送好消息,以使他們得到提升;有罪,則派去送壞消息,順便給國王的老虎送去食物。王小波在這里說的是,中國的近現代學者里,做“好消息信使”的人很多,尤其是人文學者。但對應到當下的互聯網行業亦然。他們認為,只要殺死帶來壞消息的人,壞消息就不複存在。很顯然,鴕鳥把頭埋進沙堆,獅子照樣會朝自己撲來,皇帝的新裝一旦被戳破,數據遊戲帶來的則是自欺欺人之後無法掩飾的尷尬與行業公信力的盡失,更重要的是,數據始終掩飾不了用戶對劣質產品體驗那種最真實的直覺。