導讀 : 隨著微信公眾平臺的崛起和在網紅以及草根營銷者當中炙手可熱的發展,伴隨著微信公眾平臺衍生出的第三方數據監測平臺也應運而生。

文/吳偉(微信ID:wuwei88-00)

曾幾何時,大數據這個詞闖入了互聯網人群的眼中,並迅速成為了高逼格人群交談必備詞匯。但慢慢大多數人認識到大數據的真實反饋之後,就不再對其神秘保持新鮮和艷羨,甚至接地氣務實的從業者從來不拽詞裝高端。

本人今天要說到的是微信大數據分析,隨著微信公眾平臺的崛起和在網紅以及草根營銷者當中炙手可熱的發展,伴隨著微信公眾平臺衍生出的第三方數據監測平臺也應運而生。由於微信向來是比較封閉的,重視圈子的概念,不像微博的媒體廣泛傳播屬性那麽強,所以一開始接觸微信的人大多不了解其中的門道,這也就促成了第三方數據監測平臺的可依賴性。

因為大家都不懂嘛,你的數據只要大部分還算合理,不合理的地方有合理的解釋,那麽大家都會買賬,口耳相傳。

在此列舉三個比較早期,在行業內排名靠前的數據監測平臺:新媒體排行榜、新媒體指數、微指數。最早出現的是新媒體排行榜(以下簡稱新榜),也是最早在公眾號榜單和文章榜單上確定地位的,那個時候還沒有搜狗的微信搜索,而誕生的公眾號數量也還比較少,那是一個你想要關註一個高質量賬號卻不知道如何去尋找的年代,不像現在,關註過度飽和,內容過度充斥。

新榜監測的公眾號數據僅僅十幾萬(現在樣本數已超過20萬),但是公眾號的數量現在已在兩千萬左右(具體多少我也不清楚,請勿擡杠),樣本數量其實是蠻低的,但由於新榜出現較早,且自身監測算法也已更新數次,數據慢慢趨向於真實準確數值。

數據分析自然需要數字來衡量和比較,為此新榜發布了一個自家的指數——新榜指數(New Rank Index,NRI),該指數是由新媒體排行榜(newrank.cn)基於海量數據、用戶深度反饋及專家建議而推出,用於衡量中國移動互聯網渠道新媒體(主要指兩微一端)的傳播能力,此指數反映該新媒體主體的熱度和發展趨勢。

新榜指數是由原始數據參照基數通過計算公式推導出來的標量數值,用以衡量原始數據在其所屬維度的相對表現。在此需要指出,新榜指數是為所有賬號提供了一個參照系,如果想要不同賬號之間進行比較,那就需要一個嚴格的前提——參照系穩定。

只有參照系穩定,比較才是有意義的。而這個參照系的穩定來源於長期的對於參照系內所有賬號進行觀察和考量,但是樣本數量20萬的參照系是否具有參照性呢?答案並不是肯定的,那麽如何解決這一問題?參考微信官方的數據參照系,微信官方的數據統計是基於平臺所有賬號(無效賬號除外)的數據分析,這個數據自然是最具有參照標準的,比如公眾號的閱讀轉化率平均在8%-10%,劣質賬號低於此區間,超優質賬號高於此區間。

這個區間值比較重要,後面說到的相關內容還會用到。

不管你們能不能看得懂,在此先展示一下新榜指數NRI3.0版本吧,以下數據算法解釋來自於新榜:

1、選定指標

在微信的計算中,為兼顧其數量與質量,我們使用總閱讀數、最高閱讀數、平均閱讀數、頭條閱讀數、總點贊數五個指標來對賬號進行評估,其中:

整體指標(總閱讀數,R):指統計周期內所有發布內容的閱讀數總和;

優異指標(最高閱讀,Rm):是指統計周期內所有發布內容中的單篇最高閱讀數;

質量指標(平均閱讀數,Ra ):統計周期內所有發布內容的閱讀數平均值;

主動預判指標(頭條閱讀,Rh  ):統計周期內位置為頭條的內容的閱讀總數;

互動指標(總點贊數,Z):統計周期內所有發布內容的點贊數總和。

2、指標標準化

基於不同維度指標的差異性,我們首先將所得數據標準化,即通過對各維度原始數據與該維度常數的比值計算,得到該樣本各項指標的千分化數值。

在新榜指數中,以天為最小計算周期,將常規(1天推送一次,每次最多8篇)的公眾號為對象在這一時間段內總閱讀數、最高閱讀數、平均閱讀數、頭條閱讀數和點贊數共五個指標的常數分別記為:

在不同的時間周期,即日、周、月、年(n=1,7,30,365)下,以上常數具體數值為:

在此基礎上,各指標按以下公式進行標準化:

註:此處“+1”是為了避免出現類似“ 0 閱讀”時而產生無效值。

指標加權

由於此五項數據影響微信傳播能力的程度不同,我們賦予不同的權重,分別記為 ωR , ωRm , ωRa , ωRh , ωZ 。

最終,新榜指數的計算公式表述為: 

目前,新榜使用的系數為  ωR =0.75, ωRm =0.05, ωRa =0.1, ωRh =0.05, ωZ =0.05。

而另外一家,新媒體指數也出臺了一套自己的指數標準,叫WCI,中文名字:微信傳播指數;英文:wechat communication index。給出的解釋是由微信原始數據通過一系列複雜嚴謹計算公式推導出來的標量數值,至於新媒體指數的樣本數量嘛,本人沒有深入考究,這都不重要,重要的在後面。

那麽這個WCI又有什麽用呢?WCI指數可以全面反映出微信公眾號推送文章的傳播度、覆蓋度及公號的成熟度和影響力,從而反映出微信整體熱度和公眾號的發展走勢。

而WCI指數又是怎麽算出來的呢?WCI用最高閱讀數、日均閱讀數、篇均閱讀數、日均點贊數、篇均點贊數和最高點贊數六個指標對微信賬號進行評估。

同樣的,考慮到各指標在反映傳播能力方面存在差異,新媒體指數也賦予了6個指標不同的權重,最終的計算公式如下:

相對具有行業代表性的,第三家公司微指數,算是起步比較晚的,但是號稱可同時監控1000萬公眾號,請註意這里的說法是可以同時監控,並沒有說每天會去更新1000萬公眾號的數據,稍微懂點技術的人都知道,一個創業公司如果運行這麽大數據的話服務器成本得有多高,樣本數量請自行猜測,這里不便透露。

而微指數對於賬號質量的監控指標是:7天平均閱讀、7天平均點贊、每天發布條數、有效累計粉絲、有效日活粉絲。除了最後兩個因素,其他都是毫無技術含量即可獲取到的數據指標,跟前面介紹的兩家其實並無不同,只不過新榜和新媒體指數在這些人人肉眼能夠看到的數字上加入了人為幹預系數,使之更加趨向於真實數值。

微指數呢,則是提出有效累計粉絲的概念來有理有據的告訴消費者我說的是對的,你不需要懷疑。為什麽呢?因為我這個概念不是說賬號真實的粉絲數啊,而是有效累計粉絲。

這個概念值是怎麽來的呢?是這樣的,前面我提到過一個公眾號的閱讀轉化率平均在8%-10%區間,那好,閱讀數不是都能看得到嗎,而且我還可以做出平均值來,甚至我可以說我去除了刷量帶來的虛假閱讀,有效累計粉絲的值就是根據閱讀數倒推來的。

你不信嗎?如果你真實的粉絲比我展示的數字高,那麽我可以告訴你高出來的那些是僵屍粉,你無法反駁,而我根據微信官方平均轉化區間倒推出來的數字絕對不會有錯,當然其中也加了一些權重,跟新榜、新媒體指數的權重添加類似。

同樣概念,新榜也在去年末的時候推出,但是面臨的同樣的問題是預估粉絲跟賬號真實粉絲差距太大,差距的縮小只好拿加權重來平衡和消除。

看到這里,不管你對前面列舉的公式懂沒懂,相信對於所謂的微信大數據概念有了些許的認知了吧,微信公眾號遠沒有你們想象的那麽封閉和神秘,很多數據都是可以通過第三方手段進行抓取,並且整合分析,進而得出相應的合乎常理的解釋或者榜單數據來。

自從閱讀數出現之後,微信的很多數據就出現在了人們的眼中,當然隨之而來的另一個弊端就是刷量平臺應運而生,很多賬號存在閱讀量造假的問題,但是閱讀量造假這事兒目前來說還沒有平臺監測可以做到,因為服務器成本太高,且並無多大意義,本身互聯網的水就很深,所有內幕大白於天下終歸是不好的。

所有第三方平臺說可以監測到任何賬號閱讀量造假的說法都是吹牛逼,因為目前第三方監測平臺判定一篇文章閱讀量是否真實的依據依然是對比近期平均閱讀的浮動,而這是可以通過刷不同文章的閱讀進行模擬真實閱讀的。

微信公眾號後臺現在也出了文章閱讀的來源來規避刷閱讀量的現象,但是就在公眾號後臺升級顯示閱讀來源的第二天,某刷量平臺就出現了應對措施,可以刷來源於不同渠道的閱讀數,真是道高一尺魔高一丈。

對於第三方平臺,通過獲取微信公眾號的部分數據分析整合號稱大數據實屬過分吹噓,就連搜狗作為微信的合作夥伴都拿不到所有的微信接口,而你第三方平臺僅僅是抓取了用戶眼見的數據指標就敢號稱微信大數據?我看你們所謂的大數據不過是大概的數據吧~

另外,透露一下,真正能夠監測到閱讀量造假的技術是將監測閱讀數的時間無限細分,時間段無限取中位數,最後描繪出較長時間周期內的閱讀走勢。而這樣以來會大大增加服務器的成本,刷閱讀量的服務器成本是遠遠低於監測成本的,所以有水分的互聯網還是不要太過吹毛求疵的好,睜一只眼閉一只眼,你高興我也自在。

總體來說呢,說到微信大數據分析,不過是可見數據的統計學展示,至於粉絲用戶人群畫像以及行為習慣等因素,已現有的監測手段和接口開放程度來說是根本不可能的,如果有哪一方宣稱可以制作人群畫像,那也不過是基於手機型號大概推測用戶購買力,用戶地區分布進行區域劃分,男女性別比例進行行業領域對應等等,而相對較聰明的做法是將公眾號對應的微博賬號粉絲進行人群畫像分析,同樣的結合部分可見數據加權處理,模擬出大概的人群畫像,如果不準確,那就多加幾個維度往最準確的人群畫像進行靠攏。

而用戶,尤其是廣告主,需要知道也無非就是賬號的有效累計粉絲,日活躍粉絲以及平均閱讀數或者頭條平均閱讀數,至於更垂直更嚴苛的要求對於廣告投放來說還不是太需要,相比之前公關公司只給到粉絲數和廣告報價來說,現有的第三方監測已經做得稍微好一點了,但是別以為做到這樣就是準確的大數據,還僅僅是大概數據而已,謹以此文告誡公關公司和廣告主們,不要對第三方公司的所謂大數據過分信賴,那也只不過是服務器幫助人做了計數平均取值的活兒而已。

而這種數據服務加到具體的自媒體大號報價里面那可就是你該掏錢的了,具體利潤值多少在此就不便細說了,行業內不同公關公司報價是不一樣的,基於創意策劃的附加值服務加錢合情合理,但這種數據服務如果加價過高只能就有點太一勞永逸了。