導讀 : 新三板第一家掛牌的大數據公司數據堂,在成立之初就決定做難做的“苦活”,在它采集了5年的線下數據之後,形成了一個數據壁壘。

i黑馬 田牧 11月27日報道

大數據企業首家掛牌新三板

數據堂創始人齊紅威在出來創業之前,他的身份是日本電氣公司(NEC)中國研究院研發部部長。在他近十年的數據應用和分析中,一直需要解決的問題是四處去找數據。所以當齊紅威2011年帶著他在NEC的核心班底決定創業的時候,就選擇要去做一個數據源的平臺。

為什麽不繼續做他們一直從事的數據應用解決方案?齊紅威的考量是,數據應用直到今日也沒有一個統一的行業標準,在2011年時更是只能根據客戶的需求不斷變化。“做數據應用很難做到標準化……最終(做)數據應用肯定是一堆的企業。”齊紅威說。

“數據應用很難標準化,並不代表數據不好標準化。”齊紅威把數據源比作石油,石油在成為各種形式的化工品之前是有統一標準存在的 。而在油田資源領域,最大的只有中石油、中石化幾家。齊紅威把數據源領域當做一片還無人開采的油田,在他的設想中,數據堂要成為這片油田里的中石化。

至少到目前為止,數據堂在這片油田跑在別人前面。2014年12月10日,數據堂正式在新三板上市,成為中國大數據交易及服務行業第一家掛牌新三板的企業。2015年11月6日,數據堂完成2.4億的B輪融資,其估值超過20億元人民幣。

與石化行業的生產模式類似,數據堂的業務模塊分為三部分:數據源采集加工(擁有超過46萬人的眾客堂數據采集平臺)、數據在線交易(國內首家數據電商平臺DataMall)和數據雲服務(為移動應用提供數據API接口服務的數+)。

眾包模式做數據采集

對於數據本身,齊紅威自己把繁雜的數據分為四類。第一類是在現實中沒有現成數據,而需要去采集的純線下數據;第二類是企業在主營業務中,產生的大量行業數據;第三類是在網絡中產生的大量數據,稱為互聯網數據;第四類是政府數據。

數據堂主要關註的是純線下數據和行業數據。齊紅威認為,雖然互聯網數據的規模很大,但是里面無用的信息也很大,同時內容又很單一。在對事物進行分析的時候,單靠線上數據很難完成。而線下數據收集起來很難,需要花費大量的人工、時間和資本才能從無到有,完成一定量的積累,但齊紅威認為這正是線下數據的價值。“越好做的事情,它的價值就不高。越難的事情你做成了,價值很高。”

數據堂在2011年成立之初就建立了眾客堂的眾包模式,以任務的形式把需要采集的數據分發給兼職的大學生等等。從無到有,如今眾客堂已擁有超過46萬眾包客,其中更多的也不再是學生,而是以專業采集數據的團隊為主,向數據堂提供數據源。

采集完的數據經過數據堂的加工後,變為一類標準的數據放在DataMall上售賣。而標準也是在某一類數據或指標上的局部標準,齊紅威表示,目前整個數據應用層面的行業標準還未建立,這是制約數據行業發展的一個主要因素。

政府的數據在開放

另一個制約數據行業發展的是政府層面對數據行業的政策。政府擁有大量優質的數據,但其開放程度很低。“2011-2013年,甚至2014的上半年,政府開房數據的速度其實一直是非常慢的……我們去找政府相關部門談數據的時候,大家根本沒有任何意願或者方式去開放這個數據。”齊紅威說。

但從2014年下半年開始,政府對數據的開放程度前所未有。2015年初,國務院下發《關於促進雲計算創新發展培育信息產業新業態的意見》,提出要加強大數據開發和利用,充分發揮雲計算、大數據在智慧城市建設中的服務支撐作用。

7月31日,工信部信息化和軟件服務業司組織召開了大數據產業“十三五”發展規劃編制第一次工作會議。

9月,國務院印發《促進大數據發展行動綱要》,其中重點提出要大力推動政府信息系統和公共數據互聯開放共享,加快政府信息平臺整合,消除信息孤島,推進數據資源向社會開放。

這對數據堂自然是一件政策利好的事情。雖然齊紅威認為政府數據開放的速度不會那麽快,具體實施的細節還有待落地,但數據堂已經和一些政府部門合作也獲得了一些數據。

具有典型性的則是數據堂在11月,即將要聯合青島即墨市政府,一同發布即墨市政府大數據公共服務平臺。在這個平臺中,即墨市政府負責政府大數據開放的保障,數據堂負責平臺的數據運營服務。

2014年,數據堂的營業收入達到1837萬。齊紅威預計,2015年數據堂的收入將超過8000萬。這對於未來萬億級大數據行業的規模來說還只是開始,但齊紅威信心滿滿,認為數據堂早行業3年的先發優勢將讓數據堂在此後的競爭中占據主動