📖 ZKIZ Archives


《大數據時代的歷史機遇》 引子 趙國棟

http://xueqiu.com/2594854241/23869927
大數據總統奧巴馬

2012年8月份,美國總統大選正如火如荼。出人意料的是,奧巴馬總統的數據團隊要求他去一家叫Reddit的新聞網站去回答問題。對許多人來講,Reddit是一個陌生的名字,總統的高級助手們也不例外。但是來自數據團隊的回答卻非常簡單:「因為我們需要動員的一些人,經常在Reddit上。」

這僅僅是選戰過程中一件毫不起眼的數據決策案例。事實上,奧巴馬的數據團隊非常神秘,低調,但其觸角又無處不在,幾乎左右了整個大選,他們被內部人士戲稱為「核編碼」。他們創建了單一的巨大系統,可以從民調專家、籌款人、選戰一線員工、消費者數據庫、以及「搖擺州」民主黨主要選民檔案的社會化媒體聯繫人與手機聯繫人那裡得到的所有數據都聚合到一塊。這個組合起來的巨大數據庫令奧巴馬的數據團隊工作極富成效,令人驚嘆[1]。在這個組合的數據庫中,每個選民甚至被精確的劃分為1000多個特點,通過建模和算法分析,系統能為每個選民找出一個最能說服他的理由;每晚進行6.6萬次模擬選舉,在個體水平上,計算出奧巴馬在任何一個搖擺州的勝率。事實上不僅如此:

他們建立模型能夠預測誰會在線捐款;

他們用來網上籌款的郵件,也充分利用了數據收集和分析。

他們借助模型幫助奧巴馬籌集到創紀錄的10億美元;

他們幫助優化電視精準投放廣告的模式;

他們創造出了搖擺州選民的精細模型;

他們計算出第一夫人發的拉票郵件在春天最受歡迎;

他們利用數據來詳細分析關鍵州的選民。深入分析各個族群的選民在任何時刻的趨勢。在總統候選人的第一次辯論之後,他們分析出哪些選民倒戈,哪些沒有;

他們利用熟人效應,開發Facebook APP拉票;

他們為競選團隊購買廣告提供決策參考;

他們通過一些複雜的模型來精準定位不同選民,他們購買了一些冷門節目的廣告時段,而沒有採用在本地新聞時段購買廣告的傳統做法。廣告效率相比2008年提高了14%;

他們導致經驗主義的競選專家的作用極具下降,能夠分析大數據的量化分析專家和程序員的地位卻大幅提升。

他們讓政客們,尤其是對手知道政治領域的大數據時代已經到來。

一瓶茅台酒的旅程

消費者最頭疼的恐怕還不是茅台酒的價格,而是能否買到貨真價實的茅台。道高一尺魔高一丈,茅檯曆來的防假手段,除了推高茅台酒瓶的回收價格以外,似乎並沒有真正讓消費者放心。

為每一瓶茅台建立「檔案」,消費者可以輕鬆方便的查詢到任何一瓶茅台酒的檔案材料,是防假的終極解決之道。每一瓶酒都有一個獨立的「身份證號」,銘刻到酒瓶上,在信息系統中,記錄下從灌裝到出廠、運輸、批發、零售所有環節的信息。人們只要把「身份證號」傳輸到網站一查,真偽立辯。這個辦法看起來容易,但是真正實施,我們立刻會被淹沒在大量的數據之中。

不僅僅是茅台,中國目前所有食品面臨「安全、衛生」的大難題。如果能把茅台酒的做法推而廣之,無疑是全民之福。但是這些海量的數據記錄,對傳統的信息處理技術,提出了巨大的挑戰。

茅台的故事,其實可以演繹出管理理念的變化。這是管理日益精細化的具體體現。原來「茅台們」的管理都是按照生產批次,通常認為同一個生產批次的產品,是沒有差別的。現在的管理理念則不同,要求對每一件單品實行差別化管理。

城市治理中,也在發生同樣的事情。小到每一個下水道井蓋都被仔細編號,追蹤。這當然另我們的生活更加便利,但產業界首先需要應對的則是大數據的挑戰。



大數據,事關國計民生、產業興衰、公司存亡,不可不察。

信息科技經過60餘年的發展,數據(信息)已經滲透到國家治理、國民經濟運行的方方面面。經濟活動中很大一部分都與數據的創造、傳輸、和使用有關。2012年3月份,奧巴馬公佈了美國「大數據發展計劃[1]」,標誌大數據已經成為國家戰略,上升為國家意志。國家競爭力將部分體現為一國擁有數據的規模、活性以及解釋、運用數據的能力;國家數字主權[2]體現對數據的佔有和控制。數字主權將是繼邊防、海防、空防之後,另一個大國博弈的空間[3]。沒有數據安全,也就沒有國家安全。

華為、中興開拓美國市場受挫,就是非常明顯和清晰的信號。美國政府對自家數據安全的重視程度,已經到了不能讓任何外國信息基礎設施產品供應商染指的地步。華為此前一直希望通過競標和併購等方式進入北美市場,多年來未能如願。2008年,華為與貝恩資本聯合競購3COM公司,卻因美國政府阻撓未能成行;2011年,華為被迫接受美國外國投資委員會的建議,撤銷收購3Leaf公司特殊資產的申請;同樣是在2011年,美國商務部阻止華為參與國家應急網絡項目招標。

再看看美國國防部立項的幾個大數據項目[4]:「多尺度異常檢測(ADAMS)項目解決大規模數據集的異常檢測和特徵識別的問題。網絡內部威脅(CINDER)計劃,旨在開發新的方法來檢測軍事計算機網絡與網絡間諜活動,提高對網絡威脅檢測的精準度、和速度。Insight計劃主要解決目前情報,監視和偵察系統的不足,進行網絡威脅的自動識別和非常規的戰爭行為。……(不一一列舉,參見附錄)」其他部門包括國土安全部、能源部、衛生和人類服務部、國家航天總局、美國國家科學基金會、美國國家安全局、美國地質調查局紛紛推出大數據項目。奧巴馬指出:「通過提高我們從大型複雜的數據集中提取知識和觀點的能力,加快科學與工程前進步伐,改變教學研究,加強國家安全。」

產業層面,大數據技術雖然發源於信息科技,但其影響已經遠遠超出信息行業。數據已經存在於全球經濟中的每一個部門,就如固定資產和人力資本等生產要素一樣,如果沒有它許多現代經濟活動就不會發生。我們觀察到一些新興的互聯網公司,利用新技術,大規模地收集數據,預判客戶行為,然後在不同的行業縱橫捭闔。他們劍鋒所指,現代服務業無不受其鋒芒所迫,或隨波逐流,或奮起反擊。但缺少數據資產、缺少強大的數據分析能力,這類公司無疑處在被顛覆的邊緣。另一方面,也看到傳統行業的公司,數十年如一日的堅持積累當時被視作「廢料」的數據,現在回頭審視這些數字化的資產,居然一躍成為人類的寶庫。憑藉獨一無二的「數據資產[5]」,公司進入相關行業,易如反掌。

我們回頭審視產業的起起伏伏,就會發現決定產業興衰的根本性因素,已經不是一城一地的爭奪。土地、人力、技術、資本這些傳統的生產要素,甚至需要追隨「數據資產」重新進行優化配置。封建時代,往往是裂土封王,權貴都是大地主;工業革命後,製造業鉅子,成為偶像;資本市場,受到追捧的是擁有大量錢財的投資家;但是在大數據時代,「數據資產」成為最重要的生產要素。擁有大量數據資產的人,已經成為美國總統的座上賓[6]。

產業的分分合合,一直是資本市場非常喜歡的故事。不管是分拆也好,整合也罷,資本市場都有錢賺。以往產業的整合基本圍繞產業鏈展開。要麼向上游擴展,要麼向下游兼併。但是在大數據時代,我們看到的商業圖景是圍繞「數據資產」拉開產業併購的大幕。谷歌所有的收購或者推出的新產品,都是為了增加數據資產的「維度」和「活性」[7]。所有觀察公司發展,產業未來的機構或者個人,如果忽略「數據資產」,或者對「數據資產」認知膚淺,必將導致錯誤的判斷。大數據將是決定產業未來的戰略性資產。未來產業間的整合收購,將會在很大程度上圍繞「數據資產」展開爭奪。

企業家、投資人、諮詢顧問、分析師,必須要從戰略層面思考大數據對產業、對公司的影響。2012年初,我們曾經和恆安國際的董事會一道交流大數據對製造業的影響。會上許連捷總裁[8]說:「在大數據時代我們收集數據,研究消費者行為,推出新的產品、改善供應鏈,降低庫存,一句話就是把大數據融入到經營中去。也許有可能把庫存降到近乎『零』的水平。」所以,我們談大數據,首先是思維方式的問題,要建立全面、系統的大數據意識,其次才是落實到公司戰略。大數據對公司的影響是多方面的,涉及組織、文化、流程、技術等。本書有一章來專門詳細論述大數據對公司組織結構的影響,在此不贅言。

具體到中國信息產業,發展速度一直落後於國外的巨頭,長期處在產業鏈的末端,賺取刀片一樣的利潤。積累到最後發覺只形成了簡單可替代的「中國製造」而非具備革命性創新性的「中國智造」。國家拿出大筆資金扶持上游環節的拓荒者,比如CPU、操作系統、辦公軟件,但是相關領域國內外的差距過於遙遠,也缺少大規模的商用市場,花了國家的錢,卻鮮有在商業上大獲成功的先例。但是在新興的大數據處理領域,中外公司幾乎站在同一起跑線。中國作為數據的巨大產生國,有著更廣闊的應用空間。比如中國移動、工商銀行、淘寶,已經具備世界級的產業應用環境。有業內人士表示,單純考慮狹義的大數據處理技術(如Hadoop、MapReduce、模式識別、機器學習等),中外差距僅有5年左右。如果考慮數字資產規模以及利用的技術,中外差距更多體現為意識上的差距。美國在數據開放、跨部門共享方面做出了表率。而我國對大數據的價值和應用,政府、學術界、產業界和資本市場尚待達成一致的認知。各部門、各地方普遍存在「數據割據」和「數據孤島」的現象。缺乏大數據意識,是阻礙我國大數據技術在各行業落地的關鍵因素。

大數據時代,有兩點非常有利於中國信息產業跨越式發展。第一,大數據技術以開源為主,迄今為止,尚未形成絕對技術壟斷。即便是IBM、甲骨文等行業巨擘,也同樣是集成了開源技術,和本公司原有產品更好地結合而已。開源技術對任何一個國家都是開放的,中國公司同樣可以分享開源的蛋糕。但是需要更加開放的心態,更加開明的思想,正確的對待開源社區。第二,中國人口和經濟規模,決定中國的數據資產規模,冠於全球。客觀上為大數據技術的發展,提供了演練場。第二點亟待政府、學術界、產業界、資本市場四方通力合作,在確保國家數據安全的前提下,最大程度地開放數據資產,促進數據關聯應用,釋放大數據的大價值。

目前政府和產業界積累了大量的數據資產,但是苦於缺乏行之有效的與工程實踐匹配的算法和人才,來充分挖掘數據的價值。形象地說,好多行業是守著「金山要飯吃」。而學術界,尤其是應用數學領域,在統計學習、圖像處理、網絡科學領域鑽研頗深,但缺乏大量的實際的數據來驗證和訓練算法。雖有屠龍術,無處展身手。兩方長期處於脫節的狀態。如果應用數學界和產業界緊密協作,將是中國公司的極大利好,會大大促進公司的發展。2012年11月17日,在北京大學國際數學研究中心召開了首屆「數據科學與信息產業研討會」。學術界和企業界的一百多位領軍人物和活躍分子聚集在一起,共同商討數據科學的含義和發展計劃,以及企業界的需求。這次會議為促進學術界和信息產業的聯合,開了一個好頭。

數據資產並不是大公司才有的專利。在第七章中詳細討論一種「泛互聯網化範式」,終端+平台+應用,最後形成數據資產。許許多多富有活力的公司,均符合這一範式。這也是創業型公司開啟大數據之路的總結和探索。

自從我們在中國資本市場第一個發出「大數據時代即將到來」聲音後,大數據已經成為年度熱詞。綜合政府、學術界、產業界的最新動向,我們預計,如果把2012年看成大數據普及之年,那麼2013年,將成為大數據應用之年。相關產業規劃、行業政策將紛紛出台。金融、電信、政府、電商、醫療、平安城市等相關應用將加速推進。2014到2016年將是大數據效益之年,若干中國大數據公司相關業務形成爆發性增長,部分相關公司海內外融資或IPO上市。

本書內容將圍繞大數據對產業走勢、融合、變遷的影響、在產業中的具體應用(商業模式)、以及數據科學的興起三大主題展開。本章包括大數據產生的歷史背景、激動人心的典型特徵、系統全面的認知框架等等內容,最後會簡略談談推廣大數據面臨的困難和挑戰。


[1] 《大數據研究與發展計劃原文》地址:http://www.whitehouse.gov/blog/2012/03/29/big-data-big-deal,中文譯稿參見本書附錄四

[2] 通過搜索引擎,並未發現其他文獻強調「數字主權」。之所以採用「數字主權」,而非「數據主權」,主要因為構成信息科技的基礎是「0」、「1」兩個二進制的數字。所有的數據在本質上都是「0」、「1」的排列組合。

[3] 參見國金證券大數據系列報告第三篇《以數據資產為核心的商業模式》,p1

[4] 原文參見:http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_fact_sheet_final_1.pdf

[5] 數據成為資產,見於國金證券大數據系列研究報告《大數據時代的三大發展趨勢及投資方向》

[6] 美國總統奧巴馬2011年2月17日與多名科技界領袖共進晚餐。總統左側是蘋果公司創始人斯蒂夫·喬布斯,右側是Facebook的創始人馬克·卡克伯格。

[7]維度、活性等概念在數據資產章節詳細說明,是數據資產評估模型的一部分。

[8] 許連捷現任中國民間商會副會長,泉州市工商聯主席,第十屆全國工商聯副主席。

[1] 英文原文參見CNN網站http://edition.cnn.com/2012/11/07/tech/web/obama-campaign-tech-team,下面這段文字見於博客http://blog.sina.com.cn/s/blog_5be3027d0101i44z.html
PermaLink: https://articles.zkiz.com/?id=55530

《大數據時代的歷史機遇》1.5 大數據面臨的挑戰和機遇 趙國棟

http://xueqiu.com/2594854241/23965263
大數據概念剛剛提出,有人擊節讚歎,認為「數據人」的春天到了,也有人質疑為炒作,認為不過是業界和資本市場又一次發神經而已;但更多的人是茫然的,並不知道這個概念對自己的業務意味著什麼。本節主要澄清一些概念和誤讀,探討大數據落地存在的障礙。

重新審視「自主版權」

大數據時代,產業重心發生了遷移。信息產業的重心由基礎軟件嚮應用軟件過渡,信息技術本身的重要性向數據資產的重要性過渡。而應用軟件領域,恰恰是中國軟件企業的強項。利用好開源的基礎軟件,實現在應用軟件領域的突破,帶動基礎軟件領域的進步,是中國信息產業的發展方向。

「智慧出,有大偽」。多少人假「自主版權」之名,卻從未超越開源軟件的功能?信息產業的創新,是亦步亦趨麼?微軟有操作系統,我們就必須搞「自主版權」的操作系統?多年的撥款,支持「創新」,為我國信息產業技術提升帶來哪些進步呢?幸而我們有一個華為,看看華為老闆任正非怎麼說。

2012 年7 月份,任正非與華為實驗室的幹部和專家座談。有人問:「當前在終端OS領域,Android、iOS、Windows Phone 8 三足鼎立,形成了各自的生態圈,留給其他終端OS 的機會窗已經很小,請問公司對終端操作系統有何期望和要求?」

「如果說這三個操作系統都給華為一個平等權利,那我們的操作系統是不需要的。為什麼不可以用別人的優勢呢?微軟的總裁、思科的CEO 和我聊天的時候,他們都說害怕華為站起來,舉起世界的旗幟反壟斷。我給他們說我才不反壟斷,我左手打著微軟的傘,右手打著CISCO 的傘,你們賣高價,我只要賣低一點,也能賺大把的錢。我為什麼一定要把傘拿掉,讓太陽曬在我腦袋上,腦袋上流著汗,把地上的小草都滋潤起來,小草用低價格和我競爭,打得我頭破血流。我們現在做終端操作系統是出於戰略的考慮,如果他們突然斷了我們的糧食,Android 系統不給我用了,Windows Phone 8 系統也不給我用了,我們是不是就傻了?同樣的,我們在做高端芯片的時候,我並沒有反對你們買美國的高端芯片。我認為你們要儘可能的用他們的高端芯片,好好的理解它。只有他們不賣給我們的時候,我們的東西稍微差一點,也要湊合能用上去。我們不能有狹隘的自豪感,這種自豪感會害死我們。我們的目的就是要賺錢,是要拿下上甘嶺。拿不下上甘嶺,拿下華爾街也行。我們不要狹隘,我們做操作系統,和做高端芯片是一樣的道理。主要是讓別人允許我們用,而不是斷了我們的糧食。斷了我們糧食的時候,備份系統要能用得上。」

在國家「信息安全」的背景下,我們的確是要搞操作系統,萬一別人不給我們用了呢?不能被人卡脖子。這是國家或者和華為一樣體量的公司,不得不在安全層面思考的一個問題。但是過分強調「自主版權」的操作系統是否是任正非口中「狹隘的自豪感」呢?

國家的數據安全,應該建立在「自主可控」的軟件、硬件之上,並非一定是「自主版權」的軟件、硬件。自主可控與自主版權僅僅兩字之差,但導致的產業方向,截然不同。

華為過去沒有自己操作系統,也沒有自己的芯片,但是硬是在廣闊的「應用市場」,打開一片天地。利用「應用」帶來的市場地位、積累的研發實力,開始向產業鏈上游擴張。這是一條實實在在的路。華為的成功和戰略選擇,帶給信息產業寶貴的經驗,就是紮紮實實做好應用,切切實實積累技術。華為並不是在平地起高樓,充分利用了「開源軟件」,是華為在基礎軟件領域,快速趕上的原因之一。在開源的Hadoop(大數據主流技術)社區重要貢獻公司名單,排名第七。是貢獻最大的中國公司。

過分的強調「自主版權」,使一些「頭腦靈活」的公司嗅到「商機」。去開源軟件社區,下載幾個軟件,改改界面,換一個標識,就成了「自主版權」軟件,拿來騙取國家的科技補貼。這樣的公司就是國家的蛀蟲,產業中的敗類。第一,欺騙國家,第二,違背開源社區的精神。這些公司的出發點從不是著眼於實際的應用中,他們只是騙取國家的創新扶持的撥款。他們的技術從開源社區「偷竊」而來,從無超越開源軟件的可能。

相反,哪些埋頭解決客戶的實際業務問題,利用開源軟件彌補自身基礎軟件的短板,在實際應用中,不斷的修改、完善、昇華開源軟件的公司,才是中國的信息產業的希望,他們才有可能借助應用為王的時代,實現反超。

充分利用開源軟件,尊重開源社區分享、合作的精神,發展「自主可控」的基礎軟件、基礎硬件產品,才是一條正路。事實上,中國絕大多數的軟件公司,都在利用開源軟件。最值得學習和推崇的是華為公司。第一,他們大張旗鼓的在用,尊重開源精神。第二,他們不斷地反哺開源社區,促進開源軟件的發展。反哺開源軟件,是一種態度,更是一種能力。如果公司不能超越開源軟件,是談不上反哺開源的。除華為之外的第二類是偷偷的用,模糊版權問題,談不上反哺開源社區。第三類則最為惡劣,明明是拿的人家開源軟件,非要說自主版權,這種行徑與偷盜無異。幸好中國有一些有志於技術的年輕人,自發地成立開源技術小組。我衷心的祝福他們在開源的道路上,走的更遠。

中國的互聯網公司在使用開源軟件方面做出了表率。淘寶網光棍節一天的銷售額達到191 億,這在世界上都是獨一無二的。這套以開源軟件為基礎構建、開發的後台信息系統可以說承受了最大的壓力。。京東商城也是如此,2012 年初,京東開始「去貴族化」(拋棄昂貴的商業軟件)的努力,以開源軟件為主,重新構建了其信息系統。我們在和其CTO 交流的時候,他感到非常欣慰,因為這次光棍節的購物,京東的信息系統沒有出現任何性能問題。海外的最大的電子商務公司亞馬遜、最大的搜索引擎谷歌、最大的社交網站Facebook,無一例外都選擇了開源軟件為主,構建信息系統。而且大數據技術,本就是開源軟件唱主角。既然如此複雜的業務,如此巨大的交易量,都可以使用開源軟件,我們為什麼要花大把大把的金錢,給那些提供昂貴產品的公司呢?京東商城恰好又是非常典型的例子:京東的CTO,是從大名鼎鼎的甲骨文(Oracle)公司挖來的,但也正是他主導了京東「去甲骨文」的歷程。

開源軟件,是送給中國信息產業界的一份大禮,我們要大大方方的接受他,改造他,支持他。這是一種態度,更是一種能力。校正公司對待開源軟件的態度,引導公司加強開源軟件研發、改進,支持開源事業,則是信息產業政策需要認真對待的一個課題。開源軟件既然是送給我國信息產業的一份大禮,那麼如何收下,如何用好,就是需要政府和產業界共同面對的大命題了。

缺少大數據思維和意識,沒有緊迫感

曾經有人問,發展大數據要採用哪些技術,有什麼產品?事實上:大數據首先是一種思維方式,其次才是判斷產業發展趨勢和選擇公司戰略,最後才談得上技術實現的問題。有四種典型的片面認識阻礙企業家完整的認知大數據:第一,認定是炒作;第二,片面理解;第三,視野狹隘;第四,唯技術論。這些都是缺少大數據意識的表現。儘管還有其他各種客觀原因,但是企業家的思想認識,是阻礙大數據獲得深入應用的最重要因素。
第一,認定無非是另一次炒作。這是最常見的一種誤讀。其流毒在於阻礙了人們去耐心認真的研究大數據的由來和機理。IT 業和資本的確有炒作的傳統。對千年蟲連篇累牘的報導和宣傳,除了讓IBM 等大賺一筆外,結果發現問題並沒有事前描述的那麼聳人聽聞。物聯網也曾經是資本市場的寵兒,但現在卻已風光不在。如果因此就把大數據歸於炒作一途,肯定會與機會失之交臂。大數據與以往的技術概念有顯著的不同,最大的差異是大數據已經遠遠超越技術的概念,是互聯網、智能終端、社交網絡發展到一定階段的必然產物。以往,信息技術總是在圍繞提升企業運營效率打轉,而大數據促使商業智能真正走向企業的決策中樞。

第二,片面的理解。有人一聽說大數據,就說十多年前我們就有多少多少數據。以前都說海量數據如何如何。的確,海量的數據是大數據的特徵之一,但海量數據並不等同於大數據。大數據更強調數據的多樣性、及時性。網絡日誌、文檔、視頻、圖片等都是大數據關心和處理的對象。更重要的是,大數據技術總是要求儘可能快的發現有決策價值的信息。快的度量單位是不能超過1 秒。廠商在介紹大數據概念時,往往介紹三個「V」特徵:Volume 體量大,至少要到PB 級別(1PB 等於1024 個TB,大約相當於地球觀測系統五年的數據);Velocity,實時要求高;第三個Variety,強調數據的多樣性。還有廠商增加一個V,Value,意思是說大數據有價值。這些都是對的,但不免過於片面。

第三,狹隘的視野。僅僅埋頭在自己的一畝三分地,是難以領略大數據全部魅力的。它首先是超越行業的,一定會促使新的行業誕生,也一定會令一些行業消亡。幾乎所有行業的競爭格局都將被大數據所顛覆。其次它是超越技術的,無論是開源的Hadoop,還是各廠商力推的新產品,都不足以反映大數據的全貌。作為投資人,或者公司的決策者,如果不能確立這是行業競爭的戰略要地思維,則不足以妄談大數據。

以企業在線服務市場為例,這個看起來很朝陽的產業,並沒有在中國取得引人矚目的成長。國內最大的幾家公司,營業收入大約在1 億元左右。前段時間和業內人士辯論能否免費為企業提供在線服務。大多數業界人士認為企業市場與個人市場不同,企業客戶擔心免費服務的質量,不收錢人家反而不敢用云云。事實上,我看到已經有公司免費為企業提供在線的企業管理服務,其盈利模式變成為他的在線客戶提供金融貸款業務。在線業務加小額貸款服務已經成為極具顛覆性的商業模式,這種商業模式如果進展順利,傳統的在線服務商,將面臨行業性的滅頂之災。這種新模式,其核心競爭力體現在擁有大量的、真實的客戶運營數據。借助對這些數據的收集分析,預測客戶的運營風險,最大限度的降低借貸違約風險。阿里巴巴公司剛剛提出的平台、數據、金融的戰略,則是大數據前景的最佳詮釋。

廣告產業將重新洗牌。大家都知道廣告預算至少有一半被浪費掉,可悲的是不知道浪費的是哪一半。借助大數據,廣告將變得及時和精準,而且能夠評估量化每個渠道的廣告效果,看起來具有非常誘人的前景:廣告主大大節約資金,消費者得以避免垃圾廣告的騷擾。理論上,如果大數據技術得到充分運用,那麼我們每個人將不會收到垃圾信息。在日常消費中,衝動型的購買決策越來越普遍。商家必須在消費者最感興趣的時候,及時觸發刺激消費者的購買慾望。離開大數據的支持,這種精準的營銷則難以實現。

製造業將重新定義核心競爭能力。在製造業發展的不同階段,其核心競爭力是不同的。在發展初期,產品質量是非常重要的因素,就是能夠做到人有我優。這個階段的關鍵資源是擁有先進的生產設備。產品同質化後,對於渠道的掌握和控制成為生命線,關鍵資源是優質經銷商隊伍。當渠道成熟到一定的階段,誰能掌控終端,誰將佔據競爭優勢,關鍵資源終端營銷團隊。考察製造業關鍵資源的遷移,我們發現它逐漸向最終用戶端遷移。換句話說,誰能掌握最終用戶,誰就能笑傲江湖。這方面例子還有很多,各行各業都不在少數。對此本章不在贅言,後續章節均有詳細描述。

第四,唯技術論。大數據是一種思考方式,和有沒有數據、數據量的大小、使用什麼技術,不存在嚴格的正相關。沒有最新的技術,也可以通過數據資產來獲利;即便擁有最先進的技術,缺少數據思維,沒有數據資產,往往也徒勞無功。不能單純的認為只有哪些圍繞hadoop(泛指大數據技術)開發的新興公司,才是大數據公司。也不能認為沒有技術的就不是大數據公司。相反,在大數據領域,那些擁有稀缺性數據資產的公司,往往可以指點江山,獨領風騷。大數據既不等於數據挖掘也不等於統計分析,更不等於人工智能。但是這些技術和算法都需要大數據的支持。使用同樣的算法,如果利用全部的數據集,而非小樣本量,甚至得出截然不同的結論。這就是大數據的魅力。他可以在宏觀尺度上把握潮流,也可以在微觀顆粒上預測未來。

數據治理缺位

數據割據、數據孤島和數據質量,是典型的三大數據治理問題。

因為制度、地方主義、部門主義等人為因素造成數據分散的現象,我稱之為「數據割據」;因為技術差距、歷史遺留問題等形成的數據分散的現象,稱之為「數據孤島」。數據割據現象更多存在於國家各部門、各地方之間;大型企業內部也會存在數據割據現象。譬如氣象部門詳盡的天氣觀測數據,是研究大氣規律、做天氣預報的第一手資料。但是這些數據因為各種各樣的原因在氣象局那裡睡大覺。理論上講,科學院的大氣物理研究所是可以拿到這些觀測數據的,否則,大氣所的科學家們怎麼支持氣象局的工作啊?根據「有關部門的有關規定」,大氣所的確也能夠接觸到這些數據。但實際操作中,要拿到些有用的數據,不拖個半年是不行的,而且就算到手了,也是雞零狗碎的,沒什麼用途。這就是典型的「數據割據」現象。

有家公司專門為淘寶網上的商家提供在線的服務。這些服務需要淘寶開放數據接口。早期,如果不使用淘寶提供的服務器是沒有任何障礙的,但現在這項服務有50%的時間是無法連通的。我們自然無權指責淘寶的經營策略,但這種因先發優勢進而形成數據割據的局面,的確令人擔憂。

美國政府在消除數據割據方面可謂用心良苦。除了系統性的提出國家層面的數據戰略外,一些做法也值得借鑑。具體方法參見本書第三部分的詳細介紹。

我國政府面臨更加嚴峻的數據割據困境。數據保護主義不過是部門保護主義在信息領域的延伸而已,必須出台國家級別的頂層設計,由上而下地破除阻礙數據分享的藩籬,並建立數據共享,成果分享的利益分配機制,才有望從根本改善數據割據的問題。

數據質量的好壞,直接影響數據資產的價值。數據質量主要包括數據的真實性、完整性、一致性。數據質量的解決非一日之功,需要技術、制度、文化等等方方面面的努力。如果把數據認認真真的當成資產對待,數據質量,就是需要面對的第一個問題。

數據資產的界定與安全

隨著數量越來越多的數據被數字化,在跨越組織邊界而流動著,一系列政策問題將會變得越來越重要,這包括但不限於隱私、安全、知識產權和責任。顯然,隨著海量數據的價值愈加明顯,隱私是個重要等級(尤其是對消費者來說)不斷提高的問題。個人數據(例如健康和財務記錄)經常能夠提供最重要的人類福利,例如,幫助精準確定適當的醫療或者最恰當的金融產品。然而,消費者也將這些類別的數據視為最敏感的個人隱私。顯然,個人和其生活所在的社會將不得不努力在數據隱私和數據的功用之間權衡取捨。

另一個密切相關的擔憂是數據安全,例如,如何保護競爭方面的敏感數據或應保持隱私的其他數據。最近的例子表明,數據被盜不僅暴露消費者個人信息和企業保密信息,甚至還會暴露國家安全秘密。鑑於嚴重的數據被盜事件有增無減,通過技術和政策工具解決數據安全問題將成為關鍵。

海量數據日益提升的經濟意義也昭示了一系列法律問題,尤其是當其與如下事實聯繫起來時:即數據與許多其他資產具有根本性的差異。數據可以與其他數據結合起來完美而輕鬆地複製,同樣一份數據可以由多個人同時使用。這些是數據與實體資產相比的獨有特徵。有關數據所附帶的知識產權的問題不容迴避:何人「擁有」某份數據,某一數據集附帶著何種權利?數據的「公平使用」的定義是什麼?此外,還有與責任相關的問題:當一份不準確的數據導致負面結果時誰應負責?要充分發揮海量數據的潛力,此類法律問題需要澄清,也許會隨著時間的推移逐步澄清。

缺乏大數據人才

就算政府和企業界認識到大數據可以釋放經濟的下一波增長潛力,認識到數據資產是關乎企業未來的命脈。但是如果想要成功運用大數據技術,達成企業戰略目標,最大的制約因素往往是大數據人才的匱乏。這一點已然成為推廣利用大數據技術的阿喀琉斯之踵不過許多高校近期的舉動令人欣慰。北京大學、上海交通大學、中國人民大學、北航等高校都在設立數據科學的專門研究機構和相關專業,未來,也許數據科學家將成為令人尊重的職業。
PermaLink: https://articles.zkiz.com/?id=56096

前京東副總趙國棟創辦錢包金服:給每個銀行做個“陸金所”

來源: http://newshtml.iheima.com/2015/0628/150097.html

黑馬說:目前,傳統金融機構還是缺乏互聯網思維和利用互聯網手段自我改造的技巧。對銀行來說,互聯網戰略一般是兩個方向,一是做互聯網金融,二是做電商。錢包金服創始人趙國棟認為,本地生活服務電商對傳統金融行業轉型互聯網更具優勢。他選擇的創業方向就是協助銀行做O2O生活服務類的電商,幫每個銀行建立自己的“陸金所”。

文 | i黑馬  崔婧
編輯 | 王冀


\錢包金服創始人  趙國棟

趙國棟和張嘉是在2013年認識的。
 
那時候,他倆是清華大學五道口金融學院EMBA班同學,趙國棟在京東任副總裁,分管京東金融支付相關業務,張嘉在先鋒金融工作。趙國棟2003年創辦了網銀在線,2012年被京東收購,張嘉知道趙國棟有十幾年的金融行業經驗,經常請教一些金融行業問題,倆人逐漸熟絡起來。
 
2014年,趙國棟決定再創業。一天上完課後,趙國棟和張嘉聊起了自己對金融行業未來的判斷,他了解到現在傳統金融行業缺乏互聯網手段和互聯網思維,需要有人利用互聯網的模式去改造它。他覺得這是一個大機遇,於是萌生了幫傳統金融企業向互聯網化轉型的想法,創業目標定位於提供互聯網金融服務平臺,主要為用戶提供理財、消費、信貸三方面服務。
 
張嘉覺得這是一個可實踐的想法,因為在他們金融學院EMBA班,很多同學都是傳統金融出身,這是他們的資源,他決定加入創業。隨後,他倆逐個拜訪這些同學調研市場。他們發現,一般優質資產、優質借款人和信貸資產都在銀行手中,對銀行來說,要想轉型互聯網一般有兩個方向,一是做本地化生活服務,二是做電商。對於這兩個方向,趙國棟認為,本地化生活服務對傳統金融行業轉型互聯網更具優勢。
 
幾個月後,他們成立了錢包金服集團,組建了一支十幾個人的核心團隊,趙國棟任董事長兼CEO,張嘉任副總裁。
 
“從消費模塊來講,我們首先做的是給銀行做O2O生活服務類的電商,這其實是消費領域的一種模式,因為銀行現在情況是這樣,比如建行搞了個善融商務,工行搞了個融E購,但其實銀行的優勢並不在物流、配送和供應鏈管理上,這是京東、阿里的優勢,銀行的優勢在於有很多地面部隊、商戶和營業廳,所以應該更多地為商戶做一些金融服務”,趙國棟說。
 
今年3月到5月,他們都把精力放在了做O2O生活服務上,選擇有資源或者有經營商戶經驗的地方銀行合作,比如在南京和江蘇銀行合作,在北京和建行合作,在深圳和農行合作等。
 
但是,O2O生活服務這個業務的周期很長,現在更多還在銀行內部磨合,產品還處於測試階段。趙國棟開始琢磨,如何能更快布局理財和信貸業務。
 
他選擇了收購。中融金(北京)科技有限公司(以下簡稱“中融金”)是他們的目標。中融金從去年開始已經給銀行提供P2P平臺和運營服務解決方案。
  
趙國棟表示,“其實,這相當於幫銀行做互聯網金融,像平安銀行有‘陸金所’,其實每個銀行都想建自己的‘陸金所’,這個中融金公司就是給每家銀行去搭建一個‘陸金所’。每家銀行拿出40-50億的資產放到P2P平臺上賣,是很正常的事情,如果有100家銀行就有4000-5000億的資產。如果我聯合許多銀行,做了一堆‘陸金所’,你說這樣的選擇空間多大?”
 
現在,中融金公司是錢包金服集團旗下企業,截至目前已簽了20多家銀行,到今年年底他們打算簽100家銀行。
 
趙國棟還希望能幫銀行做眾籌。“銀行除了想做互聯網金融,還想做眾籌,因為眾籌是非常好的引流工具,所以我去幫它搭眾籌平臺,提供技術,同時還幫它找項目。”
 
趙國棟舉例,商戶想開新店的時候就可以在銀行做權益眾籌,比如過去健身房辦會員卡可能1萬塊錢都不打折,現在可以打五折,初期募集一些初始會員,會員不會享受股權,而享受權益。“第一,我出了5000塊錢享受你1萬塊錢的權益,對我來說只要你這個店在,我的回報就是100%。第二,你需要100萬,找了200人,每人出5000,這200人是初始會員,他們天天健身,成為你的客戶,你既有了客戶,又有了資金,雖然打折了但還賺錢,相當於負利率再去融資,所以眾籌對幾方都是有利的。”
\錢包金服(北京)科技有限公司
創始人:趙國棟
成立時間:2015年3月
員工人數:200人
所在地區:北京
主營業務:互聯網金融
融資狀況:獲 1000萬美元A輪投資


版權聲明:本文述者崔婧,編輯王冀,文章為原創i黑馬版權所有,如需轉載請聯系zzyyanan授權。未經授權,轉載必究。

 

\Next Page


ZKIZ Archives @ 2019