📖 ZKIZ Archives


斷估.大數 百萬倉 - Start from One Million

http://philipleung168.blogspot.com/2011/09/blog-post.html


用番上年五月個篇斷估:

a 場大浪由 2008/11/4 (y/m/d) 日 1707 點開動直升至最高 2009/8/31 日 3471 點, 中間最低點為 2009/8/31 2668 點, 最近覆跌回附近, 今日收 2697 點. 三份一回調位及牛熊位早破, 中間位為 2589 點, 應為極强支持, 去到附近當局可能有啲嘢會做. a 股歷史高位為 2007/10/16 日 6092 點, 跟最近低位之中點為 3900 點, 今次升浪仍未觸及. 現五十天線同長期線交會於三千點左右, 現低過牛熊十巴仙過一星期, 不得不令人憂慮, 雖然反彈幅度超高, 不過以技術角度嚟睇其實未夠確定, 而且而家形勢都幾尷尬, 所以今月餘下走勢都幾緊要, 要睇緊啲. 所幸現在估值已比較合理, 周三晚啲外資係度吸 2823 同隘價升番去七八巴仙, 就算套戥都算值租啩.

香江今次牛市由 2008/10/27 11015 點開始, 升至牛一高點 2009/11/16 22944 點, 1/3 及中位為 18968 點及 16980 點, 牛一高位后最低點為 2010/2/8 19551 點. 技術上比 a 股强, 雖則上高收緊銀根, 外面猛印銀紙托番一把啩. 美市則由 2009/3/9 6547 點升至今, 未見高位, 亦已升破中位 10320 點 (2007/10/8 14093 點), 形勢現最强, 控到條水喉真係唔同啲,  跟足戱美市遲啲都要跌番啲啩.



直到今日為止, 呢三場低位調整低位及波幅中位數為:


恆: 9/26/11 17408 / 17990 (11015 & 24964), (如以牛一波幅計, 中位應係 17500 附近);
綜: 7/5/10  2364 / 2589 (1707 & 3471) (最近低位為 2392 於 9/26/11);
美: 7/2/10  9686 / 9679 (6547 & 12811 4/29/11) (最近低位為 10734 於 9/22/11);


恆 指創新高后反覆試過幾次廿萬四, 無功而還, 做咗幾個頂, 就跌跌至今, 暫時調整低位低過中位 3.2 巴仙; 而綜指則為 8.7 巴仙, 於上年中一早見咗; 杜指則為剛一點即彈, 時間同綜指一樣早到咗, 反而今年恆指先要試吓條中線, 玩吓 dip water. 今日綜指仲創緊新低.


劇 情發展落去, 一係恆指好似上年行早兩個幾月跌先, 綜杜兩指跟住先再創新低去中位以下, 睇落而家都係美指强得多, 正好似坊間話齋, 銀根鬆緊都係幾決定性既因素嚟, 同通脹預期啱啱相反; 一就係中位真係守得住, 係年尾前可以升番, 再創新高去; 但亦唔否決大型上落市咁法上法落去, 綜指係零九年八月創咗 3471 高后, 每次試新高都係三千二前就莫進, 杜指同恆指好些少, 不過都係行前少許而已. 如今次係零七年熊市既廷續, 咁行到而家就差一個月就四年咁長, 以香江近廿年嚟睇真係未試過咁耐, 所以筆者直至此, 都認為而家都係震痛複發緊, 為牛二既深度調整, 或大型上落市既低潮期.


計 數當然咁計, 但投資中心點係風險管理, 每人都要因應自己現金流同情緒管理而調節之, 唔係應贏都變咗輸, 跟住仲要去 icc 添. 百萬斷估兩倉都係超進取咁去投資, 啲錢都可以唔使十年內用, 而點跌個倉主都可以瞓得着, 怕且十之九點九都做唔到啩, 所以唔好亂學. 今次跌市集中係中指大股同二三線, 呢啲正係散戶集中既持貨, 話唔係重傷都幾難矣. 如係炒股同蝕緊既股, 輸太深止都無謂, 仲有渣拿既不如轉去啲仲有增長既中資股好過, 橫掂跌起嚟都係咁慘烈, 升番去怕且跑得快啲啩. 仲有錢既就提議至少六成現股倉, 真係創新低就愈低愈買, 對象咪買啲指數基金放係枕底囉, 唔好話等萬x 再哂冷, 講既九點九都做唔到, 不如切實揾個可行既去做好過, 只要中期內差唔多必贏就可, 邊有長短都贏既方案咁筍先, 諗到都做唔切嘞, 起碼身邊從未見過做到囉.


百萬倉都有衝動轉哂去高波動, 但預防估錯都係中庸咁溝算, 反正而家倉內個啲都唔算係保守類囉.


PermaLink: https://articles.zkiz.com/?id=28020

大數據掘金

http://www.p5w.net/newfortune/qianyan/201201/t4042467.htm

大數據自身蘊藏著巨大的商業價值,其開發、利用和分析等一整套運作也將催生更多的行業機會,並帶動相關產業的發展。

  儘管一面頻繁降價促銷、一面廣告攻勢凌厲,但一家零售企業最近仍頂不住競爭對手頻頻擴大市場份額,連連丟城失地。通過深入研究,企業發現原來對 手通過微博等社交網絡以及智能手機的定位數據掌握消費者的喜好,加之從門店收集的各類數據,進行整合和分析,從而第一時間捕捉到了最全面的市場情緒。同 時,他們將這些信息通過云計算平台與供應商和物流商的數據庫聯網,實時調整價格、自動補貨、跟蹤物流,輕鬆在各門店之間調配產品,實現了生產到終端消費者 的無縫連接,大幅提升了對市場的反應速度。
一家地產企業通過各種渠道獲取儘可能多的信息,更為全面瞭解自身的運營情況和外部的運營環境,從而準確地判斷出應該何時融資、何時買地、何時批量上項目,從以往在各個經濟不均衡之地圈地蓋樓的「空間掙錢」方式轉換至「時間掙錢」的方式,「快人一步」成為行業領先。
這些都是大數據應用的尋常景象。如同上世紀80年代的個人電腦,眼下,大數據還處於早期發展階段,但它已成為新時代的關鍵生產要素和產品形態,具有廣闊 的應用前景及改變世界經濟的力量。大數據的開發和應用不僅能為企業帶來更出色的商業效益,同時也將催生更多的行業機會,孕育出色的解決方案提供商,並帶動 相關產業的共同發展。正因為如此,根據 IDC的測算,到2020 年,僅企業對大數據的支出一項就將超過2000 億美元。

  大數據的商業價值
  IDC 在報告中提及,領軍企業與其他企業之間最大的顯著差別在於新數據類型的引入,這無疑是對大數據商業價值的充分肯定。傳統的商業智能系統中用以分析的數據, 大都是企業自身信息系統所產生的標準化和結構化的運營數據,只佔到企業所能獲取數據的不到15%。另外85%的非結構性和半結構性數據廣泛存在於社交網 絡、物聯網、移動計算、傳感器和電子商務等媒介之中。企業如果能將這些新的數據與業務融合,決策的依據會更全面準確。電信諮詢公司Ovum的最新調查顯 示,在北美、歐洲和亞太地區將近有半數以上的企業IT部門在不久的將來投資大數據分析。
早在2007年,沃爾瑪就建立了一個存儲能力高達 4PB以上的超大數據中心,其數據量在2010年時已達到美國國會圖書館的167倍。通過對消費者的購物行為等非結構化數據進行分析,沃爾瑪成為最瞭解顧 客購物習慣的零售商。中國移動通過對社交媒體等各種來源的大數據分析,第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責人,使他在最短時間內獲 知市場行情。
電子商務企業作為大數據時代的「吃螃蟹者」,也已經初品其甘甜。早在2006年,eBay就成立了大數據分析平台,為了準確分析 用戶的購物行為,eBay定義了超過500種類型的數據,對顧客的行為進行跟蹤分析。通過對關鍵字廣告的投入產出進行衡量,公司精確計算出每一個關鍵字為 eBay帶來的投資回報,優化過後,自 2007 年以來,eBay 產品銷售的廣告費降低了99%,頂級賣家佔總銷售額的百分比卻上升至32%。
國金證券TMT分析師趙國棟認為,企業應用大數據分為三步:第一是要融合企業內外的海量信息;第二要具備行業建模及分析的能力;第三要與企業的決策和業務流程深度整合。前兩步是技術推動,第三步將引起企業組織、流程甚至是文化方面的變革。
 催生新一代IT領袖
  正因為其中所蘊藏的巨大價值,大數據成為了眾多企業淘金的「聖地」。
IBM架構師史蒂夫·沃特(Stephen Watt)曾在《Deriving New Business Insights with Big Data》一文中簡單闡述過大數據的生態系統。簡而言之,大數據的生態系統,就是數據的生存週期。數據從產生,到處理,再到價值提取,最後被消費掉,這整 個過程就構成了大數據的生態系統(圖1)。每個步驟中都存在著不同的商業需求,已有不少成熟和初創公司深耕各自所在的領域,以期儘早佔據優勢地位。以投資 Facebook而聞名的風險投資機構AccelPartners認為,大數據是信息技術未來發展的戰略走向,將催生下一代價值數萬億美元的軟件企業。


源自雅虎的大數據系統Hadoop,主要面向存儲和處理成百上千TB直至PB級別的結構化、半結構化或非結構化的大數據。Hadoop能將大數據分解成多個子問題,將它們分配到成百上千個處理節點之上,再將結果彙集到一個小數據集當中,從而更容易分析得出最後的結果。
相比傳統的數據存儲系統,Hadoop成本更低。傳統數據存儲的費用是每GB 5美元,而在同樣容量下,Hadoop的成本僅為0.25美元。此外,Hadoop具有更強的可擴展性,幫助企業用較低的成本為此前購買的設備添加額外的 存儲空間(圖2)。僅這一性能就可在未來五年內使50%以上的數據都存儲在Hadoop環境中。


如今,Hadoop已經成為AOL、Facebook和Twitter這些公司大數據分析解 決方案的主要提供商。類似Facebook這樣的互聯網企業,一天產生的數據要比許多大公司一年的數據還要多,它們通過Hadoop收集和存儲這些數據, 再使用開源數據倉庫工具集中對其進行分析。
此外,各種新型大數據公司都呈現喜人的增長態勢。Opera Solutions的客戶將數據上傳到Opera平台,Opera根據每個客戶的個性化需求,僱傭各行業的專家來幫助他們進行數據分析,公司年營業額已經 超過1億美元。另一大數據服務商Teradata,公司2011年第1季度的營收比2010年同期增長了18%。在其總裁兼首席執行官看來,大數據需求市 場的強勁表現,是營收增長的重要原因。
傳統IT巨頭也紛紛圍攻搶食大數據盛宴。IBM憑藉在硬件與軟件方面的優勢,提供端到端、整體的大數據 解決方案。此外,在數據存儲、分析等領域有著傳統優勢的廠商,如惠普、甲骨文等公司,在大數據領域也有著明顯的優勢。2011年10月,甲骨文發佈了新版 NoSQL數據庫企業版,這是運行於Hadoop之上的大數據軟件之一。除了花大力氣開發自有技術,更多的企業希望通過合作與併購的方式來迅速彌補技術鏈 條上的不足。微軟宣佈與Hortonwork公司建立新的合作夥伴關係,後者致力於Hadoop開發。為了增強非傳統數據分析的能力,Teradata收 購了Aster Data公司。照此情形來看,一些提供單一技術方案的IT公司,很可能難逃被收購的命運。
對於國內市場,國金證券分析師易歡 歡表示,在電信、金融等重要行業,現在最大的投資建設就是數據中心的相應擴容,這幾年還停留在儲存部分信息階段,未形成對海量信息的檢索、分析、識別以及 對未來業務的預測,提升的空間相當大。對地理信息系統進行相關研究的超圖軟件(300036)以及擁有非結構化數據的相應處理業務的拓而思 (300229)以技術手段創新為依託,都已經開始向自己擅長的大數據方向衍生。用友軟件(600588)則憑藉IT系統重構的機會有望在大數據浪潮中分 得一杯羹。對於電商來說,大數據不僅能助其準確決策,為企業自身業務提供支撐,如果拆分出來,也可以作為獨立收入來源。淘寶第一個成熟的商業數據產品「數 據魔方」計劃將於2012年開放數據給第三方應用,屆時有望成為淘寶另一項收入來源。

  攜手云計算
  根據IDC的報告,未來十年全球大數據將增加50倍。僅在2011年,就有1.8萬 億GB的大數據創建產生,相當於每位美國人每分鐘寫3條Tweet,而且還是不停地寫2.6976萬年。海量的數據需要足夠空間來存儲,大數據為云計算大 規模與分佈式的計算能力提供了應用的空間。
最近一年多來,谷歌、Facebook、Rackspace等公司紛紛投建新一代數據中心,大部 分都採用更高效、節能、定製化的云服務器。根據IDC預測,80%的商業企業應用程序將被部署在云平台中。Gartner則預計到2016年底,1000 家全球大型企業中將有半數以上會把與客戶相關的敏感數據存儲在公共云中。這對於一些空置的云計算數據中心無疑是一大利好。IBM中國開發中心信息管理部大 數據開發部門經理王洪遠更預測,大數據會引發數據倉庫、數據挖掘、商業智能、云計算等應用的連鎖反應。IBM 中國開發中心首席技術官(CTO)毛新生表示,電信、銀行、保險等行業都特別希望利用互聯網蒐集海量信息,與原來交易系統中的數據結合起來,分析用戶行 為,過去做這些比較麻煩,現在云計算可以將上百萬台機器轉化成一台超大型計算機,使企業獲得新的競爭力。
雖然炙手可熱,但大數據時代的到來, 對企業來說也存在著一些風險,包括企業網絡和計算機系統是否跟得上海量數據的處理、數據能否及時更新、是否會丟失核心信息、如何處理格式繁雜的各種數據 等。IDC預測,要充分發揮「大數據」額外的競爭優勢,需要「大管道」和超高速的網絡連接,這將使得網絡的作用比以往更為關鍵。■

PermaLink: https://articles.zkiz.com/?id=30737

迎接大數據時代

http://magazine.caixin.com/2012-04-06/100376661.html

  如果你的網站擁有千萬活躍用戶,有數以百計的產品服務且多媒體、多網絡終端運行;如果你正在或打算走向云計算和Web2.0,那就恭喜你了,因 為你是大數據時代的先行者或受害者。

  在當今互聯網時代,用戶網絡行為數據「增長如此之快,以至於難以使用現有數據庫管理工具駕馭,困難存在於數據的獲取、存儲、搜索、共享、分析和 可視化等方面」。數據量之大,已不能用常見的G或T為單位來衡量,而是要用P(1000個T)、E(100萬個T)或Z(10億個T),所以稱之為「大數 據」(Big Data)。

  大數據現象在物理學、生物學等科學領域,或軍事領域,通信、金融等行業已有時日,但在互聯網業是近年來才引人關注。網絡用戶高速增長, 用戶平均網絡使用時間不斷延長;網絡服務也從單一文字走向圖片、語音和影像等多媒體形式;另外,網絡終端由過去的單一台式機變為多終端,擴充了網絡服務的 內容與範圍,這些都大大增加了數據量。

  從潛在機會看,數據量增加為網絡公司提供了精確把握用戶群體和個體網絡行為模式的基礎,如能夠充分利用,就可探索個人化、個性化、精確化和智能 化廣告推送或服務推廣,創立全新商業模式。同時,網絡公司也可通過對大數據的把握,增加用戶粘性,開發新產品和新服務,降低運營成本。

  大數據時代帶來的挑戰,主要集中在以下三個方面。首先,大數據挑戰著網絡公司的戰略決策能力。數據量的急劇增長,要求在帶寬和存儲設備等基礎設 施方面增加大量投入,如果無所作為、固守原狀,就可能失去未來發展機會,早晚會被產業淘汰;如與時俱進,轉型適應大數據時代,則需對公司現有產品和運營體 系進行全面改造,例如網站架構的重建,產品的通用化、標準化、模塊化,商業模式的創新等等。對絕大多數網絡公司而言,既要維持現有業務,保持業績穩定增 長,又要加大投入,迅速轉型,這是個進退維谷的兩難處境。

  其次,大數據挑戰著網絡公司的技術開發和數據處理能力。大數據的出現及其潛在商業價值,不僅要求網絡公司使用專門的數據庫技術和專用的數據存儲 設備,而且要求有專門的數據分析方法和使用體系。目前業內流行的一般數據挖掘方法和通用商業數據庫,無法滿足大數據時代的挑戰,而且,網絡公司需要大量高 端專業人才,包括一般的程序員和數據庫工程師及天體物理學家、生態學家、數學和統計學家、社會行為心理學家等。對海量數據的分析,不能侷限在一般數據規律 和模型的把握水平上,還要有理論思維和全面綜合的能力。

  第三,大數據挑戰著網絡公司的組織和運營能力。一般中小網絡公司沒有專門的數據管理和分析專家,即使是大型網絡公司,數據管理和分析部門也處於 分散、被動、輔助地位。大數據時代的基本分析對象是個人用戶,尋找的是個人的全面、動態、實時的網絡行為模式及此基礎上歸納出來的群體行為模式,而非過去 基於單個產品、服務、頻道的碎片式靜態統計分析。

  所以,對大數據的整體把握,是網絡公司產品開發運營、商業模式的基礎,是龍頭而非龍尾。這就需要對現有公司架構、組織體系、資源配置和權力結構 進行重組,讓數據管理與分析部門處於公司上游位置,設立首席數據官(Chief Data Officer, CDO),與CEO、COO、 CFO、 CTO等一道組成公司核心決策層。

  大數據是整個Web2.0革命的重要組成部分,Google、Facebook、蘋果和亞馬遜都已處於先發位置。中國有哪家網絡公司急起直追, 那它就可能是先行者,否則,就只能扮演受害者的角色。

  作者為互聯網資深評論員


PermaLink: https://articles.zkiz.com/?id=32559

三種大數據

http://magazine.caixin.com/2012-08-03/100419157.html

網絡上信息如海,數據如山。如何便利快捷地找到自己需要的信息,如何利用如海似山的數據創造有競爭力的商業模式,如何掌控大數據進行社會管理和服務,正是今天個人用戶、以網絡業為首的企業界以及社會管理部門所面臨的重大機遇和挑戰。

  在如何獲取大數據的問題上,網絡業正逐步形成三種戰略:前台為主,中台為主或後台為主。蘋果公司實行的是典型的前台為主戰略,即通過設計、製造 和銷售各類數據終端從源頭上獲取數據,通過自己開發的操作系統和開放平台來規範數據的標準,通過自己的云計算系統來彙集和存儲數據。Facebook則是 典型的中台為主戰略,即通過Web2.0平台的建設和運營獲取標準化和結構化的數據,並通過標準接口和對第三方應用的開放形成龐大的共享數據流。亞馬遜實 行的是典型的後台為主戰略,通過建立強大的經營後台獲取豐富的用戶數據,並通過對第三方電商開放獲取電子商務行業的大數據。

  以何為主並不意味著排斥其他,真正有實力有理想的網絡公司正在全面出擊,實施系統大數據戰略。谷歌曾是個單純的搜索網站,至今靠搜索仍創造著輝 煌的業績。但面對Web2.0革命的挑戰和隱約可見的大數據時代,谷歌幾經躊躇毅然走上了轉型新路。谷歌通過Google+將網站進化到平台,搶奪中台陣 地;通過安卓移動操作系統和推出平板電腦,爭雄前台市場;通過google drive涉足云計算領域,試水後台。這看似複雜全面出擊的玩法如果從大數據角度去理解,暗藏邏輯和雄心昭然若揭。

  在如何管理大數據的問題上,無論誰來做都難以迴避三大挑戰:個人隱私、企業利益和社會安全。在大數據爭奪戰中,個人、企業和政府是三大主角。在 理想上,大數據的獲取和使用約束越少越好;在現實中,數據所有權和使用權卻成為巨大障礙,大數據難以做大。經過多年探索實踐,一些約定俗成的規矩逐漸形 成,在一些國家已經上升到法律層面。例如,個人隱私未經本人同意不得公開,非公開的獲取和使用也得保護個人信息(姓名換成ID,屏蔽信用卡號碼等等)。隨 著網絡服務的發展,企業間的數據平等共享和交換開始時髦起來。至於對那些靠百姓稅金養活的社會管理部門,越來越多的國家立法規定必須向公眾提供原始的、完 整的、實時的數據。

  在如何利用大數據的問題上,正出現三種局面:數據獨佔、數據共享和數據公開。無論在個人層面、企業層面還是政府層面,數據獨佔幾乎是一種本能。 大家憑直覺認為一旦把自己的數據拿出去共享或公開,一定會被別人佔了便宜或做出對自己不利的事情。這有一定道理,但代價是無法有效利用大數據時代的機會和 空間。

  以蘋果和Facebook為代表的Web2.0平台正在使數據共享成為時尚。基於平台與應用之間的數據平等交換和共享,平台運營商和應用運營商 都獲得了過去無法獲得的用戶數據。當然,這種平等交換和共享是相對的,一個成功的平台可以彙集和整合數以十萬計的應用所帶來的豐富數據,而每個獨立的應用 獲得數據卻極其有限。但無論如何,這種交易是公平的、雙贏的,儘管大贏家是平台運營商。

  在數據公開方面,引導潮流不是個人或企業,代表公共利益並由公眾稅收維持的政府反而正在成為數據公開的潮流引領者和規則制定者。世界上幾十個國 家去年成立了開放政府聯盟,其中有美國和英國,但也有秘魯、東帝汶、肯尼亞這樣的發展中國家加盟。聯盟的基本宗旨就是向人民提供儘可能多的數據。今天,由 美國政府開發運營的大數據網站Data.gov正成為有志在大數據時代建功立業的個人、企業和社會團體的朝聖地。這個網站體現了大數據時代所需要的基本特 徵:數以十萬計的開放數據庫,數以千計的數據分析工具,對任何第三方開放,歡迎來自其他國家、企業和個人的參與建設和創新。

  大數據是個浩瀚的藍海,無邊無際,風很大,浪很高,水很深。主動參與進去未必會成功,而被動捲入則一定失敗。在山重水復中尋找新路,注定是這一代的歷史使命,無論他們是個人、企業還是政府。


PermaLink: https://articles.zkiz.com/?id=35778

讀《大數投資》有感 孫旭東

http://blog.sina.com.cn/s/blog_59d5d75d0102e9qc.html

中國人民大學齊 東平副教授的這本書講述了他的一整套投資方法——大數投資,以概率抽樣方法選擇少數必要數量的上市公司構建投資組合擬合投資全部上市公司的投資方法。

在書的自序中,齊教授對大數投資的基本邏輯進行了總結:

1、               投資一國的所有企業是沒有投資風險的,而投資上市公司可以實現投資全部企業的目標,所以投資全部上市公司也是沒有風險的。

2、               投資全部上市公司不僅可以像投資全部企業一樣沒有投資風險,而且可以有較高的投資收益。

3、               用概率抽樣方法可以構建與全部上市公司資產以及盈利狀況相當的部分上市公司的投資組合,達到與投資全部上市公司一樣的必有收益的結果。

4、               證券市場具有後期投資人向先期投資人無償轉移淨資產的機制。

5、               投資組合要在估值合理水平下構建。

6、               長期持有投資組合有複利收益效應。

7、               投資策略和交易法則能夠優化投資收益。[1]

有很多人不敢或不屑投資股票市場,他們或多或少地對股市存在一些偏見,這些人應該好好地讀一讀這本書。

 

特別值得一提的是第4點,齊教授認為,上市公司再融資能夠為長期投資者創造外生價值,「新加入上市公司的股東購買新股份所支付的價格高於原有股份的淨資產……新股份較高的淨資產將部分無償地確認為現有股東的權益。」這與一些傳統觀點相悖,很多投資者是非常痛恨上市公司「圈錢」的。

教授對上市公司再融資的喜愛還體現在具體的投資策略中。

在絕對勝算投資策略中,所給出的中小企業的估值數值高於大企業的估值數值,並不是出於中小企業股票更容易被市場推高,也不是由於中小企業盈利能力高於大企業,其根本原因是中小上市公司再融資所產生的外在價值遠高於大型上市公司。[2]

教授的上述觀點對我有很大的啟發。以往,我對上市公司再融資時採取定向增發方式總是感到不滿,認為這種方式對中小投資者不公平。現在,我覺得只要公司的發展確實需要資金,而公司又能保證募集資金能夠產生令人滿意的效益,則定向增發也無不可。畢竟,公開增發失敗的風險更大些,而一旦失敗,公司的發展就會受到很大的影響。

不過,我還是覺得花更高的價錢買中小企業的股票心中沒譜,或許,要等對相關的數據進行整理、分析後我才會接受齊教授這一觀點在投資策略中的應用。

 

我感到困惑的是,按上述邏輯,大體來說,投資上市公司顯然是越早越好,越多越好,為什麼在齊教授的交易法則中將構建投資組合投入的資金佔現有投資餘額的比例上限邊界定為2/3?我認為這個上限有過低之嫌。在投資中,倉位管理確實很重要,但一向以謹慎著稱的格雷厄姆在《聰明的投資者》中建議投資者持普通股的資金比率也只是不高於75%而已。

 

教授還整理出一張根據企業相關指標對投資價值進行評價的表格,為我們應用凱利公式提供了一個範本。

 

在剛看這本書時,我以為這是一本主要為業餘投資者寫的書,專業投資者不會對擬合投資全部上市公司的方法感興趣,而在書的自序中又有這樣的話:

以概率抽樣選擇企業構建投資組合是根據概率抽樣方法的客觀性選擇企業,並不要求投資人具備判斷企業優劣的特殊能力,無論是誰只要按照概率抽樣原理的具體方法選擇企業都能達到大致相同的投資結果,普通投資人都能採用這一方法。[3]

但是,看到後來,我發現複雜性出來了。

表格中所列數據並不適於所有行業,使用時需根據統計結果進行適當的調整,比如,國際鋼鐵行業股票市盈率長期保持在10倍左右的水平,所以鋼鐵行業股票市盈率為10倍時,標準分值為及格水平,有投資價值的概率值為65%[4]

統計這樣的數據顯然就不是普通人能做到的了,而且,如果要求再高一點,不但要知其然還要知其所以然,那就需要更多的專業技能了。

 

我對書中的這段話感到極度困惑。

又如,甲、乙兩家企業股票的市盈率相同,但甲企業股票的市淨率較低,則應優先選擇甲企業的股票投資[5]

按給定的條件,甲企業的淨資產收益率應該低於乙企業,這或可表明乙企業的盈利能力更強,既然如此,為什麼我們要選擇甲企業呢?這或許是作者的筆誤?

由此想到我的新書《價值投資,從看懂財報開始》也曾辛辛苦苦地和責任編輯將全文校正過不只一遍,卻仍然有不少錯誤,心情很是複雜。

读《大数投资》有感



[1] P3

[2] P115

[3] P3

[4] P105

[5] P93


PermaLink: https://articles.zkiz.com/?id=36284

習慣大數據時代

http://www.cbnweek.com/yuedu/ydpage/?raid=2313

大數據和移動辦公時代的到來會對老牌的專業信息服務提供商產生什麼影響?相應的又該做出哪些改變?近日,湯森路透集團旗下全球戰略市場集團總裁任善可 (Shanker Ramamurthy)與《第一財經週刊》記者婁曉晶分享了他對大數據時代的信息商業化模式和移動化辦公的看法。

 

C=CBNweekly
R=Shanker Ramamurthy

 

  湯森路透集團是全球領先的專業信息服務提供商。它將專業知識與創新科技相結合,為金融與風險、法律、稅務與財會、知識產權與科技以及媒體領域的專業人員和決策者提供重要的信息,產業還包括世界上最受信賴的新聞機構。


  Ramamurthy在工作中的直接匯報對象是湯森路透集團總裁和CEO,是湯森路透核心領導團隊的重要成員。


  C: 蘋果和Facebook這樣的公司收集了大量的私家數據,這會對專業的數據分析公司造成什麼影響?


  R: 現在越來越多的人開始習慣於「我們生活在一個大數據時代」這件事了,這對我們來說很幸運,我們的工作意義也更多地被認可。數據分為兩種,一種是結構性的數 據,這就是我們一直在處理的東西,我們通過專業的記者團隊和固定的信息收集途徑獲得數據,然後將它們轉換為相關的觀點提供給大客戶,它可以顯示金融波動和 商業機會。另一種形式的信息叫抽象信息,這也是目前越來越多的公司在處理的內容,但是它的信息源和受眾都和我們不同,不在我們目前的工作之中。


  C: 我們注意到,像iPad這樣的移動終端也越來越成為辦公的一部分。如何對待這股趨勢?


  R: 這絕對沒錯。在幾十年前PC剛剛得到普及的時候,我們就投入了很大心血在桌面辦工上,而現在是平板電腦和手 機了。我們推出了一個新的PC桌面金融信息產品Eikon。它也支持iPhone和黑莓,並且會在未來做得越來越輕便。我們給專業的法律人士提供的法律信 息在線平台WestlawNext現在也推出了移動設備訪問服務。在以前,法律人士想要在厚厚的法典裡尋找一個內容,做上標記並且補充一些信息時很麻煩, 現在他們用手機也能查,然後調出一個窗口添加自己想寫的備註信息。我覺得這就是未來的趨勢。


  C: 路透還有一塊軟件公司業務,這在整個湯森路透架構中持一種什麼樣的地位?


  R: 最基礎的層面是信息的收集整理,高一層面是信息的分析。再往上一層面所做的是工作流程中的管理,最高的層面就是建構整個市場的數據平台、交易平台。


  軟件的作用發生在實際的工作流程裡,幫助我們在專業層面做工作流程的整理。舉一個例子,很多公司的法律部,比如中石油或者歐美的大型企業,它都會有法 律顧問,這些法律顧問每年接手的案例達到100多件以上,我們會提供專業軟件作為工具,幫他們做好工作流的整理。我們在某種意義上可以說是兩種公司,既是 提供信息服務的公司,也是轉變信息服務的公司。


  C: 《紐約時報》說,它的廣告收入的重要性讓位於訂戶營收,而訂戶來自於電子版。那麼湯森路透旗下Times的電子版表現怎麼樣?紙質版總有一天會消亡嗎?


  R: 首先,紐約時報是個B2C公司,而我們是B2B公司,這是兩種不同的模式。雜誌、報紙他們的大部分盈利都來自於廣告,而我們不打算從報紙的廣告或者訂閱上賺錢,我們主要還是為大客戶提供專業的商業信息。


  但是,我的確認為紙質版的報紙是會消亡的,至少會減少,這是現在這個市場的情況。像我的孩子只會在iPad上看書,每個出版人都要認真地考慮這個問 題。對我而言,現在的情況就像二三十年前,我們為律師這些專業人士專門出版書選,但是現在我們為他們打造一個把內容都放上去的網站或者應用,它可以實現並 能更好地實現應有的功能。


PermaLink: https://articles.zkiz.com/?id=38598

Gartner:全球IT支出增長疲軟,大數據業務將成驚喜

http://wallstreetcn.com/node/19348

Gartner預計2012年全球IT支出為3.6萬億美元,低於此前預計的3.75萬億美元。Gartner還預計明年全球IT支出將微幅增長3.8%。微軟和IBM的三季報已經讓市場對IT支出的疲軟感到憂慮。

Gartner:
全球IT支出在2013年預計將超過3.7萬億美元,較2012年預計的3.6萬億美元支出增加3.8%。但大數據(big data)業務將帶來更多驚喜。
 
Gartner高級副總裁Peter Sondergaard表示:「到2015年,全球將新增440萬個IT崗位來支持大數據業務,其中在美國將辛之呢過190萬個IT職位。此外,美國大數 據相關的新增崗位將創造三個IT業意外的就業機會,因此在未來四年裡,信息產業將為美國帶來合計超過600萬個職位。」
 
他還說道:「但這也帶來了挑戰,行業的人才不足。我們的教育體系無法滿足。因此只有1/3的崗位預計能夠得到滿足。數據專家是稀缺商品。IT巨頭們需要立刻吸引這些人才。這些崗位是信息經濟的未來。」
 
以下圖片來自Dave Feinleib
 
 
此外,Gartner還預計到2016年,超過半數的非PC設備將由員工來選擇購買。到2020年末,所有設備中超過半數將由員工來選擇購買。這對蘋果是個好消息,微軟則相反。
PermaLink: https://articles.zkiz.com/?id=38986

阿里巴巴的大數據夢

http://www.infzm.com/content/84895

為了迎接即將到來的大數據時代,各大互聯網公司都在爭分奪秒。阿里巴巴在公佈大數據分享平台之後的半年中,也全面啟動了攻勢。但即使是這個行業的先行者,離大數據時代也還有不小的距離。

剛剛過去的2012年,秦予有個很大的遺憾,就是沒能招聘到自己想要的數據科學家,浪費了公司給的招人名額。他是支付寶用戶價值創新中心的負責人。這個中心是支付寶大數據業務的核心部門。

阿里巴巴2012年的進人指標只有200個,具體到支付寶公司,基本是只出不進,只有秦予所在的部門得到了難得的兩個進人名額。但她只招到了一個合適的。

事實上,各大互聯網公司都在尋找這樣的人。騰訊網絡媒體事業群總裁劉勝義2012年年中就公開表示:隨著用戶各類數據的累積,大數據時代已經來臨。騰訊各大產品線中都擁有自己的數據挖掘團隊。而騰訊最新財報顯示,QQ用戶數接近8億人,活躍用戶數近2億人。

阿里集團2012年7月10日就已宣佈,設立首席數據官崗位(CDO),負責推進「數據分享平台」戰略。同日,阿里發佈「聚石塔」平台,為天貓、淘寶平台上的電商及電商服務商等提供數據云服務。

阿里巴巴集團表示,如何挖掘、分析和運用這些數據,並和全社會分享,是這個戰略的核心所在。阿里巴巴是年交易額過萬億元的中國最大的電子商務平台,目前有兩萬人左右,其中近千人從事數據業務工作。

可以看到,從數據中掘金,已經成為各大互聯網公司的共識。但在這個即將到來的大數據時代,這些公司具體將如何推進呢?

「離大數據時代 還有不小距離」

秦予要找的並不是一般的數據分析師。

「國內不缺數據挖掘人才,但很難找到數據科學家。」秦予對南方週末記者說,秦予的團隊有7個人,他們在支付寶內部被稱為「數據科學家」。

一般的數據分析師是根據支付寶的各種數據進行分析,給公司決策層和各個業務部門提供諮詢支持。這也是目前很多公司都設有的商業智能部的主要職能。但數據科學家們做的事情是開發出具體可以銷售的商用化的大數據產品。

所謂大數據,一般是1000T以上的數據,如果按照一般機器配置,相當於400台到500台電腦。對這些數據信息的商業化開發就是大數據產業鏈。

《大數據時代》一書中提到,未來,數據將會像土地、石油和資本一樣,成為經濟運行中的根本性資源。數據科學家被認為是下一個十年最熱門的職業。

而大數據跟個人最為密切的關係是對隱私的可能侵入。比如,亞馬遜監視著我們的購物習慣,谷歌監視著我們的網頁瀏覽習慣,微博似乎對我們和我們朋友的關係無所不知,QQ圈子能給你推薦你不願意再見面的某個女生的照片和動態信息。

秦予是從美國歸國的計算機模擬博士後,在摩根大通和匯豐銀行工作過多年,2010年加入支付寶公司,負責支付寶和淘寶集市的大數據業務。支付寶公司擁有中國僅次於銀行業的個人數據信息。

「阿里巴巴有海量的數據,對於做大數據的人來說,阿里巴巴是中國最好的平台,很吸引人。因為我的金融背景所以選擇支付寶。」秦予對南方週末記者說。

回國進入大數據行業之後,秦予參加了很多大數據的論壇和研討會,她最大的體會是,看到的新東西很少。

「別說大數據,連小數據都很少。現在很多公司說的大數據,大都是數據的蒐集和整理。這是底層的工作。」秦予說,「中國離大數據時代還有不小距離。」

即使是作為國內大數據業務的先行者阿里巴巴,其大數據業務發展也依然是分散在各個子公司,並在2012年下半年才開始推出少量的商用產品。

「從人出發,先去找人」

支付寶曾經在八年前公司成立第二天就建立了數據部門,但真正有大數據業務,是在2010年的事情。正是那時候,支付寶從招商銀行信用卡中心招來一批專業的金融人才。秦予也是那時候加入支付寶的。

「金融行業的大數據業務已經很成熟了。」秦予說。

支付寶的數據科學家每天做的工作就是,把客戶分成50個族群進行研究。比如,細分出都市輕熟男群體,這個群體的特徵是每次買的不貴,均價七八十元,收入中等,但很喜歡在網上買東西。

還有一個族群被稱作「千金美少女」,其特徵是收入並不高,但家裡有錢,買得多,買得貴。

按照分群研究的思路,秦予的團隊把淘寶、天貓、支付寶和聚划算的用戶做系統研究,通過觀察他們喜歡看什麼媒體,上什麼網,來「生動地」知道用戶是個怎樣的人,進而推薦商品供用戶購買。

能識別用戶之後,在寫商品推薦文字的時候,不再是過去那樣千篇一律地使用「親」作為開頭。

「今天很多網站犯的錯誤就是,根據個人購買記錄,推薦一個類似的產品。其實用戶很可能買過了。用戶要的是你給他推薦一個跟他相似的人買的東西。」秦予對南方週末記者說,以前的數據研究思路是從產品出發,大數據時代是從人出發,先去找人。

支付寶發展大數據業務,目前主要是為內部服務。比如,過去支付寶很重視新客戶的獲取,但後來發現開賬戶的人多,關賬戶的人也不少,通過數據分析,支付寶建立了一個流失預警模型,預測每一個人未來三個月是否會離開支付寶,並對潛在的流失用戶做一些喚醒。

「支付寶是准金融行業,數據比較敏感,涉及用戶隱私,還沒有到開放的階段。」秦予對南方週末記者說,支付寶非常忌諱提供商用化產品給商戶,很多合作方惦記著的是支付寶的數據,但這是支付寶的高壓線。

「支付寶發展大數據的目的,跟淘寶和天貓有點偏差。我們更多地是為內部服務,淘寶和天貓更多地強調商業化。」秦予對南方週末記者說,阿里巴巴集團的大數據業務商用主要是淘寶平台的幾個公司在推進。

「數據分享平台」戰略

淘寶平台的數據大概可以分成三塊,一是離線的數據,比如什麼地方的人最愛吃大閘蟹。另外一些在線數據,主要是圖片,淘寶一些大的賣家都把圖片存在淘寶裡面。還有一些信息是用戶的淘寶收藏夾。

2010年3月,淘寶宣佈將面向全球首度開放數據,並制定了兩條大原則:數據分層次開放;涉及消費者個人或者企業隱私的數據絕對保護。

淘寶的數據開放一是對公眾的免費信息,比如推出類似於宏觀經濟數據的「淘寶指數」。商家可以根據以往的銷售信息和「淘寶指數」進行生產、庫存決策。對於大眾來說,淘寶的數據發佈就像是統計局和價格監測機構的功能,淘寶指數相當於行業和宏觀經濟的各項指標。

作為針對企業的數據開放的商用產品,淘寶推出了數據魔方產品,通過淘寶數據魔方平台,商家可以直接通過數據魔方產品獲取行業宏觀情況、自己品牌的市場狀況、消費者行為情況等,但是不能獲得競爭對手的數據。

2011年4月,數據魔方正式上線。在「店小二」的推廣下,林氏木業成為第一批使用者。林氏木業是一家完全依靠互聯網平台銷售家具的電商公司。

該公司一位市場推廣人員對南方週末記者介紹了數據魔方的具體運用過程:依據數據魔方關於熱詞的各項數據變化,及時調整優化商品標題,提高寶貝排名,進而獲取更多流量,提高銷量。

以銷售面膜為主的素野天貓旗艦店的運營經理陳林告訴南方週末記者,素野選擇數據魔方專業版本,支付3600元/年的費用,除魔方外,還可以使用量子恆道(淘寶官方推出的一款免費數據分析工具)。

「數據魔方帶來的更多是虛的概念,對流量、銷售額這種具體指標意義不大。」陳林說。

2011年6月,淘寶一分為三,變成天貓、淘寶集市和一淘網。這之後,淘寶系的大數據發展的主要任務放到了商家已經形成了付費習慣的天貓平台。目前天貓的主打大數據商用產品是聚石塔。

2012年7月,阿里巴巴集團的「聚石塔」正式發佈,「數據分享平台」戰略全面展開。聚石塔是阿里巴巴首次聯合全集團大數據力量打造的一款大數據商用產品。其中,天貓及淘寶網主要負責尋找合作夥伴,發展商家,阿里云負責提供云主機,萬網負責客戶服務。

同時,阿里巴巴B2B公司CEO陸兆禧出任集團首席數據官崗位,向CEO馬云直接匯報。馬云在聚石塔發佈的時候宣佈了阿里集團未來新戰略:平台、金融、數據。

聚石塔提供數據存儲、數據計算兩類服務。根據官網上的指導價格,若需要內存為1200M、50G容量的數據存儲服務,優惠價為6090元/年;如果購買英特爾雙核處理器、內存4G、硬盤500G、帶寬5M的彈性託管服務,價格約在7700元/年。

廣州衣酷服飾有限公司的運營總監敬小虎對南方週末記者表示,他們公司是2012年9月開始使用聚石塔服務的,正好趕上「雙十一」大促銷,兩天之內發完了所有的貨,總共3萬多票。他負責該公司在天貓上的店舖皓盾天貓旗艦店的運營。

「沒有這個軟件,半個月都發不完這些貨。」敬小虎對南方週末記者說,如果按照2011年沒有加入聚石塔時候的「雙十一」銷售情況,光把訂單人工下載下來就花費了三五天時間。而且還出現過很多漏單和重複下載問題。

不過,敬小虎表示,如果店舖一天的銷量能做到500票以上,購買聚石塔服務比較划算,否則軟件買下來除了應對「雙十一」這樣的大促銷,基本就閒置著。

平台後的產業鏈

阿里巴巴公佈的信息顯示,自2012年7月10日聚石塔發佈以來,已有十多萬的商家入駐。聚石塔的訂單覆蓋率,10月中旬的數字是20%。

2012年「雙十一」購物狂歡節,是對天貓大數據發展的一次檢驗。據天貓官方數據顯示,狂歡節大促當天,聚石塔內系統處理的訂單超過天貓總量的20%,比平時增長20倍。

又一城公司是首批進入聚石塔服務器項目的軟件IT企業。又一城公司的銷售人員賴活龍對南方週末記者表示,有ERP系統的商家可以直接找天貓,沒有ERP系統的商家,只能找像又一城這樣跟天貓有合作的軟件商,讓軟件商幫忙接入聚石塔服務。

又一城和阿里巴巴的合作模式是,又一城基於聚石塔開發的軟件,對接淘寶和天貓等阿里系公司的後台系統,包括訂單信息、商品信息、會員信息、財務信息、物流信息和庫存信息。

賴活龍對南方週末記者透露,最近半年,他的重點一直是推銷聚石塔產品,一開始很多商家聽到是推銷軟件產品的電話就會按掉電話,現在的情況好多了,不少商家主動打電話來瞭解情況。

「這跟天貓的宣傳很有關係,另外就是雙十一檢驗了產品的價值。」賴活龍說。

賴活龍也承認,商家加入聚石塔之後,最直觀的改變是訂單處理的效率提高了,以前從淘寶平台下載訂單,一分鐘能下載200單,現在至少2000單。但銷售額並沒有太大改變。

越來越多的商家被迫參與到大數據產品的購買中來。

因為促銷活動越來越多,參加的話,IT系統往往跟不上,造成錯單配送等問題,中差評接踵而至,動態評分直線下降,銷量跟著下降,所以只能是購買聚石塔服務。不參加的話,沒有流量,沒有銷售額。

「如果商家不跟著淘寶走,就會受到冷落,你進來了,碰到雙十一這樣的活動,天貓會看你是否加入了聚石塔,如果沒有加入,你報名的資質能否通過是個大問題。」賴活龍說。

PermaLink: https://articles.zkiz.com/?id=42713

思考的碎片---DATE草根的大數據分析 2013/01/21 Boracay的碎片哥

http://blog.sina.com.cn/s/blog_6a54e96a01017ovl.html
@alloysun 收集了佳緣北京用戶的數據
我們嘗試用簡單的方法分析得到如下結論

1.我的結論
我嘗試做這樣的結論,根據你的數據

1.26/29是女性高峰 
2.女性VIP比例隨年齡增加到31歲達到高峰 
3.VIP的照片比例比較高 說明嚴肅VIP比普通用戶更serious
4.VIP比例都小於1 證明這是一個女性消費佔主導網站。大約是6。5:3.5 附近
5.VIP絕對數字一直在增加沒有26歲現象。
6.男性也有30歲現象。VIP的絕對數量30歲最多。

2. @alloysun的結論

1. 在供求關係中,哪些人群是被追求的一方。
   
  1) 年輕女性(23-26)被年輕男性與大齡男性追求
  2) 成熟男性(26-35)被年輕女性與大齡女性追求

  這兩個人群的數據量以及未來增長率是網站是否能夠吸引用戶的關鍵。

2. 消費模式
 1)年輕女性(26及以下),被追逐對象,VIP(看信包月/鑽石會員)比例非常低,基本不消費。
 2)大齡女性(27及以上),優勢逐漸喪失,角色被追求者轉為追求者,vip比例明顯上升,可以理解為消費主體之一。
  3)年輕男性(25及以下),基本為追求者,基本以郵票消費為主。
  4)成熟男性(26及以上),追求年輕女性,被大齡女性追求,vip比例保持穩定(20%)。這個年齡段的男性收入水平較高,是穩定的消費主體。

3. 同類網站的競爭關係。 我注意到這種現象,不少人同時在幾個網站同時註冊,所以,並不一定是非彼即次的競爭關係。

4. 過度選擇帶來選擇困難,反而是到了年齡點,逼迫大齡男女作出決定。年輕男女的追逐會持續。

我的VIP包括鑽石用戶以及看信包月,網站上沒區分

綜上所述,我個人認為成熟男性才是網站最需要吸引的人群。他們既是消費者也是帶路貨(百貨行業用戶,意思是消費者必然會購買的產品一般設置在商場最裡面需要消費者多走幾步,如果狩獵的話就是誘餌)
年輕女性是帶路貨但不是消費者。大齡女性是消費者但不是帶路貨。
觀察所得的結論還真有意思。

這也反映或者驗證了當下婚戀市場的價值取向和社會的價值取向吻合。
PS @alloysun 是碼農,我是草根 兩個人看同樣的數據得到的結論我更依賴直覺。碼農邏輯性和條理性更強更有實用價值。
PermaLink: https://articles.zkiz.com/?id=43118

《大數據時代的歷史機遇》 引子 趙國棟

http://xueqiu.com/2594854241/23869927
大數據總統奧巴馬

2012年8月份,美國總統大選正如火如荼。出人意料的是,奧巴馬總統的數據團隊要求他去一家叫Reddit的新聞網站去回答問題。對許多人來講,Reddit是一個陌生的名字,總統的高級助手們也不例外。但是來自數據團隊的回答卻非常簡單:「因為我們需要動員的一些人,經常在Reddit上。」

這僅僅是選戰過程中一件毫不起眼的數據決策案例。事實上,奧巴馬的數據團隊非常神秘,低調,但其觸角又無處不在,幾乎左右了整個大選,他們被內部人士戲稱為「核編碼」。他們創建了單一的巨大系統,可以從民調專家、籌款人、選戰一線員工、消費者數據庫、以及「搖擺州」民主黨主要選民檔案的社會化媒體聯繫人與手機聯繫人那裡得到的所有數據都聚合到一塊。這個組合起來的巨大數據庫令奧巴馬的數據團隊工作極富成效,令人驚嘆[1]。在這個組合的數據庫中,每個選民甚至被精確的劃分為1000多個特點,通過建模和算法分析,系統能為每個選民找出一個最能說服他的理由;每晚進行6.6萬次模擬選舉,在個體水平上,計算出奧巴馬在任何一個搖擺州的勝率。事實上不僅如此:

他們建立模型能夠預測誰會在線捐款;

他們用來網上籌款的郵件,也充分利用了數據收集和分析。

他們借助模型幫助奧巴馬籌集到創紀錄的10億美元;

他們幫助優化電視精準投放廣告的模式;

他們創造出了搖擺州選民的精細模型;

他們計算出第一夫人發的拉票郵件在春天最受歡迎;

他們利用數據來詳細分析關鍵州的選民。深入分析各個族群的選民在任何時刻的趨勢。在總統候選人的第一次辯論之後,他們分析出哪些選民倒戈,哪些沒有;

他們利用熟人效應,開發Facebook APP拉票;

他們為競選團隊購買廣告提供決策參考;

他們通過一些複雜的模型來精準定位不同選民,他們購買了一些冷門節目的廣告時段,而沒有採用在本地新聞時段購買廣告的傳統做法。廣告效率相比2008年提高了14%;

他們導致經驗主義的競選專家的作用極具下降,能夠分析大數據的量化分析專家和程序員的地位卻大幅提升。

他們讓政客們,尤其是對手知道政治領域的大數據時代已經到來。

一瓶茅台酒的旅程

消費者最頭疼的恐怕還不是茅台酒的價格,而是能否買到貨真價實的茅台。道高一尺魔高一丈,茅檯曆來的防假手段,除了推高茅台酒瓶的回收價格以外,似乎並沒有真正讓消費者放心。

為每一瓶茅台建立「檔案」,消費者可以輕鬆方便的查詢到任何一瓶茅台酒的檔案材料,是防假的終極解決之道。每一瓶酒都有一個獨立的「身份證號」,銘刻到酒瓶上,在信息系統中,記錄下從灌裝到出廠、運輸、批發、零售所有環節的信息。人們只要把「身份證號」傳輸到網站一查,真偽立辯。這個辦法看起來容易,但是真正實施,我們立刻會被淹沒在大量的數據之中。

不僅僅是茅台,中國目前所有食品面臨「安全、衛生」的大難題。如果能把茅台酒的做法推而廣之,無疑是全民之福。但是這些海量的數據記錄,對傳統的信息處理技術,提出了巨大的挑戰。

茅台的故事,其實可以演繹出管理理念的變化。這是管理日益精細化的具體體現。原來「茅台們」的管理都是按照生產批次,通常認為同一個生產批次的產品,是沒有差別的。現在的管理理念則不同,要求對每一件單品實行差別化管理。

城市治理中,也在發生同樣的事情。小到每一個下水道井蓋都被仔細編號,追蹤。這當然另我們的生活更加便利,但產業界首先需要應對的則是大數據的挑戰。



大數據,事關國計民生、產業興衰、公司存亡,不可不察。

信息科技經過60餘年的發展,數據(信息)已經滲透到國家治理、國民經濟運行的方方面面。經濟活動中很大一部分都與數據的創造、傳輸、和使用有關。2012年3月份,奧巴馬公佈了美國「大數據發展計劃[1]」,標誌大數據已經成為國家戰略,上升為國家意志。國家競爭力將部分體現為一國擁有數據的規模、活性以及解釋、運用數據的能力;國家數字主權[2]體現對數據的佔有和控制。數字主權將是繼邊防、海防、空防之後,另一個大國博弈的空間[3]。沒有數據安全,也就沒有國家安全。

華為、中興開拓美國市場受挫,就是非常明顯和清晰的信號。美國政府對自家數據安全的重視程度,已經到了不能讓任何外國信息基礎設施產品供應商染指的地步。華為此前一直希望通過競標和併購等方式進入北美市場,多年來未能如願。2008年,華為與貝恩資本聯合競購3COM公司,卻因美國政府阻撓未能成行;2011年,華為被迫接受美國外國投資委員會的建議,撤銷收購3Leaf公司特殊資產的申請;同樣是在2011年,美國商務部阻止華為參與國家應急網絡項目招標。

再看看美國國防部立項的幾個大數據項目[4]:「多尺度異常檢測(ADAMS)項目解決大規模數據集的異常檢測和特徵識別的問題。網絡內部威脅(CINDER)計劃,旨在開發新的方法來檢測軍事計算機網絡與網絡間諜活動,提高對網絡威脅檢測的精準度、和速度。Insight計劃主要解決目前情報,監視和偵察系統的不足,進行網絡威脅的自動識別和非常規的戰爭行為。……(不一一列舉,參見附錄)」其他部門包括國土安全部、能源部、衛生和人類服務部、國家航天總局、美國國家科學基金會、美國國家安全局、美國地質調查局紛紛推出大數據項目。奧巴馬指出:「通過提高我們從大型複雜的數據集中提取知識和觀點的能力,加快科學與工程前進步伐,改變教學研究,加強國家安全。」

產業層面,大數據技術雖然發源於信息科技,但其影響已經遠遠超出信息行業。數據已經存在於全球經濟中的每一個部門,就如固定資產和人力資本等生產要素一樣,如果沒有它許多現代經濟活動就不會發生。我們觀察到一些新興的互聯網公司,利用新技術,大規模地收集數據,預判客戶行為,然後在不同的行業縱橫捭闔。他們劍鋒所指,現代服務業無不受其鋒芒所迫,或隨波逐流,或奮起反擊。但缺少數據資產、缺少強大的數據分析能力,這類公司無疑處在被顛覆的邊緣。另一方面,也看到傳統行業的公司,數十年如一日的堅持積累當時被視作「廢料」的數據,現在回頭審視這些數字化的資產,居然一躍成為人類的寶庫。憑藉獨一無二的「數據資產[5]」,公司進入相關行業,易如反掌。

我們回頭審視產業的起起伏伏,就會發現決定產業興衰的根本性因素,已經不是一城一地的爭奪。土地、人力、技術、資本這些傳統的生產要素,甚至需要追隨「數據資產」重新進行優化配置。封建時代,往往是裂土封王,權貴都是大地主;工業革命後,製造業鉅子,成為偶像;資本市場,受到追捧的是擁有大量錢財的投資家;但是在大數據時代,「數據資產」成為最重要的生產要素。擁有大量數據資產的人,已經成為美國總統的座上賓[6]。

產業的分分合合,一直是資本市場非常喜歡的故事。不管是分拆也好,整合也罷,資本市場都有錢賺。以往產業的整合基本圍繞產業鏈展開。要麼向上游擴展,要麼向下游兼併。但是在大數據時代,我們看到的商業圖景是圍繞「數據資產」拉開產業併購的大幕。谷歌所有的收購或者推出的新產品,都是為了增加數據資產的「維度」和「活性」[7]。所有觀察公司發展,產業未來的機構或者個人,如果忽略「數據資產」,或者對「數據資產」認知膚淺,必將導致錯誤的判斷。大數據將是決定產業未來的戰略性資產。未來產業間的整合收購,將會在很大程度上圍繞「數據資產」展開爭奪。

企業家、投資人、諮詢顧問、分析師,必須要從戰略層面思考大數據對產業、對公司的影響。2012年初,我們曾經和恆安國際的董事會一道交流大數據對製造業的影響。會上許連捷總裁[8]說:「在大數據時代我們收集數據,研究消費者行為,推出新的產品、改善供應鏈,降低庫存,一句話就是把大數據融入到經營中去。也許有可能把庫存降到近乎『零』的水平。」所以,我們談大數據,首先是思維方式的問題,要建立全面、系統的大數據意識,其次才是落實到公司戰略。大數據對公司的影響是多方面的,涉及組織、文化、流程、技術等。本書有一章來專門詳細論述大數據對公司組織結構的影響,在此不贅言。

具體到中國信息產業,發展速度一直落後於國外的巨頭,長期處在產業鏈的末端,賺取刀片一樣的利潤。積累到最後發覺只形成了簡單可替代的「中國製造」而非具備革命性創新性的「中國智造」。國家拿出大筆資金扶持上游環節的拓荒者,比如CPU、操作系統、辦公軟件,但是相關領域國內外的差距過於遙遠,也缺少大規模的商用市場,花了國家的錢,卻鮮有在商業上大獲成功的先例。但是在新興的大數據處理領域,中外公司幾乎站在同一起跑線。中國作為數據的巨大產生國,有著更廣闊的應用空間。比如中國移動、工商銀行、淘寶,已經具備世界級的產業應用環境。有業內人士表示,單純考慮狹義的大數據處理技術(如Hadoop、MapReduce、模式識別、機器學習等),中外差距僅有5年左右。如果考慮數字資產規模以及利用的技術,中外差距更多體現為意識上的差距。美國在數據開放、跨部門共享方面做出了表率。而我國對大數據的價值和應用,政府、學術界、產業界和資本市場尚待達成一致的認知。各部門、各地方普遍存在「數據割據」和「數據孤島」的現象。缺乏大數據意識,是阻礙我國大數據技術在各行業落地的關鍵因素。

大數據時代,有兩點非常有利於中國信息產業跨越式發展。第一,大數據技術以開源為主,迄今為止,尚未形成絕對技術壟斷。即便是IBM、甲骨文等行業巨擘,也同樣是集成了開源技術,和本公司原有產品更好地結合而已。開源技術對任何一個國家都是開放的,中國公司同樣可以分享開源的蛋糕。但是需要更加開放的心態,更加開明的思想,正確的對待開源社區。第二,中國人口和經濟規模,決定中國的數據資產規模,冠於全球。客觀上為大數據技術的發展,提供了演練場。第二點亟待政府、學術界、產業界、資本市場四方通力合作,在確保國家數據安全的前提下,最大程度地開放數據資產,促進數據關聯應用,釋放大數據的大價值。

目前政府和產業界積累了大量的數據資產,但是苦於缺乏行之有效的與工程實踐匹配的算法和人才,來充分挖掘數據的價值。形象地說,好多行業是守著「金山要飯吃」。而學術界,尤其是應用數學領域,在統計學習、圖像處理、網絡科學領域鑽研頗深,但缺乏大量的實際的數據來驗證和訓練算法。雖有屠龍術,無處展身手。兩方長期處於脫節的狀態。如果應用數學界和產業界緊密協作,將是中國公司的極大利好,會大大促進公司的發展。2012年11月17日,在北京大學國際數學研究中心召開了首屆「數據科學與信息產業研討會」。學術界和企業界的一百多位領軍人物和活躍分子聚集在一起,共同商討數據科學的含義和發展計劃,以及企業界的需求。這次會議為促進學術界和信息產業的聯合,開了一個好頭。

數據資產並不是大公司才有的專利。在第七章中詳細討論一種「泛互聯網化範式」,終端+平台+應用,最後形成數據資產。許許多多富有活力的公司,均符合這一範式。這也是創業型公司開啟大數據之路的總結和探索。

自從我們在中國資本市場第一個發出「大數據時代即將到來」聲音後,大數據已經成為年度熱詞。綜合政府、學術界、產業界的最新動向,我們預計,如果把2012年看成大數據普及之年,那麼2013年,將成為大數據應用之年。相關產業規劃、行業政策將紛紛出台。金融、電信、政府、電商、醫療、平安城市等相關應用將加速推進。2014到2016年將是大數據效益之年,若干中國大數據公司相關業務形成爆發性增長,部分相關公司海內外融資或IPO上市。

本書內容將圍繞大數據對產業走勢、融合、變遷的影響、在產業中的具體應用(商業模式)、以及數據科學的興起三大主題展開。本章包括大數據產生的歷史背景、激動人心的典型特徵、系統全面的認知框架等等內容,最後會簡略談談推廣大數據面臨的困難和挑戰。


[1] 《大數據研究與發展計劃原文》地址:http://www.whitehouse.gov/blog/2012/03/29/big-data-big-deal,中文譯稿參見本書附錄四

[2] 通過搜索引擎,並未發現其他文獻強調「數字主權」。之所以採用「數字主權」,而非「數據主權」,主要因為構成信息科技的基礎是「0」、「1」兩個二進制的數字。所有的數據在本質上都是「0」、「1」的排列組合。

[3] 參見國金證券大數據系列報告第三篇《以數據資產為核心的商業模式》,p1

[4] 原文參見:http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_fact_sheet_final_1.pdf

[5] 數據成為資產,見於國金證券大數據系列研究報告《大數據時代的三大發展趨勢及投資方向》

[6] 美國總統奧巴馬2011年2月17日與多名科技界領袖共進晚餐。總統左側是蘋果公司創始人斯蒂夫·喬布斯,右側是Facebook的創始人馬克·卡克伯格。

[7]維度、活性等概念在數據資產章節詳細說明,是數據資產評估模型的一部分。

[8] 許連捷現任中國民間商會副會長,泉州市工商聯主席,第十屆全國工商聯副主席。

[1] 英文原文參見CNN網站http://edition.cnn.com/2012/11/07/tech/web/obama-campaign-tech-team,下面這段文字見於博客http://blog.sina.com.cn/s/blog_5be3027d0101i44z.html
PermaLink: https://articles.zkiz.com/?id=55530

Next Page

ZKIZ Archives @ 2019