📖 ZKIZ Archives


讀書劄記151208 Fooled by Randomness (上)

來源: http://www.tangsbookclub.com/2015/12/08/%e8%ae%80%e6%9b%b8%e6%9c%ad%e8%a8%98151208-fooled-by-randomness-%e4%b8%8a/

讀書劄記151208

Fooled by Randomness (上)

執筆人:蟬

 

《Fooled by Randomness》(2005) Nassim Nicholas Taleb

 

〈關於隨機〉

「隨機Randomness也許能在學術上精確定義,但在日常生活上粗疏理解,一般是指「缺乏模式及可預測性的事件」。***

例如彩票、擲毫的結果都是大眾普遍知道的隨機事件。

 

為了系統性地表述隨機事件的結果,數學家提出了「機率Probability」的概念。機率是以數學方法表達一項事態發展的可能性。*** 例如一顆完美的骰子擲到任何點數的機率均是1/6。

 

在大量採樣的情況下, 使用機率對其 結果分佈 作出預測相當有效;但對於個別和小量採樣則不然。*** 而且機率必須透過弄清事件的結構而獲得:例如在封閉和具備清楚規則的遊戲中,屬於「演釋法deduction」的產物。****

 

另一個分析隨機的方法便是透過對過往不同結果出現的「頻率frequency」進行統計,按其分佈推測事件的未來結果。**** 這種以統計作基礎的方法屬於「歸納法induction,在處理無法弄清因果causation的事件尤其有效。

 

雖然機率和頻率統計以不同角度去描述隨機的面貌,但有趣的是 “隨機看起來往往並不隨機”。 英國著名數學家Karl Pearson在1902年記錄了一系列過百萬次輪盤遊戲的結果,發現在極高 “統計顯著性”下,該系列結果表現得極不隨機。雖然可以將其歸因於實驗裝置的不完美,但隨機可能便是這樣的一個概念:

「理型的隨機並不存在,而真實的它往往看起來並不那樣隨機。」*****

 

電腦保安方面經常會應用到隨機,將文本內容「加密」的方法一般大量運用隨機字串String。

在講述數學家Alan Turing的電影《The Imitation Game》中,Turing發明的解密機將當時被認為幾乎不可能破解的Enigma加密機擊敗。 (過程當中涉及德軍沒有完全按照使用手冊進行作業。J)

即使經過數十年來電腦的飛躍發展,現時世上也只有極少數電腦能夠生產真正的隨機結果。軍用的 “隨機產生器”必須倚賴粒子運動、氣象等資訊作為種子,才能產出“相對隨機”的內容。

 

〈強說道理的人〉

人們在處理日常資訊的時候,為了更有效率地大量儲存,往往需要將資訊加工:包括為散亂的事件建立關係,並提取重點。 人腦從記憶中提取資料時,碎化的重點往往需要重新串連,構成故事去加以理解。 這個記憶系統先天上有其限制,更且帶有偏見。

 

人在面對雜亂的訊息時會本能地從中尋找「模式Pattern」,因為模式能省卻處理和記憶所需的能力和容量,而各種模式當中最常用的便是「因果關係causation」。因果關係令所有已經發生的事情看似有根有據:只要滿足初始條件,便能得到特定結果。***

在日常生活中因果關係固然觸目皆是,但貌似而實非者卻也為數不少。 將一切事理都看作因果關係, 最大的壞處便是失去全面判決的能力

 

例子:某富翁忽發奇想,懸賞招募玩家參加「俄羅斯輪盤」遊戲:玩家只需向腦袋開槍一發,如為空發,便能獲得一千萬元獎金;每位玩家每年限玩一次。

富翁的龐大財富讓這遊戲持續多年,而玩家Sim在過去15年一直成功贏得獎金,並被新生代捧為人生大贏家,眾口交譽其膽識過人。

 

從結果看,玩家Sim真的相當成功。但如果以機率去思考他是如何走過來的,便知道他冒了多大的險。按每年勝出的機率5/6計算,Sim能連續勝出15年的機率為6.5%,即每1000個玩家當中只出現65個Sim類人物。***

 

在評價玩家Sim的成功時,不妨以另一角度切入:Sim在過去15年遊戲生涯的平行時空中,另外產生了64個勝出的Sim,和935個因輸掉而死去的Sim。

換句話說,65個生存Sim的總代價是在平行時空中遺下的935個死去的Sim。平均來說, 每個生存Sim應付代價是14.385個死Sim。

 

結論:當事件並非完全「決定性deterministic」—即同樣初始條件必然產生特定結果—的時候,一個決策的代價應為所有其他可能結果(史家稱為「替代歷史alternative history」)的總和。*****

 

這種將不確定性和概率內化的分析方法,無疑將事物的相關度弱化,令本已複雜的事物更難處理。*** 但在互聯網科技一日千里的今日,最流行的數據處理方法:「大數據Big Data」,不正正就是向因果關係不確定的一種妥協了麼?

 

然而人的思考系統對於不確定性和概率是相當不適應的,早在60年代心理學家便透過不同的實驗觀察到這點。近年美國著名心理學家Daniel Kahneman更提出「兩套系統Two System」去描述人類思考系統的特徵和盲點,並以此獲得諾貝爾經濟學獎。

下篇將介紹一些常見且甚具影響力的認知系統偏見,和隨機與非線性相遇的問題。

PermaLink: https://articles.zkiz.com/?id=174530

讀書劄記151216 Fooled by Randomness下

來源: http://www.tangsbookclub.com/2015/12/16/%e8%ae%80%e6%9b%b8%e6%9c%ad%e8%a8%98151216-fooled-by-randomness%e4%b8%8b/

讀書劄記151216
Fooled by Randomness (下)
執筆人:蟬

〈偏見與謬誤〉
過去數十年認知科學和心理學揭開了人類許多認知和思考方面的偏見。 這些“漏洞”很多是源於思考系統的「快系統」設計。 快系統的設計目的是在極短時間內作出合適的反應,而所謂「合適」則是指演化意義上的適應性,古人類在野外生活時為了存活而作出的應對。 可想而知這類反應全都是為了解決燃眉之急,如以經濟學指涉的「理性」作標準的話,這些反應往往都缺乏合理性,尤其在不確定性事件上面。***

下文舉出幾類有趣的例子。

  • Hindsight Bias 事後孔明

Tversky & Kahneman在70年代以 尼克遜總統即將訪問北京發出問卷,列出幾件可能發生的事件,讓受試者估計實現的可能性。 總統訪問結束後,針對前問卷中已然發生的事項,受試者再被提問當初他們給出的可能性評分,發現全都明顯高出原先的估算。***

「事後孔明」現象對記憶有深遠影響,人的回憶過程其實是從記憶庫中抽出一些重要片段,然後重新建立片段間的關係,*** 如時序和因果等。故此事後孔明會令人對記憶產生錯覺,久而久之將記憶扭曲並視為真實的過去,嚴重的話可能會造成精神錯亂。

  • Availability Bias 可用性偏見

受試者被Tversky & Kahneman問及英文詞語裡,以K開頭和K為第3個字母的字詞哪種較多。大部份受試者皆認為K作開頭的比較多,但實際上K為第3個字母的要比K開頭的多三倍。

「可用性偏見」源於記憶建立方式帶來的限制。 以上實驗為例,由於人在記憶字詞時會特別重視開首和結尾,中間的字母只是大概記住,往往需要倚賴首尾作為索引去回憶整組字母。 所以在記憶庫中尋找資訊時,人們常會誤以為記憶得較清晰的便是數量較多的資訊,這種偏見在人們需要 “自圓其說”時經常發生。

  • Survivorship Bias倖存者偏見

在投資界有所謂的Fund of Funds基金,其投資做法是為客戶選擇一籃子預期表現良好的基金,並適時作出調整。數年前出現過一種投資這類基金的新型策略:「減持當下表現良好的基金,而增持近況低沈者。」其前設為不同的基金長期而言表現相若,故此近況低沈的基金會在將來跑贏當下表現良好者。

這策略的問題出在取樣上面,成績太差而被迫結業的基金在統計時會被忽略,而該策略所指涉的只是已捱過困難時期的 “倖存者”。

〈當隨機遇上非線性〉
著名演化生物學家 古爾德在47歲多被診斷患上癌癥,當時主診醫生向他表示,按照統計同類病人的壽命中位數為48歲,即古氏只剩下約8個月命。古氏頓感晴天霹靂,但他並不信命,立即放下手上的研究轉而尋找證據證明自己應能存活更久。古氏在得出結論後發表一篇關於統計的學術論文《Median is not the message》,並成功地活到60多歲才離世。

古氏在文中指出,存活年數的中位數雖然正確,但存活年數的分佈並非呈現為對稱式的「常態分佈normal distribution」。實際統計指出病人若活過48歲,其平均壽命會高達72歲,即與一般人相當接近。
古氏的例子指出的是一種「非線性non-linear」事例:壓倒駱駝的並非最後一根稻草,而是一直累積的壓力。 如單純以最後一根稻草作為原因去解釋駱駝被壓倒,將會難以找到真正的因果關係。

從研究機率的著名數學模型 「Polya’s Urn波利亞的罐子 」中可以看到非線性的一種有趣特性。 假設罐子裡有紅白色球各半,遊戲規則是輪番從罐子裡抽出一個球,抽出後立即補回兩個同顏色的球,然後再抽。如是者重複進行,到底罐子裡紅白色球的分佈會變成如何?
151216上圖為電腦模擬結果,從中可以留意到兩件事:
A 最終紅或白球較多的結果大約是各佔一半。
B 經過400輪操作以後,紅白球比例的走向幾乎不可能發生逆轉。***

經濟學將這種「不可逆轉效應」稱為「Path dependent effect路徑依賴效應」***,波利亞罐子除了對研究機率有價值外,還反映出一些事理的真相。即在平等的初始條件和獨立隨機的情況下,只要賦與特定的遊戲規則,事態發展往往會造成不可逆轉的情勢。
資本主義社會的「貧富懸殊」便是一個有力的例子。***

投機作為一種在資本社會中獲取財富的手段,其本質可能是相當隨機的***:即人們的財富多寡與才能和付出並沒有直接的因果關係, 但當隨機的結果遇上不對稱性便會遭到放大,令人誤以為社會上的富人皆有其成功之道。其實他們可能只是龐大樣本下的幸運兒,而非甚麼能人異士。

如此類推,一些嘗試為隨機結果發展出來的“知識”,其有效性不言而喻。 撇除特定領域的知識不談,知識本質上便可能是不對稱的****。「歸納法」作為獲得知識的手段,在方法論上便是不對稱的:一個反例足可推翻無數的正例。 歸納法透過將個別觀察壓縮成「通則」去累積知識,當中被省去的便是隨機性。


《Fooled by Randomness》(2005) Nassim Nicholas Taleb

PermaLink: https://articles.zkiz.com/?id=175868

Next Page

ZKIZ Archives @ 2019