📖 ZKIZ Archives


小白也能理解的“標準差”

來源: http://wallstreetcn.com/node/211672

標準差(Standard Deviation)一詞經常出現在華爾街見聞網站的文章中,例如

QQ圖片20141207150125

對於部分非金融專業出身的讀者來說可能不太理解這句話代表著什麽意思,到底什麽是標準差?

當我們面對一堆數字的時候,我們可以很簡單的找出這組數字的中值,也可以很容易算出平均值。但是只有這兩個數字還不夠,因為這樣無法勾勒出這一堆數字整體的“shape”。此時,標準差的作用就可以體現出來了。

標準差是一組數值自平均值分散開來的程度的一種測量觀念。一個較大的標準差,代表一組數據里大部分的數值和其平均值之間差異較大;一個較小的標準差,代表這些數值較接近平均值。

未標題-1

例如上圖,兩組數的集合 {1, 4, 9, 14} 和 {5, 6, 8, 9} 其平均值都是7,但第二個集合里的數字明顯與7距離“更近”,通過公式算出第一個集合的標準差約為4.9,第二個約為1.5。

計算流程如下:首先計算出該組數據里每一個數字與平均值的差,然後將所有的得出差進行平方,接下來求出均值,最後再開方。

為什麽用這麽複雜的方法來計算標準差呢,這是因為在實踐中,我們發現相當多的數據都呈現近似於“正態分布”,如下圖,正態分布的概念在統計學中具有重要意義:

未標題-2

標準正態分布又稱為u分布,是以0為均數、以1為標準差的正態分布,正態分布的概率密度函數曲線呈鐘形,因此人們又經常稱之為鐘形曲線

簡單的說就是呈現正態分布的一組數據中,靠近中間高點的數字出現的概率要遠大於在兩側更遠地方出現的概率

在很多情況下統計數據都會呈現正態分布的構造,比如在樣本很大、每一個樣本又是類似的獨立隨機事件。例如能力的高低,學生成績的好壞,人們的社會態度,行為表現以及身高、體重等身體狀態都呈現正態分布。

理解正態分布對理解標準差具有重要的意義,回到上面那張鐘形曲線圖,如果說平均值可以告訴我們這條曲線最高點在什麽位置,那麽標準差就可以告訴我們這條曲線的寬窄程度。

反過來正態分布也可以用來解釋標準差:在一個標準正態分布中,數字出現的概率是固定的。

如下圖,約68.3%數值分布在距離平均值有1個標準差之內的範圍,約95.4%數值分布在距離平均值有2個標準差之內的範圍,以及約99.7%數值分布在距離平均值有3個標準差之內的範圍。稱為“68-95-99.7法則”或“經驗法則”:

empirical rule normal distribution bell curve

好的,到這里你應該已經理解了關於標準差的兩個重要概念。那麽回到金融領域中,標準差經常被用來描述價格的波動性,標準差越大說明其偏離均值程度越大,也越罕見,之後回歸常態的可能性也在升高。

回到文章開頭提到的黃金價格波動率達到6個標準差,這意味著在完美情況下每5億天的波動中,只有1天有機會出現當前這樣極端的情況,幾率約等於為0.0000001973%,大約139萬年一次(只算交易日則為202萬年)!

所以路透社分析師John Kemp當時感嘆如果價格波動按照正態分布進行,這將是黃金200萬年一遇的黑天鵝。

這時你應該可以更形象理解這種情況有多罕見了吧。當然,如果前面你全都沒看懂,那麽只要記住下面這組數字就行了:

假設有一組按天采樣的正態分布數據,簡單的概括:

出現等於1個標準差的概率約為3天一次

出現等於2個標準差的概率為約22天一次

出現等於3個標準差的概率約為370天一次

出現等於4個標準差的概率約為43年一次

出現等於5個標準差的概率約為4779年一次

出現等於6個標準差的概率約為139萬年一次

出現等於7個標準差的概率約為10億年一次

(更多精彩財經資訊,點擊這里下載華爾街見聞App)

PermaLink: https://articles.zkiz.com/?id=122678

Next Page

ZKIZ Archives @ 2019