📖 ZKIZ Archives


SENSE隨筆140605阿特蘭大作弊事件 掌門天地

http://www.tangsbookclub.com/2014/06/05/sense%E9%9A%A8%E7%AD%86140605%E9%98%BF%E7%89%B9%E8%98%AD%E5%A4%A7%E4%BD%9C%E5%BC%8A%E4%BA%8B%E4%BB%B6/

SENSE隨筆140605
統計學淺談:  阿特蘭大作弊事件
執筆人:蟬

2009年美國阿特蘭大巿報章報導,巿內某公共學校呈報的 “州立公開試CRCT”成績有作弊嫌疑。 州立調查局介入調查,發現巿內56間公共中學當中竟有44間涉嫌作弊,共牽涉178位教職員,皆為教師和校長。 其後更發覺作弊行為可能早於2001年經己發生,教師和校長涉嫌將學生答錯之試題修正才遞交當局。

這樁作弊醜聞有趣的地方,是在教職員大範圍牽涉而又沒有人其他學校舉報的情況下,作弊是如何被揭發的呢?

改過自身也有錯?
在阿特蘭大醜聞中,最先引起人注意的是試卷有大量「由錯改對」的情況。 當然,學生在覆卷的時候發現錯誤並修正是很合理的, 甚至原本答對了而「由對改錯」的也大有人在。 事件中引人注目之處,正於阿巿 “由錯改對”的行為比全州高出很多。 據分析數據的官員形容,這種情況出現而純為巧合的機率,約略等於七萬名在巨蛋球場看球賽的觀眾恰巧全都高過七呎。 J

雖然該種 “非常情況”不能百分百確定存在作弊— 實際上統計無法百分之百確定任何事情,*** 但卻有足夠理據去發起調查。

對於外行人來說,要理解如何以統計去“偵查” 異常數據似乎相當困難,當中牽涉一大堆專業術語。 但統計學中某些基本方法和理論,對於判斷日常生活的事理卻有不少幫助。

〈尋找失落的旅遊巴士〉
假設大家都知道甚麼是 平均數mean。現在試看以下的例子。

城中正同時舉行兩個美食展覽: “香腸展覽會”和 “有機蔬菓展覽會” ,兩個展覽會均極受海外朋友歡迎。 會方為疏導數千名海外參觀者,特意提供機場往返會場的穿梭巴士服務。 作為工作人員,主管突然致電給你說其中一輛滿載有機蔬菓展訪客的旅遊巴失去聯繫,要你幫忙把它尋找出來。

當你盤算如何著手之時,發現面前正有一輛載滿外籍乘客的巴士,可是由於語言不通,無法得知他們是否有機展覽的訪客,而主管給你唯一的資料是「全體海外參觀遊客的平均體重為140磅。」 手足無措的你決定替車上60名遊客量度體重(不知哪來的秤),得到的平均體重為170磅

不懂統計的人看到這裡,大概也可以斷定這輛巴士並非有機展覽的,原因是遊客的平均體重太重了。但我們要如何系統地把這個判斷表達出來呢?

要以統計角度進行分析,我們先要弄清一些基本概念。 在例子中,主管給出的數據是以所有遊客為對象的,是分析中的母體population,包括統計對象所有成員

舉例:香港人口普查的母體便是香港所有居民,而被選中接受普查的居民便是樣本sample
越具代表性的樣本,便應該越與母體相似。***
如果巴士上的是有機展覽的遊客,則車上遊客的體重應該與母體相似。

〈充滿差別的成員〉
為了讓這個分析的目標更科學,我們先定下一個假設:旅遊巴士上的乘客都是有機展覽的遊客。

大家也知道,即使母體的平均體重是140磅,遊客個別體重的差別卻可以很大。統計學以標準差standard deviation (SD)去表達一個母體內成員的差異。 上面例子中,資料顯示母體的標準差為9磅。 意思是成員的體重很大機會在一個標準差內(131-149磅),而更大機會在兩個標準差內(140±18);而幾乎沒有成員會在3個標準差以外。 這種成員分佈的形式,便是著名的「常態分佈normal distribution。」
(註:計量上的表達為68.2%在SD內,95.4%在2SD內和99.7%在3SD內。)
140605

如果巴士上的乘客就是一個從母體的抽樣,即使隨機抽樣的成員及體重分佈不一樣,他們也應該有相當的相似度。 你替巴士乘客量度體重時也順便把標準差12算出來。 所以母體和巴士乘客的體重分佈(1SD)範圍便分別為131-149及158-182,兩者並沒有交集。

好了這似乎給出了很強的證據了吧?但似乎抽樣時的偏差也會造成這個狀況。 既然這樣,我們便唯有引入「中央極限定理」了。

〈中央極限定理Central Limit Theorem
Def. 中央極限定理指出,任何母體的樣本平均數會圍繞著母體平均數約略形成一個常態分佈。***

將定理運用在我們的例子上,大概便是這樣:

將每輛接載有機展覽的巴士(隨機樣本)上乘客的體重計算出一個平均數,由於每輛車的成客都不同,所以平均數並不一樣。但大多數樣本的平均數將非常接近母體平均數。

中央定理指出所有樣本的平均數將以母體平均數為中心以並以常態分配, 無論母體的分配形狀為何。*****

要了解樣本平均數的常態分配如何,我們要引入一個新的概念:「標準誤standard error」標準誤是用來衡量樣本平均數的分佈性的。*** 而之前提到的標準差則是用來衡量母體的分佈性。 所以我們可以進一步說:標準誤便是樣本平均數的標準差

標準誤越大,樣本分佈的範圍越廣。 母體的標準差越大,則合理地個別樣本的平均數差異也越大;而樣本規模越大,則個別樣本的平均數差異也越小。 標準差的公式為S/√N,當中S為母體的標準差,而N為樣本的規模。

例子中母體的平均數為140磅,標準差為9磅;旅遊巴士乘客的平均體重為170磅,樣本規模為60。以此得出標準誤為1.16。

170磅分佈在母體平均體重的26個標準誤內。機會之低難以數字表達,要落在7個標準差內的機率大概等於10.7億年出現一天的事件。 所以,旅遊巴士上的乘客來自有機展覽的機會率幾乎是零。 我們可以挺肯定地推翻這個假設,因為我們的運氣應該不至於那麼壞。

 

參考:
《聰明統計學的13又1/2堂課》
《Naked Statistics: Stripping the Dread from the Data》(2013)  Charles Wheelan

PermaLink: https://articles.zkiz.com/?id=102210

亞特蘭大聯儲Lockhart:仍會在下半年加息

來源: http://wallstreetcn.com/node/214088

20150207Atlanta-President-Dennis-Lockhart

亞特蘭大聯儲主席Dennis Lockhart在強勁的非農數據後重申,預計美聯儲會在今年年中或下半年加息。

《華爾街日報》,他表示:“我依然相信加息的環境將在今年年中或者晚一些時候成熟。不過我無法對具體時間做出預測,因為這主要取決於數據。”

昨天公布的美國非農就業數據異常強勁。1月新增非農就業人口25.7萬,遠超預期。失業率略微上升至5.7%,不過勞動者的薪資增速大漲0.5%,創七年新高。

就業市場的回暖再次引發了市場對於加息的猜測。如今,以耶倫為主的幾乎所有美聯儲官員都認為應該在今年年內加息,年中是最有可能的時間。

不過,受國際油價下跌影響,通脹率持續維持在2%的目標以下,又為加息增加了很大的不確定性。

彭博Lockhart同時還表示,在加息之前,“我們希望看到通脹好轉的確鑿證據。”

Lockhart今年在FOMC擁有投票權,他常被視為美聯儲官員意見的風向標。最近一段時間,他對於加息的觀點一直沒有變化。

在上周的FOMC聲明中,FOMC表示對加息要“保持耐心”。耶倫在12月的講話中曾明確表示:“至少在未來兩次FOMC會議中,美聯儲不會采取緊縮政策。”

(更多精彩財經資訊,點擊這里下載華爾街見聞App)

PermaLink: https://articles.zkiz.com/?id=131172

亞特蘭大聯儲行長﹕今年加息一兩次

1 : GS(14)@2016-07-17 15:28:13

【明報專訊】正當市場預期英國脫歐後,會拖慢美國加息步伐,市場內就加息問題醞釀「放鴿」之際,《路透》引述聯邦儲備銀行系統被視為「鷹派」代表之一的亞特蘭大聯儲銀行行長洛克哈特(Dennis Lockhart,圖)表示,今年可能仍能完成加息一、兩次,反映聯儲局內「鷹派」成員加息之心不死。

年底前加息概率低於50%

在洛克哈特再提加息之議之時,另一被視為聯儲「鷹派」代表的聖路易斯聯儲銀行布拉德(James Bullard)才說,他在過去6個月變得有點「更鴿派」了,他表示,市場已經消化,聯儲在年底前加息的概率不到50%,他重申今年僅加息一次。他更說,恐怕不能再指望過去的貨幣刺激措施,激發新一輪經濟成長,並認為現時的增速似乎相當低。

不過,曾經主張在年內加3次息的洛克哈特則稱,今年仍能加息一、兩次。他更說,他們從來沒有就通脹問題發生過真正的爭論。

被視為鴿派的明尼阿波利斯聯儲銀行行長Neel Kashkari(卡什卡利)則稱,聯儲應當關注美國經濟受全球因素影響的程度,並且密切關注美元匯率,認為目前通脹超過目標、失去控制的風險是零。


來源: http://www.mpfinance.com/fin/dai ... 9775&issue=20160717
PermaLink: https://articles.zkiz.com/?id=303884

同鄉反擊:亞特蘭大罪案非突出

1 : GS(14)@2017-01-17 01:55:11

特朗普批評劉易斯時指他的選區「破敗」和「罪案叢生」,令已故黑人民權領袖馬丁路德金家鄉亞特蘭大受辱,當地人和傳媒隨即抱不平,指當地著名學府林立,罪案問題亦非特別突出,科技產業欣欣向榮。劉易斯所屬喬治亞州國會第五選區,覆蓋亞特蘭大市75%面積和周邊市郊,選區居民的年收入中位數比全國值低,貧窮人口比例21%比全國高6.3個百分點,但區內有喬治亞理工學院、埃默里大學等學府,居民擁有學位比例達40%,遠高於全國平均的19%。第五選區雖有不少窮區,但市中心相當繁榮,除了有Panasonic、AT&T等的科研中心或業務外,更是可口可樂、達美航空和美國南方電力等大型公司的總部所在地。一名地產商負責人指,選區內最昂貴地段的住宅售價達780萬港元,市中心美輪美奐,「特朗普口中的一定是另一個亞特蘭大」。罪案方面,《亞特蘭大憲法日報》自行分析數字,指亞特蘭大市暴力罪案率在人口逾20萬的城市中,排第14高,當中未計紐約市和克里夫蘭等欠完整數據城市,並指整體犯罪率近年下降,兇殺數字雖有增加,但與全國趨勢相符。美國《亞特蘭大憲法日報》




來源: http://hk.apple.nextmedia.com/international/art/20170116/19898361
PermaLink: https://articles.zkiz.com/?id=322775

【從前今日】阿特蘭大奧運恐襲 釀2死逾百傷

1 : GS(14)@2017-07-29 03:23:49

1996年美國亞特蘭大奧運會期間,距離奧運村1.5公里的百年奧運公園,於當年今日正舉行一場露天音樂會。凌晨1時左右,911報案中心收到神秘電話,稱30分鐘後將會有炸彈於公園爆炸,警員隨後在現場找到一個綠色袋,爆炸組發現袋中有10吋長的管狀炸彈。當警員正組織及疏散緊人群時,管狀炸彈突然爆炸,造成1死111人受傷。一名土耳其攝影師在趕去拍攝現場時,心臟病發去世,令事件死亡人數增至2人。百年奧運公園因為爆炸,關閉了三天,而放置炸彈的,是本土恐怖分子魯道夫,他想通過爆炸案反映不滿及吸引媒體注意,他同時牽涉多宗爆炸案,潛藏5年、最後於2003年被捕,被判終生監禁。綜合報道




來源: http://hk.apple.nextmedia.com/international/art/20170727/20103267
PermaLink: https://articles.zkiz.com/?id=338906

Next Page

ZKIZ Archives @ 2019