1、計量_2_test1第二章 統計檢定n由資料統計值觀察到的現象,必須驗證,這就是統計中的假說檢定,藉由統計的科學方法,得到合理的評估。n例:台灣股市平均而言,第一季的平均報酬為最高,從統計理論的觀點,單純就平均報酬本身的大小來比較是不嚴謹的,較穩健的作法,是要建立假說,並運用統計方法加以檢定。第一節 基本說明計量_2_test2n十年台指報酬率結果n10年平均季報酬為1.89%,報酬率不高。n季標準差為18.8%,顯示台灣股市波動非常大。n若按季來看,各季的報酬率報、標準差並不一致。N Mean Std Dev Minimum Maximum 40 0.0189318 0.1879646 -0
2、.2740134 0.6858029可由 excel 得到計量_2_test3n近十年台股大盤各季季報酬,那一季投資較好?第一季第二季第三季第四季19910.24390.0594-0.1344-0.050519920.01370.0475-0.1953-0.067419930.4347-0.1821-0.02940.68581994-0.17260.13120.1880-0.01171995-0.0670-0.1917-0.05030.01991996-0.00360.26720.00240.047019970.19690.1020-0.0335-0.061619980.1081-0.1354
3、-0.1426-0.082019990.14070.2213-0.10230.137920000.1477-0.1743-0.2740-0.1807平均數.1042.0050-.0772.0437標準差.1721.1739.1258.2411計量_2_test4n十年台指各季報酬率結果(sas 報表)-quarter1=1-The MEANS Procedure Analysis Variable:return1 N Mean Std Dev Minimum Maximum 10 0.1042043 0.1721342 -0.1726660 0.4347432-quarter1=2-Analy
4、sis Variable:return1 N Mean Std Dev Minimum Maximum 10 0.0050176 0.1739437 -0.1917688 0.2672536-quarter1=3-Analysis Variable:return1 N Mean Std Dev Minimum Maximum 10 -0.0771558 0.1258225 -0.2740134 0.1880303-quarter1=4-Analysis Variable:return1 N Mean Std Dev Minimum Maximum 10 0.0436611 0.2411414
5、-0.1807399 0.6858029計量_2_test5n平均季報酬率為:1423;投資風險所代表的標準差則為:4213。與一般高風險高報酬的想法頗為吻合。n因此只以報酬平均來分析哪一季的投資較好,基本上不符合財務學理,因為高風險通常伴隨著高報酬。故從統計學上來看,只看平均報酬是有謬誤的,較嚴謹的方法是建立假說並運用統計方法加以檢定,看其是否具有統計上的顯著性。計量_2_test6樣本估計之母體實際母體統計推論必產生差異,稱為抽樣誤差;抽樣誤差的大小與樣本數、推論方法等有關,依據抽樣分配來估計。例:在 95%的信心水準下,抽樣錯誤差為正負3.1個百分點。在=0.05,支持率 22%與 24
6、%在統計上差異不顯著。2.1.1 抽樣誤差推論第二節 假說檢定計量_2_test7 點估計 分類資料:以樣本比例估計母體比例 數量資料:以樣本平均數估計母體平均數、以樣本標準差估計標準差估計之精確度 2.1.2 估計/.nSes平均數:/)1(s.e.npp發生率:計量_2_test8例:1.Gain mean=20.06,s.e.=2.25 以 95%的信心水準估計平均利潤=20.02 (2.78)(2.25)2.在 95%的信心水準下,抽樣錯誤差為正負3.1個百分點:資料支持的比例=24%,則估計支持率在 20.9%到 27.1%之間。/.).(re whe.),.(.;2/nSesest
7、xfd 區間估計 以一區間估計參數可能落入的範圍。/)1(.).(re whe.),.(2/nppeseszpp計量_2_test9研究主題對立假說陪襯虛無假說假說10 :HH 2.1.3 檢定檢定:將一研究主題作成假說(Hypothesis),根據資料來判斷是否接受此假說,或,將觀察到的現象作成假說,根據資料來驗証此假說。Null hypothesis&Alternative hypothesis計量_2_test10n型錯誤 vs.型錯誤 事實H0事實上為真 H1事實上為真結論為H0結論正確型錯誤(此機率設為)結論為H1型錯誤(此機率設為)結論正確不論檢定後做的結論為何,都可能產生錯誤註:
8、在結論為 H1 時,犯錯的最大機率為計量_2_test11觀念:骰子10次,得到8次的6點,這是機運或是假骰子?設立虛無假說為:此骰子是一均勻骰子如果是均勻骰子,計算得到超過 8 次 6 點的機率是 0.000019,即根據資料算出 p-值=0.000019是均勻骰子的機率小於 0.000019判斷此骰子顯然不是一均勻骰子。計量_2_test12檢定的顯著p-值不顯著的情況顯著的情況計量_2_test13資料顯示 H0 為真的可能性 p-值 70計量_2_test16常用於檢定的分布 理論上,對一常態資料,樣本平均數是一常態分布,樣本變異數屬於 2 分布。由此推導出 t-分布與 F-分布,它們
9、是統計推論上常用之分布。1)-n1,-F(n F21/S/S22222121 1)t(n-T/nSX用於平均數檢定或兩組資料比較用於兩組變異數比較、多組資料比較、或變異數分析計量_2_test172.2 二組資料比較 二組資料比較例題:4 第一季與第三季的報酬率是否不同?(二獨立樣本)4 電子股與金融股的報酬率是否不同?(二配對樣本)分析的方法分別為:(H0:1=2 )4二獨立樣本 二組變異數相等時用 pooled t-test 二組變異數不等時用 Satterthwaite test(近似法)4二配對樣本-paired t-test (H0:D=1-2 =0 )注意:上述檢定法使用的條件是資
10、料為常態分布資料計量_2_test18Pooled t-test 之原理 C.I.for 1 2:2121112/2;2121nnpnnstyy 假設變異數相等Test H0:1=2 vs.H1:1 2|2value-p221tTPnn211 where,221222211221112121nn)s(n)s(ns)-n t(nSy-ytpnnp計量_2_test19Satterthwaite test 之原理1)/(1)/(2212222212121222121222121)()nnsnnsnsnsnsns,t(y-y tp-value=2P(T|t|)C.I.for 1 2:222121ss
11、/2;2121nntyy不需假設變異數相等Test H0:1=2 vs.H1:1 2計量_2_test20n檢定12與22是否相等,採用F 檢定。H0:12=22,22211112222222/1,1/SSFF nnSS何時可假設變異數相等?當 p-值 0.05時,可假設二組變異數相等。計量_2_test211、預覽資料(作統計值與比較圖)(i)資料是否有特殊分佈?(ii)分散度是否有明顯差異?(iii)均值是否有明顯差異?2、資料是否可假設來自常態母體?(i)Normality test,(ii)非常態時檢視 Normal probability plot3、決定是否可假設二組的變異數相等。
12、用 F-test,p-value 0.05時,設變異數相等 4、選擇平均數差異檢定法 Test H0:1=2,變異數相等時,用 pooled t-test 變異數不等時,用 Satterthwaite test5、必要時計算差異的信賴區間6、作結論【二組獨立資料比較的實作過程】計量_2_test22n例:檢定第一、第三季報酬是否不同n由pooled t-test 得到p-value=0.015|t|return1 Pooled Equal 18 2.69 0.0150 return1 Satterthwaite Unequal 16.5 2.69 0.0158 Equality of Vari
13、ances Variable Method Num DF Den DF F Value Pr F return1 Folded F 9 9 1.87 0.3642計量_2_test23例:檢定第四季變異數是否高於第三季的n由F-test,p-value=0.033|t|return1 Pooled Equal 18 -1.40 0.1771 return1 Satterthwaite Unequal 13.6 -1.40 0.1826 Equality of Variances Variable Method Num DF Den DF F Value Pr F return1 Folded
14、F 9 9 3.67 0.0660計量_2_test24例:檢定第四季平均報酬率是否與第三季的不同n因為二季報酬率的變異數有顯著差異,使用Satterthwaite test,得到 p-value=0.1826=0.05,故不拒絕H0。n台股第四季的平均報酬率和第三季的無明顯差異。說明:由於三、四季的變異數有顯著差異,當我們在檢定平均數差異時,無法得到顯著性;所以在實務問題上,二組的比較不該只比較平均數。計量_2_test25二配對資料比較:輸入二欄資料 工具 資料分析 t-檢定:成對母體平均數差異檢定 註:若工具中未出現”資料分析”,請在增益集中勾選 VBA分析工具箱計量_2_test26二
15、配對資料比較 excel 報表計量_2_test271.輸入資料2.工具 資料分析 F-檢定:兩個常態母體變異數差異的檢定3.工具 資料分析 由F-檢定結果擇一 檢定之p-值0.025時,t-檢定:母體平均數差異檢定,異數數相等 檢定之p-值0.025時,t-檢定:母體平均數差異檢定,異數數不相等二組母體平均數差異檢定計量_2_test28二獨立資料比較 excel 報表一計量_2_test29二獨立資料比較 excel 報表二計量_2_test301、輸入資料:將二組資料分別輸入二行2、Analysis ANOVA t Test t Test Type:paired Column:paire
16、d variables Analysis:Plots:不需勾選 Titles:比較兩成對樣本:計量_2_test311、輸入資料:組別佔一行,資料佔一行2、Analysis ANOVA t Test t Test Type:Two sample Column:Group by 組別,Analysis var.測量資料 Analysis:Plots:平均數比較圖box and whisker 或 means Titles:比較兩非成對樣本:計量_2_test32 1.輸入資料2.Analysis Descriptive Distribution Analysis Columns:選擇欲檢定的變數 Distributions:Normal Plots:Probability plot 常態性檢定