1、1 變異數分析變異數分析是用來是用來 檢定多組平均數是否相等的檢定多組平均數是否相等的問題,問題,不是在檢定變異數相等的問題不是在檢定變異數相等的問題 212.1變異數分析簡介變異數分析簡介 在第九章例9.6我們檢定甲、乙 兩家公司輪胎平均壽命是否有顯著差異?如果要問的是甲、乙、丙、丁 四家公司輪胎平均壽命有無顯著差異,那要如何進行呢?3一對對做比較 也許初學者會想這有什麼困難呢?只要一對對做比較,先比較甲、乙兩組有無差異,再比較甲、丙有無差異,4 如果做兩次的一對對平均數的比較 都沒有差異,那甲、乙、丙三家廠商輪胎平均壽命 就沒有差異了,5 但問題在於每一次做檢定時,作決策必有犯錯的風險 (
2、即有犯錯機會,如型I、型II誤差),6 例如上述做2次比較,如每次訂的顯著水準是0.05,則2次合計後犯型I誤差是多少,就無法真正算出,可能會高達0.05+0.05=0.10也不一定。7例例12.1、有甲、乙、丙三種包裝設計,比較兩兩組間平均銷售量 是否有顯著差異?各隨機找10家商店銷售,結果甲、乙、丙的 樣本平均銷售量與標準差分別如下 8 甲乙丙 商店數 101010 平均數 464250 標準差 5559(1)檢定甲、乙兩種包裝設計 平均銷售量是否有顯著差異?(2)檢定甲、丙兩種包裝設計 平均銷售量是否有顯著差異?(3)檢定乙、丙兩種包裝設計 平均銷售量是否有顯著差異?10(1)甲、乙兩組
3、比較 1011014246Pst101101542467889.1545 11甲、乙兩種包裝設計平均銷售量沒有顯著差異 1009.27889.1|025.0,18tt12(2)甲、丙兩組比較 1011015046Pst101101550467889.1545 13甲、丙兩種包裝設計平均銷售量沒有顯著差異 1009.27889.1|025.0,18tt14(3)乙、丙兩組比較 1011015042Pst101101550425776.3585 15乙、丙兩種包裝設計平均銷售量有顯著差異 1009.25776.3|025.0,18tt16 12.2 一因子模式一因子模式 17 一因子的配置 1A
4、2A iA kA 11y 21y 1 iy 1ky 12y 22y 2iy 2ky ijy 11ny 22ny iiny kkny 樣本平均數 1y 2y iy ky y 樣本標準差 1s 2s is ks s 18一因子模式一因子模式()ijiijy19其中(1)ijy是因子A在第i個水準下第 j 個實驗觀察值;(2)i是因子A在第i個水準下的平均數;(3)ij是誤差項(不可控因子),並假設 ijiidN(0,2);(4)in是因子A在第i個水準下的樣本數。20變異數分析變異數分析(ANOVA)用來檢定 k 組母體平均數是否相等問題,寫成數學式子是檢定 都相等不是所有ikHH:121021對
5、誤差項我們有對誤差項我們有3個基本假設:個基本假設:(1)常態性常態性(各個誤差取自常態分配)(2)均質性均質性(各個誤差變異數相等)(3)獨立性獨立性(各個誤差間無相關)22一因子模式一因子模式():ijiijy23平均數是否有顯著差異?即檢定 kH.:2100.:210kH24如果虛無假設0H是對的話,那麼各組樣本平均數iy應都很接近 yyyyk2125式很大時,就應棄卻 2222112)()()(yyyyyykkii0H26第i組的變異 22221)()()(iiniiiiiyyyyyySSi212)1()(iinjiijsnyyi27組內平方和組內平方和(或殘差平方和或殘差平方和)ki
6、njiijkiyySSSSSSSSEW11221)(.28 組間平方和組間平方和(B)(或因子或因子A的平方和的平方和(SSA)2222211)(.)()(yynyynyynSSABkk=kinjikinjiiiyy112112)(29F檢定)kN/()k/(WBF1MSEMSASSESSA)kN/()k/(1 30例例12.2 輪胎平均壽命 設陽明貨運公司想從甲、乙、丙、丁 四家輪胎廠商中選一家廠商採購輪胎,各從四家廠商隨機抽樣10個輪胎做測試 試問此四家廠商輪胎平均壽命 是否有顯著差異?(=0.05)31表表12.3 四種廠牌輪胎壽命 廠牌 壽命 甲 y1 85 83 75 92 83 8
7、2 80 78 84 84 乙 y2 76 88 74 79 86 89 95 88 84 90 丙 y3 85 82 77 84 66 81 79 76 78 83 丁 y4 83 91 92 88 85 84 75 89 93 87 32變異數分析變異數分析 都相等不是所有ikHH:1210336.821y S1=4.5265 9.842y S2=6.6575 1.793y S3=5.5066 7.864y S4=5.3135 325.8344321432144332211yyyynnnnynynynyny34組間平方和 2442332222112)()()()()(yynyynyynyy
8、nyyBi=10(82.6-83.325)2+(84.9-83.325)2+(79.1-83.325)2+(86.7-83.325)2=322.475 35組內平方和 4321SSSSSSSSW1110.3069 因此 8417.30492.10736/307.11103/475.322)440/()14/(WBF=3.49 36結論是顯著,即四組輪胎的平均壽命不相等 F3,36,0.05=2.87,因F F3,36,0.05 37表表12.2 四種廠牌輪胎壽命 ANOVA表 變異來源 自由度 平方和 均方和 F值 P值 組間(B)3 322.475 107.4917 3.49 0.0255
9、組內(W)36 1110.300 30.8417 總和(TO)39 1432.775 38P值與F值的關係圖 012343.49P39一因子的模式一因子的模式 ijiijy ki,.,1 40平方和分解(直角三角形畢氏定理畢氏定理)ijy iy y 總(SSTO)組間(SSA)組內(SSE)41例例12.3、(例例12.1續)甲、乙、丙三種包裝設計,各隨機找10家商店銷售,結果甲、乙、丙樣本平均銷售量與 標準差如表12.1,42 甲乙丙 商店數 101010 平均數 464250 標準差 55543 試以ANOVA檢定甲、乙、丙 三種包裝的平均銷售量是否有顯著差異?44三種包裝設計 ANOVA
10、表變異來源 自由度 平方和 均方和 F值 組間(B)2 320 160 6.4 組內(W)27 675 25 總和(TO)29 995 45三種肥料對蕃茄產量的影響 農夫想研究甲、乙、丙 三種肥料對蕃茄產量的影響,他有一塊長方形土地共1200坪地,如果他將此土地分成三區,每區400坪各施一種肥料,實驗設計配置圖如下 46只有一筆資料無法做統計推論 區1 施 甲 肥 區2 施 乙 肥 區3 施 丙 肥 47每區再細分成幾塊大小相等的地 列行 1 2 3 4 一 二 三 48無隨機效果混合混合 列行 1 2 3 4 一 甲 甲 甲 甲 二 乙 乙 乙 乙 三 丙 丙 丙 丙 49完全隨機實驗配置圖
11、 乙 丙 甲 甲 甲 甲 丙 乙 乙 乙 丙 丙 50例例12.6甲、乙、丙三種肥料其蕃茄產量如下 y21 385 y31 350 y13 350 y14 341 y11 367 y12 348 y32 347 y24 356 y22 382 y23 369 y33 335 y34 330 檢定此主效用是否顯著 51資料整理 甲肥 乙肥 丙肥 367 385 350 348 382 347 350 369 335 341 356 330 平均數yi 351.5 373 340.5 標準差Si 11.03 13.29 9.54 52 yyyy1233=355,Syyijji()212 1=17.
12、46 也算出綜合樣本標準差 SSSSp1222323=11.39 53(1)SSTOyyNSijjniki()()(.)2112211117463354 (2)SSEWyyNk Sijijnikpi()().2112 ()().()nSnSnSkk1122222111 1168(3)SSAByySSTOSSEijniki().211 335411682186(4)FSSA kSSENk()()()().12186 3 11168 123842 FFkNk12,9 0 05,.=4.2565 所以H0顯著,即三種肥料的平均產量有顯著差異。5412.3各組母體變異數之檢定各組母體變異數之檢定等至少
13、有兩組變異數不相:1222210HHk55哈雷檢定法H=22iiMinsMaxs 56例例12.7、(例12.2續)試檢定甲、乙、丙、丁四家輪軩公司 輪胎壽命的變異數是否相等(=0.05)?57 S12=(4.5265)2=20.4892 S22=(6.6575)2=44.3223 S32=(5.5066)2=30.3226 S42=(5.3135)2=28.2333 故 H=4892.203223.4422iiMinSMaxS=2.1632 查表H4,10,0.05=6.31,因 H F2,24,0.05=3.4028 所以H0是顯著,即有肥料因素的主效用存在 104澆水量的因素平方和SSB
14、=ij kj2)(=15(2221)=15(4)2+(4)2)=480 105澆水量對蕃茄平均產量有顯著差異FB=15.5480246.123148052912SSESSB=93.28 F1,24,0.05=4.2597 所以澆水量因素B的主效用也是顯著的。106例例12.11交互作用問題 某食品公司研究在媒體做廣告與 在店頭陳列商品對提升顧客購買 咖啡、餅乾、奶昔 三種食品意願是否有幫助?(表平均100人中有意願購買的人數)試問廣告與陳列分別對 咖啡、餅乾、奶昔是否有交互作用?107有意願購買的人數 商品 沒廣告沒陳列 11 沒廣告有陳列 12 有廣告沒陳列 21 有廣告有陳列 22 咖啡
15、1 4 3 6 餅乾 2 5 6 14 奶昔 1 8 7 4 108圖圖12.3 廣告與陳列對咖啡購買意願交互作用圖示 咖啡購買意願 沒陳列 有陳列 1 4 3 6 沒廣告 有廣告 咖啡購買意願 沒廣告 有廣告 1 3 4 6 沒陳列 有陳列 y y 109圖圖12.4 廣告與陳列對餅乾購買意願交互作用圖示 餅乾購買意願 沒陳列 有陳列 2 5 6 14 沒廣告 有廣告 餅乾購買意願 沒廣告 有廣告 2 6 5 14 沒陳列 有陳列 y y 110圖圖12.5 廣告與陳列對奶昔購買意願交互作用圖示 奶昔購買意願 沒陳列 有陳列 1 4 7 8 沒廣告 有廣告 奶昔購買意願 沒廣告 有廣告 1
16、4 8 7 沒陳列 有陳列 y y 111例例12.12、某人想研究甲、乙、丙、丁 四種包裝對某食品銷售量是否有影響?隨機找40家規模大致相同的商店,分成4組,每組10家,各銷售一種包裝設計食品一個月,記錄銷售量如下 112四種包裝設計銷售量 甲 乙 丙 丁 1y 2y 3y 4y 1 63 77 31 42 2 70 64 36 61 3 68 84 51 58 4 83 75 46 56 5 66 69 35 54 6 75 78 40 55 7 68 66 50 52 8 67 81 51 49 9 69 67 35 36 10 71 79 45 77 113 試問四種包裝的平均 銷售量
17、是否有顯著差異?114平均 iy 70 74 42 54 標準差is 5.56 6.98 7.53 11.04 115 總平均與標準差分別為y=60 s=15.091 116組間平方和 241101241101)()(yyBijiiji)6054()6042()6074()6070(1022226560 117總平方和 241101)(yySSTOijij 22)091.15(3939s 8882 118殘差平方和 BSSTOyySSEWiijij241101)(232265608882 9.3336/23223/6560)440/()14/(WBF 119一因子(包裝)ANOVA表 變異來源
18、 自由度 平方和 均方和 F值 組間 3 6560 2186.67 33.9 殘差(E)36 2322 64.50 總(TO)39 8882 120例例12.13(例例12.12續)若四種包裝甲、乙、丙、丁設計分別是:甲是彩色、凱蒂貓,乙是彩色、皮卡丘,丙是黑白、凱蒂貓,丁是黑白、皮卡丘,121 故四種包裝設計分成兩個因子,分別為 因子A色彩(分成彩色與黑白兩水準),因子B玩偶(凱蒂貓與皮卡丘兩水準),:122其水準配合(配方)可以下列交叉設計表示因子A 彩色 黑白 因子B 凱蒂貓 皮卡丘 123 資料如表12.16,試問(1)色彩(因子A)的主效用是否顯著?(2)玩偶(因子B)的主效用是否顯
19、著?(3)AB交互作用是否顯著?124兩因子各種配方平均數 玩偶 凱蒂貓(1)皮卡丘(2)iy 彩色(1)70 74 72 黑白(2)42 54 48 色彩(A)jy 56 64 60 125 二維模式ANOVA表 變 異 來 源 自由度 平方和 均方和 F值 色彩(A)玩偶(B)交互作用(AB)1 1 1 5760 640 160 5760 640 160 89.30 9.92 2.48 殘差(E)36 2322 64.50 總(TO)39 8882 126結論:結論:(1)色彩(因子A)是顯著的,即不同色彩兩種包裝設計會影響銷售量。(2)玩偶(因子B)是顯著的,即不同玩偶會影響銷售量。(3
20、)色彩與玩偶的交互作用是不顯著的。127第十二章第十二章 摘要摘要 1.變異數分析變異數分析(ANOVA)不是在檢定幾組母體變異數是否相等 而是在檢定幾組母體的平均數是否相等 128 2.了解由兩組獨立樣本的兩組獨立樣本的t檢定檢定 擴充到多組獨立樣本的檢定多組獨立樣本的檢定。129 4.一因子模式一因子模式為 右邊有(總平均),(因子A)與(殘差)三項,故ANOVA表中有三個平方和 y130 5.二因子模式二因子模式(有交互作用)為 右邊有(總平均),(因子A),(因子B),(交互作用),(殘差)五項,故ANOVA表中有五個平方和)(y131 6.集區設計模式集區設計模式為 右邊有(總平均)
21、,(因子A),(因子B),(殘差)四項,故ANOVA表中有四個平方和 y132 7.集區設計模式集區設計模式與 二因子二因子(無交互作用無交互作用)模式模式完全相同,但以設計角度看是不同的想法 133 8.集區設計集區設計是兩組相關樣本兩組相關樣本(成對)的擴充,所以也可以集區設計來做 成對資料的檢定。134 11.了解ANOVA中可控因子的水準與 配方之意義,以及 不可控因子(誤差項)的基本假設 (均質性、常態性、獨立性均質性、常態性、獨立性)。135 12.了解實驗設計的基本觀念,以及實驗資料與觀察資料的異同。136 13.了解集區設計的重要性,並知道它與二因子設計的差異 137 14.知道二因子交互作用交互作用的意義,明瞭不用兩次單因子實驗設計,而用一次的二因子實驗設計的理由 138 15.以圖解與分析兩種方式探討 因子間的交互作用是否存在?並且知道在交互作用不存在時,如何簡化模式與分析資料