1、生物統計與生物統計與SAS軟體課程教學軟體課程教學(三三)雙變項統計分析雙變項統計分析(一一)台大衛生政策與管理研究所江宜珍2005.1.29課程宗旨瞭解一組、兩組或多組母群體或樣本間,等距變項(或等比變項)的統計檢定方法即類別變項vs.等距變項(或等比變項)的雙變項統計分析方法此次課程所提及的雙變項統計方法,均假設此等距變項(或等比變項)呈“常態分佈”,且均為“母數分析”(而非“無母數分析”)統計方法一組樣本vs.母群體兩組獨立樣本兩組相依樣本多組獨立樣本檢定方法Z-testt-testPaired t-testANOVA事後檢定無無無有例子(以雙尾為例)糖尿病病人的血壓平均值是否與正常人相
2、同糖尿病病人的血壓平均值是否與肺結核病人相同經藥物治療後,糖尿病病人的血壓平均值“後測值”是否與“前測值”相同糖尿病、肺結核、胃潰瘍、的血壓平均值是否相同Z-test vs.t-test若已知母群體的標準差,則使用Z-testZ值:某組樣本的平均值,距離母群體平均值幾個母群體標準差通常母群體的標準差都是未知的,所以會以樣本的標準差去推估母群體的標準差,則會使用t-testt值:某組樣本的平均值,距離母群體平均值(另一樣本平均值)幾個樣本標準差t分佈會受自由度(n-1)影響,若樣本數越大,則t分佈越接近Z分佈,在n120時,t與Z幾乎一樣單尾檢定 vs.雙尾檢定單尾檢定雙尾檢定(較常用)Ho(虛
3、無假設)(希望能推翻虛無假設)12(第一組的平均值小於第二組)12(第一組的平均值大於第二組)12(兩組的平均值沒有“差異”)H1(對立假設)(為我們心中真正的假設)12 12 12 p-value vs.-value p:意指“Ho成立的機率或可能性”:意指“能接受Ho成立的機率或可能性的最 低底線”,即為檢視標準通常會設 0.05(即5%)若p,即p0.05,則拒絕Ho(即推翻虛無假設)若太難達到顯著差異,或此研究可採較為不保守的檢視標準,則可設 0.10,即10%)若太容易達到顯著差異,或此研究需採較為保守的檢視標準,則可設 0.01,即1%)Z分佈Z=-2 -1 0 1 2 Z=1.9
4、6-1.96時,陰影面積佔全部的時,陰影面積佔全部的95%對於標準差的假設若樣本來自同一母群體,則應假設其標準差相同若樣本來自不同母群體,則應假設其標準差不同兩組相依樣本意指兩組樣本的個體是有關聯的常用Paired t-test分析的情況同一個人的兩個部位,可以一個做實驗組、一個做對照組(或稱控制組)同一個人,先做A測試,過一段時間再做B測試,比較兩種方法有無差異同卵雙胞胎,隨機分派一個做實驗組、一個做對照組以“前測實驗後測”的方法,對同一人進行調查,比較前後測值有無改變因果假設此類方法通常有因果假設即存在自變項和依變項的關係類別變項(組別)為因、等距變項(或等比變項)為果但有時也會有例外,若
5、只是想要比較兩組人的某變項平均值,也可以是“等距變項(或等比變項)為因、類別變項(組別)為果”Ex.欲比較有無罹患肺癌病人的血壓平均值是否有差異點估計 vs.區間估計在呈現分析結果時,通常會給予“點估計”及“區間估計”兩種數值,供讀者參考平均值、1、12 等數值均為點估計值95%信賴區間(95%Confidence Interval簡稱95%C.I.)意指我們有95%的信心或可能性,所求得的點估計值會落在此範圍內Ex.Ho:12,若 12 的95%C.I.值包含“0”,則表示Ho:12 的假設有可能成立結果呈現方式平均值平均值標準差標準差95%95%信賴區間信賴區間t t值值(Z(Z值值)p
6、p值值性別性別男男女女居住地區居住地區台北市台北市台北縣台北縣ANOVA1變異數分析,即Analysis of Variance的縮寫N-way ANOVAN:共有幾個類別變項(ex.欲檢視性別、種族)本堂課所指的雙變項分析,則指“One-way ANOVA”,即一個類別變項(且為多組別)vs.等距變項(或等比變項)與Z-test、t-test之異同目的均為比較以一個類別變項分組之等距變項平均值的差異前兩者以“平均數”進行分析;ANOVA則為透過“變異數”分析來檢定各組平均值是否有差異ANOVA2Ho:12 34H1:至少有2組以上的母群體平均值不相等Assumption:各組變異數相等,因此
7、在進行ANOVA時,需先檢定各組的變異數是否相等(F-test)ANOVA3總變異量的分解(TSS=WSS+BSS)WSS(組內差異、組內變異量,Within Sum of Square)各組內每個個體值與該組平均值差別的平方和自由度=n-k,k為組別個數BSS(組間差異、組間變異量,Between Sum of Square)各組平均值與總平均值差別的平方和自由度=k-1TSS(總變異量,Total Sum of Square)各組內每個個體值與總平均值差別的平方和自由度=n-1=(n-k)+(k-1)ANOVA4F-testF=MBSS/MWSSMBSS=BSS/(k-1)(組間平均變異數
8、,Mean Between Sum of Square)MWSS=WSS/(n-k)(組內平均變異數,Mean Within Sum of Square)若組間差異組內差異,且p0.05,則表示各組的平均值有顯著差異事後檢定因為ANOVA檢定只能知道各組的平均值是否有差異,即只要有任兩組的平均值有差異就會呈現顯著,所以要進行事後檢定,瞭解到底是哪些組(兩兩比較)的平均值有差異最常用Scheffes(薛費事後檢定)、Bonferroni、LSD(最小顯著差異法,Least Significant Difference method)三種,前兩者較嚴格Scheffes:tBonferroni:LSD:t 1,11knkFkkC2*21,knt結果呈現方式平均值平均值標準差標準差95%信賴區間信賴區間F值值p值值事後檢定事後檢定血型血型OABAB教育程度教育程度不識字不識字國中、國小國中、國小高中、高職高中、高職大學、大專大學、大專碩士、博士碩士、博士謝謝大家的耐心聆聽嚕謝謝大家的耐心聆聽嚕
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。