1、第八章第八章 t检验、检验、Z检验和两型错误检验和两型错误 福建医科大学流行病与卫生统计学系 1 一、一、两两样本均数比较样本均数比较 二、大样本均数的二、大样本均数的Z检验检验 三、正态性检验三、正态性检验 四、变量变换四、变量变换 五、假设检验注意问题五、假设检验注意问题 2 当总体方差不齐时当总体方差不齐时的的t检验检验 前面阐述了方差齐性的情况下,如何进行两个前面阐述了方差齐性的情况下,如何进行两个 样本均数比较的样本均数比较的t检验检验 如果方差不齐,则如果方差不齐,则t检验的结果可信度大打折扣检验的结果可信度大打折扣 很多学者建议在这样的情况下采用自由度校正很多学者建议在这样的情况
2、下采用自由度校正 的方法计算的方法计算t分布的概率,或者直接采用非参数分布的概率,或者直接采用非参数 检验检验 3 一、两样本均数比较一、两样本均数比较 三种三种近似近似t 检验检验方法方法 4 Satterthwaite-Aspin t (Satterthwaite, 1941, 1946; Aspin 1948, 1949)分别提出了使用校正自由度的方法计分别提出了使用校正自由度的方法计 算算t值所对应的概率值所对应的概率P 他们提出的自由度计算方法为现在大多数统他们提出的自由度计算方法为现在大多数统 计学软件所采用,公式如下计学软件所采用,公式如下 2 22 112212 22 22 2
3、2 12 1122 12 12 / / 11 snsn xx ttv sssnsn nn nn 5 Welch t * (Welch, 1947)类似类似Satterthwite法,使用校正法,使用校正 自由度的方法进行自由度的方法进行t检验,公式如下:检验,公式如下: 2 22 112212 22 22 22 12 1122 12 12 / / 2 1 1 snsn xx ttv sssn n sn n n n 6 Cochran 13.7,4.21,8 / 4.68; 7.958 / 11 2.306, ,0.05 xy xy xsnysn snsn xy tv ssnsn s nn nn
4、 ttt H xyxy y y x x 将将 代代入入SatterthwaiteSatterthwaite公公式式中中 查查表表得得在在的的水水准准上上, 拒拒绝绝,认认为为两两组组大大鼠鼠血血糖糖的的总总体体均均数数不不同同 10 【例例3-7】 为研究某种新药治疗贫血患者的疗效,将为研究某种新药治疗贫血患者的疗效,将20 名贫血患者随机分成两组,一组用新药治疗,另一组用名贫血患者随机分成两组,一组用新药治疗,另一组用 常规药物治疗,测得血红蛋白增加量(常规药物治疗,测得血红蛋白增加量(g/L)见表。问新)见表。问新 药与常规药治疗贫血患者后的血红蛋白平均增加量有无药与常规药治疗贫血患者后的
5、血红蛋白平均增加量有无 差别?差别? 治疗药物 血红蛋白增加量(g/L) 新药组 30.5 21.4 25.0 34.5 33.0 32.5 29.5 25.5 24.4 23.6 常规药组 19.5 19.0 13.0 24.7 21.5 22.0 19.0 15.5 24.5 23.4 表表 3-7 两种药物治疗贫血患者结果两种药物治疗贫血患者结果 两样本总体方差相等两样本总体方差相等 t 检验检验 56. 499.27新药组:82. 321.20常规药组: 11 资料识别:资料识别: 资料类型:资料类型:定量变量资料定量变量资料 设计类型:设计类型:两独立样本两独立样本 1. 资料特点:
6、定量、两组独立样本资料资料特点:定量、两组独立样本资料 处理组处理组1:认为其所在总体均数为认为其所在总体均数为 m m1; 处理组处理组2:认为其所在总体均数为认为其所在总体均数为 。. 2. 检验目的:检验目的:两组间观察指标的差异性比较。两组间观察指标的差异性比较。 210 mm:即 H 2 m 12 正态性检验正态性检验 由于有抽样误差的存在,必须对由于有抽样误差的存在,必须对n 0.05; 按按 = 0.05水准不拒水准不拒 绝绝H0,可以认为新药和常规药治疗贫血患者后血红蛋白,可以认为新药和常规药治疗贫血患者后血红蛋白 增加量不同,根据样本均数的信息增加量不同,根据样本均数的信息
7、,认为,认为 , 即服用新药后平均增加量高于常规药。即服用新药后平均增加量高于常规药。 H0: m m1 1 m m2 2 H1 :m m1 1 m m2 2 137. 4 ) 11 ( 2 /XX/XX 2121 2 2 2 2 21 2 1 2 1 21 nnnn nn XX t )()( 20 -218 21XX 12 mm 15 1. 正态性检验:正态性检验: Analyze Descriptive Statistics Explore Dependent list框框 Y Factor list框框group Plots框框Normality plots with tests Con
8、tinue OK 【电脑实现电脑实现】 16 结果输出: Tests of Normality .20710.200*.93210.466 .17610.200*.93510.482 group 新药组 常规药物组 y StatisticdfSig.StatisticdfSig. Kolmogorov-SmirnovaShapiro-Wilk This is a lower bound of the true significance.*. Lilliefors Significance Correctiona. 17 2. 两独立样本的两独立样本的t 检验检验 Analyze Compare
9、 means Independent- sample T Test Test Variable(s) 框框 y Grouping Variable框框group Define Groups框框 Group 1: 1; Group 2: 2 Continue OK 18 【电脑实现电脑实现】SPSS 两样本比较的t 检验: 19 结果输出: Independent Samples Test 1.345.2614.13718.0017.78001.88073.828811.7312 4.13717.461.0017.78001.88073.820011.7400 Equal variances a
10、ssumed Equal variances not assumed y FSig. Levenes Test for Equality of Variances tdfSig. (2-tailed) Mean Difference Std. Error DifferenceLowerUpper 95% Confidence Interval of the Difference t-test for Equality of Means 20 在在 =0.10 检验水准下检验水准下,新药组和常规药物组血红蛋白增加量,新药组和常规药物组血红蛋白增加量 均服从正态分布均服从正态分布(W 检验:检验:
11、P1=0.466,P20.482)且)且两总体方差两总体方差 齐 (齐 (F1.345, P=0.261) ; 采用) ; 采用两独立样本的两独立样本的 t 检验检验: t=4.137,=18, P=0.001。结果表明:在。结果表明:在 =0.05(双侧双侧)检验水准下,可以认为两药检验水准下,可以认为两药 疗效不同, 新药治疗的患者血红蛋白平均增加量高于常规药治疗的疗效不同, 新药治疗的患者血红蛋白平均增加量高于常规药治疗的 患者患者。 12 mm 的的 95%置信区间置信区间(3.829, 11.731)也表明也表明新药治疗的患者新药治疗的患者 血红蛋白平均增加量高。血红蛋白平均增加量高
12、。 表 6.2 不同组别血红蛋白增加量(sx) 组别 n Hb 含量(g/L) 新药组 10 27.99 4.56 常规药组 10 20.21 3.82 【结果报告结果报告】 21 例例 在上述例子国产四类新药阿卡波糖胶囊在上述例子国产四类新药阿卡波糖胶囊 的降血糖效果研究中,测得用拜糖平胶囊的的降血糖效果研究中,测得用拜糖平胶囊的 对照组对照组20例病人和用阿卡波糖胶囊的试验组例病人和用阿卡波糖胶囊的试验组 20例病人,其例病人,其8周时糖化血红蛋白周时糖化血红蛋白HbA1c(%) 下降值如表下降值如表3-7。问用两种不同药物的病人其。问用两种不同药物的病人其 HbA1c下降值是否不同?下降
13、值是否不同? 表表3-7 对照组和试验组对照组和试验组HbA1c下降值下降值(%) 分组 N 均数 标准差 对照组 20 1.46 1.36 试验组 20 1.13 0.70 22 1.建立假设、确定检验水准建立假设、确定检验水准 H0:两总体均数相同,即:两总体均数相同,即1 2 H1:两总体均数不同,即:两总体均数不同,即1 2 (双侧检验)(双侧检验)=0.05 2.计算检验统计量计算检验统计量 965.0 20 70.0 20 36.1 13.146.1 22 2 2 2 1 2 1 21 n S n S XX t V1=20-1=19; v2=20-1=19 3.确定确定P值。作出推
14、断结论值。作出推断结论 093.2t 21 2 2 1 1 22 , 2 , 2 XX XX SS tStS 按按=0.05水准,不拒绝水准,不拒绝H0,无统计学意义,无统计学意义 按按t检验:检验: 23 按按satterthweite近似近似t检验:检验: 4.28 120 ) 20 70.0 ( 120 ) 20 36.1 ( ) 20 70.0 20 36.1 ( 1 )( 1 )( )( 2 2 2 2 2 22 2 2 2 2 2 1 2 1 1 2 222 21 n n S n n S SSXX =28、t=0.965;结果同前结果同前 24 25 按按Welch近似近似t检验:
15、检验: 4.292 120 ) 20 70.0 ( 120 ) 20 36.1 ( ) 20 70.0 20 36.1 ( 2 1 )( 1 )( )( 2 2 2 2 2 22 2 2 2 2 2 1 2 1 1 2 222 21 n n S n n S SSXX =29、t=0.965;结果同前结果同前 26 27 28 二、大样本二、大样本Z检验检验 Z Z检验(亦称检验(亦称Z Z- -testtest)是用检验统计)是用检验统计 量量Z Z来命名的来命名的。 用于样本含量用于样本含量n n足够大(足够大(n100n100)的)的 样本均数与总体均数的比较、成组样本均数与总体均数的比较
16、、成组 设计两样本均数的比较设计两样本均数的比较。 29 (一)、单样本(一)、单样本Z检验检验 适用于当适用于当n较大(较大(n100),检验统计量),检验统计量Z值的计值的计 算公式为:算公式为: n s X Z 0 m 式中式中 为样本均数,为样本均数,0为已知总体均数,为已知总体均数,s 为样本标准差,为样本标准差,n为样本含量。为样本含量。 X 30 例例 已知正常男性血色素已知正常男性血色素 0 0=14.0g(%) =14.0g(%)。 从某地区人群中随机抽取从某地区人群中随机抽取144144名正常男名正常男 性作为样本,性作为样本, = 14.2g(%),s=1.3g(%)=
17、14.2g(%),s=1.3g(%)。 问该地区正常男性与一般正常男性血色问该地区正常男性与一般正常男性血色 素的差异有无不同?素的差异有无不同? X 31 (1)建立假设,确定检验水准)建立假设,确定检验水准 H0: =0 H1: 0 =0.05 (2)计算统计量)计算统计量 0=14.0, n=144, =14.2, s=1.3 X 85.1 144 3.1 0.142.14 0 n s X Z m 32 (3 3)确定)确定P P值值 因为因为1.850.05。 (4 4)按按 =0.05检验水准,不拒绝检验水准,不拒绝H0, 差别无统计学意义,尚不能认为该地差别无统计学意义,尚不能认为
18、该地 区正常男性与一般正常男性血色素不区正常男性与一般正常男性血色素不 同。同。 33 (二)、成组设计的两样本(二)、成组设计的两样本 均数比较的均数比较的Z检验检验 34 当两样本含量均大于当两样本含量均大于50,即使总体分,即使总体分 布偏离正态,其样本均数仍近似正态布偏离正态,其样本均数仍近似正态 分布,可用分布,可用 Z 检验。检验。 2 2 1 1 2 1 21 Z n S n S XX 35 表表 健康成人的血红蛋白含量测定值(健康成人的血红蛋白含量测定值(g/Lg/L) 性别性别 例数例数 均数均数 标准差标准差 男男 360360 134.5 7.1 女女 255 117.6
19、 10.2 例例 为研究健康成年男、女血红蛋白有无差别,某地为研究健康成年男、女血红蛋白有无差别,某地 抽样调查了部分健康成人的血红蛋白含量,观察结抽样调查了部分健康成人的血红蛋白含量,观察结 果如下表。果如下表。 36 (1) 建立假设检验,确定检验水准建立假设检验,确定检验水准 H0:m m1=m m2,即健康成年男女血红蛋白没有差别,差即健康成年男女血红蛋白没有差别,差 别是由抽样误差造成的。别是由抽样误差造成的。 H1: m m1 m m2 ,即即健康成年男女血红蛋白有差别。,即即健康成年男女血红蛋白有差别。 =0.05 (双侧)(双侧) 本资料是成组设计的两样本均数比较,可用本资料是
20、成组设计的两样本均数比较,可用t检验,检验, 由于两样本含量皆较大,也可用由于两样本含量皆较大,也可用u检验以简化计算检验以简化计算 37 (2) 计算统计量计算统计量 今今 =73.07, S1=10.75,n1100 =80.30,S2=11.83,n2105 将已知数据代入公式(将已知数据代入公式(9.26)中,得:)中,得: 1 X 2 X 83.22 255/2.10360/1.7 6.1175.134 Z 22 2 2 1 1 2 1 21 n S n S XX 38 (3)确定确定P值,作出统计推断值,作出统计推断 按自由度按自由度v=v=,查查t界值表界值表,Z Z0 0. .
21、001 001= =3 3. .2905 2905,所所 以以P 5000时,结果以时,结果以Kolmogorov- Smirnov (D检验检验) 为准为准 H0:呈正态分布;:呈正态分布;H1:不呈正态分布:不呈正态分布 =0.10 正态性检验:正态性检验: 47 注意:注意: 很多统计方法的前提是变量服从正态分布,很多统计方法的前提是变量服从正态分布, 应该建立这种意识,应该建立这种意识, 对变量是否服从正态对变量是否服从正态 分布应该通过检验确定。分布应该通过检验确定。 在在SPSS 中有很多方法可以进行正态分布中有很多方法可以进行正态分布 的检验的检验, 在使用中可以根据自己对在使用
22、中可以根据自己对SPSS 熟熟 悉程度选择一种方法对正态分布进行检验。悉程度选择一种方法对正态分布进行检验。 48 四、变量变换四、变量变换 1 1、对数变换(、对数变换(1 1)对数正态)对数正态 (2 2)样本标准差与均数成比)样本标准差与均数成比 例或变异系数是常数例或变异系数是常数 2 2、平方根变换(、平方根变换(1 1)PossionPossion分布分布 (2 2)轻度偏态)轻度偏态 3 3、平方根反正弦、平方根反正弦 率或百分比率或百分比 4 4、倒数变换、倒数变换 两端波动大两端波动大 49 五五.假设检验注意问题假设检验注意问题 统计学中的两类错误统计学中的两类错误 关于设
23、计方案关于设计方案 关于统计量的使用条件关于统计量的使用条件 关于“显著性”一词的说明关于“显著性”一词的说明 “差别有无统计学意义差别有无统计学意义”的使用的使用 区间估计与假设检验的关系区间估计与假设检验的关系& 统计学意义与专业意义之别统计学意义与专业意义之别 单双侧检验的问题单双侧检验的问题 50 mmm m0,该样本来自正常人群该样本来自正常人群 mmm m0 ,该样本来自该样本来自高血压人群高血压人群 制定依据为小概率事件原理制定依据为小概率事件原理 这是从正常人群中这是从正常人群中 随机抽样的样本血随机抽样的样本血 压均数的分布压均数的分布 诊断标准诊断标准 极端的样本,小概率事
24、件发生极端的样本,小概率事件发生 这一部分样本误判为高血压这一部分样本误判为高血压 这些样本看了不是那么“极端”这些样本看了不是那么“极端” 依据标准,这一部分样本漏判依据标准,这一部分样本漏判 收缩压收缩压=140mmHg(18.7kPa) 51 1. 统计学中的两类错误统计学中的两类错误 可见统计学假设检验过程中可能会发生两种可见统计学假设检验过程中可能会发生两种 不同类型的错误不同类型的错误 一种情况是:如果这个样本来源于正常人群一种情况是:如果这个样本来源于正常人群 (H0:m m=m m正常 正常是正确的 是正确的)结果由于它是一个极端结果由于它是一个极端 的样本,超过了诊断标准(落
25、在拒绝域内)的样本,超过了诊断标准(落在拒绝域内) 使得我们根据小概率事件原理,拒绝了原假使得我们根据小概率事件原理,拒绝了原假 设,将其误判为高血压患者设,将其误判为高血压患者 这种拒绝了原本正确的这种拒绝了原本正确的H0的错误称为的错误称为I类错类错 误误(type I error) 52 统计学中的两类错误统计学中的两类错误 另一种情况是:如果这个样本来源于高血压另一种情况是:如果这个样本来源于高血压 人群(人群( H1:m mm m正常 正常是正确的),结果由于这 是正确的),结果由于这 个样本看起来不是那么极端,比诊断标准低个样本看起来不是那么极端,比诊断标准低 (并未落在拒绝域的范
26、围内),使得我们将(并未落在拒绝域的范围内),使得我们将 其视为来自正常人群的一个样本其视为来自正常人群的一个样本 这种接受不正确的这种接受不正确的H0的错误称为的错误称为II类错误类错误 (type II error) 53 统计学中的两类错误统计学中的两类错误 犯一类错误的概率有多大?犯一类错误的概率有多大? 如果样本信息落入拒绝域,我们就会拒绝正确如果样本信息落入拒绝域,我们就会拒绝正确 的的H0假设,此时就会犯一类错误;所以假设,此时就会犯一类错误;所以I类错类错 误的概率误的概率= ,就是小概率事件的标准(检验就是小概率事件的标准(检验 水准)水准) 其大小在假设检验之前就已规定,一
27、般为其大小在假设检验之前就已规定,一般为0.050.05 或或0.010.01 因为这种概率较小,所以在拒绝原假设时通常因为这种概率较小,所以在拒绝原假设时通常 都意味着接受都意味着接受H1(认为这个样本来自于高血压认为这个样本来自于高血压 人群,误判的可能性仅为人群,误判的可能性仅为0.05或或0.01,非常小,非常小 ,因此下结论时较绝对,因此下结论时较绝对) 54 统计学中的两类错误统计学中的两类错误 犯二类错误的概率有多大?犯二类错误的概率有多大? 要知道高血压样本中漏判的比例,必须要知道高血要知道高血压样本中漏判的比例,必须要知道高血 压患者的总体均值,而后根据正态分布的曲线下面压患
28、者的总体均值,而后根据正态分布的曲线下面 积规律计算积规律计算 但是在研究结束之间通常所谓“异常”的总体水平但是在研究结束之间通常所谓“异常”的总体水平 是未知的,即并不知道高血压患者的总体血压会比是未知的,即并不知道高血压患者的总体血压会比 正常人高多少,正常人高多少,所以通常情况下二类错误的概率是所以通常情况下二类错误的概率是 未知的未知的;为了与一类错误的概率相区别,称之为;为了与一类错误的概率相区别,称之为b b 因此在不拒绝原假设时需要特别注意,不拒绝因此在不拒绝原假设时需要特别注意,不拒绝H H0 0假假 设并不意味着一定接受它!设并不意味着一定接受它! 55 统计学中的两类错误统
29、计学中的两类错误 不拒绝不拒绝H H0 0,只能认为是“,只能认为是“有条件的接受有条件的接受H H0 0” 或“或“阴性待查阴性待查” 因为如果此时漏诊的可能性较大,认为这群因为如果此时漏诊的可能性较大,认为这群 人是正常人的话就会有很大的代价(例如在人是正常人的话就会有很大的代价(例如在 当前的标准下,当前的标准下, b 30b 30,意味着如果承认,意味着如果承认 该样本来自正常人群,会使该样本来自正常人群,会使3030的高血压人的高血压人 群的样本漏诊)群的样本漏诊) 这就是之前当这就是之前当P 时结论为“尚不认为有差时结论为“尚不认为有差 别”的原因别”的原因 56 统计学中的两类错
30、误统计学中的两类错误 因此统计学上十分在意一种情况:如果这因此统计学上十分在意一种情况:如果这 群人真的是来自高血压人群的样本,能够群人真的是来自高血压人群的样本,能够 将他们准确的判断为患者的概率有多高将他们准确的判断为患者的概率有多高 这就是统计学检验的功效(这就是统计学检验的功效(power):即):即 当研究总体与当研究总体与H H0 0假设确有差别时,按照当假设确有差别时,按照当 前规定的显著性水准能够发现这种差别的前规定的显著性水准能够发现这种差别的 概率,其大小为概率,其大小为1 1 b b 57 H H0 0: :mmm m0 H H1 1: :mmm m0 I类错误,类错误,
31、 判断正确,判断正确,1-b b II类错误,类错误,b b 判断正确,判断正确,1- 58 统计学中的两类错误统计学中的两类错误 假设检验的两类错误表假设检验的两类错误表 实际实际 情况情况 检验结果检验结果 拒绝拒绝H0 不拒绝不拒绝H0 H0正确正确 I类错误类错误( ) 结论正确结论正确(1- ) H1正确正确 结论正确结论正确(1-b b) I类错误类错误(b b) 59 1-的作用的作用 若检验功效低下若检验功效低下(例如例如20%),则在此情况下,两个,则在此情况下,两个 有差别的总体仅有有差别的总体仅有20%的可能会被研究者认为有差的可能会被研究者认为有差 别,此时即使通过当前
32、的样本得到别,此时即使通过当前的样本得到P50 例数例数 正态正态 偏态偏态 n 50 方差齐方差齐 t 检验检验 ) 11 ( 21 21 nn S XX t c 2 21 nn 方差不齐方差不齐 方差齐方差齐 变量变换或秩和检验变量变换或秩和检验 t检验检验 2 2 2 1 2 1 21 n S n S XX t 11 )( 2 4 1 4 222 21 2 1 n S n S SS xx xx 84 两样本是否相关或经过配对?两样本是否相关或经过配对? 是是 否否 差值是否来自正态总体差值是否来自正态总体? 配对配对t检验检验 变量变换变量变换 是是 否否 两样本是否来自正态总体或大样本
33、两样本是否来自正态总体或大样本? 是是 否否 两总体方差是否相同两总体方差是否相同? 是是 两组独立样本两组独立样本t检验检验 变量变换变量变换 两独立样本两独立样本 配对设计配对设计 是是 秩和检验秩和检验 是是 秩和检验秩和检验 t检验检验 否 两样本定量资料平均水平比较的分析思路两样本定量资料平均水平比较的分析思路 85 术前术前(24 例例) 31.5 30.0 28.6 39.7 45.2 20.3 37.3 24.0 36.2 20.5 23.1 29.0 33.1 35.2 28.9 26.4 25.9 23.8 30.4 31.6 27.9 33.0 34.0 32.7 术后术
34、后(12 例例) 2.0 3.2 2.3 3.1 1.9 2.2 1.5 1.8 3.2 3.0 2.8 2.1 【案例案例3-1】 为研究直肠癌患者手术前后血清为研究直肠癌患者手术前后血清CEA含量有无差异,含量有无差异, 作者收集了以下资料:作者收集了以下资料: 86 正确做法正确做法 : 此案例涉及完全随机设计两小样本资料的假设检验,此案例涉及完全随机设计两小样本资料的假设检验, 统计方法的选择一定要结合数据特征。通过对两组数据统计方法的选择一定要结合数据特征。通过对两组数据 进行正态性检验,发现两样本均来自正态总体,但方差进行正态性检验,发现两样本均来自正态总体,但方差 齐性检验结果表明,两总体方差不齐,所以最好的办法齐性检验结果表明,两总体方差不齐,所以最好的办法 就是检验,此种情况一般不主张采用秩和检验,因为检就是检验,此种情况一般不主张采用秩和检验,因为检 验功效会大大降低。验功效会大大降低。 87