大学精品课件：第7.8章t检验两类错误第二次课.ppt-资源下载-163文库_上传原创PPT模板、课件、文档赚钱

大学精品课件：第7.8章t检验两类错误第二次课.ppt

1、第八章第八章 t检验、检验、Z检验和两型错误检验和两型错误福建医科大学流行病与卫生统计学系 1 一、一、两两样本均数比较样本均数比较二、大样本均数的二、大样本均数的Z检验检验三、正态性检验三、正态性检验四、变量变换四、变量变换五、假设检验注意问题五、假设检验注意问题 2 当总体方差不齐时当总体方差不齐时的的t检验检验前面阐述了方差齐性的情况下，如何进行两个前面阐述了方差齐性的情况下，如何进行两个样本均数比较的样本均数比较的t检验检验如果方差不齐，则如果方差不齐，则t检验的结果可信度大打折扣检验的结果可信度大打折扣很多学者建议在这样的情况下采用自由度校正很多学者建议在这样的情况

2、下采用自由度校正的方法计算的方法计算t分布的概率，或者直接采用非参数分布的概率，或者直接采用非参数检验检验 3 一、两样本均数比较一、两样本均数比较三种三种近似近似t 检验检验方法方法 4 Satterthwaite-Aspin t (Satterthwaite, 1941, 1946; Aspin 1948, 1949)分别提出了使用校正自由度的方法计分别提出了使用校正自由度的方法计算算t值所对应的概率值所对应的概率P 他们提出的自由度计算方法为现在大多数统他们提出的自由度计算方法为现在大多数统计学软件所采用，公式如下计学软件所采用，公式如下 2 22 112212 22 22 2

3、2 12 1122 12 12 / / 11 snsn xx ttv sssnsn nn nn 5 Welch t * (Welch, 1947)类似类似Satterthwite法，使用校正法，使用校正自由度的方法进行自由度的方法进行t检验，公式如下：检验，公式如下： 2 22 112212 22 22 22 12 1122 12 12 / / 2 1 1 snsn xx ttv sssn n sn n n n 6 Cochran 13.7,4.21,8 / 4.68; 7.958 / 11 2.306, ,0.05 xy xy xsnysn snsn xy tv ssnsn s nn nn

4、 ttt H xyxy y y x x 将将代代入入SatterthwaiteSatterthwaite公公式式中中查查表表得得在在的的水水准准上上，拒拒绝绝，认认为为两两组组大大鼠鼠血血糖糖的的总总体体均均数数不不同同 10 【例例3-7】为研究某种新药治疗贫血患者的疗效，将为研究某种新药治疗贫血患者的疗效，将20 名贫血患者随机分成两组，一组用新药治疗，另一组用名贫血患者随机分成两组，一组用新药治疗，另一组用常规药物治疗，测得血红蛋白增加量（常规药物治疗，测得血红蛋白增加量（g/L）见表。问新）见表。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无药与常规药治疗贫血患者后的

5、血红蛋白平均增加量有无差别？差别？治疗药物血红蛋白增加量（g/L）新药组 30.5 21.4 25.0 34.5 33.0 32.5 29.5 25.5 24.4 23.6 常规药组 19.5 19.0 13.0 24.7 21.5 22.0 19.0 15.5 24.5 23.4 表表 3-7 两种药物治疗贫血患者结果两种药物治疗贫血患者结果两样本总体方差相等两样本总体方差相等 t 检验检验 56. 499.27新药组：82. 321.20常规药组： 11 资料识别：资料识别：资料类型：资料类型：定量变量资料定量变量资料设计类型：设计类型：两独立样本两独立样本 1. 资料特点：

6、定量、两组独立样本资料资料特点：定量、两组独立样本资料处理组处理组1：认为其所在总体均数为认为其所在总体均数为 m m1；处理组处理组2：认为其所在总体均数为认为其所在总体均数为。. 2. 检验目的：检验目的：两组间观察指标的差异性比较。两组间观察指标的差异性比较。 210 mm：即 H 2 m 12 正态性检验正态性检验由于有抽样误差的存在，必须对由于有抽样误差的存在，必须对n 0.05；按按 = 0.05水准不拒水准不拒绝绝H0，可以认为新药和常规药治疗贫血患者后血红蛋白，可以认为新药和常规药治疗贫血患者后血红蛋白增加量不同，根据样本均数的信息增加量不同，根据样本均数的信息

7、，认为，认为，即服用新药后平均增加量高于常规药。即服用新药后平均增加量高于常规药。 H0： m m1 1 m m2 2 H1 ：m m1 1 m m2 2 137. 4 ) 11 ( 2 /XX/XX 2121 2 2 2 2 21 2 1 2 1 21 nnnn nn XX t ）（）（ 20 -218 21XX 12 mm 15 1. 正态性检验：正态性检验： Analyze Descriptive Statistics Explore Dependent list框框 Y Factor list框框group Plots框框Normality plots with tests Con

8、tinue OK 【电脑实现电脑实现】 16 结果输出: Tests of Normality .20710.200*.93210.466 .17610.200*.93510.482 group 新药组常规药物组 y StatisticdfSig.StatisticdfSig. Kolmogorov-SmirnovaShapiro-Wilk This is a lower bound of the true significance.*. Lilliefors Significance Correctiona. 17 2. 两独立样本的两独立样本的t 检验检验 Analyze Compare

9、 means Independent- sample T Test Test Variable(s) 框框 y Grouping Variable框框group Define Groups框框 Group 1: 1； Group 2: 2 Continue OK 18 【电脑实现电脑实现】SPSS 两样本比较的t 检验: 19 结果输出: Independent Samples Test 1.345.2614.13718.0017.78001.88073.828811.7312 4.13717.461.0017.78001.88073.820011.7400 Equal variances a

10、ssumed Equal variances not assumed y FSig. Levenes Test for Equality of Variances tdfSig. (2-tailed) Mean Difference Std. Error DifferenceLowerUpper 95% Confidence Interval of the Difference t-test for Equality of Means 20 在在 =0.10 检验水准下检验水准下，新药组和常规药物组血红蛋白增加量，新药组和常规药物组血红蛋白增加量均服从正态分布均服从正态分布（W 检验：检验：

11、P1=0.466，P20.482）且）且两总体方差两总体方差齐（齐（F1.345， P=0.261）；采用）；采用两独立样本的两独立样本的 t 检验检验： t=4.137，=18， P=0.001。结果表明：在。结果表明：在 =0.05(双侧双侧)检验水准下，可以认为两药检验水准下，可以认为两药疗效不同，新药治疗的患者血红蛋白平均增加量高于常规药治疗的疗效不同，新药治疗的患者血红蛋白平均增加量高于常规药治疗的患者患者。 12 mm 的的 95%置信区间置信区间(3.829, 11.731)也表明也表明新药治疗的患者新药治疗的患者血红蛋白平均增加量高。血红蛋白平均增加量高

12、。表 6.2 不同组别血红蛋白增加量(sx) 组别 n Hb 含量（g/L）新药组 10 27.99 4.56 常规药组 10 20.21 3.82 【结果报告结果报告】 21 例例在上述例子国产四类新药阿卡波糖胶囊在上述例子国产四类新药阿卡波糖胶囊的降血糖效果研究中，测得用拜糖平胶囊的的降血糖效果研究中，测得用拜糖平胶囊的对照组对照组20例病人和用阿卡波糖胶囊的试验组例病人和用阿卡波糖胶囊的试验组 20例病人，其例病人，其8周时糖化血红蛋白周时糖化血红蛋白HbA1c(%) 下降值如表下降值如表3-7。问用两种不同药物的病人其。问用两种不同药物的病人其 HbA1c下降值是否不同？下降

13、值是否不同？表表3-7 对照组和试验组对照组和试验组HbA1c下降值下降值(%) 分组 N 均数标准差对照组 20 1.46 1.36 试验组 20 1.13 0.70 22 1.建立假设、确定检验水准建立假设、确定检验水准 H0：两总体均数相同，即：两总体均数相同，即1 2 H1：两总体均数不同，即：两总体均数不同，即1 2 （双侧检验）（双侧检验）=0.05 2.计算检验统计量计算检验统计量 965.0 20 70.0 20 36.1 13.146.1 22 2 2 2 1 2 1 21 n S n S XX t V1=20-1=19; v2=20-1=19 3.确定确定P值。作出推

14、断结论值。作出推断结论 093.2t 21 2 2 1 1 22 , 2 , 2 XX XX SS tStS 按按=0.05水准，不拒绝水准，不拒绝H0，无统计学意义，无统计学意义按按t检验：检验： 23 按按satterthweite近似近似t检验：检验： 4.28 120 ) 20 70.0 ( 120 ) 20 36.1 ( ) 20 70.0 20 36.1 ( 1 )( 1 )( )( 2 2 2 2 2 22 2 2 2 2 2 1 2 1 1 2 222 21 n n S n n S SSXX =28、t=0.965;结果同前结果同前 24 25 按按Welch近似近似t检验：

15、检验： 4.292 120 ) 20 70.0 ( 120 ) 20 36.1 ( ) 20 70.0 20 36.1 ( 2 1 )( 1 )( )( 2 2 2 2 2 22 2 2 2 2 2 1 2 1 1 2 222 21 n n S n n S SSXX =29、t=0.965;结果同前结果同前 26 27 28 二、大样本二、大样本Z检验检验 Z Z检验（亦称检验（亦称Z Z- -testtest）是用检验统计）是用检验统计量量Z Z来命名的来命名的。用于样本含量用于样本含量n n足够大（足够大（n100n100）的）的样本均数与总体均数的比较、成组样本均数与总体均数的比较

16、、成组设计两样本均数的比较设计两样本均数的比较。 29 （一）、单样本（一）、单样本Z检验检验适用于当适用于当n较大（较大（n100），检验统计量），检验统计量Z值的计值的计算公式为：算公式为： n s X Z 0 m 式中式中为样本均数，为样本均数，0为已知总体均数，为已知总体均数，s 为样本标准差，为样本标准差，n为样本含量。为样本含量。 X 30 例例已知正常男性血色素已知正常男性血色素 0 0=14.0g(%) =14.0g(%)。从某地区人群中随机抽取从某地区人群中随机抽取144144名正常男名正常男性作为样本，性作为样本， = 14.2g(%),s=1.3g(%)=

17、14.2g(%),s=1.3g(%)。问该地区正常男性与一般正常男性血色问该地区正常男性与一般正常男性血色素的差异有无不同？素的差异有无不同？ X 31 （1）建立假设，确定检验水准）建立假设，确定检验水准 H0: =0 H1: 0 =0.05 （2）计算统计量）计算统计量 0=14.0, n=144, =14.2, s=1.3 X 85.1 144 3.1 0.142.14 0 n s X Z m 32 （3 3）确定）确定P P值值因为因为1.850.05。（4 4）按按 =0.05检验水准，不拒绝检验水准，不拒绝H0，差别无统计学意义，尚不能认为该地差别无统计学意义，尚不能认为

18、该地区正常男性与一般正常男性血色素不区正常男性与一般正常男性血色素不同。同。 33 （二）、成组设计的两样本（二）、成组设计的两样本均数比较的均数比较的Z检验检验 34 当两样本含量均大于当两样本含量均大于50，即使总体分，即使总体分布偏离正态，其样本均数仍近似正态布偏离正态，其样本均数仍近似正态分布，可用分布，可用 Z 检验。检验。 2 2 1 1 2 1 21 Z n S n S XX 35 表表健康成人的血红蛋白含量测定值（健康成人的血红蛋白含量测定值（g/Lg/L）性别性别例数例数均数均数标准差标准差男男 360360 134.5 7.1 女女 255 117.6

19、 10.2 例例为研究健康成年男、女血红蛋白有无差别，某地为研究健康成年男、女血红蛋白有无差别，某地抽样调查了部分健康成人的血红蛋白含量，观察结抽样调查了部分健康成人的血红蛋白含量，观察结果如下表。果如下表。 36 (1) 建立假设检验，确定检验水准建立假设检验，确定检验水准 H0：m m1=m m2，即健康成年男女血红蛋白没有差别，差即健康成年男女血红蛋白没有差别，差别是由抽样误差造成的。别是由抽样误差造成的。 H1： m m1 m m2 ，即即健康成年男女血红蛋白有差别。，即即健康成年男女血红蛋白有差别。 =0.05 （双侧）（双侧）本资料是成组设计的两样本均数比较，可用本资料是

20、成组设计的两样本均数比较，可用t检验，检验，由于两样本含量皆较大，也可用由于两样本含量皆较大，也可用u检验以简化计算检验以简化计算 37 (2) 计算统计量计算统计量今今 =73.07， S1=10.75，n1100 =80.30，S2=11.83，n2105 将已知数据代入公式（将已知数据代入公式（9.26）中，得：）中，得： 1 X 2 X 83.22 255/2.10360/1.7 6.1175.134 Z 22 2 2 1 1 2 1 21 n S n S XX 38 (3)确定确定P值，作出统计推断值，作出统计推断按自由度按自由度v=v=，查查t界值表界值表，Z Z0 0. .

21、001 001= =3 3. .2905 2905，所所以以P 5000时，结果以时，结果以Kolmogorov- Smirnov (D检验检验) 为准为准 H0：呈正态分布；：呈正态分布；H1：不呈正态分布：不呈正态分布 =0.10 正态性检验：正态性检验： 47 注意：注意：很多统计方法的前提是变量服从正态分布，很多统计方法的前提是变量服从正态分布，应该建立这种意识，应该建立这种意识，对变量是否服从正态对变量是否服从正态分布应该通过检验确定。分布应该通过检验确定。在在SPSS 中有很多方法可以进行正态分布中有很多方法可以进行正态分布的检验的检验, 在使用中可以根据自己对在使用

22、中可以根据自己对SPSS 熟熟悉程度选择一种方法对正态分布进行检验。悉程度选择一种方法对正态分布进行检验。 48 四、变量变换四、变量变换 1 1、对数变换（、对数变换（1 1）对数正态）对数正态（2 2）样本标准差与均数成比）样本标准差与均数成比例或变异系数是常数例或变异系数是常数 2 2、平方根变换（、平方根变换（1 1）PossionPossion分布分布（2 2）轻度偏态）轻度偏态 3 3、平方根反正弦、平方根反正弦率或百分比率或百分比 4 4、倒数变换、倒数变换两端波动大两端波动大 49 五五.假设检验注意问题假设检验注意问题统计学中的两类错误统计学中的两类错误关于设

23、计方案关于设计方案关于统计量的使用条件关于统计量的使用条件关于“显著性”一词的说明关于“显著性”一词的说明 “差别有无统计学意义差别有无统计学意义”的使用的使用区间估计与假设检验的关系区间估计与假设检验的关系& 统计学意义与专业意义之别统计学意义与专业意义之别单双侧检验的问题单双侧检验的问题 50 mmm m0，该样本来自正常人群该样本来自正常人群 mmm m0 ，该样本来自该样本来自高血压人群高血压人群制定依据为小概率事件原理制定依据为小概率事件原理这是从正常人群中这是从正常人群中随机抽样的样本血随机抽样的样本血压均数的分布压均数的分布诊断标准诊断标准极端的样本，小概率事

24、件发生极端的样本，小概率事件发生这一部分样本误判为高血压这一部分样本误判为高血压这些样本看了不是那么“极端”这些样本看了不是那么“极端” 依据标准，这一部分样本漏判依据标准，这一部分样本漏判收缩压收缩压=140mmHg（18.7kPa） 51 1. 统计学中的两类错误统计学中的两类错误可见统计学假设检验过程中可能会发生两种可见统计学假设检验过程中可能会发生两种不同类型的错误不同类型的错误一种情况是：如果这个样本来源于正常人群一种情况是：如果这个样本来源于正常人群 (H0:m m=m m正常正常是正确的是正确的)结果由于它是一个极端结果由于它是一个极端的样本，超过了诊断标准（落

25、在拒绝域内）的样本，超过了诊断标准（落在拒绝域内）使得我们根据小概率事件原理，拒绝了原假使得我们根据小概率事件原理，拒绝了原假设，将其误判为高血压患者设，将其误判为高血压患者这种拒绝了原本正确的这种拒绝了原本正确的H0的错误称为的错误称为I类错类错误误(type I error) 52 统计学中的两类错误统计学中的两类错误另一种情况是：如果这个样本来源于高血压另一种情况是：如果这个样本来源于高血压人群（人群（ H1:m mm m正常正常是正确的），结果由于这是正确的），结果由于这个样本看起来不是那么极端，比诊断标准低个样本看起来不是那么极端，比诊断标准低（并未落在拒绝域的范

26、围内），使得我们将（并未落在拒绝域的范围内），使得我们将其视为来自正常人群的一个样本其视为来自正常人群的一个样本这种接受不正确的这种接受不正确的H0的错误称为的错误称为II类错误类错误 (type II error) 53 统计学中的两类错误统计学中的两类错误犯一类错误的概率有多大？犯一类错误的概率有多大？如果样本信息落入拒绝域，我们就会拒绝正确如果样本信息落入拒绝域，我们就会拒绝正确的的H0假设，此时就会犯一类错误；所以假设，此时就会犯一类错误；所以I类错类错误的概率误的概率= ，就是小概率事件的标准（检验就是小概率事件的标准（检验水准）水准）其大小在假设检验之前就已规定，一

27、般为其大小在假设检验之前就已规定，一般为0.050.05 或或0.010.01 因为这种概率较小，所以在拒绝原假设时通常因为这种概率较小，所以在拒绝原假设时通常都意味着接受都意味着接受H1(认为这个样本来自于高血压认为这个样本来自于高血压人群，误判的可能性仅为人群，误判的可能性仅为0.05或或0.01，非常小，非常小，因此下结论时较绝对，因此下结论时较绝对) 54 统计学中的两类错误统计学中的两类错误犯二类错误的概率有多大？犯二类错误的概率有多大？要知道高血压样本中漏判的比例，必须要知道高血要知道高血压样本中漏判的比例，必须要知道高血压患者的总体均值，而后根据正态分布的曲线下面压患

28、者的总体均值，而后根据正态分布的曲线下面积规律计算积规律计算但是在研究结束之间通常所谓“异常”的总体水平但是在研究结束之间通常所谓“异常”的总体水平是未知的，即并不知道高血压患者的总体血压会比是未知的，即并不知道高血压患者的总体血压会比正常人高多少，正常人高多少，所以通常情况下二类错误的概率是所以通常情况下二类错误的概率是未知的未知的；为了与一类错误的概率相区别，称之为；为了与一类错误的概率相区别，称之为b b 因此在不拒绝原假设时需要特别注意，不拒绝因此在不拒绝原假设时需要特别注意，不拒绝H H0 0假假设并不意味着一定接受它！设并不意味着一定接受它！ 55 统计学中的两类错误统

29、计学中的两类错误不拒绝不拒绝H H0 0，只能认为是“，只能认为是“有条件的接受有条件的接受H H0 0” 或“或“阴性待查阴性待查” 因为如果此时漏诊的可能性较大，认为这群因为如果此时漏诊的可能性较大，认为这群人是正常人的话就会有很大的代价（例如在人是正常人的话就会有很大的代价（例如在当前的标准下，当前的标准下， b 30b 30，意味着如果承认，意味着如果承认该样本来自正常人群，会使该样本来自正常人群，会使3030的高血压人的高血压人群的样本漏诊）群的样本漏诊）这就是之前当这就是之前当P 时结论为“尚不认为有差时结论为“尚不认为有差别”的原因别”的原因 56 统计学中的两类错

30、误统计学中的两类错误因此统计学上十分在意一种情况：如果这因此统计学上十分在意一种情况：如果这群人真的是来自高血压人群的样本，能够群人真的是来自高血压人群的样本，能够将他们准确的判断为患者的概率有多高将他们准确的判断为患者的概率有多高这就是统计学检验的功效（这就是统计学检验的功效（power）：即）：即当研究总体与当研究总体与H H0 0假设确有差别时，按照当假设确有差别时，按照当前规定的显著性水准能够发现这种差别的前规定的显著性水准能够发现这种差别的概率，其大小为概率，其大小为1 1 b b 57 H H0 0: :mmm m0 H H1 1: :mmm m0 I类错误，类错误，

31、判断正确，判断正确，1-b b II类错误，类错误，b b 判断正确，判断正确，1- 58 统计学中的两类错误统计学中的两类错误假设检验的两类错误表假设检验的两类错误表实际实际情况情况检验结果检验结果拒绝拒绝H0 不拒绝不拒绝H0 H0正确正确 I类错误类错误( ) 结论正确结论正确(1- ) H1正确正确结论正确结论正确(1-b b) I类错误类错误(b b) 59 1-的作用的作用若检验功效低下若检验功效低下(例如例如20%)，则在此情况下，两个，则在此情况下，两个有差别的总体仅有有差别的总体仅有20%的可能会被研究者认为有差的可能会被研究者认为有差别，此时即使通过当前

32、的样本得到别，此时即使通过当前的样本得到P50 例数例数正态正态偏态偏态 n 50 方差齐方差齐 t 检验检验 ) 11 ( 21 21 nn S XX t c 2 21 nn 方差不齐方差不齐方差齐方差齐变量变换或秩和检验变量变换或秩和检验 t检验检验 2 2 2 1 2 1 21 n S n S XX t 11 )( 2 4 1 4 222 21 2 1 n S n S SS xx xx 84 两样本是否相关或经过配对？两样本是否相关或经过配对？是是否否差值是否来自正态总体差值是否来自正态总体？配对配对t检验检验变量变换变量变换是是否否两样本是否来自正态总体或大样本

33、两样本是否来自正态总体或大样本？是是否否两总体方差是否相同两总体方差是否相同？是是两组独立样本两组独立样本t检验检验变量变换变量变换两独立样本两独立样本配对设计配对设计是是秩和检验秩和检验是是秩和检验秩和检验 t检验检验否两样本定量资料平均水平比较的分析思路两样本定量资料平均水平比较的分析思路 85 术前术前(24 例例) 31.5 30.0 28.6 39.7 45.2 20.3 37.3 24.0 36.2 20.5 23.1 29.0 33.1 35.2 28.9 26.4 25.9 23.8 30.4 31.6 27.9 33.0 34.0 32.7 术后术

34、后(12 例例) 2.0 3.2 2.3 3.1 1.9 2.2 1.5 1.8 3.2 3.0 2.8 2.1 【案例案例3-1】为研究直肠癌患者手术前后血清为研究直肠癌患者手术前后血清CEA含量有无差异，含量有无差异，作者收集了以下资料：作者收集了以下资料： 86 正确做法正确做法：此案例涉及完全随机设计两小样本资料的假设检验，此案例涉及完全随机设计两小样本资料的假设检验，统计方法的选择一定要结合数据特征。通过对两组数据统计方法的选择一定要结合数据特征。通过对两组数据进行正态性检验，发现两样本均来自正态总体，但方差进行正态性检验，发现两样本均来自正态总体，但方差齐性检验结果表明，两总体方差不齐，所以最好的办法齐性检验结果表明，两总体方差不齐，所以最好的办法就是检验，此种情况一般不主张采用秩和检验，因为检就是检验，此种情况一般不主张采用秩和检验，因为检验功效会大大降低。验功效会大大降低。 87

邮箱/手机：
温馨提示：	系统将以此处填写的邮箱或者手机号生成账号和密码，方便再次下载。如填写123，账号和密码都是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？