1、1 第七章第七章 假设检验假设检验 福建医科大学公共卫生学院福建医科大学公共卫生学院 2 法官的判决法官的判决 法庭上,陪审团需要建立以下两种假设:法庭上,陪审团需要建立以下两种假设: 事先并不知道哪种假设是正确的,需要根据事先并不知道哪种假设是正确的,需要根据 呈庭证供,才可下结论呈庭证供,才可下结论 无罪无罪 有罪有罪 3 胎儿的性别胎儿的性别 有人声称能够预测胎儿的性别,我们对此有有人声称能够预测胎儿的性别,我们对此有 两种假设:两种假设: 事先并不知道哪种假设是正确的,需要根据事先并不知道哪种假设是正确的,需要根据 她推测的结果,才可下结论她推测的结果,才可下结论 无此能力无此能力 有
2、此能力有此能力 4 商家信誉商家信誉 某商家宣称他所卖的鸡蛋绝对新鲜,可以达某商家宣称他所卖的鸡蛋绝对新鲜,可以达 到“百里挑一”;是否可以相信商家信誉?到“百里挑一”;是否可以相信商家信誉? 事先并不知道哪种假设是正确的,需要对其事先并不知道哪种假设是正确的,需要对其 鸡蛋检验后,才可下结论鸡蛋检验后,才可下结论 商家有信誉商家有信誉 商家无信誉商家无信誉 5 ? 否定否定 肯定肯定 6 胎儿性别胎儿性别统计学的思维方式统计学的思维方式 女士说她可以预测胎儿的性别女士说她可以预测胎儿的性别 暂时认为她是瞎猜,每个孕妇被猜对的可能性均为暂时认为她是瞎猜,每个孕妇被猜对的可能性均为 50% 让她
3、对让她对10个孕妇作推断,结果是全部说对了;在瞎猜个孕妇作推断,结果是全部说对了;在瞎猜 的情况下,全对的可能性为的情况下,全对的可能性为0.510=0.000976563 在一次试验中出现小概率事件是不太可能的,故认为在一次试验中出现小概率事件是不太可能的,故认为 她真的有这种能力!她真的有这种能力! 7 关于商家信誉关于商家信誉 某商家宣称他所卖的鸡蛋绝对新鲜,可以达到“百某商家宣称他所卖的鸡蛋绝对新鲜,可以达到“百 里挑一”;结果有人买了里挑一”;结果有人买了10个鸡蛋,其中个鸡蛋,其中2个坏了,个坏了, 是否还可以相信商家广告?是否还可以相信商家广告? 暂时认为商家是有信誉的,在此前提
4、下暂时认为商家是有信誉的,在此前提下10个鸡蛋中个鸡蛋中 出现出现2个或更多变质的可能性为个或更多变质的可能性为0.004,是小概率事,是小概率事 件!件! 但是对于该顾客而言,他仅仅购买了一次,就碰上但是对于该顾客而言,他仅仅购买了一次,就碰上 了小概率事件,所以商家的信誉度值得怀疑了小概率事件,所以商家的信誉度值得怀疑 8 假设检验假设检验 先对先对总体的参数总体的参数提出某种假设提出某种假设,然后利用样然后利用样 本信息判断是否本信息判断是否拒绝拒绝该假设过程该假设过程 反证法反证法 + + 小概率事件原理小概率事件原理 9 假设检验假设检验hypothesis test:先对总体的参数
5、:先对总体的参数(或分布或分布 形式形式)提出某种假设提出某种假设,然后利用样本信息判断假设然后利用样本信息判断假设 是否成立的过程是否成立的过程 逻辑上运用反证法逻辑上运用反证法(暂且认为总体的情况如此暂且认为总体的情况如此, 而后看样本信息是否能够驳倒原先的假设而后看样本信息是否能够驳倒原先的假设),统统 计上依据小概率原理计上依据小概率原理(如果样本的情况属于小概如果样本的情况属于小概 率事件率事件,那么小概率事件不应该在一次抽样的情那么小概率事件不应该在一次抽样的情 况下发生况下发生) 10 假设检验的基本步骤假设检验的基本步骤 例:已知一般健康男性的脉搏均数为例:已知一般健康男性的脉
6、搏均数为72.0次次/ 分,标准差为分,标准差为6.0次次/分;某医生在某山区随分;某医生在某山区随 机抽取了机抽取了25名健康成年男性,测得他们的脉名健康成年男性,测得他们的脉 搏均数为搏均数为74.6次次/分,问该山区男性的脉搏均分,问该山区男性的脉搏均 数是否高于一般健康成年男性?数是否高于一般健康成年男性? 11 假设检验的基本步骤假设检验的基本步骤 从资料提供的信息来看,样本均数从资料提供的信息来看,样本均数74.6与总体均数与总体均数72.0不相等,不相等, 其原因可有以下两个方面:其原因可有以下两个方面: 样本对应的总体均数等于样本对应的总体均数等于72.0,差别仅仅是由于抽样误
7、,差别仅仅是由于抽样误 差所致;差所致; 该地区的男性的脉搏均数与一般男性存在本质上的差该地区的男性的脉搏均数与一般男性存在本质上的差 异异:高海拔导致脉搏较快?高海拔导致脉搏较快? 两种情况只有一个是正确的,且二者必居其一,需要我们作两种情况只有一个是正确的,且二者必居其一,需要我们作 出选择。出选择。 12 假设检验的基本步骤假设检验的基本步骤 :建立假设:建立假设 步骤步骤1:建立假设:建立假设 在假设的前提下有规律可寻在假设的前提下有规律可寻 无效假设无效假设null hypothesis,记为,记为H0,表示目前的,表示目前的 差异是由于抽样误差引起的差异是由于抽样误差引起的 备择假
8、设备择假设alternative hypothesis,记为,记为H1,表示,表示 目前的差异是主要由于本质上的差别引起目前的差异是主要由于本质上的差别引起 13 研究者想收集证据予以反驳的假设研究者想收集证据予以反驳的假设 总是含有符号总是含有符号 “”,又称又称“0假设假设” 总是针对未知的总体参数作假设总是针对未知的总体参数作假设 表示为表示为 H0,记为,记为H0:m m = 某一数值;表示样本所某一数值;表示样本所 来源的总体参数某具体数值来源的总体参数某具体数值 无效假设无效假设 14 研究者想收集证据予以支持的假设研究者想收集证据予以支持的假设 又称为“研究假设”,总是含有符号“
9、又称为“研究假设”,总是含有符号“ ” 同样总是针对样本所来源的总体参数同样总是针对样本所来源的总体参数 表示为表示为H1,记为,记为H1:m m 某一数值(单侧)某一数值(单侧) m m72.0,并,并 没有指明具体值,那么总体的情况是很复杂的)没有指明具体值,那么总体的情况是很复杂的) 根据备择假设的取值趋向,将假设分为双侧或单侧(如果仅仅根据备择假设的取值趋向,将假设分为双侧或单侧(如果仅仅 是含有“是含有“” ,则称为双侧;而具体指明是,则称为双侧;而具体指明是“”或“或“72.0,该地区男性的脉搏均数高于一般(但是具体高多,该地区男性的脉搏均数高于一般(但是具体高多 少不知道)少不知
10、道) H0假设比较单纯、明确,且在该假设的前提下就有规律可寻;假设比较单纯、明确,且在该假设的前提下就有规律可寻; 而而H1假设包含的情况比较复杂;因此,检验是针对假设包含的情况比较复杂;因此,检验是针对H0的的 18 假设检验的基本步骤:确定假设检验的基本步骤:确定a a 步骤步骤2:确立检验水准:确立检验水准(significance level) 小概率事件是否发生小概率事件是否发生拒绝拒绝H0 究竟概率小到多少称为“小概率”究竟概率小到多少称为“小概率” “小概率”的标准“小概率”的标准检验水准,记为检验水准,记为a a 通常将其定为通常将其定为0.05或或0.01 请注意:因为用到了
11、小概率事件原理,我们的结论最终不是完全请注意:因为用到了小概率事件原理,我们的结论最终不是完全 肯定的,而是带有一定概率性!肯定的,而是带有一定概率性! 19 假设检验的基本步骤:构建统计量假设检验的基本步骤:构建统计量 步骤步骤3:计算检验统计量:计算检验统计量 检验的名称就是由所计算的统计量命名(例检验的名称就是由所计算的统计量命名(例 如计算如计算t值称为值称为t检验,检验,Z值就是值就是Z检验,检验,c c2值值 就是卡方检验,就是卡方检验,F值就是值就是F检验,等等)检验,等等) 根据分析目的、资料类型、设计类型、样本大根据分析目的、资料类型、设计类型、样本大 小、方法的适用条件等选
12、择相应的检验方法并小、方法的适用条件等选择相应的检验方法并 计算检验统计量。计算检验统计量。 20 假设检验的基本步骤:构建统计量假设检验的基本步骤:构建统计量 21 假设检验的基本步骤:计算假设检验的基本步骤:计算P值值 P值的含义为:当值的含义为:当H0成立的情况下,统计量获得现有数值以及成立的情况下,统计量获得现有数值以及 更不利于更不利于H0的数值的可能性有多大的数值的可能性有多大 在本题中,所谓更不利于在本题中,所谓更不利于H0指的是,样本均数与总体均数间的指的是,样本均数与总体均数间的 差别比现有的还要大:差别比现有的还要大: 体现在体现在Z值上就是值上就是P(Z2.167)=?
13、72.02.6(74.6)实实际际就就是是样样本本均均数数比比还还大大x 22 假设检验的基本步骤:计算假设检验的基本步骤:计算P值值 通过计算机的运算得到通过计算机的运算得到P1.513% 如何通过查课后的附表快速得到结果?如何通过查课后的附表快速得到结果? 单侧单侧Z0.05=1.64 我们的结果我们的结果 z=2.17 单侧的面积为单侧的面积为0.05 面积面积a a,则表示在,则表示在H0成立的情况下,出现当前样本以及比当前成立的情况下,出现当前样本以及比当前 更极端情况的概率并非小概率事件,根据当前的样本信息还不更极端情况的概率并非小概率事件,根据当前的样本信息还不 足于拒绝足于拒绝
14、H0 本题的结果由于本题的结果由于P ,按按水准水准,不拒绝不拒绝H0 ,无统计学意义无统计学意义, 尚不能认为尚不能认为不同或不等不同或不等。 建立假设,确定检验水准建立假设,确定检验水准 确定确定P值值 计算检验统计量计算检验统计量 作推断结论作推断结论 拒绝拒绝H0,接受,接受H1, , 认为差异有统计学意义认为差异有统计学意义 P P P P 不拒绝不拒绝H0, 认为差异无统计学意义认为差异无统计学意义 26 27 1.1.建立假设,确定检验水准建立假设,确定检验水准 H0: = m m0=3min,新疗法使患者锻炼,新疗法使患者锻炼 持续时间的平均增加量等于常规疗法;持续时间的平均增
15、加量等于常规疗法; H1: m m0, ,新疗法使患者锻炼持续时间的 新疗法使患者锻炼持续时间的 平均增加量不等于常规疗法;平均增加量不等于常规疗法; 双侧双侧0.05 课本例子课本例子: 28 2.2.计算统计量计算统计量 已知已知m m0 3min,n50, X =4min 7140.4 50/5.1 34 t 49150 29 3.确定P值 按自由度按自由度 ,查,查t界值表,界值表, 因为因为4.7140 3.496 ,所以,所以P50) 则可以使用则可以使用Z检验检验 有关样本资料的差异性比较有关样本资料的差异性比较 定量资料定量资料 定性资料定性资料 数据类型数据类型 前提条件前提
16、条件 t / u检验检验 四格表四格表 RC表表 配对配对 四格表四格表 设计类型设计类型 单单 样样 本本 两两 独独 立立 样样 本本 配配 对对 设设 计计 多多 独独 立立 样样 本本 方差分析方差分析 两两 组组 二二 分分 类类 配配 对对 设设 计计 多多 组组 多多 分分 类类 单单 样样 本本 两、两、 多多 独独 立立 样样 本本 配配 对对 设设 计计 不满足不满足t 检验检验/方方 差分析条件的差分析条件的 等等 级级 资资 料料 设计设计 类型类型 设计类型设计类型 检验检验 2 c非参数检验非参数检验-秩和检验秩和检验 34 SPSS软件 35 一、样本均数与总体均
17、数 的比较 36 推断样本所代表的未知总体均数推断样本所代表的未知总体均数与已知总与已知总 体均数体均数 0 0有无差别。 有无差别。 已知总体均数已知总体均数 0 0一般为理论值、标准值或经 一般为理论值、标准值或经 大量观察所得的稳定值。大量观察所得的稳定值。 统计量统计量t t的计算公式:的计算公式: 1, | 00 n nS X S X t X mm 37 38 已知某地新生儿出生体重均数为已知某地新生儿出生体重均数为3.36kg, 从该地随机抽取从该地随机抽取40名新生儿,测得其平均体名新生儿,测得其平均体 重为重为3.27kg,标准差为,标准差为0.44kg,问该地农,问该地农 村
18、新生儿体重是否与该地新生儿平均出生体村新生儿体重是否与该地新生儿平均出生体 重不同?重不同? 例例8.1 39 (1) 建立检验假设建立检验假设,确定检验水准确定检验水准 H0:m m=3.36,该地农村新生儿体重与该地新生儿平该地农村新生儿体重与该地新生儿平 均体重相同均体重相同 H1:m m 3.36,该地农村新生儿体重与该地新生儿平该地农村新生儿体重与该地新生儿平 均体重不同均体重不同 a a =0.05 40 (2) 计算统计量计算统计量 41 (3) 确定确定P值,作出统计推断值,作出统计推断 查附表查附表3,t界值表界值表,t=-1.294的绝对值的绝对值,得得 0.2P0.4,按
19、按 =0.05检验检验水准水准,不拒绝不拒绝H0,差差 异无统计学意义异无统计学意义,尚不能认为该地农村新生儿体尚不能认为该地农村新生儿体 重与该地新生儿平均体重不同重与该地新生儿平均体重不同。 a 第二节第二节 配对均数的比较配对均数的比较 42 配对设计 何为配对设计?何为配对设计? 有时影响试验或研究结果的不仅仅是我们所有时影响试验或研究结果的不仅仅是我们所 观察的因素,例如要比较两种药物的疗效,观察的因素,例如要比较两种药物的疗效, 如果两组患者在开始时的病情严重程度相差如果两组患者在开始时的病情严重程度相差 较大,那么即使最终两药的治愈情况不同,较大,那么即使最终两药的治愈情况不同,
20、 也不能归结于药物差别;在这里患者的病情也不能归结于药物差别;在这里患者的病情 称之为非处理因素或“混杂”因素称之为非处理因素或“混杂”因素 配对设计就是研究者为了控制可能存在的非配对设计就是研究者为了控制可能存在的非 处理因素对研究结果的影响而采用的一种“处理因素对研究结果的影响而采用的一种“ 均衡”的设计方法均衡”的设计方法 43 44 男性男性 40 40 轻度轻度 男性男性 42 42 轻度轻度 女性女性 45 45 中度中度 女性女性 43 43 中度中度 女性女性 55 55 重度重度 女性女性 57 57 重度重度 门诊号门诊号1 1 门诊号门诊号2 2 门诊号门诊号3 3 门诊
21、号门诊号4 4 门诊号门诊号5 5 门诊号门诊号6 6 性别、年龄、性别、年龄、 高血压的程高血压的程 度将影响到度将影响到 药物的疗效,药物的疗效, 决定将以上决定将以上 三个“混杂”三个“混杂” 因素作为匹因素作为匹 配变量配变量 门诊号门诊号1 vs. 1 vs. 门诊号门诊号6 6 门诊号门诊号2 vs. 2 vs. 门诊号门诊号4 4 门诊号门诊号3 vs. 3 vs. 门诊号门诊号5 5 随机数:随机数:99 34399 343 随机数:随机数:494 567494 567 随机数:随机数:206 126206 126 试验试验 对照对照 试验试验 对照对照 对照对照 试验试验 对
22、子号对子号 试验组试验组 对照组对照组 1 1 门诊门诊6 6 门诊门诊1 1 2 2 门诊门诊4 4 门诊门诊2 2 3 3 门诊门诊3 3 门诊门诊5 5 45 试验组与对照组的两个观察对象均按照一定的条件配成对子,试验组与对照组的两个观察对象均按照一定的条件配成对子, 同一对子中的“混杂”因素在二者间几乎相同;而在不同对子同一对子中的“混杂”因素在二者间几乎相同;而在不同对子 间这些“混杂”因素则有可能差别很大间这些“混杂”因素则有可能差别很大 配对设计配对设计(A) 甲药甲药 乙药乙药 A 受试对象按受试对象按某些特征某些特征配对,两对象随机接受两种处理配对,两对象随机接受两种处理 4
23、6 配对设计配对设计(B) 方法甲方法甲 方法乙方法乙 B 一份样品,一分为二,随机接受两种处理一份样品,一分为二,随机接受两种处理 47 治疗前治疗前 治疗后治疗后 治 疗 配对设计配对设计(C) C 受试对象处理前后比较受试对象处理前后比较 48 配对设计的t检验 通过匹配,通过匹配,除了研究的处理因素之外除了研究的处理因素之外 ,其他可能对效果有影响的非处理因,其他可能对效果有影响的非处理因 素在该对子间是相同素在该对子间是相同的的 所以所以配对的两个观察对象的配对的两个观察对象的差值差值反映反映 了两组处理因素效应的净差值了两组处理因素效应的净差值 49 观察序号观察序号 样本样本1
24、样本样本2 差值差值 1 x11 x21 d1 = x11 - x21 2 x12 x22 d2 = x12 - x22 i x1i x2i di = x1i - x2i n x1n x2n dn = x1n- x2n 配对设计的t检验的数据形式 50 2 idd 2 d dd d d dd dd d N( ,)dd dN( ,), n St d- t=t(n -1)n sn ,根根据据前前面面的的介介绍绍,差差值值 的的样样本本均均数数 将将满满足足正正态态分分布布,表表达达为为但但是是由由于于未未 知知,只只知知;所所以以只只可可作作 变变换换,如如下下: ,其其中中为为对对子子数数 配对
25、设计t检验的原理 51 检验的原理:如果两总体间没有差别,那么 每个对子的差的总体均数为0,即md=0(H0) 检验的统计量: (1) 0 ,其其中中为为对对子子数数,因因为为 ,化化简简后后得得到到课课本本公公式式: d dd dd d dd d tt nn sn d t sn m m m m 配对设计t检验的原理 52 53 (1) 建立检验假设建立检验假设,确定检验水准确定检验水准 H0:md=0,儿童皮肤对不同结核菌素的反应性无差别 H1:md0,儿童皮肤对不同结核菌素的反应性有差别 =0.05 a 例例 8.2 (2) 计算统计量计算统计量 54 55 (3) 确定确定P值,作出统计
26、推断值,作出统计推断 查附表查附表3,t界值表界值表,4 4. .5205204 4. .437437,得得 P0.001,按按 =0.05水准水准,拒绝拒绝H0,接受接受H1。 。 差异具有统计学意义差异具有统计学意义,可认为两种不同结核可认为两种不同结核 素对儿童皮肤反应性有差别素对儿童皮肤反应性有差别。 a 【例例】为研究某种抗癌新药对小白鼠移植性肉瘤为研究某种抗癌新药对小白鼠移植性肉瘤S180的的 抑瘤效果,将抑瘤效果,将20只小白鼠按性别、体重、窝别配成对子。只小白鼠按性别、体重、窝别配成对子。 每对中随机抽取一只服用抗癌新药,另一只作为阴性对照,每对中随机抽取一只服用抗癌新药,另一
27、只作为阴性对照, 服用生理盐水,观察其对小白鼠移植性肉瘤服用生理盐水,观察其对小白鼠移植性肉瘤S180的抑瘤效的抑瘤效 果,经过一定时间,测得小白鼠瘤重如表果,经过一定时间,测得小白鼠瘤重如表3.6所示。问小所示。问小 白鼠服用抗癌新药和生理盐水后平均瘤重有无不同?白鼠服用抗癌新药和生理盐水后平均瘤重有无不同? 表表3.63.6 不同组别抑瘤效果(瘤重不同组别抑瘤效果(瘤重/g/g) 配对号配对号 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 1010 对照组对照组 0.80 0.80 0.74 0.74 0.31 0.31 0.48 0.48 0.76 0.76 0
28、.65 0.65 0.72 0.72 0.68 0.68 0.39 0.39 0.53 0.53 新药组新药组 0.47 0.47 0.42 0.42 0.38 0.38 0.44 0.44 0.38 0.38 0.43 0.43 0.39 0.39 0.71 0.71 0.32 0.32 0.41 0.41 d d 0.33 0.33 0.32 0.32 - -0.07 0.07 0.04 0.04 0.38 0.38 0.22 0.22 0.33 0.33 - -0.03 0.03 0.07 0.07 0.12 0.12 56 资料类型:资料类型:数值资料;数值资料;设计类型:设计类型:配
29、对设计配对设计 检验原理:检验原理:配对资料并不是两个独立样本,当对子内配对资料并不是两个独立样本,当对子内 部相减之后,得到的部相减之后,得到的差值差值资料资料实际上是一个样本实际上是一个样本。如无。如无 效假设作两组间效假设作两组间效应效应同,那么考查的是其差值资料是不同,那么考查的是其差值资料是不 是来自于一个均数为是来自于一个均数为0的已知总体的问题。的已知总体的问题。 故配对故配对t 检验可看成差值检验可看成差值d 的样本均数所代表的未知的样本均数所代表的未知 总体均数与已知总体均数总体均数与已知总体均数 0=0的比较,即 的比较,即 。 m m = 0=0. 检验目的:检验目的:类
30、似于类似于单样本的检验,单样本的检验,其实质就是其实质就是检验差检验差 值的均数(或中位数)是否等于零,即值的均数(或中位数)是否等于零,即 =0。 【案例解析案例解析】 57 1.配对设计资料,差值符合正态分布,考虑t 检验。 【案例解析案例解析】 2.计算公式:计算公式: 式中式中d 为差值均数,为差值均数,Sd为差值标准差为差值标准差n 1为为 自由度,注意自由度,注意 n 指的是对子数。指的是对子数。 特殊的单样本特殊的单样本 t 检验:检验: 1, / 0 n ns d t d 58 (1)建立假设,确定检验水准建立假设,确定检验水准 0 H: d m =0 1 H: d m 0 双
31、侧双侧a =0.05 (2)计算检验统计量计算检验统计量 本例中,本例中,n=10,d=1.71, 0 .79510/7950/ ndd t= d d s n = 262. 3 10/1658. 0 171. 0 9110v (3)确定确定 P 值,值,作作统计推断结论统计推断结论: 查查t界值表,得界值表,得P0.1,故结果为不拒绝,故结果为不拒绝H0, 尚不认为两组总体方差不同尚不认为两组总体方差不同 87 如果想知道另外一侧,可以按如下操作:之如果想知道另外一侧,可以按如下操作:之 前的分子、分母自由度分别为前的分子、分母自由度分别为v1、v2,现已,现已 知大于知大于1的一侧界值;那么
32、小于的一侧界值;那么小于1的一侧界值的一侧界值 等于分子自由度为等于分子自由度为v2,分母自由度为,分母自由度为v1的的F界界 值的倒数,即:值的倒数,即: 1 1 1 12 2 1 小小于于 一一侧侧 大大于于 界界 侧侧界界值值 值值 一一 , , F F 88 成组t检验 通过方差齐性检验结果认为例通过方差齐性检验结果认为例3-7两总体两总体 方差相同,故可以使用成组方差相同,故可以使用成组t t检验分析两检验分析两 样本来自的总体均数是否相等样本来自的总体均数是否相等 H0 : m m1 m m2,两组总体均数相同,两组总体均数相同 H1 : m m1 m m2,两组总体均数不同,两组
33、总体均数不同 a a0.05;双侧;双侧 89 22 0.05/2,38 2.0650,3.0601,20 2.6250,2.4205,20 -0.642 (1)(1) 11 (1)(1) 238 2.0242.024,0.0 xx yy xxyy xyxy xy xsn ysn xy t nsns nnnn nn ttP 代代入入下下列列公公式式中中 , 0 5 0.525)0.05PHa a (统统计计学学软软件件计计算算 结结果果,所所以以在在的的水水准准上上,尚尚不不拒拒绝绝, 尚尚不不认认为为两两种种药药物物的的总总体体降降糖糖效效果果不不同同 90 91 本章小结本章小结 假设检验的基本思想和步骤假设检验的基本思想和步骤 t检验的应用检验的应用