1、假设检验(Hypothesis Test),南京医科大学公卫学院生物统计学系 柏建岭,- 统计推断内容之一,Outline,基本思想 基本步骤 均数的假设检验 假设检验中几个基本概念 假设检验中几个值得注意的问题,一个统计学实验,一位常饮牛奶加茶的女士声称,她能辨别先倒进杯子里的是茶还是牛奶。对此做了8次试验,她都正确地说出了。,碰巧猜对吗?,一个统计学故事,假设:她没有这个本事,是碰巧猜对的! 连续猜对8个杯子的可能性 P 是多少? P=0.58=0.00390625 你认为原假设 H0 成立吗? 推断结论她真的有这个本事! (不是碰巧猜对的。) 依据:小概率原理。 P 0.05为小概率。,
2、做个实验,总体A是100例正常成年男子血红蛋白(g/L,以下省略)实测值的集合,从中随机抽取样本a1 和样本 a2 ;总体B是另外100例正常成年男子血红蛋白实测值的集合,从中随机抽取样本b1;a1 、a2和b1三个样本的含量均为10例,有关数值如下:,在知道A和B总体的参数时,a1-a2,a1-b1,假如事先不知道A和B是不是同一个总体,a1-b1,?,假设检验的基本思想,提出一个假设 如果假设成立,得到现有样本的可能性 可能性很小(小概率事件),在一次试验中本不该得到,居然得到了,说明我们的假设有问题,拒绝之。 有可能得到手头的结果(不是小概率),故根据现有的样本无法拒绝事先的假设(没理由
3、),假设检验的基本思想,提出一个假设(H0); 如果假设成立,会得到现在的结果吗? 两种: 得到现在的结果可能性很小(小概率) 拒绝H0 有可能得到现在的结果(不是小概率) 没有理由拒绝H0,例4.4,大规模调查表明健康成年男子血清总胆固醇的均数为4.6mmol/L,今随机调查某单位食堂成年男性炊事员25名,测得血清总胆固醇均数为5.1mmol/L,标准差为0.88mmol/L,试问该单位食堂成年男性炊事员血清总胆固醇的均数与健康成年男子血清总胆固醇的均数有无差别?,例4.4:,手头样本,手头样本对应的未知总体均数等于已知总体均数0,差别仅仅是由于抽样误差所致 除抽样误差外,样本所来自的未知总
4、体与已知总体不同,存在本质差异,例4.4:,建立假设,零假设(null hypothesis),记为H0 H0:0; 备择假设(alternative hypothesis),记为H1 H1:0。,确定检验水准 (Significance Level),一般取=0.05 小概率事件的判断标准,选定检验方法计算检验统计量 (计算样本与总体的偏离),统计量t表示,在标准误的尺度下,样本均数与总体均数0的偏离。这种偏离称为标准t离差。,根据抽样误差理论,在H0假设前提下,统计量t服从自由度为n-1的t分布,即t值在0的附近的可能性大,远离0的可能性小,离0越远可能性越小。 t值越小,越利于H0假设
5、t值越大,越不利于H0假设,计算概率P(与统计量t值对应的概率),在H0成立的前提下,获得现有这么大的标准t离差以及更大离差 的可能性。 P=P(|t|2.841) ? 按 =25-1=24查附表2的t界值表,t0.05,24=2.064 P =P ( |t| 2.064 )=0.05,P=P(|t|2.841)0.05,理论基础:t 分布,结论(根据小概率原理作出推断),在H0成立的前提下出现现有差别或更大差别的可能性P(| t | 2.841)小于0.05,是小概率事件,即现有样本信息不支持H0。 判断标准: 当P 时,拒绝H0,接受H1 ; 当P 时,不拒绝H0 。 本例P0.05,按
6、=0.05的水准,拒绝H0,接受H1,差别有统计学意义。可以认为该单位食堂成年男性炊事员血清总胆固醇比健康成年男子高 。,假设检验的意义,得到关于总体的结论 如本例假设检验的意义在于分辨手头样本所代表的未知总体和已知总体是否为同一总体,换句话说,即分辨手头样本是否为已知总体的一个随机样本。,假设检验的基本思想,“反证法”的思想 先根据研究目的建立假设,从H0假设出发,先假设它是正确的,再分析样本提供的信息是否与H0有较大矛盾,即是否支持H0,若样本信息不支持H0,便拒绝之并接受H1 ,否则不拒绝H0 。,假设检验的基本步骤,建立检验假设 确定检验水准 计算检验统计量,界定P值 推断性结论 当P
7、 时,拒绝H0,接受H1,差别有统计学意义。 当P 时,不拒绝H0,差别尚无统计学意义。,均数的假设检验,样本均数与总体均数比较的t检验 配对设计计量资料的t检验 成组设计计量资料的t检验 成组设计计量资料的u检验,例4.4,H0:4.6(mmol/L) ; H1:4.6(mmol/L); =0.05。 t2.841t0.05,24=2.064 P 0.05 按 =0.05的水准,拒绝H0,接受H1,差别有统计学意义。 可以认为该单位食堂成年男性炊事员血清总胆固醇比健康成年男子高。,配对设计定量资料的t检验,配对设计是研究者为了控制可能存在的主要的非处理因素而采用的一种实验设计方法。 自身配对
8、 同一对象接受两种处理,如同一标本用两种方法进行检验,同一患者接受两种处理方法; 异体配对 将条件相近的实验对象配对,并分别给予两种处理。,配对t 检验,首先求出各对数据间的差值d 若两处理因素的效应无差别,差值d的总体均数d应该为0,故可将该检验理解为样本均数 与总体均数d =0的比较。,例4.5 为研究某新的降压药对高血压患者舒张压的影响,随机抽取了10名高血压患者,分别在其用药前和用药后一个月测量其舒张压,试问该降压药对高血压患者的舒张压是否有影响?,表4.2 10名高血压患者用药前后舒张压的测定值(mmHg),H0:d0,用药前后的舒张压相同; H1:d0,用药前后的舒张压不同。 双侧
9、 =0.05。 按 = n-1=10-1=9,查t值表,得0.005P0.002。 按 = 0.05水准,拒绝H0,接受H1,差别有统计学意 义,可以认为高血压患者用药后舒张压降低。,例4.6 某医生研究脑缺氧对脑组织中生化指标的影响,将乳猪按出生体重配成7对,一组为对照组,一组为脑缺氧模型组。试比较两组猪脑组织钙泵的含量有无差别。,H0:d0,即两组乳猪脑组织钙泵含量相等; H1:d0,即对照组乳猪脑组织钙泵含量高于实验组。 单侧 =0.05。 按= n-1=7-1=6查t界值表,得P0.05,按 = 0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为脑缺氧可造成钙泵含量的降低。,
10、两样本均数比较的t检验,完全随机设计 受试对象被随机分配到两组中,分别接受不同的处理。 从两个总体中随机地抽取一部分个体进行研究 。 例如手术组与非手术组、新药组与对照组等。 目的:推断 1 2?,= n1+ n2-2,两样本均数比较的t检验公式,例4.7,某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名正常人和13名病毒性肝炎患者血清转铁蛋白含量(g/dl),问患者和正常人转铁蛋白含量是否有差异?,12名正常人和13名病毒性肝炎患者血清转铁蛋白含量(g/dl),12名正常人和13名病毒性肝炎患者血清转铁蛋白含量(g/dl),s12=9.772,s22=12.172,H0 :12,正常
11、人与病毒性肝炎患者的转铁蛋白含量相等; H1 :12 ,正常人与病毒性肝炎患者的转铁蛋白含量不等。 双侧 =0.05。 =n1n22=12132=23 按自由度23查附表2,t界值表得t0.01,23=3.725,tt0.01,25,P0.01, 按 = 0.05水准,拒绝H0,接受H1 差别有统计学意义,可以认为病毒性肝炎患者的转铁蛋白含量较低。,在两个样本均数比较时,若两组样本含量都很大,可用u检验,其计算公式为:,u为标准正态离差,按正态分布界定P值并作出结论 。,例4.9,某地随机抽取正常成年男子和正常成年女子各150名,测定红细胞计数(单位:1012/L,下同),其测定结果如下,试说
12、明男女红细胞计数有无差别?,男:,女:,例4.9,H0 :12,男女红细胞计数总体均数相同; H1 :12 ,男女红细胞计数总体均数不同; =0.05。 计算检验统计量: u=8.0741.96, P0.05 按 =0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为男性红细胞计数较女性高。,2020/4/7,柏建岭讲稿,41,如法官判定一个人是否犯罪,首先是假定他“无罪”(H0),然后通过侦察寻找证据,如果证据充分则拒绝 “无罪”的假定(H0),判嫌疑人有罪;否则只能暂且认为“无罪”的假定(H0)成立。,法官的审判,被告无罪假设,2020/4/7,柏建岭讲稿,42,法官的审判_无罪假
13、设,第一类错误与第二类错误,拒绝H0,接受H1 不拒绝H0 H0真实 第一类错误( ) 正确推断(1) H0不真实 正确推断(1) 第二类错误() 统计学上规定:H0真实时被拒绝为第一类错误(又称型错误,type error),H0不真实时不拒绝为第二类错误(又称型错误,type error)。,与间关系:大,小;小,大。,图4.3 I、II型错误示意(以单侧u检验为例),P值的意义,从 H0 总体中随机获得等于或大于现有统计量值的概率。 拒绝H0时所冒的风险。,t,t,的意义,I型错误的概率。 根据研究者的要求在计算检验统计量之前设定的。 确定=0.05,即I型错误的概率为0.05,理论上1
14、00次抽样中发生这样的错误平均有5次。,检验效能,又称把握度 Power of a test 1 两总体确有差别,按水准能发现它们有差别的能力。 例如1-=0.9,意味着若两总体确有差别,则理论上100次抽样研究中,平均有90次能得出有差别的结论。,假设检验中需注意的几个问题,要有严密的研究设计 个体应具有同质性 资料应具代表性 组间应具可比性,假设检验中需注意的几个问题,应用t检验对两样本均数进行比较时,要求原始数据满足如下三个条件: 独立性(independence) 正态性(normality): 方差齐性(homogeneity):,方差齐性检验,理论上,t检验前应作方差齐性检验 样本
15、含量较大时,对等方差的要求较弱 样本含量较小时,应先作方差齐性检验 判断两总体方差是否相等可用F检验,样本方差比的分布,从同一总体随机抽取的样本之两方差,其方差比(大方差/小方差)的分布服从 F 分布,两样本均数比较方法的选择,方差齐 方差不齐 小样本 t 检验 t 检验 大样本 u 检验 u 检验,两样本均数比较方法的选择,假设检验中需注意的几个问题, 水准是在假设检验之前设定的,说明按不超越多大的风险为条件作结论,是犯I型错误的最大风险。 P值是指由H0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值的概率。,假设检验中需注意的几个问题,P值的大小标明以多大的风险拒绝H0。
16、P值越小,说明越有理由拒绝H0而接受H1,越有理由说明样本所分别来自的总体有差别。,双侧检验与单侧检验,H1从一个方向上偏离H0所规定者,称为单侧检验; H1从两个方向上偏离H0所规定者,称为双侧检验;,双侧检验与单侧检验,检验假设的写法不同:,双侧检验与单侧检验,原则上依据资料的性质来选择双侧检验与单侧检验。 若比较甲、乙两种方法孰优,这里含有甲优于乙和乙优于甲两种可能的结果,而且研究者只要求分出优劣,故应选用双侧检验。 若甲是从乙改进而得,已知如此改进可能有效,也可能无效,但不可能改进后反不如前,故应选用单侧检验。 不要无把握时误用单侧检验,也不可在条件具备时错过正当使用的机会 。,结论的
17、概率性,无论做出何种推断结论,总是有风险的! 拒绝H0时可能范I类错误; 不拒绝H0时可能范II类错误。 结论不能绝对化。 统计学已证明 由此可以肯定 报告结果:应说明t 值和P 值,结论的表达,P, 差异有统计学意义, 这种差异不太可能是偶然的。 statistically significant; If the data are not consistent with the null hypothesis, the difference is said to be statistically significant. P, 差异无统计学意义 这种差异不排除偶然性。 No statisti
18、cal significance.,Significant的意义,有意义的; 意味深长的 表明. 的(of) 重要的, 重大的, 值得注意的 有效的, 有影响的 非偶然的(not by chance),大纲要求,掌握假设检验的基本思想、原理及步骤。 掌握样本均数与总体均数比较的t检验。 掌握成组设计与配对设计两样本均数比较的t检验。 熟悉t检验的应用条件。,大纲要求,掌握两类错误的概念。 熟悉检验效能的概念及影响因素。 了解假设检验应注意的问题。 了解区间估计和假设检验的关系。,练习7,10例男性矽肺患者的血红蛋白 (g/L) 的均数为125.9(g/L),标准差为16.3(g/L),已知男性
19、健康成人的血红蛋白正常值为140.2(g/L),问矽肺患者的血红蛋白是否与健康人不同。,H0:140.2,矽肺患者的血红蛋白与健康人相同; H1:140.2,矽肺患者的血红蛋白与健康人不同。 =0.05 t t0.05,9=2.262 P 0.05 按 =0.05的水准,拒绝H0,接受H1,差别有统计学意义。认为矽肺患者的血红蛋白与健康人不同。,练习7区间估计,本例自由度=10-1=9,经查表得t0.05,9=2.262,则 矽肺患者的血红蛋白总体均数的95%CI:(114.24,137.56)g/dl,不包括男性健康成人的血红蛋白的总体均数140.2(mg/dl),所以说矽肺患者的血红蛋白与
20、健康人不同。,练习8,某医院用某新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L)如下,问新药与常规药物的疗效有无差别?,H0 :12,新药与常规药物的疗效相同 ; H1 :12 ,新药与常规药物的疗效不同 。 双侧 =0.05。 =n1n22=10102=18 t0.20,18=1.330,tt0.20,18,P 0.20,差别无统计学意义,故尚且不能认为新药与常规药物的疗效有所不同 。,练习9,将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后(治后一月)的血沉(mm/小时)如下。试问:(1)甲乙两药是否均有效?(2
21、)甲乙两药的疗效有无差别?,练习9,分析思路,疗前两组同质性比较,以分析可比性; 各组疗前疗后差值比较,分别确定各自的疗效; 两组疗前疗后差值相互比较,分析两组的效果是否相同?,两组药物降血沉效果(mm/小时)的比较,疗前 疗后 差值 甲药 8.702.41 5.503.10 3.201.93 乙药 9.601.84 4.601.96 5.002.98,疗前两组 方差齐性检验,F=1.7138,P=0.4345 可以认为用药前两组方差齐,1=9 2=9,疗前两组差异比较 t检验,t=0.94,P=0.3597 可以认为两组具有可比性,=n1n22=18,甲药服药前后比较:,t=5.2372,P
22、=0.0005 可以认为甲药有降低血沉的作用。,=n-1=9,乙药服药前后比较:,t=5.3033,P=0.0005 可以认为乙药亦有降低血沉的作用。,=n-1=9,两组服药前后差值相互比较:,t=1.6022,P=0.1265 尚且不能认为两药降低血沉的效果有差别,=n1n22=18,综合结论,用药前两组具有可比性( t =0.481,P=0.637);服用甲药和乙药均有降低血沉的效果(t =5.2372,P0.001;t =5.3033,P0.001);两药降低血沉的效果无差别(t =0. 1.6022,P=0.1265)。,选择题,统计推断的内容是 A用样本指标推断总体指标 B检验统计上
23、的“假设” CA、B 均不是 DA、B 均是,选择题,关于假设检验的P值,下列说法正确的是 A P是H0成立的概率 B P是 I 型误差的概率 C P是 H0 成立时,获得现有差别的概率。 D 统计推断时的风险。 E 拒绝H0时所冒的风险。,选择题,由两样本均数的差别推断两总体均数的差别,得到差别有统计学意义的结论,是指 A 两样本均数差别有统计学意义 B 两总体均数差别有统计学意义 C 两样本均数差别和两总体均数差别都有统计学意义 D 其中一个样本均数和它的总体均数差别有统计学意义,选择题,当样本含量固定时,选择下列哪个检验水准得到的检验效能最高 : A B C D E,选择题,通常可采用以下那种方法来减小抽样误差: A减小样本标准差 B减小样本含量 C扩大样本含量 D以上都不对,选择题,配对设计的目的: A提高测量精度 B操作方便 C为了可以使用t 检验 D提高组间可比性,Many Thanks!,
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。