1、5 假设检验,引子 : 1. 医学科学研究的特点 医学统计学的任务,风 险,假设检验的基础,假设检验的基本思想 假设检验的步骤 单组样本资料的假设检验 假设检验的两类错误 假设检验的几个观点,【例5-1】 某一般中学男生的心率平均值0=75次/分,标准差= 5.0次/分(大规模调查获得);我们通 过抽样调查,获得经常参加体育锻炼的某中学100名男生的心率平均值为 ; 问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?,未知总体,第二种可能性:,已知总体,样本均数与拟比较的总体均数不等有两种可能:,抽样误差,本质差异运动的影响,n=100,第一种可能性:,唯证据原则反证法,假设检验实质是反
2、证法与概率学小概率理论的 一个完美结合,什么是假设检验?,假设:先预设一种立场,是对总体参数的数值所作的一种陈述,例:认为经常参加体育锻炼的男生心率与一般中学男生的没有差异,即1=;其实质是将样本统计量 与已知总体均数之间差异的原因归结为抽样误差。,检验:是一种方法,它一定是利用样本提供的信息,从概率的角度来判断这个假设是正确的(是抽样误造成的)?还是错误的(不是抽样误差造成的)?,下结论,H0:零假设,t 界值,-t 界值,根据P 值,得出结论,H1:备择假设,验证假设,建立假设,下结论,预设=0.05,P 值,三个重要概念: 检验水准 检验统计量 概率P值,1. 小概率事件原则和检验水准
3、,小概率事件,检验水准 - (level of test),是一个概率值;在假设检验中,定义发生概率 的事件叫小概率事件,将称为检验水准; 应事先确定,一般取值0.05或0.01。 选为0.05只是一种习惯,而不是绝对的标准。,概率,2. 检验统计量:,检验统计量是利用样本数据的多种信息,计算得到的一个综合指标;它可以反应该样本可能存在抽样误差的大小,从而成为决定是否可以拒绝H0的证据。 在零假设情况下,统计量服从一个给定的概率分布(如t分布、F分布和 分布等 )。 如果算出的检验统计量取值落在该分布的临界值之外,则可认为该零假设的成立是个小概率事件,可下拒绝H0的决定。而且,该检验统计量的绝
4、对值越大,拒绝H0的理由越充分,反之不拒绝H0的理由越充分。,3. 概率P 值,:就是根据抽样分布的规律,由H0所规定的总体中作一次随机抽样,实际中得到目前这个样本,甚至包括比这个更偏、更极端样本的累积可能性。 换言之:在H0 成立的前提下,出现目前检验统计量及更不利于H0成立的统计量的累积概率,也就是H0成立的概率。,假设检验的 P 值,-t 界值,t 界值,关于假设检验的几个观点,根据P 值下结论:,当P 时,则结论为:按检验水准拒绝 H0,接受 H1,认为差异有统计学意义(统计结论),可认为不同或*取值高于#的(专业结论); 当P 时,则结论为:按检验水准不拒绝H0,认为差异无统计学意义
5、(统计结论),还不能认为不同或*取值高于#(专业结论)。,“不拒绝H0”只因为此时拒绝H0的证据不足,绝不等同于接受H0。所以下结论时对H0只能说“拒绝”或“不拒绝”,而对H1只能说“接受”。,假设检验的结果只能说明有无统计学意义(statistical significance),而不能说明专业上的差异大小:P 值越小只能说明,作出拒绝 H0,接受 H1的统计学证据越充份,推论时犯错误的机会越小;而与专业上1-2的大小无直接关系。 当P值接近于值时,下结论应尤其慎重。,5.2 假设检验的步骤,建立假设,确定检验水准及单双侧,确定P值,计算检验统计量,作推断结论,拒绝H0,接受H1, 认为差异
6、有统计学意义,P,P ,不拒绝H0, 认为差异无统计学意义,假设检验的步骤:,建立假设H0、H1 确定检验水准 根据专业知识,确定单、双侧检验,5.2.1 建立假设检验,确定检验水准:, 什么是零假设 (Null Hypothesis) ?,(1)一般是作没有差别的假设,又称“原假设”或“无效假设” ,表示为 H0,即 H0: = 某一数值,如 = 0 (2) 该假设将差异的原因归结为抽样误差,1. 建立假设:提出无效假设和备择假设, 什么是备择假设 (Alternative Hypothesis) ?,(1)与无效假设相对立有差别的假设, 由不等号 , 或 组成,常表示为 H1;即 H1:
7、某一数值;或 某一数值, 某一数值。 (2) 该假设将差异的原因归结为环境因素,或是一种本质差异。,2. 确定检验水准 ,由研究者事先确定。 表示为 ,常用的 值有0.01、0.05; 是一个概率值,假设原假设为真时,拒绝原假设的概率,又被称为抽样分布的拒绝域。,注意:,3. 根据数据特征和专业知识,确定单、双侧,t 临界值,- t 临界值,问:经常参加锻炼的男生与一般男生心率有何不同?,双侧检验:用于推断两总体有无差别时,对两总体间可能存在的两种位置关系均要考虑在内。,t 临界值,问:经常参加锻炼的男生是否低于一般男生的?,2. 单侧检验:用于推断两总体有无差别时,仅考虑两总体间可能存在的两
8、种位置关系的一种。,一般情况下,如结果不明确时,采用双侧假设 H1: 某一数值, 如 0(双侧,包括 0和 0 两方面),如果从专业上能肯定其中一侧是不可能的,则采用单侧对立假设 H1: 某一数值;如 0 (左单侧) H1: 某一数值;如 0 (右单侧),单侧、双侧检验的描述方法:,5.2.2 选择检验方法和计算检验统计量:,假设检验方法的选择: 即检验统计量的选择。要依据以下内容,选择最适当的假设检验方法(检验统计量)。,有关样本资料的差异性检验,定量资料,前提 条件,t / Z检验,单样本,两独立样本,配对设计,多独立样本,不满足t 检验/方差分析条件的,检验,秩和检验,随机区组资料,析因
9、设计资料,重复测量资料,前提条件,前提条件,2. 计算检验统计量:各检验方法都有其相应的检验统计量,不同的检验统计量通常都依据于其特定的抽样分布。,举例:,5.2.3 根据检验统计量的结果作出统计推断:在两个对立的检验假设间二取一的规则是: (1)若 P ,意味着在H0成立的前提下不大可能发生当前,或是更不利的状况 拒绝 (2)若 P ,意味着在H0成立的前提下,发生当前状况或是更不利的状况的可能性还是比较大的 不拒绝,95%,t 分布图,最后得出结论: 1.根据统计推断的结果,作出统计学结论: 指对 “ 假设的H0 是否真实” 作出判断的过程。即:比较 p 值和检验水准,得出拒绝或不拒绝无效
10、假设的结论。 2.并结合相应的专业知识,给出一个专业的结论,5.3 单组样本资料的假设检验,变量变换或秩和检验,两 独 立 样 本,假设检验,单 样 本,配对资料,差值,正态,偏态,对子数,t 检验,n =50,正态,偏态,n 50,t 检验,方差不齐,方差齐,变量变换或秩和检验,t 检验,【例5-1】 某一般中学男生的心率平均值0=75次/分,标准差= 5.0次/分(大规模调查获得);我们通 过抽样调查,获得经常参加体育锻炼的某中学100名男生的心率平均值为 ; 问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?,【案例解析】,研究目的:差异性比较 资料类型:定量资料 设计类型:单样本
11、设计,单样本资料Z检验,总体标准差已知,=5.0,H0:= 0 H1:0 =0.05,统计结论:已知 Z(0.05/2)=1.96,则 P 0.05 ,故拒绝H0,接受 H1 ,认为 与0的差别有统计学意义,可认为经常参加锻炼的中学男生人群的心率低于一般人群的心率。 专业结论:经常参加体育锻炼有助于增强男生的心功能。,检验过程:,1. 建立假设:,确定检验水平:,2. 计算检验统计量:,3. 确定 p 值,作出推断结论:,某药物100mg溶解在1L溶剂中,溶解后的标准浓度是20.00mg/L。现采用某种测定方法进行溶解实验,重复实验11次获得的药物浓度分别为:20.99、20.41、20.10
12、、21.11。 请问:用该种方法测得的药物浓度与标准浓度20.0mg/l是否相同?,【案例5.2】,【案例解析】,研究目的:差异性比较 资料类型:定量资料 设计类型:单样本设计,正态性检验,单样本资料t 检验,该样本来自正态分布的总体,n =11,样本含量较小,H0:=20mg/L,仪器正常 H1:20mg/L,仪器不正常 =0.05,检验过程:,1. 建立假设:,确定检验水平:,2. 计算检验统计量:,3. 确定 p 值,作出推断结论:,统计结论:查t 界值表,得t (0.05/2,10) =2.228,按0.05 检验水准,拒绝H0,接受H1;认为这种方法测得的药物浓度与标准浓度不同。 专
13、业结论:该方法测得的药物总体平均浓度高于标准,该方法的效果欠佳。,【电脑实现】 SPSS,1.正态性检验:,正态性检验结果输出:,H0:呈正态分布; H1:不呈正态分布 =0.10,有建议: 当n 2000 时,结果以Shapiro-Wilk (W检验)为准; 当n 2000时,结果以Kolmogorov- Smirnov (D检验) 为准,2.单组样本均数 t 检验:,结果输出:,两总体均数差及95%CI,用于比较的已知总体均数,置信区间回答了“量”的问题:即总体均数差在哪个位置,差异大小是多少;如本题 0.98(0.27,1.70)mg/L 。 而假设检验回答了质的问题:即如果两总体均数间
14、存在着差异,那么比统计学的角度确认这种差异的把握度有多大,如本题 P=0.012。,注意: 总体均数差的置信区间和 t 检验结果是完全一致性的,同时这两者又互为补充:,【结果报告】,用某仪器测量浓度为20mg/L的标准液11次,得样本均数和标准差分别为20.98mg/L、1.068mg/L。 经单样本设计资料 t 检验, t =3.056,v=10,P=0.012,两总体的均数差及95%CI为 0.98(0.27,1.70)mg/L;按0.05的 检验水准,拒绝H0,接受H1,认为差异有统计学意义(统计结论);该仪器测得的浓度总体上高于标准液,认为该仪器存在着系统误差(专业结论)。,5.4 假
15、设检验的两类错误和检验功效,假设检验是统计推的重要内容,它是应用数学上的反证法和小概率事件实际推断原则,根据样本 统计量对总体作出推断,结论具有概率性。,结论的风险性两类错误,I 类错误 ( type I error )弃真:,I 类 错误示意图(以单侧 t 检验为例),误诊 (假阳性),实事:H0 为真,II型错误示意图(以单侧 t 检验为例),漏诊 (假阴性),II 类错误 ( type II error ) )存伪:,实事:H0 为假, H1 为真,假设检验中的两类错误:,1. 第一类错误(弃真错误) 拒绝了实际上存在的H0 第一类错误的概率为 ,2. 第二类错误(纳伪错误) 不拒绝实际
16、上不存在的H0 第二类错误的概率为 ,定义:通常把1-,即拒绝不正确H0的概率称为检验功效,也称把握度。 意义是:当两个总体确有差别时,按所规定的检验水准的水平,能发现这种差异的能力。 如1-=0.80,理论上100次抽样检验中,平均有80次能够得出差别有统计学意义的结论。 一般情况下要求1-在0.80以上。,5.4.3 检验功效(power of test),由于所建立的检验主要是控制犯I类错误的概率,而对犯II类错误的概率却无法直接控制,即对一个检验犯II类错误的概率究竟怎样无所而知。,要谨慎对待 “不拒绝H0”的结论 即“阴性结果”,因此,Power值的大小已成为某些国际会议审查论文设计
17、内容之一;有的已明确规定,若研究者根据P0.05下阴性结论时,必须提供Power值。,检验水准定的越大 总体参数间的差异越大 个体差异(标准差)越小 样本含量越大,5.4.4 影响检验功效的因素:,检验功效越大,1. 越大, 越小,则Power越大,只有通过增加样本含量,你才可能同时减少两类错误!,样本含量一定时,和的关系就像翘翘板,小就大, 大 就小。,当样本量取定时,要减小 b ,应把a 取大一些,2. 总体参数间的差异越大,Power越大,3. 个体差异越小,Power越大,若两样本总体确有差异时, 在一定范 围内,样本含量n 越大,Power越大。,通过增大n的方法,达到增大Power
18、的目的,检验功效/样本含量估算常用软件:,SAS nQuery Advisor EGRET SIZ Sample power SASA PASS EXCEL,PASS (power analysis and sample size) 是Jerry开发的专业样本含量估算和效能分析软件。 PASS可以对均数间的比较、方差分析、相关和回归分析、计数资料的假设检验和病例随访资料分析等检验条件下的检验效能和样本含量进行估计。,小 结,假设检验是依据样本提供的有限信息对总体做推断的过程。 假设检验的步骤为: 建立假设计算统计量确定p值,作出推断结论 假设检验的基本思想是根据小概率的原理,认为“小概率事件在
19、一次抽样中不太可能出现”。 假设检验中无论拒绝不拒绝H0,都有可能犯错误(类错误和类错误)。 假设检验的推断结果下结论时不能绝对化,并要结合专业知识。,步骤:,案例分析:见教材P89 案例1、 案例2 见每章后:常见疑问,案例辨析1: 为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的检验,随机抽取25名患者服用了新药,以常规药的疗效均值为,进行检验,无效假设是,对立假设是,检验水平=1%。结果值很大,拒绝了无效假设。“拒绝了无效假设”意味着什么?下面的说法你认为对吗?,说法: (1)你绝对否定了总体均数相等的无效假设。 (2)你得到了无效假设
20、为真的概率是1%。 (3)你绝对证明了总体均数不等的备择假设。 (4)你能够推论备择假设为真的概率是99%。 (5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。 (6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。?,最佳选择题:,1.统计推断的内容是: A用样本指标推断总体指标 B检验统计上的“假设” CA、B均不是 DA、B均是,2.两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小: Aa=0.05 Ba=0.01 Ca=0.10 Da=0.20,3. 关于假设检验,下列那一项说法是正确的: A单侧检验优于双侧检验 B采用
21、配对t检验还是两独立样本t 检验是由实验 设计方法决定的 C检验结果若P值大于0.05,则接受H0犯错误的可 能性很小 D用t 检验进行两样本总体均数比较时,不要求方 差齐性,简答题:,1. 什么是一类错误?什么是二类错误?二者之间有什么关系? 2. P 与有什么区别和联系? 3.既然假设检验的结论有可能有错,为什么还要进行假设检验?,答案:,P值的大小和没有必然关系。,3. P是指H0成立的前提下,出现目前样本数据对应的统计量数值乃至比它更极端数值的概率。,是事先确定的检验水准。,4. 假设检验中,无论拒绝不拒绝H0,都可能会犯错误:表现为拒绝H0时,会犯第一类错误,不拒绝H0时,会犯第二类错误,但这并不能否认假设检验的作用。 . 因为只要涉及到抽样,就会有抽样误差的存在,因此就需要进行假设检验。 . 只是要注意假设检验的结论只是个概率性的结论,它的理论基础是“小概率事件不太可能原理”。 .,练习题:,提 问:,THANK YOU!,