1、假设检验的基本步骤假设检验的基本步骤1教学内容:教学内容:第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误第二节第二节 t分布分布第三节第三节 总体均数估计总体均数估计第四节第四节 假设检验基本原理与步骤假设检验基本原理与步骤第五节第五节 t检验检验第六节第六节 假设检验的注意事项假设检验的注意事项第七节第七节 正态性与方差齐性检验正态性与方差齐性检验2 假设检验的基本假设检验的基本原理和步骤原理和步骤34n法庭上,陪审团需要建立以下两种法庭上,陪审团需要建立以下两种假设:假设:n事先并不知道哪种假设是正确的,事先并不知道哪种假设是正确的,需要根据呈庭证供,才可下结论需要根据呈庭证供
2、,才可下结论5n有人声称能够预测胎儿的性有人声称能够预测胎儿的性别,我们对此有两种假设:别,我们对此有两种假设:n事先并不知道哪种假设是正事先并不知道哪种假设是正确的,需要根据她推测的结果,确的,需要根据她推测的结果,才可下结论才可下结论6n某商家宣称他所卖的鸡蛋绝对新鲜,可某商家宣称他所卖的鸡蛋绝对新鲜,可以达到以达到“百里挑一百里挑一”;是否可以相信商;是否可以相信商家信誉?家信誉?n事先并不知道哪种假设是正确的,需要事先并不知道哪种假设是正确的,需要对其鸡蛋检验后,才可下结论对其鸡蛋检验后,才可下结论78n女士说她可以预测胎儿的性别女士说她可以预测胎儿的性别n暂时认为她是瞎猜,每个孕妇被
3、猜对的可能暂时认为她是瞎猜,每个孕妇被猜对的可能性均为性均为50%n让她对让她对10个孕妇作推断,结果是全部说对了;个孕妇作推断,结果是全部说对了;在瞎猜的情况下,全对的可能性为在瞎猜的情况下,全对的可能性为0.510=0.000976563n在一次试验中出现小概率事件是不太可能的,在一次试验中出现小概率事件是不太可能的,故认为她真的有这种能力!故认为她真的有这种能力!9关于商家信誉关于商家信誉 某商家宣称他所卖的鸡蛋绝对新鲜,可某商家宣称他所卖的鸡蛋绝对新鲜,可以达到以达到“百里挑一百里挑一”;结果有人买了;结果有人买了10个鸡蛋,其中个鸡蛋,其中2个坏了,是否还可以相个坏了,是否还可以相信
4、商家广告?信商家广告?暂时认为商家是有信誉的,在此前提下暂时认为商家是有信誉的,在此前提下10个鸡蛋中出现个鸡蛋中出现2个或更多变质的可能个或更多变质的可能性为性为0.004,是小概率事件!,是小概率事件!但是对于该顾客而言,他仅仅购买了一但是对于该顾客而言,他仅仅购买了一次,就碰上了小概率事件,所以商家的次,就碰上了小概率事件,所以商家的信誉度值得怀疑信誉度值得怀疑10n先对总体的参数提出某种假先对总体的参数提出某种假设,然后利用样本信息判断设,然后利用样本信息判断是否拒绝该假设过程是否拒绝该假设过程n反证法反证法 +小概率事件原理小概率事件原理【例例3-5】某医生测量了某医生测量了100名
5、从事铅名从事铅作业男性工人的血红蛋白含量,算作业男性工人的血红蛋白含量,算得其均数为得其均数为130.83g/L,标准差为,标准差为25.74g/L。问从事铅作业工人的血。问从事铅作业工人的血红蛋白是否不同于正常成年男性平红蛋白是否不同于正常成年男性平均值均值140g/L?11未知总体未知总体?第二种可能性:第二种可能性:已知总体已知总体Lg/1400样本均数与拟比较的总体均数不等有两种可能:样本均数与拟比较的总体均数不等有两种可能:抽样误差抽样误差本质差异本质差异职业的影响职业的影响 n=36第一种可能性:第一种可能性:LgX/83.13012 解析:解析:(1 1)抽样误差)抽样误差 (2
6、 2)环境因素)环境因素 上述两种可能是对立的,互不相容的,上述两种可能是对立的,互不相容的,事实上只能是其中的一个,如何进行判断事实上只能是其中的一个,如何进行判断呢?我们可通过呢?我们可通过假设检验假设检验来回答这个问题。来回答这个问题。13 假设检验的基本思想14无罪假设无罪假设 无差异假设无差异假设 统计推断统计推断刑事诉讼刑事诉讼作检验作检验 学术上:唯证据原则学术上:唯证据原则反证法反证法找证据找证据 15基本思路:基本思路:首先假定该样本来自的总体就是已知总体,首先假定该样本来自的总体就是已知总体,即即0,然后根据样本统计量的特征,找出,然后根据样本统计量的特征,找出它取样于或不
7、取样于它取样于或不取样于总体总体0的证据,的证据,从而从而取得取得间接的判断间接的判断。161400H0:零假设零假设10083.130nXt 界值t 分布图分布图-t 界值根据根据P 值,得出结论值,得出结论H1:备择假设备择假设10083.130nX),(20N,验证假设验证假设建立假设建立假设下结论下结论检验统计量检验统计量预设预设 =0.05P 值值17假设检验的小概率事件原则和检验水准假设检验的小概率事件原则和检验水准 小概率事件(小概率事件(0.05 or 0.01)检验水准检验水准 (level of test):假设检验中,定义发生概率:假设检验中,定义发生概率 的的事件叫事件
8、叫小概率事件小概率事件,并称,并称为为检验水检验水准准,一般,一般取取0.05。故对于故对于H0 为真而言,检验统计量为真而言,检验统计量超过超过对应的临界值的概率对应的临界值的概率P,对对于一次随机抽样而言,一般是不会发于一次随机抽样而言,一般是不会发生的,所以如果出现这种情况,可以生的,所以如果出现这种情况,可以凭此作出拒绝凭此作出拒绝H0的决策。的决策。18假设检验中的假设检验中的 P 值值:所谓:所谓P 值,值,由由H0所规定的总体中作一所规定的总体中作一次随机抽样,获得依据现有样本获得的次随机抽样,获得依据现有样本获得的检验统计量的概率,也即是检验统计量的概率,也即是H0成立的概成立
9、的概率。率。换言之,是指在换言之,是指在H0 成立的前提下,出成立的前提下,出现统计量目前值及更不利于零假设数值现统计量目前值及更不利于零假设数值的概率。的概率。假设检验中的假设检验中的 P 值值PP-t 界值界值t 界值界值P 19假设检验假设检验 (hypothesis test)的概念:的概念:亦称显著性检验亦称显著性检验(significance test),是依据样本提供的有限信息对总体作,是依据样本提供的有限信息对总体作推断的统计学方法,是在对研究总体的两种对立的判断推断的统计学方法,是在对研究总体的两种对立的判断 之间做选择的决策程序。之间做选择的决策程序。选用适当方法根选用适当
10、方法根据样本对总体提据样本对总体提供的信息作检验供的信息作检验对总体的参数对总体的参数或分布作出某或分布作出某种假设种假设推断此假设推断此假设应当拒绝或应当拒绝或不拒绝不拒绝提出假设提出假设验证假设验证假设得出结论得出结论20 假设检验的步骤21建立假设,确定检验水准建立假设,确定检验水准确定确定P值值计算检验统计量计算检验统计量作推断结论作推断结论拒绝拒绝H0,接受,接受H1,认为差异有统计学意义认为差异有统计学意义P PP P 不拒绝不拒绝H0,认为差异无统计学意义认为差异无统计学意义22一、一、对立假设、确定检验水准:对立假设、确定检验水准:1.建立假设建立假设H0、H12.确定检验水准
11、确定检验水准3.根据实际情况、确定单、双侧检验根据实际情况、确定单、双侧检验4.根据资料类型,选择检验方法;根据资料类型,选择检验方法;231.明确资料类型、选择检验方法:明确资料类型、选择检验方法:假设检验的方法很多,如假设检验的方法很多,如t 检验、检验、F 检验及检验及 检验等,检验等,各有其适用条件和范围。各有其适用条件和范围。应根据研究目的、设计类型和资料特点等因素选择应根据研究目的、设计类型和资料特点等因素选择合适的检验方法,并计算出对应统计量。合适的检验方法,并计算出对应统计量。变量变量数值变量数值变量分类变量分类变量单样本资料单样本资料两、多组独立样本资料两、多组独立样本资料配
12、对设计资料配对设计资料2243.根据数据特征和专业知识,确定单、双侧根据数据特征和专业知识,确定单、双侧t 临界值临界值-t 临界值临界值),(2N已知总体问:从事铅作业男性工人问:从事铅作业男性工人Hb与正常成年男性是否不同?与正常成年男性是否不同?双侧检验双侧检验:用于推断两总体有无差别时,对两总体:用于推断两总体有无差别时,对两总体间可能存在的两种位置关系均要考虑在内。间可能存在的两种位置关系均要考虑在内。拒绝域拒绝域拒绝域拒绝域a a/2 25t 临界值临界值),(2N已知总体问:从事铅作业男性工人问:从事铅作业男性工人Hb是否高于正常成年是否高于正常成年男性?男性?拒绝域拒绝域2.单
13、侧检验单侧检验:用于推断两总体有无差别时,仅考虑:用于推断两总体有无差别时,仅考虑两总体间可能存在的两种位置关系的一种。两总体间可能存在的两种位置关系的一种。a a 26n 一般情况下,如结果不明确时,采用双侧假设一般情况下,如结果不明确时,采用双侧假设 H1:某一数值,某一数值,如如 0(双侧,包括(双侧,包括 0和和 0 0 两方面)两方面)n如果从专业上能肯定其中一侧是不可能的,则如果从专业上能肯定其中一侧是不可能的,则采用单侧对立假设采用单侧对立假设 H1:某一数值;如某一数值;如 0 0(左单侧)(左单侧)H1:某一数值;如某一数值;如 0 0(右单侧)(右单侧)单侧、双侧检验的确定
14、原则及描述方法:单侧、双侧检验的确定原则及描述方法:27n 一般情况下,如结果不明确时,采用双侧假设一般情况下,如结果不明确时,采用双侧假设 H1:某一数值,某一数值,如如 0(双侧,包括(双侧,包括 0和和 0 0 两方面)两方面)n如果从专业上能肯定其中一侧是不可能的,则如果从专业上能肯定其中一侧是不可能的,则采用单侧对立假设采用单侧对立假设 H1:某一数值;如某一数值;如 0 0(左单侧)(左单侧)H1:某一数值;如某一数值;如 0 0(右单侧)(右单侧)单侧、双侧检验的确定原则及描述方法:单侧、双侧检验的确定原则及描述方法:28 什么是什么是零假设零假设(Null Hypothesis
15、)?(1)一般是作)一般是作没有差别没有差别的假设,又称的假设,又称“原假设原假设”或或“无效假设无效假设”,表示为,表示为 H0,即,即 H0:=某一数值,如某一数值,如 =0(2)该假设将差异的原因归结为该假设将差异的原因归结为抽样误差抽样误差29 什么是什么是备择假设备择假设(Alternative Hypothesis)?(1)与无效假设相对立)与无效假设相对立有差别有差别的假设,的假设,由由不等号不等号,或或 组成,常表示为组成,常表示为 H1;即;即 H1:某一数值;或某一数值;或 不拒绝不拒绝H0,认为差异无统计学意义认为差异无统计学意义37假设检验例子38变量变换变量变换或秩和
16、检验或秩和检验 n 总体标准差总体标准差已知时已知时 或或 未知但未知但 n 较大(如较大(如n60)n 未知,未知,n较小(较小(n60),且),且 样本来自正态分布的总体样本来自正态分布的总体t 检验检验u 检验检验n 样本例数样本例数 n60且样且样 本来自偏态分布总体本来自偏态分布总体 3940【例例3-5】某医生测量了某医生测量了100名从事名从事铅作业男性工人的血红蛋白含量,铅作业男性工人的血红蛋白含量,算得其均数为算得其均数为130.83g/L,标准差,标准差为为25.74g/L。问从事铅作业工人。问从事铅作业工人的血红蛋白是否不同于正常成年的血红蛋白是否不同于正常成年男性平均值
17、男性平均值140g/L?【案例解析案例解析】1.首先考虑对原始数据进行正态性检验:首先考虑对原始数据进行正态性检验:结果表明,该样本所属总体来自正态分布。结果表明,该样本所属总体来自正态分布。2.再者再者已知,故考虑用已知,故考虑用 u 检验。检验。3.u 检验统计量:检验统计量:n 资料类型:定量资料资料类型:定量资料n 设计类型:单样本设计类型:单样本 41统计结论统计结论:已知:已知 U(0.05/2)=1.96,则,则 P 正常正常是正确的),结果由于这个样本看起来不是那么极端,是正确的),结果由于这个样本看起来不是那么极端,比诊断标准低(并未落在显著性水准比诊断标准低(并未落在显著性
18、水准a a规定的范围内),使规定的范围内),使得我们尚不认为他们是高血压患者;这种不拒绝原本不正得我们尚不认为他们是高血压患者;这种不拒绝原本不正确的确的H0的错误称为的错误称为II类错误类错误(type II error)55统计学中的两类错误统计学中的两类错误 犯一类错误的概率有多大?犯一类错误的概率有多大?如果样本信息落入拒绝域(拒绝域就是根据如果样本信息落入拒绝域(拒绝域就是根据小概率事件原理构建的),我们就会拒绝正小概率事件原理构建的),我们就会拒绝正确的原假设,此时就会犯一类错误;所以确的原假设,此时就会犯一类错误;所以I类类错误的概率错误的概率=a a,就是小概率事件的标准(检就
19、是小概率事件的标准(检验水准、诊断标准),故其大小表达为验水准、诊断标准),故其大小表达为a a 所以一类错误是在拒绝正确的原假设时发生,所以一类错误是在拒绝正确的原假设时发生,其大小在假设检验之前就已规定,一般为其大小在假设检验之前就已规定,一般为0.050.05或或0.010.01 因为这种概率较小,所以在拒绝原假设时通因为这种概率较小,所以在拒绝原假设时通常都意味着接受常都意味着接受H1(认为这个样本来自于高血认为这个样本来自于高血压人群,这种结论错误的可能性仅为压人群,这种结论错误的可能性仅为0.05或或0.01,非常小,非常小)56统计学中的两类错误统计学中的两类错误 犯二类错误的概
20、率有多大?犯二类错误的概率有多大?二类错误是不拒绝错误的原假设二类错误是不拒绝错误的原假设实际上就是漏实际上就是漏诊的概率;要知道漏诊的概率必须要知道高血压患诊的概率;要知道漏诊的概率必须要知道高血压患者的总体均值,而后根据正态分布的曲线下面积规者的总体均值,而后根据正态分布的曲线下面积规律计算律计算 但是在研究结束之间通常所谓但是在研究结束之间通常所谓“异常异常”的总体水平的总体水平是未知的,即并不知道高血压患者的总体血压会比是未知的,即并不知道高血压患者的总体血压会比正常人高多少,所以通常情况下二类错误的概率是正常人高多少,所以通常情况下二类错误的概率是未知的;为了与一类错误的概率相区别,
21、称之为未知的;为了与一类错误的概率相区别,称之为b b 因此在不拒绝原假设时需要特别注意,不拒绝原假因此在不拒绝原假设时需要特别注意,不拒绝原假设并不意味着接受它!因为如果此时漏诊的可能性设并不意味着接受它!因为如果此时漏诊的可能性较大,认为这群人是正常人的话就会有很大的代价较大,认为这群人是正常人的话就会有很大的代价(例如在当前的标准下,(例如在当前的标准下,b 30b 30,意味着如果承,意味着如果承认该样本来自正常人群会使认该样本来自正常人群会使3030的高血压人群的样的高血压人群的样本得不到及时的治疗)本得不到及时的治疗)57统计学中的两类错误统计学中的两类错误 因此统计学上十分在意一
22、种情况:如果这群因此统计学上十分在意一种情况:如果这群人真的是来自高血压人群的样本,能够将他人真的是来自高血压人群的样本,能够将他们准确的判断为患者的概率有多高们准确的判断为患者的概率有多高?这就是统计学检验的功效(这就是统计学检验的功效(power):即当):即当研究总体与原假设确有差别时,按照当前规研究总体与原假设确有差别时,按照当前规定的显著性水准能够发现这种差别的概率,定的显著性水准能够发现这种差别的概率,其大小为其大小为1-b1-b58如如1-b b 0.90,意味着若两总体确有,意味着若两总体确有差别,则理论上在差别,则理论上在100次检验中,平均次检验中,平均有有90次能够得出有
23、统计学意义的结论。次能够得出有统计学意义的结论。所作的检验若有较大的所作的检验若有较大的1-值,我们说值,我们说该检验方法的检验功效较高,因为该检验方法的检验功效较高,因为H0不成立时能够被及时检出不成立时能够被及时检出59统计学中的两类错误统计学中的两类错误 假设检验的两类错误表假设检验的两类错误表检验结果检验结果实际实际情况情况拒绝拒绝H0不拒绝不拒绝H0H0正确正确I类错误类错误(a a)结论正确结论正确(1-a a)H1正确正确结论正确结论正确(1-b b)I类错误类错误(b b)由于所建立的检验主要是控制犯由于所建立的检验主要是控制犯I类错类错误误的概率,而对犯的概率,而对犯II类错
24、误的概率类错误的概率却无却无法直接控制,即对一个检验犯法直接控制,即对一个检验犯II类错误的类错误的概率究竟怎样无所而知。概率究竟怎样无所而知。要谨慎对待要谨慎对待“不拒绝不拒绝H0”的结论的结论 即即“阴性结果阴性结果”60 “阴性阴性”极可能是极可能是 II类错误的概率类错误的概率 过高,或说检过高,或说检验功效(验功效(Power)1-过低,出现的假阴性结果。过低,出现的假阴性结果。n 某研究者对某研究者对“中华医学杂志中华医学杂志”、“中华血液学杂中华血液学杂志志”、“中华儿科杂志中华儿科杂志”、“解放军医学杂志解放军医学杂志”、“中华传染病杂志中华传染病杂志”的的317篇研究报告中的
25、篇研究报告中的641个阴个阴性结论作性结论作Power分析分析,结果发现,结果发现17.0%的阴性结果可的阴性结果可靠、靠、3.7%基本可靠,基本可靠,3.6%基本不可靠,基本不可靠,75.7%不可不可靠靠。n 国外国外Friedman等对等对Power低于低于0.9的的65个阴性结果重个阴性结果重新将新将Power值提高到值提高到0.9,发现,发现70%的阴性结果可转的阴性结果可转为阳性结论。为阳性结论。61 因此,因此,Power值值的大小已成为某些国的大小已成为某些国际会议审查论文设计内容之一;有的已明际会议审查论文设计内容之一;有的已明确规定,若研究者根据确规定,若研究者根据P0.05
26、下阴性结论下阴性结论时,必须提供时,必须提供Power值值。62检验水准检验水准定的越大定的越大总体参数间的差异越大总体参数间的差异越大 个体差异(标准差)越小个体差异(标准差)越小 样本含量越大样本含量越大 影响检验功效的因素:影响检验功效的因素:检验功效越大检验功效越大631.1.a a 越大,越大,b b 越小,则越小,则Power越大越大只有通过增加样本只有通过增加样本含量,你才可能同含量,你才可能同时减少两类错误时减少两类错误!当样本量取定时当样本量取定时,要减小要减小 b b,应把,应把a a 取大一些取大一些64a a 0 0H H1 1:0 0病人病人1-1 1总体参数间的差异
27、越大,总体参数间的差异越大,Power越大越大65a a 0 01-1 1,Power越大越大a a 0 0 1 11-664.若两样本总体确有差异时,若两样本总体确有差异时,在一定范在一定范 围内,围内,样本含量样本含量n 越大越大,Power越大。越大。通过增大通过增大n的方法,达到的方法,达到增大增大Power的目的的目的67检验功效检验功效/样本含量估算常用软件:样本含量估算常用软件:n SASn nQuery Advisorn EGRET SIZn Sample powern SASAn PASSn EXCEL68 PASS(power analysis and sample siz
28、e)是是Jerry开开发的专业发的专业样本含量估算和效能样本含量估算和效能分析软件。分析软件。PASS可以对均数间的比较、方差分析、相关和回归分可以对均数间的比较、方差分析、相关和回归分析、计数资料的假设检验和病例随访资料分析等检验析、计数资料的假设检验和病例随访资料分析等检验条件下的检验效能和样本含量进行估计。条件下的检验效能和样本含量进行估计。69小小 结结假设检验是依据样本提供的有限信息对总体做推断假设检验是依据样本提供的有限信息对总体做推断的过程。的过程。假设检验的步骤为:假设检验的步骤为:建立假设建立假设计算统计量计算统计量确定确定p值,作出推断结论值,作出推断结论假设检验的基本思想
29、是根据小概率的原理,认为假设检验的基本思想是根据小概率的原理,认为“小概率事件在一次抽样中不太可能出现小概率事件在一次抽样中不太可能出现”。假设检验中无论拒绝不拒绝假设检验中无论拒绝不拒绝H0,都有可能犯错误,都有可能犯错误(类错误和类错误和类错误)。类错误)。假设检验的推断结果下结论时不能绝对化,并要结假设检验的推断结果下结论时不能绝对化,并要结合专业知识。合专业知识。70步骤:建立假设,确定检验水准建立假设,确定检验水准确定确定P值值计算检验统计量计算检验统计量作推断结论作推断结论拒绝拒绝H0,接受,接受H1,认为差异有统计学意义认为差异有统计学意义P PP P 不拒绝不拒绝H0,认为差异
30、无统计学意义认为差异无统计学意义71最佳选择题:最佳选择题:1.统计推断的内容是:统计推断的内容是:A用样本指标推断总体指标用样本指标推断总体指标 B检验统计上的检验统计上的“假设假设”CA、B均不是均不是 DA、B均是均是2.两样本比较时,分别取以下检验水准,下列何者所取两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小:第二类错误最小:Aa a=0.05 Ba a=0.01 Ca a=0.10 Da a=0.20723.关于假设检验,下列那一项说法是正确的:关于假设检验,下列那一项说法是正确的:A单侧检验优于双侧检验单侧检验优于双侧检验B采用配对采用配对t检验还是两独立样本检验还
31、是两独立样本t 检验是由实验检验是由实验 设计方法决定的设计方法决定的C检验结果若检验结果若P值大于值大于0.05,则接受,则接受H0犯错误的可犯错误的可 能性很小能性很小D用用t 检验进行两样本总体均数比较时,不要求方检验进行两样本总体均数比较时,不要求方 差齐性差齐性73简答题:简答题:1.什么是一类错误?什么是二类错误?二什么是一类错误?什么是二类错误?二者之间有什么关系?者之间有什么关系?2.P 与与有什么区别和联系?有什么区别和联系?3.既然假设检验的结论有可能有错,为什既然假设检验的结论有可能有错,为什么还要进行假设检验?么还要进行假设检验?74答案:答案:P值的大小和值的大小和没
32、有必然关系。没有必然关系。3.P是指是指H0成立的前提下,出现目前样本成立的前提下,出现目前样本数据对应的统计量数值乃至比它更极端数据对应的统计量数值乃至比它更极端数值的概率。数值的概率。是事先确定的检验水准。是事先确定的检验水准。754.假设检验中,无论拒绝不拒绝假设检验中,无论拒绝不拒绝H0,都可能会,都可能会犯错误:表现为拒绝犯错误:表现为拒绝H0时,会犯第一类错误,不拒时,会犯第一类错误,不拒绝绝H0时,会犯第二类错误,但这并不能否认假设检时,会犯第二类错误,但这并不能否认假设检验的作用。验的作用。.因为只要涉及到抽样,就会有抽样误差的存在,因为只要涉及到抽样,就会有抽样误差的存在,因此就需要进行假设检验。因此就需要进行假设检验。.只是要注意假设检验的结论只是个概率性的结只是要注意假设检验的结论只是个概率性的结论,它的理论基础是论,它的理论基础是“小概率事件不太可能原小概率事件不太可能原理理”。.76