1、第八章 假设检验第一节第一节 统计假设检验的原理统计假设检验的原理一、假设与假设检验一、假设与假设检验(一)内涵:(一)内涵:假设:统计学中假设一般专指用统计学术语对总体参假设:统计学中假设一般专指用统计学术语对总体参数所做的假定性说明。数所做的假定性说明。假设检验:通过对两个统计量的分析、比较、判断两假设检验:通过对两个统计量的分析、比较、判断两者的差异是抽样误差引起所致还是由于总体参数间真者的差异是抽样误差引起所致还是由于总体参数间真正存在差异,这一推论过程称为假设检验分为:参数正存在差异,这一推论过程称为假设检验分为:参数检验和非参数检验。检验和非参数检验。由于建设检验是检验统计值之间的
2、差异是否显著,也叫差由于建设检验是检验统计值之间的差异是否显著,也叫差异的显著性检验。异的显著性检验。它的前提是建立假设,一般有两个相互对立的假设,零假它的前提是建立假设,一般有两个相互对立的假设,零假设(设()和备择假设()和备择假设()。)。是研究者根据样本信息期望拒绝的假设,也是研究者根据样本信息期望拒绝的假设,也称为虚无假设、待检假设。称为虚无假设、待检假设。和和 相互排斥,是研究者根据样本信息期望相互排斥,是研究者根据样本信息期望证实的假设。证实的假设。(二)假设检验的原理与方法(二)假设检验的原理与方法与参数估计相同,都是依据抽样分布理论,二者不同与参数估计相同,都是依据抽样分布理
3、论,二者不同之处:之处:1.参数估计是指出在一定的置信度下某个总体参数被包参数估计是指出在一定的置信度下某个总体参数被包含在什么区间内。含在什么区间内。2.假设检验是指出在一定的概率下某个待检假设(零假假设检验是指出在一定的概率下某个待检假设(零假设)是否为真。也即是说从零假设出发,可根据已知设)是否为真。也即是说从零假设出发,可根据已知条件构造一个统计量,并说明该统计量的分布形态和条件构造一个统计量,并说明该统计量的分布形态和特征。特征。3.P一般采用两种水平:一般采用两种水平:p 0.05和和p0.01 作为小概率事件的标准作为小概率事件的标准 这个标准称为显著性水平,用这个标准称为显著性
4、水平,用 表示。表示。当当 取定取定0.05(0.01)时,只要统计量的值在抽样分布中)时,只要统计量的值在抽样分布中出现的概率等于或小于出现的概率等于或小于0.05(0.01),就认为小概率事件),就认为小概率事件发生了,应拒绝零假设。发生了,应拒绝零假设。(三)假设检验中的小概率原理(三)假设检验中的小概率原理 假设检验的基本思想是概率性质的反证法。假设检验的基本思想是概率性质的反证法。(p223)二、假设检验中的两类错误p224(一)第类错误和第错误(二)两类型错误的关系p229 1.不一定等于1,因为 与 是建立在两个不同的前提上的概率。2.在其它条件不变的情况下,与 不可能同时减小或
5、增大。3.称为统计检验力。1三、单侧检验与双侧检验 单侧检验:在假设检验中,若将拒绝概率 置于理论抽样分布的一侧。双侧检验:在假设检验中,若将拒绝概率 置于理论抽样分布的两侧。双侧检验显著的单侧检验一定显著,单侧检验显著的双双侧检验显著的单侧检验一定显著,单侧检验显著的双侧检验不一定显著。侧检验不一定显著。应根据研究目的恰当选择假设检验的形式。应根据研究目的恰当选择假设检验的形式。四、假设检验的不骤四、假设检验的不骤p232 根据问题要求,建立虚无假设和备择假设根据问题要求,建立虚无假设和备择假设 根据给定条件确定样本分布为何种抽样分布,确定相应的检根据给定条件确定样本分布为何种抽样分布,确定
6、相应的检验方法,并计算出统计量的值;验方法,并计算出统计量的值;确定显著性水平确定显著性水平 做出判断。把临界值与计算所得的统计量的值相比较,若统做出判断。把临界值与计算所得的统计量的值相比较,若统计量值落在计量值落在 的拒绝区间内,则拒绝的拒绝区间内,则拒绝 ,接受,接受 ;若统;若统计量落在计量落在 接受区间内,则接受接受区间内,则接受 ,拒绝,拒绝 。:10HH第二节第二节 平均数的显著性检验平均数的显著性检验 类型类型 单总体平均数差异显著性检验单总体平均数差异显著性检验平均数的显著平均数的显著性检验性检验 双总体平均数差异显著性检验双总体平均数差异显著性检验平均数差异的平均数差异的显
7、著性检验显著性检验 条件:条件:被检验的样本应是随机样本被检验的样本应是随机样本 总体分布为正态分布总体分布为正态分布一、单总体平均数差异显著性检验(一)总体分布为正态分布,总体方差已知一)总体分布为正态分布,总体方差已知 由抽样分布的讨论可知,当总体总体分布为正态分布,由抽样分布的讨论可知,当总体总体分布为正态分布,总体方差已知,无论样本容量的大小,其样本平均数的抽总体方差已知,无论样本容量的大小,其样本平均数的抽样分布均为正态分布,因此可用样分布均为正态分布,因此可用Z检验方法进行检验。检验方法进行检验。在检验中,计算统计量值的公式:在检验中,计算统计量值的公式:例:某地区统考数学,假设该
8、统考数学成绩服从正态分布,已知其总平均数分为50分,标准差为12分。从该区随机选择一个班作为样本,该班有学生50人,经计算该班平均成绩为53分,试为该班成绩与总平均成绩的差异是否显著?对某专业可在全国同类高校内进行统一测试,已知全体考生成绩服从正态分布,其总平均数分为64分,标准差为8.6分。从某高校随机抽取20份试卷,经计算得到这20份试卷的平均成绩为70分。问该校学生的平均成绩是否显著优于全体学生的平均水平。(二)总体分布为正态分布,总体方差未知 由抽样分布的讨论可知,当总体总体分布为正态分布,总体方差未知,其样本平均数的抽样分布服从自由度为n-1的t分布,因此可用t检验方法进行检验。例:
9、三、总体为非正态分布二、双总体平均数差异显著性检验二、双总体平均数差异显著性检验双总双总体均数之差检验体均数之差检验 内容:内容:样本性质:样本性质:独立样本:从两无关总体抽取的两个样本。独立样本:从两无关总体抽取的两个样本。相关样本:从相关总体抽取的两个样本。相关样本:从相关总体抽取的两个样本。同组比较:同组前后比较。同组比较:同组前后比较。配对样本:同质被试两两配对形成样本的先后比较。配对样本:同质被试两两配对形成样本的先后比较。(一)两均数差检验的条件(一)两均数差检验的条件 样本:随机抽样。样本:随机抽样。总体:正态分布;非正态,总体:正态分布;非正态,n30。总体方差:齐性总体方差:
10、齐性(二)均数之差的标准误均数之差的标准误 检验时需考虑的因素检验时需考虑的因素 样本性质如何?样本性质如何?12、22已知否?已知否?方差一致否?方差一致否?(三)检验方法与过程(三)检验方法与过程 1.方法方法 Z检验检验 t 检验检验 Z检验检验例:从某地区的六岁儿童中随机抽取男生30人,身高平均为114cm,抽取女生 27人平均身高为112.5cm。根据以往资料,该地区六岁男童身高的标准差为5cm。女童身高的标准差为6.5cm,能否根据这一次抽样测量的结果下结论:该地区六岁男女儿童的身高有显著性差异。某幼儿园在儿童入园时对49名儿童进行了比奈智力测验(=16),结果平均智商汇=106,
11、一年后再对同组被试施测,结果充=110,已知两次测验结果的相关系数r=74,问能否说随着年龄增长与一年的教育,儿童智商有了显著提高。如果经检验两个总体方差不等,则求两个样本的联合方差即失去意义。这时很自然地会想到应该分别用两个样本方差作为它无偏估计。但是这时的分布不再是t分布更不是正态分布。对于这个问题不少人提出过各种解决方法,其中柯克兰CochrazO与柯克斯Cod于1957年介绍的方法最常用。12、22未知(方差不齐性)未知(方差不齐性)若实际得到的若实际得到的 则认为两个平均数在则认为两个平均数在 水平差异显著。水平差异显著。例:为了比较独生子女与非独生子女在社会性方面的差异,随机抽取独
12、生子女25人,非独生子女31人,进行社会认知测验,结果独生子女平均数为25.3,标准差为6;非独生子女的平均数为29.9,标准差为10.2。试问独生与非独生子女的社会认知能力是否存在显著差异?(已知两总体方差不齐性)例某年某市青少年儿童体质调查结果,其中某年某市青少年儿童体质调查结果,其中208名名12岁男性少年平均身高岁男性少年平均身高145.3,标准差,标准差6.69;201名女性少年平均身高名女性少年平均身高135.2,标准差,标准差6.62。性别对性别对12岁少年身高是否有显著影响?岁少年身高是否有显著影响?分析:分析:双侧检验;双侧检验;总体正态;总体正态;2、2未知;未知;样本独立
13、;样本独立;方差一致;Z 或t检验小结:在具体应用假设检验时,一定要根据各种条件,使用相应的公式,不可错用。尤其是平均数差异的t检验,条件较多,相应的公式不少,切不能以一代全。假设检验首先一个步骤是建立Ho(零假设),但是应该清楚:任何一种统计量的假设检验,其出发点都是对Ho的检验。统计结论是对Ho能否被拒绝做出推断。2.假设检验的基本思想是一种反证法式的推理,即通过检验Ho的真伪来反证研究假设H1的真伪,若Ho为真,则H1必假,而Ho为假H1即真,而且无论做出Ho是真还是假的结论都带有概率性质的。3、与两种类型错误概率的关系是个值得注意的问题,一般情况下+1。尽管本章大部分例题没有对自进行讨
14、论,但在许多实际问题中自不容忽视,尤其“统计检验力”(1-)是个相当重要的统计学概念。假设检验中的显著与实际问题中效果的显著既有联系又有区别前者是统计学概念,而后者是专业上常用的术语,以两个样本平均数差异检验为例,当t检验的结果在.05水平上显著,这是从统计学意义来说由样本平均数之间的差异可以作出两个总体平均数存在差异的结论。但两总体平均数之间的差异是否具有专业意义即有否实际上的显著效果)还要根据专业上的标准而定统计结论显著并不一定意味着实际效果的显著。例如研究某种教育方法是否有效,实验结果实验组比控制组平均智商提高1分(实验组IQ=104,控制组IQ=103),实验组与控制组的取样人数非常大
15、,达几千人之多,那么检验的结果,差异一定非常量著,但是智商提高1分似乎并没有什么实际价值。因此,虽然统计结果统计结果显著气而下结论说该种教育方法对于显著气而下结论说该种教育方法对于提高智力有显著效果却仍然不能令人信服。提高智力有显著效果却仍然不能令人信服。平平均均数数假假设设检检验验样本与总样本与总体平均数体平均数差异检验差异检验两样本平两样本平均数差异均数差异检验检验 已知已知 未知小样本未知小样本 未知大样本未知大样本独立样本独立样本相关样本相关样本 已知已知 未知小样本未知小样本 未知大样本未知大样本方差齐性方差齐性方差不齐性方差不齐性r r已知已知r r未知未知 已知已知 未知小样本未
16、知小样本 未知大样本未知大样本小样本小样本大样本大样本作业:从某中学二年级随机抽取学生从某中学二年级随机抽取学生50名作为样本,在学期初进名作为样本,在学期初进行了一次阅读测验,平均分行了一次阅读测验,平均分=55,S=5;期未又进行一次类;期未又进行一次类似测验,似测验,平均分平均分=60,S=7;两次测验的相关为;两次测验的相关为0.6。试问。试问阅读水平的提高是否可靠阅读水平的提高是否可靠?一个一个n=10的配对样本,实验组和对照组分别的配对样本,实验组和对照组分别被施以两种教学方法,后期测验结果如下表所示,被施以两种教学方法,后期测验结果如下表所示,试比较两种教学方法效果是否有显著差异
17、?试比较两种教学方法效果是否有显著差异?配对配对12345678910实验组实验组 86 83 8578749675959078对照组对照组 83 83 8587928688748597第三节 方差的差异显著性检验方差差异显著性检验步骤与平均数差异显著性检验类方差差异显著性检验步骤与平均数差异显著性检验类似似 标准差的抽样分布受样本容量的影响标准差的抽样分布受样本容量的影响,只有样本容量只有样本容量较大时其抽样分布才接近正态较大时其抽样分布才接近正态,因此需要对标准差进行因此需要对标准差进行参数估计时参数估计时,一般都转换成方差的参数估计。同样道理一般都转换成方差的参数估计。同样道理,对于标准差的差异检验一般也应转换成方差的差异检对于标准差的差异检验一般也应转换成方差的差异检验。因此验。因此,本章只讨论方差的差异检验本章只讨论方差的差异检验。一、单总体方差的差异显著性检验p243 当从正态分布的总体中随机抽取容量为n的样本时,其样本方差与总体方差比值的分布为 分布。即 二、两样本方差之间的差异显著性检验p245第四节第四节 相关系数的差异显著性检验相关系数的差异显著性检验