1、第八章第八章 假设检验假设检验假设检验在统计方法中的地位假设检验在统计方法中的地位统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验主要内容主要内容n假设检验的含义及基本原理假设检验的含义及基本原理n原假设与备选假设原假设与备选假设n假设检验的判断原则假设检验的判断原则n假设检验中的两类错误假设检验中的两类错误n假设检验的基本步骤假设检验的基本步骤3引例引例 相信有一句话大家都耳熟能详:相信有一句话大家都耳熟能详:“实践是检验真理实践是检验真理的唯一标准!的唯一标准!”,通过上一章的学习和应用,我们发现,通过上一章的学习和应用,我们发现,很多数据不切合实际,无法反
2、映真实的情况,又有一些很多数据不切合实际,无法反映真实的情况,又有一些数据在某种显著性水平下合乎真理,那么是不是就直接数据在某种显著性水平下合乎真理,那么是不是就直接作出这样的判断呢?这些判断到底有多少的可靠性呢?作出这样的判断呢?这些判断到底有多少的可靠性呢?例如,例如,20172017年高校毕业生满意度能不能反映大部分毕业年高校毕业生满意度能不能反映大部分毕业生的态度?生的态度?3737个城市平均月薪能不能反映各个城市的真个城市平均月薪能不能反映各个城市的真实收入情况?大学生平均月消费数据可不可靠?等等实收入情况?大学生平均月消费数据可不可靠?等等 通过本章的学习,相信你会通过实践,进一步
3、验证通过本章的学习,相信你会通过实践,进一步验证你的判断!你的判断!4第一节第一节 假设检验概述假设检验概述n一、假设检验的含义一、假设检验的含义 假设检验又称显著性检验,是利用样本假设检验又称显著性检验,是利用样本观测信息,以一定的概率,检验事先对总体观测信息,以一定的概率,检验事先对总体参数或总体分布形态作出的规定或假设是否参数或总体分布形态作出的规定或假设是否成立,或判断总体真实情况是否与原假设存成立,或判断总体真实情况是否与原假设存在显著的系统性差异。在显著的系统性差异。第一节第一节 假设检验概述假设检验概述n二、假设检验的原理二、假设检验的原理 假设检验,首先是对总体某些参数作出假设
4、,假设检验,首先是对总体某些参数作出假设,然后根据所得样本数据,利用然后根据所得样本数据,利用“反证法反证法”思想和思想和“小概率原理小概率原理”对假设的正确性作出判断的统计推对假设的正确性作出判断的统计推断过程。断过程。第一节第一节 假设检验概述假设检验概述n二、假设检验的原理二、假设检验的原理这个值不像我这个值不像我们应该得到的们应该得到的样本均值样本均值.如果这是总如果这是总体的假设均值体的假设均值样本均值样本均值.因此我们拒绝因此我们拒绝原假设原假设=50=80H0第一节第一节 假设检验概述假设检验概述n三、假设检验的程序三、假设检验的程序 一个完整的假设检验过程,通常包括以下几个步骤
5、:一个完整的假设检验过程,通常包括以下几个步骤:第一节第一节 假设检验概述假设检验概述n三、假设检验的程序三、假设检验的程序 我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设 别无选择别无选择!三、假设检验的程序三、假设检验的程序-n1.原假设原假设H0n又称零假设;又称零假设;n研究者想收集证据予以研究者想收集证据予以推翻推翻的假设;的假设;n总体参数没有变化或变总体参数没有变化或变量之间没有关系,量之间没有关系,n最初是成立的,之后根最初是成立的,之后根据样本数据确定是否有据样本数据确定是否有足够的证据足够的证据拒绝拒绝它。它。n2.备选假设备选假设H1n又称对立
6、假设;又称对立假设;n研究者想收集证据予以研究者想收集证据予以支持支持的假设;的假设;n总体参数发生了变化或总体参数发生了变化或变量之间有某种关系变量之间有某种关系n最初是不成立的,之后最初是不成立的,之后根据样本数据确定是否根据样本数据确定是否有足够的证据有足够的证据支持支持它。它。或或 或或 0100:HH0100:HH0100:HH三、假设检验的程序三、假设检验的程序-n3.3.双侧检验与单侧检验双侧检验与单侧检验 根据备选假设根据备选假设H1不同,假设检验又分为双侧检不同,假设检验又分为双侧检验和单侧检验。以总体均值验和单侧检验。以总体均值的检验为例的检验为例:假设假设双侧检验双侧检验
7、单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0:m m =m m0 0H0:m m m m0 0H0:m m m m0 0备择假设备择假设H1:m m m m0 0H1:m m m m0 0三、假设检验的程序三、假设检验的程序-n4.例题分析例题分析 例8.1 某品牌洗衣粉在它的产品说明书中声称:平均净含量不少于1250克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试写出用于检验的原假设与备择假设。解:研究者抽检的意图是倾向于证实这种洗衣粉的平均净含量并不符合说明书中的陈述。因此,建立的原假设和备择假设为:三、假设检验的程序三、
8、假设检验的程序-n4.例题分析例题分析 例8.2 一家研究机构估计,某城市中拥有本科学历的人数比例超过50%。为验证这一估计是否正确,该研究机构随机抽取了100个样本进行检验。试陈述用于检验的原假设与备择假设。解:研究者想收集证据予以支持的假设是“该城市中本科学历人数比例超过50%”。因此,建立的原假设和备择假设为:三、假设检验的程序三、假设检验的程序-n5.建立假设的相关建立假设的相关技巧技巧n原假设和备择假设是一个完备事件组,而且相原假设和备择假设是一个完备事件组,而且相互对立;互对立;原假设和备择假设必有一个成原假设和备择假设必有一个成 立,立,而且只有一个成立;而且只有一个成立;n先确
9、定先确定,再确定原假设;,再确定原假设;n等号等号“=”总是放在原假设上总是放在原假设上。n因研究目的不同,对同一问题可能提出不同的因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)假设(也可能得出不同的结论)三、假设检验的程序三、假设检验的程序-n1.含义含义n总体参数的假设检验,要借助于样本统计量进总体参数的假设检验,要借助于样本统计量进行统计推断,用于假设检验问题的统计量称为行统计推断,用于假设检验问题的统计量称为检验统计量。检验统计量。n2.检验统计量的检验统计量的选取选取n用于进行检验的是用于进行检验的是大样本大样本还是还是小样本小样本;n总体标准差总体标准差 是是
10、已知已知还是还是未知未知等等。等等。注:在不同的条件下应选择不同的检验统计量。注:在不同的条件下应选择不同的检验统计量。三、假设检验的程序三、假设检验的程序-n假设检验通常把假设检验通常把小概率事件小概率事件发生的概率规定为一发生的概率规定为一个具体数值,统计上把称之为假设检验中的显著个具体数值,统计上把称之为假设检验中的显著性水平;性水平;n用用(alpha)表示,常用的)表示,常用的 值有值有0.01,0.05,0.10三个三个,一般选,一般选0.05;n当作出接受原假设的决定时,其正确的概率(可当作出接受原假设的决定时,其正确的概率(可能性)分别对应为能性)分别对应为90%,95%,97
11、.5%和和99%等。等。注:注:由研究者事先确定。由研究者事先确定。三、假设检验的程序三、假设检验的程序-n1.临界值原则临界值原则n计算出检验统计量,并确定显著性水平后,要运计算出检验统计量,并确定显著性水平后,要运用临界值原则对原假设作出接受或拒绝的决定。用临界值原则对原假设作出接受或拒绝的决定。n根据样本统计量的概率分布特征,将根据样本统计量的概率分布特征,将 转化为该转化为该分布下的临界值,然后将所计算的检验统计量与分布下的临界值,然后将所计算的检验统计量与临界值相比较来判断是否接受原假设的原则。临界值相比较来判断是否接受原假设的原则。n2.接受域:概率接受域:概率P 的区域,为的区域
12、,为大概率大概率区域,称之区域,称之为原假设的接受区域。为原假设的接受区域。n3.拒绝域:概率拒绝域:概率P 的区域,为的区域,为小小概率概率区域,称之区域,称之为原假设的为原假设的拒绝拒绝区域。区域。三、假设检验的程序三、假设检验的程序-n1.拒绝原假设拒绝原假设H1n原则:临界值原则:临界值n检验统计值的绝检验统计值的绝对值大于临界值;对值大于临界值;nP。n2.接受原假设接受原假设H0n原则:临界值原则:临界值n检验统计值的绝检验统计值的绝对值小于临界值;对值小于临界值;nP。三、假设检验的程序三、假设检验的程序-n3.用统计量决策用统计量决策抽样分布抽样分布0临界值临界值临界值临界值/
13、2/2拒绝拒绝H0置信水平置信水平拒绝域拒绝域接受域接受域拒绝域拒绝域拒绝拒绝H0/2/2三、假设检验的程序三、假设检验的程序-n3.用统计量决策用统计量决策拒绝拒绝H0置信水平置信水平接受域接受域0临界值临界值抽样分布抽样分布拒绝域拒绝域三、假设检验的程序三、假设检验的程序-n3.用统计量决策用统计量决策拒绝拒绝H0置信水平置信水平接受域接受域0临界值临界值抽样分布抽样分布拒绝域拒绝域三、假设检验的程序三、假设检验的程序-n4.用用P值进行决策值进行决策 /2/2 /2 /2 Z Z拒绝拒绝H H0 0拒绝拒绝H H0 00 0三、假设检验的程序三、假设检验的程序-n4.用用P值进行决策值进
14、行决策计算出的样本统计量计算出的样本统计量 0 0置信水平置信水平拒绝拒绝H H0 0抽样分布抽样分布三、假设检验的程序三、假设检验的程序-n4.用用P值进行决策值进行决策 0 0置信水平置信水平拒绝拒绝H H0 0抽样分布抽样分布计算出的样本统计量计算出的样本统计量思考:多大的思考:多大的P 值合适?值合适?n1.原假设的可信度有多高?原假设的可信度有多高?n如果如果H0所代表的假设是人们多年来一直相信所代表的假设是人们多年来一直相信的,就需要很强的证据(小的的,就需要很强的证据(小的P值)才能说值)才能说服他们;服他们;n2.拒绝的结论是什么?拒绝的结论是什么?n如果拒绝如果拒绝H0而肯定
15、而肯定H1,就需要有很强的证,就需要有很强的证据显示要支持据显示要支持H1。(因为拒绝。(因为拒绝H0要花很高要花很高的成本)的成本)第一节第一节 假设检验概述假设检验概述n四、假设检验中的两类错误四、假设检验中的两类错误 通过假设检验作出一个接受或拒绝原假设的决策,通过假设检验作出一个接受或拒绝原假设的决策,是基于样本提供的不完全信息分析对未知总体特征的是基于样本提供的不完全信息分析对未知总体特征的推断,即由样本推断总体。因此,假设检验不可能百推断,即由样本推断总体。因此,假设检验不可能百分百的绝对正确,也可能会犯错误,存在决策不正确分百的绝对正确,也可能会犯错误,存在决策不正确的风险。主要
16、有两类错误:的风险。主要有两类错误:假设假设接受H0拒绝H0H0为真实为真实判断正确弃真错误()H0为不真实为不真实采伪错误()判断正确四、假设检验中的两类错误四、假设检验中的两类错误n第第I类(类()错误和错误和第第II类(类()错误的关系错误的关系你要同时减少两类你要同时减少两类错误的惟一办法是错误的惟一办法是增加样本容量增加样本容量!和和 的关系就像的关系就像翘翘板,翘翘板,小小 就就大,大,大大 就小。就小。关乎决策:三个与其关乎决策:三个与其n与其,人为地把显著性水平与其,人为地把显著性水平 固定按某一水平上,固定按某一水平上,不如干脆选取检验统计量的不如干脆选取检验统计量的P值;值
17、;n与其,大致知道犯第与其,大致知道犯第错误的概率,不如干脆知错误的概率,不如干脆知道一个确切的犯第道一个确切的犯第类错误的概率(类错误的概率(P值)值)n与其,为选取与其,为选取“适当的适当的”的的 而苦恼,不如干脆而苦恼,不如干脆把真正的把真正的(P值)值)算出来。算出来。第二节第二节 一个正态总体的假设检验一个正态总体的假设检验n一、正态总体一、正态总体n设总体设总体 ,抽取容量为,抽取容量为n的样本的样本n样本均值样本均值 与方差与方差 计算公式分别为:计算公式分别为:我们将利用上述信息,来检验关于未知参数均值我们将利用上述信息,来检验关于未知参数均值和方差的假设。和方差的假设。),(
18、2mNXnxxx,21niixnX11niiXxnS12)(11X2S第二节第二节 一个正态总体的假设检验一个正态总体的假设检验n一、正态总体的参数一、正态总体的参数n设总体设总体 ,抽取容量为,抽取容量为n的样本的样本n样本均值样本均值 与方差与方差 计算公式分别为:计算公式分别为:我们将利用上述信息,来检验关于未知参数均值我们将利用上述信息,来检验关于未知参数均值和方差的假设。和方差的假设。),(2mNXnxxx,21niixnX11niiXxnS12)(11X2S第二节第二节 一个正态总体的假设检验一个正态总体的假设检验总体方差已知总体方差已知z 检验检验(单尾和双尾单尾和双尾)总体方差
19、已知总体方差已知t 检验检验(单尾和双尾单尾和双尾)2 2 检验检验(单尾和双尾单尾和双尾)均值均值总体参数总体参数方差方差第二节第二节 一个正态总体的假设检验一个正态总体的假设检验n二、均值二、均值m m的假设检验的假设检验n1.H0:m m=m m0n2.n 2已知:已知:(大、小样本均适用)(大、小样本均适用)n 2未知:未知:小样本:小样本:大样本:大样本:)10(/0,NnXZm)1,0(/s0NnXZm)1(/0ntnsXtm第二节第二节 一个正态总体的假设检验一个正态总体的假设检验n二、均值二、均值m m的假设检验的假设检验n3.给出显著性水平给出显著性水平(0.01、0.05或
20、或0.1)n4.确定接受域和拒绝域(以确定接受域和拒绝域(以双侧检验为例双侧检验为例)n 2已知:当已知:当 ,则拒绝原假设,反之则接受,则拒绝原假设,反之则接受H0;n 2未知:大样本同未知:大样本同 2已知情况一致已知情况一致 小样本:当小样本:当 ,则拒绝原假设,反之则接受,则拒绝原假设,反之则接受H0;2ZZ 2tt 二、均值二、均值m m的假设检验的假设检验n6.例题分析例题分析 例8.3 某广告公司在广播电台做流行歌曲磁带广告,它的插播广告是针对平均年龄为21岁的年轻人的,标准差为16。这家广告公司经理想了解其节目是否为目标听众所接受。假定听众的年龄服从正态分布,现随机抽取400多
21、位听众进行调查,得出的样本结果为 岁,。以0.05的显著水平判断广告公司的广告策划是否符合实际?25x21S 8二、均值二、均值m m的假设检验的假设检验n6.例题分析例题分析 解例8.3:由题意可知,这是关于总体均值的双侧检验问题,其假设检验过程如下:首先,建立假设:然后,选择并计算统计量。因为是大样本,所以用Z统计量进行检验。且 最后,进行统计决策。由附表查得,在5%的显著水平下,=1.96,知道 ,所以拒绝原假设,即调查结果表明该公司的节目并没有吸引它所预期的听众,广告策划不符合实际,需要改变和调整。01:21,:21HHmm25 2120/4/400 xZnm2Z|20 1.96Z 二
22、、均值二、均值m m的假设检验的假设检验n6.例题分析例题分析 例8.4 某汽车轮胎厂宣称,该厂一等品轮胎的平均寿命在一定重量和正常行驶条件下大于25000公里,对一个由15个轮胎组成的随机样本进行试验,得到样本平均值和标准差分别为27000公里和5000公里。假定轮胎寿命近似服从正态分布,试问在5%的显著性水平下,是否可以相信产品同厂家所说的标准相符?二、均值二、均值m m的假设检验的假设检验n6.例题分析例题分析 解例8.4:根据题意,可知样本均值为27000公里,标准差为5000.可建立检验假设如下:由于总体方差未知且n=15,因此,可构造t统计量:最后,进行统计决策。查表得临界值 ,由
23、于 ,所以接受原假设,即有充分理由相信汽车轮胎厂所说的标准和实际相符。250002500010mm:;:HH1.5515/50002500027000/0nSXtm76.1)14(05.0t)14(t05.0t第二节第二节 一个正态总体的假设检验一个正态总体的假设检验n三、方差三、方差 2的假设检验的假设检验n1.H0:2=n2.nm m已知:已知:nm m未知:未知:n若所计算的若所计算的 2检验统计量的值大于临界值,则拒绝检验统计量的值大于临界值,则拒绝原假设原假设,反之则接受,反之则接受H0;20)()(nxnii22102021m)1-n()1(122202Sn三、方差三、方差 2的假
24、设检验的假设检验n6.例题分析例题分析 例8.5 某工厂用自动包装机包装葡萄糖,已知总体每袋葡萄糖的质量为500克,抽取了8袋葡萄糖,测得各袋样本葡萄糖的质量分布为:495、510、505、498、503、492、502、505,问能否认为每袋葡萄糖质量的方差?(取显著性水平为5%)252三、方差三、方差 2的假设检验的假设检验n6.例题分析例题分析 解例8.5:按题意,要检验的假设是:构造检验统计量:查表得 。因为 ,所以在显著性水平为5%的条件下,接受原假设,即认为每袋葡萄糖的质量的方差为25。01:2,:25HH22512.04)500(251)(12101210202iiniixxm3
25、.18)10(205.0205.02第三节第三节 两个正态总体的假设检验两个正态总体的假设检验n一、两个正态总体一、两个正态总体n设总体设总体 ,,从该两个总体中分从该两个总体中分别抽取样本别抽取样本n其样本均值和样本方差分别为:其样本均值和样本方差分别为:我们将利用上述信息,来检验关于两个总体未知参数我们将利用上述信息,来检验关于两个总体未知参数均值和方差的假设。均值和方差的假设。),(211mNX221121,nnyyyxxx1111niixnX112)(1111niiXxnS),(222mNY21_21niiynY11_22)(2121niiYynS第三节第三节 两个正态总体的假设检验两
26、个正态总体的假设检验总体参数总体参数均值差均值差方差比方差比z 检验检验(大样本大样本)t 检验检验(小样本小样本)F 检验检验第三节第三节 两个正态总体的假设检验两个正态总体的假设检验n二、均值二、均值m m的假设检验的假设检验n1.H0:m m1=m m2n2.n 2均已知:均已知:n 2均未知,但相等:均未知,但相等:)10(222121,NnnYXZ)2(212212nntnnYXt第三节第三节 两个正态总体的假设检验两个正态总体的假设检验n二、均值二、均值m m的假设检验的假设检验n3.给出显著性水平给出显著性水平(0.01、0.05或或0.1)n4.确定接受域和拒绝域(以确定接受域
27、和拒绝域(以双侧检验为例双侧检验为例)n 2均已知:当均已知:当 ,则拒绝原假设,反之则接受,则拒绝原假设,反之则接受H0;n 2均未知,但相等:当均未知,但相等:当 ,则拒绝原假设,反,则拒绝原假设,反之则接受之则接受H0;2ZZ 2tt 二、均值二、均值m m的假设检验的假设检验n6.例题分析例题分析 例8.6 某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?男性职员男性职员女性职员女性职员n1=44n1=32 =75
28、 =70S12=64 S22=42.251x2x二、均值二、均值m m的假设检验的假设检验n6.例题分析例题分析 解例8.6:=0.05,n1=44,n2=32211210mmmm:;:HH002.33225.4244647075zn检验统计量:n决策:拒绝H0n结论:该公司男女职员的平均小时工资之间存在显著差异 z01.96-1.960.025拒绝拒绝 H0拒绝拒绝 H00.025二、均值二、均值m m的假设检验的假设检验n6.例题分析例题分析 例8.7 甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有 。为比较两台机床的加工精度有无显
29、著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。在=0.05的显著性水平下,样本数据是否提供证据支持“两台机床加工的零件直径不一致”的看法?2221甲甲20.519.819.720.420.120.019.019.9乙乙20.719.819.520.820.419.620.2二、均值二、均值m m的假设检验的假设检验n6.例题分析例题分析 解例8.7:=0.05,n1=8,n2=7 临界值:211210mmmm:;:HH002.33225.4244647075zn检验统计量:检验统计量:n决策:无法拒绝H0n结论:样本提供的证据还不足以推翻“两台机床加工
30、的零件直径不一致”的看法t02.160-2.1600.025拒绝拒绝 H0拒绝拒绝 H00.025855.0/1/1)(2121nnsxxtp第三节第三节 两个正态总体的假设检验两个正态总体的假设检验n三、方差三、方差 2的假设检验的假设检验n1.H0:n2.n若所计算的若所计算的F检验统计量的值大于临界值,则拒绝检验统计量的值大于临界值,则拒绝原假设原假设,反之则接受,反之则接受H0;2221)1,1(),min(),max(22112221分母分子nnFSSSSF三、方差三、方差 2的假设检验的假设检验n6.例题分析例题分析 例8.8 某地统计部门想了解不同经济类型的企业奖金的发放情况。现
31、从私营企业抽查8人,从国有企业抽查7人,得各企业平均每季发放奖金数据如下:私营:532 600 556 688 469 632 686 700 国有:400 322 280 514 250 388 600试问,在2%的显著水平下,两种经济类型的企业平均每季发放的奖金的方差是否有差异?三、方差三、方差 2的假设检验的假设检验n6.例题分析例题分析 解例8.8:按题意,要检验的假设是:经计算,可得 ,可计算出检验统计量:查表得 。因为 ,所以在显著性水平为2%的条件下,接受原假设,即认为不同经济类型平均每季每人发放奖金额的方差无显著性差异。2221122210:HH;373.126,997.832221SS2.264),min(),max(22112221SSSSF191.7)7,6(2F2FF 本章小结本章小结均值均值方差方差均值差均值差方差比方差比F F检验检验 1 12 2,2 22 2已知已知 1 12 2,2 22 2未知未知Z Z检验检验t t检验检验大样本大样本小样本小样本Z Z检验检验 2 2已知已知Z Z检验检验 2 2未知未知t t检验检验卡方检验卡方检验本章完本章完