1、第 6 章 假设检验统计学6.1 假设检验的基本问题假设检验的基本问题 6.2 大样本情形下的总体均值检验大样本情形下的总体均值检验6.3 小样本情形下的总体均值检验小样本情形下的总体均值检验6.3 总体比例的检验总体比例的检验学习目标1.假设检验的基本思想和原理假设检验的基本思想和原理 2.假设检验的步骤假设检验的步骤3.总体均值的检验总体均值的检验4.总体比例的检验总体比例的检验6.1 假设检验的基本问题1原假设与备择假设原假设与备择假设2拒绝域和检验统计量拒绝域和检验统计量3两类错误和显著性水平两类错误和显著性水平4单侧检验与双侧检验单侧检验与双侧检验什么是假设检验什么是假设?(hypo
2、thesis)o 对总体参数的具体数值所作的陈述n 总体参数包括总体总体均值均值、比例比例、方差方差等n 分析之前之前必需陈述什么是假设检验?(hypothesis test)1.先对总体的参数提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理o 区间估计是用给定的大概率推断出总体参数区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。总体的状况所做出的假设进行判断。o 假设检验与区间估计结合起来,构成完整的假设检验与区间估计结合起
3、来,构成完整的统计推断内容。统计推断内容。o假设检验与区间估计的差别主要在于:假设检验与区间估计的差别主要在于:假设检验的基本思想m m=50假设检验的过程我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设 别无选择别无选择!o 例例1 1:消费者协会接到消费者投诉,指控品牌:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为包装上标明的容量为250250毫升。消费者协会从毫升。消费者协会从市场上随机抽取市场上随机抽取5050盒该品牌纸包装饮品,测试盒该品牌纸包装饮品,测试发现平均含量
4、为发现平均含量为248248毫升,小于毫升,小于250250毫升。这是毫升。这是生产中正常的波动,还是厂商的有意行为?消生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?欺骗了消费者呢?o 消费者协会实际要进行的是一项统计检验工作。消费者协会实际要进行的是一项统计检验工作。检验总体平均检验总体平均 =250=250是否成立。这就是一个是否成立。这就是一个原假设原假设(null hypothesis)(null hypothesis),通常用,通常用 表示。表示。0Hm原假设与备择假设原假设(null hypo
5、thesis)1.研究者想收集证据予以反对的假设2.又称“0假设”3.表示为 H0H0:指定为符号=,或,例如,H0:10cm1.研究者想收集证据予以支持的假设2.也称“研究假设”3.表示为 H1nH1:某一数值,或某一数值n例如,H1:”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)n 备择假设的方向为“”,称为右侧检验右侧检验 双侧检验与单侧检验(假设的形式)假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设备择假设备择假设两类错误与显著性水平两类错误与显著性水平假设检验中的两类错误1.第第类错误类错误(弃真错误弃真错误)原假设
6、为真时拒绝原假设原假设为真时拒绝原假设第第类错误的概率记为类错误的概率记为 被称为显著性水平被称为显著性水平2.第第类错误类错误(取伪错误取伪错误)原假设为假时未拒绝原假设原假设为假时未拒绝原假设第第类错误的概率记为类错误的概率记为 (Beta)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H H0 0 检验检验决策决策实际情况实际情况H H0 0为真为真H H0 0为假为假未拒绝未拒绝H H0 0正确决策正确决策(1 (1 a a)第第类错类错误误(b b)拒绝拒绝H H0 0第第类类错误错误(a a)正确决策正确决策(1-(1-b b)错误和 错误的关系你不能同时减你不能同时减少两
7、类错误少两类错误!影响影响 错误的因素错误的因素o 1.总体参数的真值n 随着假设的总体参数的减少而增大o2.显著性水平 n 当 减少时增大o3.总体标准差 n 当 增大时增大o4.样本容量 nn 当 n 减少时增大显著性水平(significant level)1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的 值有0.01,0.05,0.104.由研究者事先确定假设检验中的小概率原理o 什么小概率?什么小概率?o1.在一次试验中,一个几乎不可在一次试验中,一个几乎不可能发生的事件发生的概率能发生的事件发生的概率o2.在一次试验中小概率事件
8、一旦发在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设生,我们就有理由拒绝原假设o3.小概率由研究者事先确定小概率由研究者事先确定统计量与拒绝域统计量与拒绝域o 构造一个统计量来决定是否拒绝原假设。构造一个统计量来决定是否拒绝原假设。o 对不同的问题,要选择不同的检验统计量。对不同的问题,要选择不同的检验统计量。1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量的标准化结果n原假设H0为真n点估计量的抽样分布 o 检验统计量确定后,就要利用该统计量的分布检验统计量确定后,就要利用该统计量的分布以及由实际问题中所确定的显著性水平,来进以及由实际
9、问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,一步确定检验统计量拒绝原假设的取值范围,即拒绝域。即拒绝域。o 在给定的显著性水平在给定的显著性水平下,检验统计量的可能下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平区域。小概率区域就是概率不超过显著性水平的区域,是原假设的拒绝区域;大概率区域的区域,是原假设的拒绝区域;大概率区域是概率为是概率为1-1-的区域,是原假设的接受区域。的区域,是原假设的接受区域。o 单侧检验与双侧检验/21/2-Z/2 Z/2 Z 0 0 Z双侧检验双
10、侧检验左侧检验左侧检验右侧检验右侧检验显著性水平和拒绝域(双侧检验)/2 显著性水平和拒绝域(双侧检验)显著性水平和拒绝域(双侧检验)显著性水平和拒绝域(双侧检验)显著性水平和拒绝域(单侧检验)显著性水平和拒绝域(左侧检验)显著性水平和拒绝域(左侧检验)显著性水平和拒绝域(右侧检验)显著性水平和拒绝域(右侧检验)决策规则n 双侧检验:I统计量I 临界值,拒绝H0n 左侧检验:统计量 临界值,拒绝H0假设检验结论的表述假设检验结论的表述1.假设检验的目的就在于试图找到拒绝原假设,而不在于证明什么是正确的2.拒绝原假设时结论是清楚的n例如,H0:m=10,拒绝H0时,我们可以说m103.当不拒绝原
11、假设时n并未给出明确的结论n不能说原假设是正确的,也不能说它不是正确的n例如,当不拒绝H0:m=10,我们并未说它就是10,但也未说它不是10。我们只能说样本提供的证据还不足以推翻原假设假设检验步骤的总结1.陈述原假设和备择假设陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据确定一个适当的检验统计量,并利用样本数据算出其具体数值算出其具体数值4.确定一个适当的显著性水平,并计算出其临界确定一个适当的显著性水平,并计算出其临界值,指定拒绝域值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策将统计量的值与临界
12、值进行比较,作出决策n统计量的值落在拒绝域,拒绝统计量的值落在拒绝域,拒绝H0,否则不拒绝,否则不拒绝H0n也可以直接利用也可以直接利用P值值作出决策作出决策6.2 总体均值的检验总体均值的检验1大样本情形下总体均值的检验大样本情形下总体均值的检验2小样本情形下总体均值的检验小样本情形下总体均值的检验总体均值的检验总体均值的检验(大样本大样本)o 例例1 1:消费者协会接到消费者投诉,指控品牌:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为包装上标明的容量为250250毫升。消费者协会从毫升。消费者协会从
13、市场上随机抽取市场上随机抽取5050盒该品牌纸包装饮品,测试盒该品牌纸包装饮品,测试发现平均含量为发现平均含量为248248毫升,小于毫升,小于250250毫升。这是毫升。这是生产中正常的波动,还是厂商的有意行为?消生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?欺骗了消费者呢?o 在例在例1 1中,按历史资料,总体的标准差是中,按历史资料,总体的标准差是4 4毫毫升。我们通过检验总体均值是否等于升。我们通过检验总体均值是否等于250250毫毫升,来判断饮料厂商是否欺骗了消费者。程升,来判断饮料厂商是否欺骗
14、了消费者。程序如下:序如下:第一步:确定原假设与备选假设。第一步:确定原假设与备选假设。o:=250;:250o 以上的备选假设是总体均值小于以上的备选假设是总体均值小于250毫升,毫升,因为消费者协会希望通过样本数据推断出厂因为消费者协会希望通过样本数据推断出厂商的欺骗行为商的欺骗行为(大于大于250毫升一般不会发毫升一般不会发生生)。因此使用左侧检验。因此使用左侧检验。0Hmm1H第二步:构造出检验统计量第二步:构造出检验统计量o 如果总体的标准差已知,则正态总体如果总体的标准差已知,则正态总体(正常正常情况下,生产饮料的容量服从正态分布情况下,生产饮料的容量服从正态分布)的的抽样平均数,
15、也服从正态分布,对它进行标抽样平均数,也服从正态分布,对它进行标准化变换,可得到:准化变换,可得到:o o 可用可用z作为检验统计量。作为检验统计量。1,00NnXzm第三步:确定显著性水平、拒绝域。o 通常显著水平由实际问题确定,我们这里取通常显著水平由实际问题确定,我们这里取=0.05,左侧检验,拒绝域安排在左边,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值:查标准正态分布表得临界值:o-=-1.645,拒绝域是,拒绝域是z-1.645。z第四步:计算检验统计量的数值。o样本平均数 ,n=50,代入检验统计量得:248X645.154.35042502480nXzm第五步:判断。第
16、五步:判断。o 检验统计量的样本取值落入拒绝域。拒绝原检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明该种纸包饮料的平均容量小于包装盒上注明的明的250毫升,厂商有欺诈之嫌。毫升,厂商有欺诈之嫌。o总体标准差未知时对总体均值检验经常用t统计量:o但是,在大样本场合(样本容量n大于30时),t-统计量与标准正态分布统计量近似,通常用z检验代替t检验。)1(0ntnsXtm总体均值的检验(大样本)o 1.假定条件假定条件n 正态总体或非正态总体大样本正态总体或非正态总体大样本(n 30)2.使
17、用使用z检验统计量检验统计量n 2 已知:已知:n 2 未知:未知:总体均值的检验总体均值的检验(大大样本检验方法的总结样本检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:m=m0H1:mm0H0:mm0H1:mm0统计量统计量 已知:未知:拒绝域拒绝域P值决策值决策拒绝H0nxzm0nsxz0m2/zz zzzz P总体总体均值的检验均值的检验(小样本小样本)总体均值的检验总体均值的检验(小样本小样本)o 1.假定条件假定条件n总体服从正态分布总体服从正态分布n小样本小样本(n 30)2.检验统计量检验统计量n 2 已知:已知:n 2 未知:未知
18、:总体均值的检验总体均值的检验(小小样本检验方法的总结样本检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:m=m0H1:mm0H0:mm0H1:mm0统计量统计量 已知:未知:拒绝域拒绝域P值决策值决策拒绝H0nxzm0nsxt0m)1(2/ntt)1(ntt)1(nttP6.2 总体比例的检验总体比例的检验总体比例检验总体比例检验1.假定条件假定条件n总体服从二项分布总体服从二项分布n可用正态分布来近似可用正态分布来近似(大样本大样本)2.检验的检验的 z 统计量统计量总体比例的检验总体比例的检验(检验方法的总结检验方法的总结)假设假设双侧检验双
19、侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:=0 0H1:0 0H0:0 0H1:0 0统计量统计量拒绝域拒绝域P值决策值决策拒绝拒绝H0P2/zz npz)1(000zzzz 总体比例的检验(例题分析)o【例】【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 =0.05和=0.01,检验该杂志读者群中女性的比例是否为80%?它们的值各是多少?总体比例的检验(例题分析)o H0:=80%o H1:80%o =0.05o n=200o 临界值临
20、界值(c):总体比例的检验(例题分析)o H0:=80%o H1:80%o =0.01o n=200o 临界值临界值(c):例例2:o 某企业声明有某企业声明有30%以上的消费者对其产品以上的消费者对其产品质量满意。如果随机调查质量满意。如果随机调查600名消费者,表名消费者,表示对该企业产品满意的有示对该企业产品满意的有220人。试在显著人。试在显著性水平性水平=0.05下,检验调查结果是否支持下,检验调查结果是否支持企业的自我声明。企业的自我声明。第一步:作出假设第一步:作出假设o 解:。解:。o :=30%,:30%。o 以上的备选假设是企业自我声明的结论,我以上的备选假设是企业自我声明
21、的结论,我们希望该企业说的是实话。因此使用右侧检们希望该企业说的是实话。因此使用右侧检验。验。0H1Ho 第二步:构造第二步:构造z z检验统计量。检验统计量。o 第三步:确定拒绝域。第三步:确定拒绝域。o 显著水平显著水平=0.05=0.05,查标准正态分布表得,查标准正态分布表得o 临界值:临界值:=1.645=1.645,o 拒绝域是拒绝域是z1.645z1.645。zo 第四步:计算检验统计量的数值。第四步:计算检验统计量的数值。o 样本成数样本成数p=220/600=0.37,总体假设的,总体假设的成数成数 =0.3,代入代入z检验统计量得:检验统计量得:0.370.33.510.3
22、 1 0.3/600pzno 第五步:判断。第五步:判断。o 检验统计量的样本取值检验统计量的样本取值z=3.51.645,落入拒绝域。落入拒绝域。o 拒绝原假设,认为样本数据证明该企业声明拒绝原假设,认为样本数据证明该企业声明属实。属实。p-值检验值检验o p-值检验就是通过计算值检验就是通过计算p-值,再将它与显著性水值,再将它与显著性水平平作比较,决定拒绝还是接受原假设。作比较,决定拒绝还是接受原假设。o 所谓所谓p-值就是拒绝原假设所需的最低显著性水平。值就是拒绝原假设所需的最低显著性水平。o p-值判断的原则是:如果值判断的原则是:如果p-值小于给定的显著性值小于给定的显著性水平水平
23、,则拒绝原假设;否则,接受原假设。,则拒绝原假设;否则,接受原假设。o 或者,更直观来说就是:如果或者,更直观来说就是:如果p-值很小,拒绝原假值很小,拒绝原假设,设,p-值很大,不拒绝原假设。请大家注意的是这值很大,不拒绝原假设。请大家注意的是这里的里的p-值是指概率。值是指概率。z检验的检验的p-值:值:o检验统计量为检验统计量为z z统计量的统计量的p-p-值计算公式,值计算公式,表示检验统计量的抽样数据,则表示检验统计量的抽样数据,则p-p-值为:值为:o如果:如果:,p p值值=2 =2 o如果:如果:,p p值值=o如果:如果:,p p值值=0z1H1H1H0mm0mm0mm0zz
24、p 0zzp0zzp 例例3:利用:利用p-值检验重新检验例值检验重新检验例1。o 解:解:o 第一、第二步与例第一、第二步与例1完全相同,故省略之。完全相同,故省略之。o 第三步:计算样本统计的数值。第三步:计算样本统计的数值。o 样本平均数样本平均数 ,n=50,代入检验统,代入检验统计量得:计量得:248X54.350425024800nXzmo第四步:计算第四步:计算p-值。值。o使用左侧检验,使用左侧检验,p-值值=。查标准正态分布表得:查标准正态分布表得:op-值值=1-F(3.54)=(1-0.999 8)=0.000 20zzpo 第五步:判断。第五步:判断。op-p-值小于给出的显著性水平值小于给出的显著性水平(0.05)(0.05),拒绝原假设,接受备选假设,与例拒绝原假设,接受备选假设,与例1 1的的结论相同。结论相同。本章小节1.假设检验的基本问题假设检验的基本问题 2.总体均值的检验总体均值的检验3.总体比例的检验总体比例的检验
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。