1、第八章第八章 单总体假设检验单总体假设检验第一节第一节大样本假设检验大样本假设检验p 根据大样本假定根据大样本假定(n(n 50)50),样本均值,样本均值X X趋趋于正态分布:于正态分布:p p 其中:其中: 总体均总体均值;值; p 2 2总体方差。当总体方差。当 2 2未知时,可用样本方差未知时,可用样本方差S S2 2代替,代替, 2 2 S S2 2;p nn样本容量。样本容量。 一、大样本总体均值检验一、大样本总体均值检验),(2nNxp 标准值:标准值: ,p 该值当原假设该值当原假设H H0 0: = = 0 0 成立的条件下,可以成立的条件下,可以唯一地为样本组所确定,唯一地
2、为样本组所确定,因此,大样本总体均值检因此,大样本总体均值检验所用统计量为:验所用统计量为:) 10(,NnSxnsXZ0 有了统计量有了统计量Z Z,再根据显著性水平,再根据显著性水平 就可就可以对大样本均值检验作如下归纳:以对大样本均值检验作如下归纳:p ( (一一) ) 原假设为:原假设为:H H0 0: = = 0 0,p ( (二二) ) 研究假设研究假设H H1 1,p 单边:单边:H H1 1: 0 0,或,或H H1 1: Z(H1:0) Z2Z2 2 例例1 1:为了验证统计报表的正确性,作了共:为了验证统计报表的正确性,作了共5050人的抽样调查,人的抽样调查,人均收入人均
3、收入 结果有:结果有:X=871X=871元,元,S=21S=21元,问能否证明统计报表中元,问能否证明统计报表中人均收入人均收入 =880=880元是正确的。元是正确的。( (显著性水平显著性水平 =0.05)=0.05)解:依题意,可作如下假设 H0:=880 元 H1:880 元 则有统计量nSxnxZ00 03. 35021880871Z 因为=0.05,双端检验,查表得2Z=1.96 而|Z|=3.031.96,所以拒绝原假设,即不能认为人均收入 880 元是正确的。 例例2 2:接上题,如果根据以上的样本资料,但却采:接上题,如果根据以上的样本资料,但却采用区间估计的方法,试问是否
4、也能作出对原有假设用区间估计的方法,试问是否也能作出对原有假设H H0 0: =880=880的判断?的判断?解:已知样本值:x =871 元,S=21 元 1-=1-0.05=95% 2Z=1.96 可以计算出置信度为95%的区间估计值 ,nZx2nZx2=871-502196. 1, 871+502196. 1 =871-5.82,871+5.72=865.18,876.82 现在根据小概率原理来推论总体=880 是否成立。 显然,如果总体均值为 880 元,则 95%的置信区间应该包括 880 元。而现在区间没有包括,即出现了小概率事件,故推翻原假设。 例例3 3:如果真实总体的如果真实
5、总体的 =870=870元,求接受原假设元,求接受原假设H H0 0: =880=880元时所犯第二类元时所犯第二类( (纳伪纳伪) )错误错误 的的值。值。p 解:根据原假设解:根据原假设H H0 0: : =880(=880(元元) ),S=21(S=21(元元) ),1-1- =0.95=0.95,n=50n=50,作,作X X的分布图的分布图A A,并求出接受域,并求出接受域的临界值。的临界值。18.874502196. 18802X82.885502196. 18802X 同理,根据真实总体同理,根据真实总体 =870 =870 ,作,作X X的分布图的分布图(B)(B),于,于是对
6、于真实总体是对于真实总体 =870=870元来说,样本均值元来说,样本均值 X874.18X874.18的的部分部分( (阴影部分阴影部分) )都将误认为都将误认为 =880=880元,这部分面积就是元,这部分面积就是犯第二类错误犯第二类错误 的数值:的数值: Z Z1 1= =1.41 Z=1.41 Z2 2= = (z(z2 2)- )- (z(z1 1) ) 0.5-0.5- (1.41)=0.5-0.4207=0.0793(1.41)=0.5-0.4207=0.0793 它表示,如果真实总体它表示,如果真实总体 =870=870,而原假设为,而原假设为H H0 0: =880=880的
7、话,那么平均而言,每的话,那么平均而言,每100100次抽样中,将约有次抽样中,将约有8 8次当作次当作 =880=880而被接受。而被接受。50218708 .87459. 5502187082.885二、大样本总体成数检验二、大样本总体成数检验p 前面已谈到,定类的二分变量,当赋于以下前面已谈到,定类的二分变量,当赋于以下的数值后:的数值后:p 1 1p q qi i= p 0 0p 成数实际可以看作是一种特殊的均值,总体成数实际可以看作是一种特殊的均值,总体成数成数P P就是二分变量的总体均值:就是二分变量的总体均值:P=P= ;样本成数;样本成数就是二分变量的样本均值:就是二分变量的样
8、本均值:X X。 在大样本情况下:在大样本情况下:(np(np 5 5和和n(1-p)n(1-p) 5)5),样本成数,样本成数 趋向正态分布趋向正态分布: n(p: n(p,2 2) ),其中:,其中:PP总体成数,总体成数,nn样本容量。则:样本容量。则:p标准化:标准化: N(0,1)N(0,1)p p 该值当原假设该值当原假设H H0 0:P=PP=P0 0的条件下,可以唯一的条件下,可以唯一地为样本值所确定。因此,大样本总体成数检验地为样本值所确定。因此,大样本总体成数检验所用的统计为:所用的统计为:p ppnppppppZp)1 ( nppppZ)1 (000nppnpQp)1 (
9、2 有了统计量有了统计量Z Z和显著性和显著性 ,可以类比,可以类比总体均值的讨论,作如下归纳:总体均值的讨论,作如下归纳: 1. 原假设:H0:P=P0 2. 研究假设:H1: 单边 H1:PP0 或:H1:PZ (H1:pp0) 2. Z-Z (H1 : p2Z 2 2 2Z 2Z 例例4 4:某地区成年人中吸烟占某地区成年人中吸烟占75%75%,经过戒烟宣传,经过戒烟宣传之后,抽样调查发现之后,抽样调查发现100100名被调查的成人中,有名被调查的成人中,有6363人是人是吸烟者。问戒烟宣传是否收到了成效。吸烟者。问戒烟宣传是否收到了成效。( ( =0.05)=0.05) 解 : H0
10、: P=0.75 H1: P0.75 nppppZ)1(000 =77.20433.012.0100)75.01(75.075.010063 =0.05 -Z0.05=-1.65 因 为 Z=-2.77-Z0.05=-1.65所 以 , 否 定 原 假 设 P=0.75, 即 可 以 认 为 戒 烟 宣 传 收到 了 成 效 , 吸 烟 比 例 有 所 下 降 。 P0 或Z (Hi:0) :Z- Z(H1: 0) Z Z双 边 : :Z2Z或 Z0 H1:0 双边 H1:0 统计量:t=) 1(0ntnsx 拒绝域:拒绝域: 单边::t0) t(n-1) t- t(H1: t0 .0 5(9
11、 -1 )= 1 .8 6所 以 拒 绝 H0, 接 受 H1, 即 可 以 认 为 该 地 区 的平 均 初 婚 年 龄 已 超 过 了 2 0 岁 ( = 2 .5 )二、单正态总体方差检验二、单正态总体方差检验在 实 际 工 作 中 , 有 时 须 检 验 总 体 的 方 差 2。对 于 单 正 态 总 体 , 检 验 方 差 所 用 的 统 计 量为 自 由 度 K = n -1 的 X2分 布)1(1222nxsn 其 中 : S2 样 本 方 差 n 样 本 容 量检 验 步 骤 有 :1 原 假 设 : H0: 2 =022 研 究 假 设 : H1 :3 统 计 量 x2=)1
12、()1(2220nxsn4 4拒绝域拒绝域单边:X2X2(H1:2 02) 或 X2X21-( H1:2 X22或 X2X=25.27X2 2(1-0.01)=14.3(1-0.01)=14.3 X2(29) 0.01 X2(1-0.01)=14.3所以接受H0、否定H1,即该研究人员的看法不能被证实(a=0.01)总结总结 条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:=0 H1:0z(2) H0: = 0 H1:0(3) H0: = 0 H1: 0z0z0正态总正态总体体2已已知知(n30)nXZ022 总体均值的检验总体均值的检验条件条件检验条件量检验条件量拒绝域拒绝域
13、H0、H1(1) H0:=0 H1:0(2) H0: = 0 H1:0(3) H0: = 0 H1:000nsxt00正态总正态总体体2未未知知(n30)总体均值的检验总体均值的检验22条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:=0 H1:0(2) H0: = 0 H1:0(3) H0: = 0 H1: 0 nxZ0nSxZ0非正态非正态总体总体n302已知已知或未知或未知总体均值的检验总体均值的检验22条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:P=P0 H1:PP022z(2) H0:PP0 H1:PP0(3) H0:PP0 H1:PP0zZ0zZ02Z2Z0np5nq5nqpppZ000总体成数的检验总体成数的检验