1、Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-1第第9章章假设检验基础:单侧检验商务统计学(第5版)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-2学习目标在本章,你将学到在本章,你将学到:n基本的假设检验原理n如何使用假设检验进行均值和比例检验n每种假设检验过程的前提假设,如何评价他们,以及被违反的后果n如何避免假设检验中存在的陷阱n假设检验中的伦理道德问题Basic Business Statistics,11e 2009 Prentice-H
2、all,Inc.Chap 9-3假设是什么?n假设是关于总体 参数的声称(断言):n总体均值n总体比例例例:一个城市的每月电话账单均值一个城市的每月电话账单均值 =$42例例:一个城市成年人拥有手机的比例一个城市成年人拥有手机的比例 =0.68Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-4零假设,H0n检验声称或断言例:在美国每个家庭平均有3台电视机()n是总体参数,不是样本统计量3:H03:H03X:H0Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap
3、 9-5零假设,H0n首先假设零假设是真的n与无罪被证明有罪的概念是相识的n引用现状或历史价值n总是包含“=”,“”或“”n可能被拒绝,也可能不(续)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-6备择假设,H1n零假设的对立面n例,在美国每个家庭的电视机不是3台 (H1:3)n向现状发出挑战n不包含“=”,“”或“”n可能被证明,也可能不n一般是研究者试图去证明的Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-7假设检验过程n断言:总体均值是50n
4、H0:=50,H1:50n抽样并确定样本均值总体样本Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-8假设检验过程n假定样本年龄均值 X=20.n这个比断言的人的年龄均值50低很多n如果零假设是真的,那么得到一个不同的样本均值的概率是非常小的,所以要拒绝零假设n换言之,如果总体均值是50,那么得到一个均值是20的样本是不可能的,你可以推出总体均值一定不是50(续)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-9假设检验过程X的抽样分布 =50如果如果
5、H0是真是真的的几乎不可能得到此处的样本均值拒绝零假设=5020实际上此处是总体均值X(续)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-10检验统计量和临界值n如果样本均值接近于假定的总体均值,零假设不被拒绝n如果样本均值与假定的总体均值相差很大,零假设被拒绝n多大是相差很大,以至拒绝 H0?n检验统计量的临界值为决定“人为地画了一条线”它解答了差距多大是足够大。Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-11检验统计量和临界值临界值“远离”抽
6、样分布的均值检验统计量的抽样分布拒绝域拒绝域非拒绝域Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-12假设检验决策中可能的错误n第一类错误第一类错误 n拒绝真实的零假设n考虑一类严重的错误n发生第一类错误的概率 n称作统计检验的显著性水平n研究者预先设定的n第二类错误第二类错误n没有拒绝错误的零假设n发生第二类错误的概率Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-13假设检验决策中可能的错误可能出现的假设检验结果真实情况统计决策H0为真H0为假不
7、拒绝H0正确决策概率1-第二类错误概率拒绝H0第一类错误概率正确决策概率1-(续)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-14假设检验决策中可能的错误n置信系数(1-)是当H0是真的时候不拒绝的概率。n假设检验的置信水平 是(1-)*100%.n统计检验能力(1-)是当H0是假的时候拒绝的概率(续)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-15第一类与第二类错误的关系第一类与第二类错误不可能同时发生 第一类错误仅在H0是真的时候发生 第二
8、类错误仅在H0是假的时候发生 如果第一类错误的概率(),那么第二类错误的概率()Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-16影响第二类错误的因素n所有其它条件不变,n 当假设参数和真实值 之间的差别n 当 n 当 n 当 n 显著性水平=Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-17显著性水平与拒绝域因为拒绝域位于分布的两侧,称其为双侧检验。H0:=3 H1:3临界值临界值拒绝域拒绝域/20 /2 Basic Business Stati
9、stics,11e 2009 Prentice-Hall,Inc.Chap 9-18均值的假设检验 已知已知 未知未知 的假设检验的假设检验(Z 检验检验)(t 检验检验)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-19均值的Z假设检验(已知)n把样本统计量()转换为 ZSTAT 检验统计量 X检验统计量是:nXSTATZ Known Unknown 的假设检验的假设检验 已知已知 未知未知(Z 检验检验)(t 检验检验)Basic Business Statistics,11e 2009 Prentice-Hall,
10、Inc.Chap 9-20假设检验的临界值方法n均值的双侧检验,已知:n把样本统计量()转换为检验统计量(ZSTAT)n对于表格或计算机指定的显著性水平,确定Z临界值n决策规则:如果检验统计量落入拒绝域里,则拒绝 H0;否则不拒绝H0 XBasic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-21不拒绝 H0拒绝H0拒绝 H0n有两个截断值(临界值),定义拒绝域 双侧检验/2-Z/20H0:=3 H1:3+Z/2/2下限临界值上限临界值3ZXBasic Business Statistics,11e 2009 Prentice-H
11、all,Inc.Chap 9-22假设检验的6个步骤1.写出零假设 H0和备择假设H12.选择显著性水平,样本容量n3.确定适应的检验统计量与样本分布4.找出将拒绝域与非拒绝域分开的临界值Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-23假设检验的6个步骤5.收集数据并计算检验统计量的值6.作出统计决策并且得出管理性结论。如果检验统计量落入非拒绝域,不拒绝零假设H0。如果检验统计量落入拒绝域,则拒绝零假设。在实际问题中得出管理性结论。(续)Basic Business Statistics,11e 2009 Prenti
12、ce-Hall,Inc.Chap 9-24假设检验例子检验在美国每个家庭的电视机台数均值是检验在美国每个家庭的电视机台数均值是3的断言。的断言。(假定假定 =0.8)1.写出零假设和备择假设nH0:=3 H1:3 (双侧检验)2.指定目标显著性水平和样本容量n假设此检验 =0.05,n=100Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-25 2.0.08.161000.832.84nXSTATZ假设检验例子3.确定适当的方法n假设已知,则使用Z检验。4.确定临界值n对应于=0.05,Z临界值是 1.965.收集数据并计
13、算检验统计量n假设样本结果是n=100,X=2.84 (=0.8是假设已知的)所以检验统计量是:(续)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-26拒绝 H0不拒绝 H0n6.检验统计量是否落入拒绝域?/2=0.025-Z/2=-1.960拒绝 H0,如果 ZSTAT 1.96;否则不拒绝 H0假设检验例子(续)/2=0.025拒绝 H0+Z/2=+1.96其中,ZSTAT=-2.0 -1.96,所以检验统计量在拒绝域里Basic Business Statistics,11e 2009 Prentice-Hall,
14、Inc.Chap 9-276 (续).作出并解释结论-2.0因为ZSTAT=-2.0 -1.96,拒绝零假设并有足够的证据得出在美国每个家庭中电视机台数不是3假设检验例子(续)拒绝 H0不拒绝 H0=0.05/2-Z/2=-1.960=0.05/2拒绝 H0+Z/2=+1.96Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-28假设检验的p值方法np值:在H0 是真的情况下,使得某一检验统计量等于或者大于样本结果的概率np值也称作观察到的显著性水平n它是拒绝H0的最小 值 Basic Business Statistics
15、,11e 2009 Prentice-Hall,Inc.Chap 9-29假设检验的p值方法:解释p值n将p值与 进行对比n如果p值 ,拒绝H0n如果p值 ,不拒绝H0n牢记n如果p值低,则H0可行。Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-30p值假设检验的5个步骤1.写出零假设H0和备择假设H12.选择显著性水平,样本容量n3.确定适应的检验统计量和样本分布4.收集数据并计算检验统计量的值和p值5.作出统计决策并得出管理性结论。如果p值,则拒绝H0,否则不拒绝H0。在具体问题中将管理性决策表述出来。Basic B
16、usiness Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-31p值假设检验的例子检验在美国每个家庭的电视机台数均值是检验在美国每个家庭的电视机台数均值是3的断言。的断言。(假定假定 =0.8)1.写出零假设和备择假设nH0:=3 H1:3 (双侧检验)2.指定目标显著性水平和样本容量n假设此检验 =0.05,n=100Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-32 2.0.08.161000.832.84nXSTATZp值假设检验的例子3.确定适当的方法n假设已知,则使
17、用Z检验。4.收集数据并计算检验统计量和p值n假设样本结果是n=100,X=2.84 (=0.8 是假设已知的)所以检验统计量是:(续)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-33p值假设检验的例子:计算p值4.(续)计算p值。n如果H0是真的,有多大可能使得ZSTAT为-2(或以任一方向更远离均值0)?p值值=0.0228+0.0228=0.0456P(Z 2.0)=0.0228Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-34n5.p值?
18、n因为p值=0.0456 所以不拒绝H0两侧t检验在p值应用的例子(Minitab)One-Sample T Test of mu=168 vs not=168 N Mean StDev SE Mean 95%CI T P25 172.50 15.40 3.08 (166.14,178.86)1.46 0.157p值 所以不拒绝H0Basic Business Statistics,11e 2009 Prentice-Hall,Inc.双侧检验和置信区间的联系n令 X=172.5,S=15.40和n=25,的置信度是95%的置信区间是:172.5 -(2.0639)15.4/25 172.5
19、+(2.0639)15.4/25 166.14 178.86n因为此区间包含假设均值(168),所以我们在显著性水平 =0.05下不拒绝零假设。Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-44单侧检验n在有些情况下,备择假设集中于某一特定的方向H0:3 H1:3这是一个左尾检验,因为备择假设集中于均值3以下这是一个右尾检验,因为备择假设集中于均值3以上Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-45拒绝 H0不拒绝 H0n由于拒绝区域只有一个尾
20、部,故仅有一个临界值。左尾检验-Z 或-t0H0:3 H1:3n由于拒绝区域只有一个尾部,故仅有一个临界值。临界值Z 或或tX_Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-47例子:右尾t均值检验:(未知)一个电话公司的管理者认为顾客每月的话费账单在增加,现在已经超过了每月$52。公司希望去检验这个断言。(假定是正态总体)H0:52 平均值每月不超过$52H1:52 平均值每月超过$52(即,有足够的证据证明管理者的断言)形成假设检验:Basic Business Statistics,11e 2009 Prentic
21、e-Hall,Inc.Chap 9-48拒绝 H0不拒绝 H0 =0.101.3180拒绝拒绝 H0拒绝 H0,如果 tSTAT 1.318例子:确定拒绝域(续)n假设此检验=0.10,n=25。确定拒绝域:Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-49获得检验统计量的样本值并计算检验统计量假设所取的样本有如下结果:n=25,X=53.1,and S=10 n故检验统计量是:0.5525105253.1nSXtSTAT例子:检验统计量(续)Basic Business Statistics,11e 2009 Pren
22、tice-Hall,Inc.Chap 9-50拒绝 H0不拒绝 H0例子:决策 =0.101.3180拒绝拒绝 H0不拒绝不拒绝H0,因为,因为tSTAT=0.55 1.318 没有足够的证据表明话费均值超过$52tSTAT=0.55作出决策并解释结论:(续)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-51例子:p值检验的使用n计算p值并与 进行对比(使用excel计算的p值见下页的表)拒绝 H0 =.10不拒绝 H01.3180拒绝拒绝 H0tSTAT=.55p值值=.2937不拒绝不拒绝 H0,因为,因为p值值=.
23、2937 =.10Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-52右尾t检验的p值计算表Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-53比例的假设检验n涉及绝对变量n两种可能的结果n具有成功的特性n不具有成功的特性n总体成功数的部分或比例表示成Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-54比例n样本的成功数比例表示成pn n当n和n(1-)都大于5,p将接近于正态分布
24、,均值和标准差如下:n Xpn样本中的成功数样本容量pn)(1p(续)Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-55np的抽样分布接近于正态分布,所以检验统计量是ZSTAT 值:比例的假设检验n)(1pSTATZn 5和和n(1-)5p的假设检验的假设检验n 5或或n(1-)5本章不讨论Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-56n一种最终的等价形式,用成功数表示,X:用成功数表达的比例Z检验)(1nnXSTATZX 5和和n-X 5X假
25、设检验假设检验X 5或或n-X 5本章不讨论Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-57例子:比例Z检验 一个销售公司宣称它的邮件有8%收到了回复。为了检验这个断言,一个容量为500的随机样本,回复为25。在显著性水平为=0.05进行检验。核查:n =(500)(.08)=40n(1-)=(500)(.92)=460Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-58比例Z检验:求解 =0.05 n=500,p =0.05拒绝H0,=0.05时
26、H0:=0.08 H1:0.08临界值临界值:1.96检验统计量:检验统计量:决策决策:结论结论:z0拒绝拒绝拒绝拒绝.025.0251.96-2.47有足够的证据拒绝公司8%回复的断言。2.47500.08).08(1.08.05n)(1pSTATZ-1.96Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-59不拒绝 H0拒绝拒绝 H0拒绝拒绝 H0/2=.0251.960Z=-2.47计算p值并与 进行对比 (对于双侧检验,p值总是位于两侧)(续)0.01362(0.0068)2.47)P(Z2.47)P(Zp值值=0
27、.0136:p值求解拒绝拒绝H0,因为,因为p值值=0.0136 =0.05Z=2.47-1.96/2=.0250.00680.0068Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-60潜在缺陷与道德n使用随机选择的数据以便减少选择性偏差n在没有同意的情况下,不进行研究n在收集数据前,选择显著性水平,及检验类型(单侧或两侧)n所有的相关的都应在报告中报告,包括统计意义和现实重要性Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-61小结n假设检验方法的使用n学习均值Z检验(已知)n讨论了假设检验的临界值法和p值法n学习单侧和双侧检验Basic Business Statistics,11e 2009 Prentice-Hall,Inc.Chap 9-62小结n学习均值t检验(未知)n学习比例Z检验n讨论缺陷和道德问题(续)