1、统计学贾俊平第章 假设检验1第8章 假设检验8.1 假设检验的问题8.2 单个总体的假设检验8.3 两个总体的假设检验8.4 假设检验的进一步讨论统计学贾俊平第章 假设检验2需要无罪证明的证明引例引例统计学贾俊平第章 假设检验3引例 引例1:再谈女士品茶 在实验中,那位女士被奉上一连串的已经调制好的茶,其中,有的是先加茶有的先加奶,各占一半 情形一:如果只给那位女士一杯茶,那么即使她没有区分能力,她也有50%的机会猜对。如果给两杯茶,她仍可能猜对。事实上,如果她知道两杯茶分别以不同的方式调制,她可能一下子全部猜对(或全部猜错) 情形二:这位女士能做出区分,她仍然有猜错的可能。或者是其中的一杯与
2、奶没有充分地混合,或者是泡制时茶水不够热。即便这位女士能做出区分,也很有可能是奉上了10杯茶,她却只是猜对了其中的9 杯统计学贾俊平第章 假设检验4引例 引例2:维生素真相(见BBC视频) 2007年2月28日出版的国际权威医学杂志美国医学会杂志发表了一项由多国研究人员共同完成的研究。这项研究显示,服用维生素E死亡率增加4%,服用茁胡萝卜素死亡率增加7%,服用维生素A死亡率增加16%,没有证据表明维生素C能延年益寿统计学贾俊平第章 假设检验5统计学贾俊平第章 假设检验68.1 假设检验的一般问题统计学贾俊平第章 假设检验7 假设检验的基本思想 假设的陈述 两类错误与显著性水平 检验统计量与拒绝
3、域 检验中的P值统计学贾俊平第章 假设检验8假设检验的基本思想 什么是假设 (hypothesis) ? 对总体参数的具体数值所作的陈述 总体参数包括总体均值、比率、方差等 分析之前必须陈述我认为这种新药的疗效比原有的药物更有效!统计学贾俊平第章 假设检验9假设检验的基本思想假设检验 (hypothesis testing)n先给予总体未知参数一个假设值,再利用样本或实验结果来推断此假设的可信度。n逻辑上采用反证法,依据统计上的小概率原理n概率证伪统计学贾俊平第章 假设检验10假设检验的基本思想小概率原理小概率原理n在一次试验中,一个几乎不可能发生称为小概率事件n在一次试验中小概率事件一旦发生
4、,我们就有理由拒绝原假设n小概率的大小一般由研究者事先确定统计学贾俊平第章 假设检验11假设检验的基本思想Identify the PopulationAssume thepopulation平均 GPA(学分绩点) is 3.5( )REJECTTake a SampleNull HypothesisNo, not likely!X2.4 likely if Is 3.5?2.4X 0:3.5H统计学贾俊平第章 假设检验12假设检验的基本思想 = 3.5不太可能得到这个样本均值 .如果事实上,这正是总体的均值. 因此我们拒绝原假设 = 3.5. 的抽样分布的抽样分布2.4如果如果 H0 为真
5、为真XX统计学贾俊平第章 假设检验13假设的陈述 原假设和备择假设 原假设?(null hypothesis)稻草人 待检验的假设,又称“0假设” 研究者想收集证据予以反对的假设 总是有等号 , 或 表示为 H0例如, H0: 某特定值若为不等式(或 )也可写为= 例 H0: 3.5统计学贾俊平第章 假设检验14假设的陈述备择假设 (alternative hypothesis)与原假设对立的假设,也称“研究假设”这与原假设为互斥研究者想收集证据予以支持的假设。总是有不等号: , 或 表示为 H1例如,H: 某特定值如 H: ”或“”的假设检验,称为单侧检验或单尾检验(one-tailed t
6、est)l备择假设的方向为“”,称为右侧检验右侧检验 统计学贾俊平第章 假设检验25双侧检验和单侧检验例析:n一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立l研究者总是想证明自己的研究结论(寿命延长)是正确的l备择假设的方向为“”(寿命延长)l建立的原假设与备择假设应为 H H0 0: : 1500 H 1500 H1 1: : 1500 1500统计学贾俊平第章 假设检验26双侧检验和单侧检验n一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立l研究者总是想证明自己的研究结论(废品率降低)是正确的l备择假设
7、的方向为“”(废品率降低)l建立的原假设与备择假设应为 H H0 0: : 2% H2% H1 1: : 2% 2%统计学贾俊平第章 假设检验27双侧检验和单侧检验n某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验l检验权在销售商一方l作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不正确的l备择假设的方向为“”(寿命不足1000小时)l建立的原假设与备择假设应为 H H0 0: : 1000 H 1000 H1 1: : 10001000统计学贾俊平第章 假设检验28双侧检验和单侧检验假设研究的问题双侧检验左侧检验
8、右侧检验H0 = 0 0 0H1 0 0统计学贾俊平第章 假设检验29两类错误与显著性水平两类错误n统计检验有点像法院审案,在样本数据(证据)还没有充分显示嫌疑人“有罪”之前,我们暂且假定原假设为:嫌疑人“无罪”n在法院的审判中有两种可能的错误:无罪的人被误判为有罪,有罪的人被无罪释放统计学贾俊平第章 假设检验30两类错误与显著性水平(续) 与法院审判类似,检验也有两种犯错的可能:null hypothesis在正确的情况下被推翻(type I error错杀无辜)及null hypothesis不正确但没有被拒绝(type II error放纵坏人) “辛普森杀妻案” “聂树斌案”统计学贾俊
9、平第章 假设检验31H0: 无罪无罪陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0 检验决策实际情况H0为真H0为假未拒绝H0正确决策(1 a第类错误(b 拒绝H0第类错误(a 正确决策(1-b 假设检验就好像一场审判过程假设检验过程两类错误与显著性水平统计学贾俊平第章 假设检验32第一类错误和第二类错误n第一类错误(弃真错误)l原假设为真时拒绝原假设l第一类错误的概率为a,即显著性水平l( a )则置信水平两类错误与显著性水平统计学贾俊平第章 假设检验33 第二类错误(取伪错误) 原假设为假时没有拒绝原假设 第二类错误的概率为b (Beta) The power of the t
10、est is (b)为假)绝域检验统计量落入无法拒为假)不拒绝错误)型000H(PHH(PII(Pb两类错误与显著性水平统计学贾俊平第章 假设检验34例析nUSA Today报导在美国非法赌博的金额至少平均每人每年$200,你觉得这个数字太过于夸张,因此找了n个人的样本来估计每年非法赌博的平均金额。你想要检验的假设为:H0:$200H1: 临界值,拒绝H0l左侧检验:统计量 临界值,拒绝H0统计学贾俊平第章 假设检验59检验统计量与拒绝域n注意l根据样本所提供的信息,我们面临两种可能的决定: 拒绝null hypothesis (rejecting H0) 无法拒绝null hypothesi
11、s (not rejecting H0)l有人会说接受accepted null hypothesis,不过较为正确的说法应该是无法拒绝或无法推翻H0统计学贾俊平第章 假设检验60假设检验中的值P 值(P-value)的缘起n在假设检定中,我们通常会事先决定显著水平,然后根据决定之后的值找出拒绝域及接受域n但在很多的情况下,我们无法预估type I 错误及type II错误的成本,因此无法确定合意的值。所以有时候我们直接指出得到观察统计量的概率统计学贾俊平第章 假设检验61假设检验中的值P 值n如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率l左侧检验时,P-值为曲线上方小于等于小
12、于等于检验统计量部分的面积l右侧检验时,P-值为曲线上方大于等于大于等于检验统计量部分的面积n被称为观察到( the observed significant level)的显著性水平统计学贾俊平第章 假设检验62假设检验中的值nP-value 告诉我们:如果零假设为真,我们观察到目前数据显示的检验统计量的概率有多高?如果这个概率很小,则我们可以拒绝零假设,因为如果假设为真,则仅有很小的概率抽取任意的随机样本会得到目前的观察值nP-value是不仅止于告诉我们在某一显著水平下是否拒绝H0,如果我们知道P-value = .002则我们知道H0不但在.05的显著水平下会被拒绝,在.005的水平下
13、也会被拒绝统计学贾俊平第章 假设检验63假设检验中的值 如果仅知道P-value =.04,则是否拒绝H0可以由读者来决定,如果某一研究人员决得.01才算显著,则H0不会被拒绝,如果将显著水平置于.05,则拒绝 一般在研究报告中,研究者经常直接写出p-value而让读者自己去决定是否要拒绝H0 一些证据:P.010 适度证据:P.005 很强证据:P.001统计学贾俊平第章 假设检验64假设检验中的值a/ 2 a/ 2 Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值n双侧检验统计学贾俊平第章 假设检验65假设检验中的值H0值临界值a样本统计量拒绝域
14、抽样分布1 - a置信水平计算出的样本统计量P 值n左侧检验统计学贾俊平第章 假设检验66假设检验中的值n右侧检验统计学贾俊平第章 假设检验67小结:假设检验的步骤临界值方法P值方法第1步 确定零假设和备择假设第1步 确定零假设和备择假设第2步 抽取随机样本第2步 抽取随机样本第3步 确定适当检验统计量并用样本 数据计算其具体值第3步 确定检验统计量的值第4步 确定显著性水平,计算临界值 及拒绝域第4步 计算P值第5步 比较检验统计量的值与临界 值,决定拒绝还是无法拒绝原 假设第5步 比较P值和,如果小于则拒绝原假设,否则无法拒绝第6步 给出假设检验的结论第6步 给出假设检验的结论统计学贾俊平
15、第章 假设检验688.2 单个总体的假设检验统计学贾俊平第章 假设检验69Z 检验(单尾和双尾) t 检验(单尾和双尾)Z 检验(单尾和双尾) 检验(单尾和双尾)均值单个总体比例方差统计学贾俊平第章 假设检验70单个总体均值检验总体 是否已知?用样本标准差S代替 t 检验nSXt0样本容量nz 检验 nXZ0z 检验nSXZ0统计学贾俊平第章 假设检验71单个总体均值检验总体均值的检验 (2 已知,或2未知但大样本)n假定条件l总体服从正态分布l若不服从正态分布, 可用正态分布来近似(n30)n使用Z-统计量l2 已知:l2 未知:)1 ,0(0NnXZ)1 ,0(0NnSXZ统计学贾俊平第章
16、 假设检验72单个总体均值检验n例解(2 已知)Does an average box of cereal contain 368 grams of cereal? A random sample of 25 boxes showed = 372.5. The company has specified to be 15 grams and the distribution to be normal. Test at the a 0.05 level.l368 gm.H0: 368 H1: 368统计学贾俊平第章 假设检验73单个总体均值检验Z01.96.025Reject-1.96.0251
17、.50X368XX372.5Reject0:368H1:368H统计学贾俊平第章 假设检验74单个总体均值检验372.53681.501525XZna = 0.05n = 25临界值: 1.96检验统计量: 决策:结论:Do Not Reject at a = .05.Z01.96.025Reject-1.96.025H0: 368 H1: 3681.50Insufficient Evidence that True Mean is Not 368.统计学贾俊平第章 假设检验75单个总体均值检验n值解法(p-Value = 0.1336) (a a = 0.05) Do Not Reject.
18、01.50ZRejecta a = 0.051.96p-Value = 2 x 0.0668Test Statistic 1.50 is in the Do Not Reject RegionReject统计学贾俊平第章 假设检验76单个总体均值检验n例解(2未知但大样本)l某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (a0.05)统计学贾俊平第章 假设检验77单个总体均值检验H0: 1
19、200H1: 1200a = 0.05n = 100临界值(s):检验统计量: 在 a = 0.05的水平上不能拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:5 . 1100300120012450nxzZ0拒绝域0.051.645统计学贾俊平第章 假设检验78单个总体均值检验总体均值的检验(2未知小样本)n假定条件l总体为正态分布l2未知,且小样本n使用t 统计量) 1(0ntnSXt统计学贾俊平第章 假设检验79单个总体均值检验n例解l某汽车制造商宣称该公司一款低价车肇事平均修车费低于等于$200。消费者基金会认为修车费高于此数值,欲检证下列假设:H0: u u0 H1:
20、u u0l消费者基金会不愿在证据不充分的条件下,随意驳斥制造商的宣称,因此将假设检定的显著水平a严格地定在1%。因为检证肇事修车的成本甚高,因此消基会仅找了9个样本点,发现:245, 305, 175, 250, 280, 160, 250, 195, 210统计学贾俊平第章 假设检验80单个总体均值检验H0: 200H1: 200a = 0.0n = 100临界值(s): t.01,8 =2.896检验统计量: 在 a = 0.01的水平上不能拒绝H0不能认为收费较高决策:Z0拒绝域0.012.896896. 286. 19/35.48200230/0nsuxt统计学贾俊平第章 假设检验81
21、单个总体均值检验n例解l一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(a = 0.05)统计学贾俊平第章 假设检验82单个总体均值检验H0: 40000H1: 40000a = 0.05df = 20 - 1 = 19临界值(s):检验统计量: 在a = 0.05的水平上不能拒绝H0有证据表明轮胎使用寿命显著地大于40000公里决策: 结论: 894.
22、 020500040000410000nsxt-1.7291t0拒绝域.05统计学贾俊平第章 假设检验83单总体比率检验单总体比率检验n假定条件l有两类结果l总体服从二项分布l可用正态分布来近似n比例检验的 Z 统计量) 1 , 0()1 (000NnPZ统计学贾俊平第章 假设检验84单总体比率检验n例析lA marketing company claims that a survey will have a 4% response rate. To test this claim, a random sample of 500 were surveyed with 25 responses.
23、 Test at the a = .05 significance level.Check:500 .0420 51500 1 .04 4805npnp统计学贾俊平第章 假设检验85单总体比率检验0.05临界值: 1.961.1411.05.041.14111.04 1 .04500SppZppna = .05n = 500Do not reject at a = .05.H0: p .04 H1: p .04检验统计量:决策:结论:Z0RejectReject.025.0251.96-1.96We do not have sufficient evidence to reject the c
24、ompanys claim of 4% response rate.SP0.04统计学贾俊平第章 假设检验86单总体比率检验(p-Value = 0.2538) (a = 0.05) Do Not Reject.01.1411ZRejecta = 0.051.96p-Value = 2 x .1269Test Statistic 1.1411 is in the Do Not Reject RegionRejectn值解法统计学贾俊平第章 假设检验87单总体方差检验单总体方差的检验(2 检验)n检验单个总体的方差或标准差n假设总体近似服从正态分布n检验统计量样本方差假设的总体方差) 1() 1
25、(22022nSn统计学贾俊平第章 假设检验88单总体方差检验n例解l某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (a a=0.05=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1统计学贾俊平第章 假设检验89单总体方差检验H0:
26、2 = 1H1: 2 1a = 0.05df = 25 - 1 = 24临界值(s):统计量: 在 a = 0.05的水平上不能拒绝H0不能认为该机器的性能没有达到设计要求 2039.3612.40a /2 =.05决策:结论:8 .201866. 0) 125(s ) 1n(2022统计学贾俊平第章 假设检验908.3 两个总体的假设检验统计学贾俊平第章 假设检验91两个总体的检验Z 检验(大样本)t 检验(小样本)t 检验(小样本)Z 检验F 检验独立样本配对样本均值比率方差统计学贾俊平第章 假设检验92两总体均值的检验假设研究的问题没有差异有差异均值1 均值2均值1 均值2H0 1 2
27、= 0 1 2 0 1 2 0H1 1 20 1 2 0统计学贾俊平第章 假设检验93两总体均值的检验独立样本(12、 22 已知)n假定条件l两个样本是独立的随机样本l两个总体都是正态分布l若不是正态分布, 可以用正态分布来近似(n130和 n230)n检验统计量为) 1 , 0(Nnn)()XX(Z2221212121统计学贾俊平第章 假设检验94两总体均值的检验 当样本n30时,两样本均值的抽样分布为近似正态分布121/n11X222/n22X1- 2222121nn布样分的抽XX21统计学贾俊平第章 假设检验95两总体均值的检验) 1 , 0(Nnsns)()XX(Z222121212
28、1) 1 , 0(Nnn)()XX(Z2221212121独立样大样本 (12、 22 未知,)n如果是大样本(n30),则我们可以用样本方差s2來取代未知的总体方差2。统计学贾俊平第章 假设检验96两总体均值的检验n例解l(P&G)公司宣布含氟牙膏Crest可以防止蛀牙,为了检证此一假设,我们找了一群牙齿健康状况相同的十岁小朋友,将之分成用含氟及用普通牙膏两组,观察一年后纪录其蛀牙状况l假设从用普通牙膏的小朋友中取100个随机样本,其蛀牙平均值为4.8颗,方差为s12=1.1颗。在从用含氟牙膏的小朋友中取120独立样本,计算其平均蛀牙数为3.6颗,方差为s22=0.9颗,在显著水平5%下检定
29、上述的假说统计学贾俊平第章 假设检验97两总体均值的检验(续) 0:against 0 :211210uuHuuHReject H02221212121nsns)()XX(Z1209 . 01001 . 10)(21XXZ645. 182. 81209 . 01001 . 10)6 . 38 . 4(Z统计学贾俊平第章 假设检验98两总体均值的检验n例解lIs there evidence to conclude that the average monthly charge in the entire population of American Express Gold Card memb
30、ers is different from the average monthly charge in the entire population of Preferred Visa cardholders?212 = 452 =x1200=nVisa Preferred :1 Population111185 = 523 =x800=nCard Gold :2 Population222统计学贾俊平第章 假设检验99两总体均值的检验cesignifican of levelcommon any at rejected is 0H0 -7.926)p(z :value-p926. 796. 8
31、712346.80718002185120022120)523452(2221210)21()21(021:1H021:0Hnnxxz统计学贾俊平第章 假设检验100两总体均值的检验独立小样本( )n检验具有等方差的两个总体的均值n假定条件l两个样本是独立的随机样本l两个总体都是正态分布l两个总体方差未知但相等 n检验统计量21212111)()(nnSXXtp其中:2) 1() 1(212222112nnSnSnSp统计学贾俊平第章 假设检验101两总体均值的检验 NYSE NASDAQNumber 21 25Sample Mean 3.27 2.53 Sample Std Dev 1.30
32、 1.16 Assuming equal variances, isthere a difference in average yield (a a = 0.05)? 1984-1994 T/Maker Co.n例解lYoure a financial analyst for Charles Schwab. Is there a difference in average dividend yield between stocks listed on the NYSE & NASDAQ? You collect the following data:统计学贾俊平第章 假设检验102两总体均值的
33、检验p-Value 2(p-Value is between .02 and .05) (a = 0.05) Reject.02.03ZRejecta 2.0154is between .01 and .025Test Statistic 2.03 is in the Reject RegionReject-2.0154=.025n值解法统计学贾俊平第章 假设检验103两总体均值的检验H0: 1 - 2 = 0 i.e. (1 = 2)H1: 1 - 2 0 i.e. (1 2)a = 0.05df = 21 + 25 - 2 = 44临界值(s):检验统计量: 决策结论Reject at a
34、 = 0.05.There is evidence of a difference in means.t0 2.0154-2.0154.025Reject H0Reject H0.0252.033.272.532.03111.5022125t统计学贾俊平第章 假设检验104两总体均值的检验独立小样本( )n检验具有等方差的两个总体的均值n假定条件l两个样本是独立的随机样本l两个总体都是正态分布l两个总体方差未知但相等 n检验统计量2221212121)()(nSnSXXt统计学贾俊平第章 假设检验105两总体均值的检验(续)匹配样本n检验两个总体的均值l配对或匹配,各种前测、后测的比较如广告前
35、后的销售额、接受训练前后的成绩差异等l由于两组数据不是独立随机样本,我们将两两的差异当成一个随机样本来处理n假定条件l两个总体都服从正态分布l如果不服从正态分布,可用正态分布来近似统计学贾俊平第章 假设检验106两总体均值的检验观察序号样本1样本2差值1x 11x 21d1 = x 11 - x 212x 12x 22d2 = x 12 - x 22MMMMix 1ix 2idi = x 1i - x 2iMMMMnx 1nx 2ndn = x 1n- x 2n统计学贾俊平第章 假设检验107两总体均值的检验样本差值均值样本差值标准差自由度df n - 1统计量nsdtddnddnii11)(
36、12nddsniidd:假设的差值统计学贾俊平第章 假设检验108两总体均值的检验n例解lAssume you work in the finance department. Is the new financial package faster (a=0.05 level)? You collect the following processing times:User Existing System (1) New Software (2) Difference DiC.B.9.98 Seconds 9.88 Seconds .10T.F.9.88 9.86 .02M.H.9.84 9.7
37、5 .09R.K.9.99 9.80 .19M.O.9.94 9.87 .07D.S.9.84 9.84 .00S.S.9.86 9.87 - .01C.T.10.12 9.98 .14K.T.9.90 9.83 .07S.Z.9.91 9.86 .052.0721 .06215iiDDDnDDSn统计学贾俊平第章 假设检验109两总体均值的检验Is the new financial package faster (0.05 level)? H0: d 0 H1: d 0 a 0检验统计量临界值=1.8331 df = n - 1 = 9Reject a 01.8331决策: Reject
38、H0t Stat. in the rejection zone.结论: The new software package is faster.3.66t66. 310/6125. 0072. 0nsdtdd统计学贾俊平第章 假设检验110两总体比率之差检验比率之差检验n假定条件l两个总体是独立的l两个总体都服从二项分布ln1p15, n1q15, n2p25, n2q25l可以用正态分布来近似n检验统计量) 1 , 0()1 ()1 ()()(2221112121NnnPPZ统计学贾俊平第章 假设检验111两总体比率之差检验n例解l在高校学生的一个随机样本中,36名男生中有16人说他们购买食品
39、时看生产日期,而36名女生中则有28人说说好们购买食品时看生产日期,判断在这一点上,女生是否比男生更细心?( = 0.05 = 0.05)统计学贾俊平第章 假设检验112两总体比率之差检验H0: - 0H1: - )n检验统计量lF = s12 /s22F(n1 1 , n2 1)统计学贾俊平第章 假设检验114两总体方差比检验FFa/Fa/无法拒绝域统计学贾俊平第章 假设检验115两总体方差比检验 NYSE NASDAQNumber 21 25Sample Mean 3.27 2.53 Sample Std Dev 1.30 1.16 Is there a difference in the
40、 variances between the NYSE & NASDAQ at the a a 0.05 level? 1984-1994 T/Maker Co.n例解lYoure a financial analyst for Charles Schwab. Is there a difference in average dividend yield between stocks listed on the NYSE & NASDAQ? You collect the following data:统计学贾俊平第章 假设检验116两总体方差比检验 H0: 1 12 2 = = 2 22 2
41、 H1: : 1 12 2 2 22 2 a a .05 df df1 1 20 dfdf2 2 24 临界值临界值:检验统计量:检验统计量: 决策决策:结论:结论:Do not reject at a = 0.05.0F2.330.415.025RejectReject.0251.25There is insufficient evidence to prove a difference in variances.25. 116. 130. 1222221ssF统计学贾俊平第章 假设检验1178.4 假设检验的进一步讨论统计学贾俊平第章 假设检验118区间估计与假设检验比较根据置信区间检验n
42、求出双侧检验均值的置信区间n若总体的假设值 0在置信区间外,拒绝H0 已知时: 未知时:nzxnzxaa22,nstxnstx22,aa统计学贾俊平第章 假设检验119区间估计与假设检验比较a/2 统计学贾俊平第章 假设检验120区间估计与假设检验比较左侧检验:求出单边置信下限若总体的假设值 0 0小于单边置信下限,拒绝H0nStxnzxaa或统计学贾俊平第章 假设检验121区间估计与假设检验比较n右侧检验:求出单边置信上限n若总体的假设值 0大于单边置信下限,拒绝H0nstxnzxaa或统计学贾俊平第章 假设检验122区间估计与假设检验比较 假设检验的局限 小心诠释统计显著性 样本很大时,即
43、使效应 (effect)差异不大也会产生统计显著性 ; 但可能因为效应差异不大而没有实际的效用 数据上呈现的统计显著性应配合资料形态来诠释 离群值的检查等 配合估计区间来诠释 置信区间也估计效应的大小统计学贾俊平第章 假设检验123区间估计与假设检验比较 例析 1000组配对样本的相关系数为 0.08 ,在1%的显著性水平下具有显著性,仅表示有足够的证据认为总体相关系数不是零且应为正 在实用上, 0.08的相关性常可忽略而不会影响后续分析 以散布图检查资料的相关性 检查数据间是否具有函数关系,或是离群值影响相关性的强度等 以相关系数的置信区间来了解相关性的强度统计学贾俊平第章 假设检验124区
44、间估计与假设检验比较n置信区间只能在预先规定的概率前提下进行计算,而假设检验能够根据样本数据获得的统计量(Z,t)及样本的其他信息(如自由度n)获得确切的概率P值统计学贾俊平第章 假设检验125假设检验的几点补充说明 再谈统计显著性 统计显著性的价值在于,指出“效应(effect) 的发生并非偶然”的证据。可应用于: 新药产品的有效性与安全性需显著性证据 法庭在审理差别待遇的诉讼需要统计显著性 营销者需要知道新的广告策略是否显著地优于旧的策略 医学研究者要了解新的疗法是否显著得好 统计学贾俊平第章 假设检验126假设检验的几点补充说明(续)n检验的原理是“小概率事件在一次试验中不发生”,以此作
45、为推断的依据,决定是无法拒绝或拒绝。但是这一原理只是在概率意义下成立,并不是严格成立的,即不能说小概率事件在一次试验中绝对不可能发生统计学贾俊平第章 假设检验127假设检验的几点补充说明(续) 在假设检验中,原假设与备选假设的地位是不对等的。一般来说是较小的,因而检验推断是“偏向”原假设,而“歧视”备选假设的。因为,通常若要否定原假设,需要有显著性的事实,即小概率事件发生,否则就认为原假设成立。因此在检验中无法拒绝,并不等于从逻辑上证明了的成立,只是找不到不成立的有力证据。 在应用中,对同一问题若提出不同的原假设,甚至可以有完全不同的结论统计学贾俊平第章 假设检验128假设检验的几点补充说明(
46、续)n从另一个角度看,既然是受保护的,则对于的肯定相对来说是较缺乏说服力的,充其量不过是原假设与试验结果没有明显矛盾;反之,对于的否定则是有力的,且越小,小概率事件越难于发生,一旦发生了,这种否定就越有力,也就越能说明问题统计学贾俊平第章 假设检验129假设检验的几点补充说明P-值多小才可信的衡量基础: H0 的可信程度:若 H0已被相信行之有年,则需较强的证据 (P-值较小)才可说服别人。 拒绝 H0 的后果:若拒绝 H0 后会引起昂贵的改变如产品包装,则需较强的证据 (P-值较小)来支持新包装会提升产品的销售的说法。统计学贾俊平第章 假设检验130假设检验的几点补充说明 常用的显著水平有1
47、0%, 5%, 1% 及0.1% 法庭在审理差别待遇的诉讼案件多使用5%的显著性水平 显著与不显著之间并没有明显的界限,显著性证据的强度如同P-值减少一样是渐进的 P-值为 0.49与 0.51提供的证据强度并没有太大的差别 不应把常用的显著性水平当做一成不变的标准统计学贾俊平第章 假设检验131假设检验的几点补充说明 两种常见错误 马后炮专家 从已经发生的事件中通过检验倒推“规律” 多次重复 寻找期望结果Aha! 找到几个具显著性的指标了!统计学贾俊平第章 假设检验132小结条件检验统计量拒绝域H0、H1(1) H0:=0 H1:02a2az(2) H0:0 H1:0(3) H0:0 H1:
48、az0az0nxZ0正态总体2已知统计学贾俊平第章 假设检验133小结条件检验统计量拒绝域H0、H1(1) H0:=0 H1:02a2at(2) H0:0 H1:0(3) H0:0 H1:at0at0nsxt02at2at0正态总体2未知(n30)统计学贾俊平第章 假设检验134小结条件检验统计量拒绝域H0、H1(1) H0:=0 H1:02a2az(2) H0:0 H1:0(3) H0:0 H1:az0az02aZ2aZ0nxZ0nSxZ0非正态总体n302已知或未知统计学贾俊平第章 假设检验135小结条件检验统计量拒绝域H0、H1(1) H0:=0 H1:02a2az(2) H0:0 H1
49、: 0(3) H0:0 H1:0az0az02aZ2aZ0np5nq5npZ)1(000统计学贾俊平第章 假设检验136小结条件检验统计量拒绝域H0、H1总体服从正态分布222) 1(sn2020:H2021:H22) 1n(22) 1n(21aa2020:H2021:H2020:H2021:H222) 1( na2) 1(1na统计学贾俊平第章 假设检验137小结条件检验统计量拒绝域H0、H1(1) H0: 1=2 H1: 1 2 2a2az(2) H0:1 2 H1: 1 2 (3) H0: 1 2 H1:1 2 az0az02aZ2aZ022212121nnxxZ两个正态总体2122,已
50、知统计学贾俊平第章 假设检验138小结条件检验统计量拒绝域H0、H1(1) H0: 1 = 2 H1: 1 2 2a2at(2) H0: 1 2 H1: 1 2 (3) H0: 1 2 H1: 1 2 at0at02at2at0两个正态总体2122,未知,但相等2) 1() 1(21222211nnsnsnSp21212111)()(nnsXXtp统计学贾俊平第章 假设检验139小结条件检验统计量拒绝域H0、H1(1) H0:1 = 2 H1:1 2 2a2a(2) H0:1 2 H1:1 2 (3) H0:1 2 H1:1 2 a0az02aZ2aZ0两个非正态体n130 n2302122,
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。