1、第第 5 章章 假设检验假设检验李芳凤李芳凤 email:不同情况下总体均值的区间估计总体分布样本量 已知 未知正态分布大样本小样本非正态分布 大样本知识点回顾知识点回顾知识点回顾知识点回顾1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差 2 的点估计量为s2,且已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命的平均值为1490h,标准差为24.77h。1)试求灯泡平均使用寿命95%的置信区间。随堂测试解:已知N(,2),n=16,1-=95%,t/2=2.131总体均值在1-置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8h15
2、03.2h正常人的平均体温是 吗?37.136.936.937.136.436.936.636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.0当问起健康的成年人体温是多少时,多数人的回答是37oC,这似乎已经成了一种共识。下面是一个研究人员测量的50个健康成年人的体温数据:37oC正常人的平均体温是37oC
3、吗?根据样本数据计算的平均值是36.8oC,标准差为0.36oC 根据参数估计方法得到的健康成年人平均体温的95%的置信区间为(36.7,36.9)。研究人员发现这个区间内并没有包括37oC.因此提出“不应该再把37oC作为正常人体温的一个有任何特定意义的概念”.我们应该放弃“正常人的平均体温是37oC”这个共识吗?本章的内容就将提供一套标准统计程序来检验这样的观点.假设问题的提出什么是假设?(hypothesis)n在参数检验中,对总体参数的具体数值所作的陈述q就一个总体而言,总体参数包括总体均值总体均值、比例比例、方差方差等q分析之前之前必需陈述什么是假设检验?(hypothesis te
4、st)1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法2.有参数检验(总体分布已知)和非参数检验(总体分布未知)3.逻辑上运用反证法,统计上依据小概率原理原假设(null hypothesis)1.又称“0假设”,研究者想收集证据予以反对的假设,用H0表示2.最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 3.总是有符号 ,或 qH0:=某一数值qH0:某一数值qH0:某一数值l例如,H0:10cm1.研究者想收集证据予以支持的假设,用Ha表示2.备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择
5、假设 3.总是有符号 ,或 qHa:某一数值qHa:某一数值qHa:”或“”的假设检验,称为单边检验或单尾检验(one-tailed test)q备择假设的方向为“”,称为右边检验右边检验 双边检验与单边检验双边检验与单边检验P95双侧检验与单边检验假设假设双边检验双边检验单边检验单边检验左边检验左边检验右边检验右边检验原假设原假设H0:=0 0H0:0 0H0:0 0备择假设备择假设Ha:0 0Ha:0 0假设检验中的两类错误1.研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误.2.原假设和备择假设不能同时成立,决策的结果要么拒绝H0
6、,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误.假设检验中的两类错误n1.第一类错误(弃真错误)第一类错误(弃真错误)q原假设为真时拒绝原假设q第一类错误的概率为n被称为显著性水平n2.第二类错误(取伪错误)第二类错误(取伪错误)q原假设为假时接受原假设q第二类错误的概率为(Beta)P95两类错误的控制1.一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些.2.一般来说,发生哪一类错误的
7、后果更为严重,就应该首要控制哪类错误发生的概率。但在假设检验中,人们往往先控制第类错误的发生概率.假设检验基本思想假设检验基本思想小概率原理:小概率原理:如果对总体的某种假设是如果对总体的某种假设是的,那么不利于的,那么不利于或不能支持这一假设的事件或不能支持这一假设的事件A(小概率事件)(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中几乎不可能发生的;要是,就有理由怀疑该假设的,就有理由怀疑该假设的真实性,真实性,这一假设。这一假设。总总 体体(某种假设某种假设)抽样抽样样样 本本(观察结果观察结果)检验检验(接受)(接受)(拒绝)(拒绝)小概率事件小概率事件未未 发发 生生小概
8、率事件小概率事件发发 生生例例某车间用一台包装机包装葡萄糖某车间用一台包装机包装葡萄糖,袋装糖的袋装糖的净重是一个随机变量净重是一个随机变量,它服从正态分布它服从正态分布.0.497 0.506 0.518 0.524 0.498 0.511当机器正当机器正常时常时,其均值为其均值为0.5kg,标准差为标准差为0.015kg.某日开工某日开工后为检验包装机是否正常后为检验包装机是否正常,随机地抽取它所包装随机地抽取它所包装的糖的糖9袋袋,称得净重为称得净重为(kg):问机器是否正常问机器是否正常?0.520 0.515 0.512,的的净净分分别别表表示示这这一一天天袋袋装装糖糖和和以以 ,的
9、的均均值值和和标标准准差差重重总总体体 X,015.0 ),015.0,(2 NX于是于是.未知未知这里这里 由长期实践表明标准差比较稳定由长期实践表明标准差比较稳定,我我们们就就设设.0.5 我们提出两个相互对立的假设我们提出两个相互对立的假设.:01 H0.5 问题是根据样本值判断问题是根据样本值判断还是还是 为此,为此,:0H 0 5.0然后,我们给出一个合理的法则,根据这一法则,然后,我们给出一个合理的法则,根据这一法则,利用已知样本做出决策。利用已知样本做出决策。问题问题分析分析00,H如果作出的决策是接受则认为,即认为机器工作是正常的即认为机器工作是正常的,否则否则,认为是不正常的
10、认为是不正常的.,的无偏估计的无偏估计是是 X不应不应|0 x,总总体体均均值值由由于于要要检检验验的的假假设设涉涉及及.进行判断进行判断本均值本均值X,0为真为真H可借助样可借助样,太大太大为真时为真时当当0H.)1,0(/0NnX 00|/xxn衡量的大小可归结为衡量的大小。,k适当选定一正数适当选定一正数,/0时时满足满足当观测值当观测值knxx 反之,反之,,0H拒绝假设拒绝假设 .0H就接受假设就接受假设,/0时时若若knx ),1,0(/0NnXZ 为真时,为真时,由于当由于当0H由标准正态分布分位点的定义得:由标准正态分布分位点的定义得:.0H接受接受 ,/2/0时时 znx ,
11、0H拒绝拒绝,/2/0时时当当 znx 0.05,在实例中若取定在实例中若取定,96.1 025.02/zzk 则则 ,9 n又已知又已知 0.511,x由样本算得由样本算得 1.96,2.2/0 nx 即有即有于是拒绝假设于是拒绝假设H0,假设检验过程如下假设检验过程如下:0.015,认为包装机工作不正常认为包装机工作不正常.例例 一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设.例例
12、 某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设.解:解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为 H0:500 H1:临界值,拒绝H0q左边检验:统计量 临界值,拒绝H0P值检验法什么是P 值?1.是一个概率值P值告诉我们:值告诉我们:如果原假设是正确的话,我们得到目前这个样本数据的可能性有多大。如果这个可能性很小,就应该拒绝原假设 2.被称为观察到的(或实测的)显著性水平n如,要检验全校学生的平均
13、生活费支出是否等于500元,检验的假设为nH0:=500;Ha:500。n假定抽出一个样本算出的样本均值600元,得到的值为P=0.02,这个0.02是指如果平均生活费支出真的是500元的话,那么,从该总体中抽出一个均值为600的样本的概率仅为0.02。n如果你认为这个概率太小了,就可以拒绝原假设。因为如果原假设正确的话,几乎不可能抓到这样的一个样本,既然抓到了,就表明这样的样本不在少数,所以原假设是不对的.nP值越小,你拒绝原假设的理由就越充分。P 值检验法nP值,不拒绝H0nP值1.645在 =0.05的水平上拒绝H0nH0:-0.545nn=5n =0.05n临界值临界值(s):有证据表
14、明生产商在牛奶中掺了水.2 已知均值的检验【例例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度均值为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05)z 1020n =0.05nn=16n临界值临界值(s):总体均值的区间估计(正态总体,方差()未知)n1.假定条件q总体服从正态分布,但方差()未知2.使用 t 分布统计量2 未知小样本均值的检验【例例】某机器制造出的肥皂厚度为5cm,已知肥皂厚度服从正态分布。今
15、欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。2 未知小样本均值的检验nH0:=5nH1:5n =0.05ndf=10-1=9n临界值临界值(s):总体均值的检验总体均值的检验(大样本大样本)1.假定条件q在大样本情况下,如果总体不是正态分布,可用正态分布来近似(n 50)2.使用正态分布统计量 z2(,)XNn2 未知大样本均值的检验【例例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过大大超过规定标准。为了进行验证,随机抽取了100件作
16、为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(0.05)nH0:1200nH1:1200n =0.05nn=100n临界值临界值(s):【练习练习】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论?该制造商的产品同他所说的标准相符?(=0.05)nH0:40000nH1:40000n =0.05ndf=20-1=19n临界值临界值(
17、s):总体均值的检验(检验统计量)总体总体 是否是否已知?已知?t 检验检验用样本标用样本标准差准差S代替代替样本量样本量nz 检验检验 z 检验检验方差的卡方(2)检验1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.检验统计量方差的卡方(2)检验【例例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随 机 抽 取 2 5 瓶,分 别 进 行 测 定(用 样 本 减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (=0.05)0.3-
18、0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1方差的卡方(2)检验nH0:2=1nH1:2 1n =0.05ndf=25-1=24n临界值临界值(s):两个正态总体均值差的假设检验(EXCEL实现)两个正态总体参数的检验两总体均值差检验独立样本双样本等方差双样本异方差配对样本成对二样本P100-104两个总体均值之差的检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异均值均值1 1 均值均值2 2均值均值1 1 均值均值2 2H0 1 2=0 1 2 0 1
19、 2 0H1 1 2 0 1 2 0两个总体均值之差的检验两台机床加工零件的样本数据两台机床加工零件的样本数据(cm)甲甲20.519.819.720.420.120.019.0 19.9乙乙20.719.819.520.820.419.620.2两个总体均值之差的检验(用Excel进行检验)n第第1步:步:将原始数据输入到Excel工作表格中 n第第2步:步:选择【工具】下拉菜单并选择【数据分析数据分析】选项 n第第3步:步:在【数据分析】对话框中选择【t-检验:检验:双样本等方差假设双样本等方差假设】n第第4步:步:当对话框出现后,在【变量1的区域】方框中输入第1个样本的数据区域,在【变量
20、2的区域】方框中输入第2个样本的数据区域 n在【假设平均差】方框中输入假定的总体均值之差 在【】方框中输入给定的显著性水平(本例为0.05)n在【输出选项】选择计算结果的输出位置,然后【确定】两个总体均值之差的检验(用Excel进行检验)0.05两个总体均值之差的检验(例题分析独立小样本,1222)两台机床加工零件的样本数据两台机床加工零件的样本数据(cm)甲甲20.519.819.720.420.120.019.019.9乙乙20.719.819.520.820.419.620.2两个总体均值之差的检验(用Excel进行检验)n第第1步:步:将原始数据输入到Excel工作表格中 n第第2步:
21、步:选择“工具”下拉菜单并选择【数据分析数据分析】选项 n第第3步:步:在【数据分析】对话框中选择【t-检验:双检验:双样本异方差假设样本异方差假设】n第第4步:步:当对话框出现后,在【变量1的区域】方框中输入第1个样本的数据区域,在【变量2的区域】方框中输入第2个样本的数据区域n在【假设平均差】方框中输入假定的总体均值之差n在【】方框中输入给定的显著性水平(本例为0.05)n在【输出选项】选择计算结果的输出位置,然后【确定】两个总体均值之差的检验(用Excel进行检验)0.05两个总体均值之差的检验(匹配样本的 t 检验)n1.检验两个总体的均值q配对或匹配q重复测量(前/后)q小样本匹配样
22、本的 t 检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异总体总体1 1 总体总体2 2总体总体1 1 总体总体2 2H0 D=0 D 0 D 0H1 D 0 D 0n【例例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:匹配样本的 t 检验训练前训练前94.5101110103.59788.596.5101104116.5训练后训练后8589.5 101.5968680.58793.593102样本差值计算表样本差值计算表训练前训练前训练
23、后训练后差值差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计合计98.5配对样本的 t 检验配对样本的 t 检验(例题分析用Excel进行检验)n第第1步:步:选择“工具”n第第2步:步:选择“数据分析”选项n第第3步:步:在分析工具中选择“t检验:平均值的成检验:平均值的成对二样本分析对二样本分析”n第第4步:步:当出现对话框后n在“变量1的区域”方框内键入数据区域n在“变量2的区域”方框内键入数据区域 n在“假设平均差”方框内键入8.5n显
24、著性水平保持默认值两个总体方差比的检验(F 检验)1.假定条件q两个总体都服从正态分布,且方差相等q两个独立的随机样本2.假定形式qH0:12=22 或 H0:12 22 (或 )H1:12 22 H1:12 22 (或)3.检验统计量(在原假设12=22 下)qF=S12/S22F(n1 1,n2 1)2211122222(1,1)SF nnS两个总体方差的 F 检验(临界值)0不能拒绝不能拒绝H0F拒绝拒绝H0拒绝拒绝 H0两个总体方差比的检验【例例】一家房地产开发公司准备购进一批灯泡,公司打算在两个供货商之间选择一家购买。这两家供货商生产的灯泡平均使用寿命差别不大,价格也很相近,考虑的主
25、要因素就是灯泡使用寿命的方差大小。如果方差相同,就选择距离较近的一家供货商进货。为此,公司管理人员对两家供货商提供的样品进行了检测,得到的数据如右表。检验两家供货商灯泡使用寿命的方差是否有显著差异(=0.05)两家供货商灯泡使用寿命数据两家供货商灯泡使用寿命数据 样本样本1650 569 622 630 596637 628 706 617 624563 580 711 480 688723 651 569 709 632样本样本2568 540 596 555496 646 607 562589 636 529 584681 539 617两个总体方差比的检验n第第1步:步:选择“工具工具”下拉菜单,并选择【数据分析数据分析】n第第3步:步:在分析工具中选择【F检验检验 双样双样本方差本方差】n第第4步:步:当出现对话框后,在【变量1的区域】方框内键入数据区域,在【变量2的区域】方框内键入数据区域,在【】框内键入给定的显著性水平n选择输出区域 n选择【确定】两个总体方差比的检验(用Excel进行检验)n作业:nP112n5n8
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。