1、第8章 假设检验8.1、假设检验的基本思想8.2、总体平均值的假设检验8.3、比例的假设检验8.4、方差的假设检验8.5、两个总体参数的假设检验8.6、参数估计和建设检验的关系8.1、假设检验的基本思想8.1.1 假设检验的数理逻辑与反证法假设检验就是根据关于总体参数的某种假设,依据样本分布规律如果能推论出几乎不可能的事件,即小概率事件,这时我们可以认为关于总体参数的某个假设几乎不成立。假设检验的思想也被称为小概率原理。例8.1、在例7.1的数据中,某医院育婴房随机抽取9名新生儿,检查他(她)们的体重数据如下(单位KG):2.8,3.1,3.6,3.7,3.8,3.2,2.9,3.3,4.1。
2、假设新生儿体重分布服从正态分布,且标准差为0.4。根据样本数据,能否判断新生儿平均体重为4.0公斤?解:首先,假设新生儿体重为4.0公斤(原假设H0),如果这一说法不正确,则新生儿体重不等于4.0公斤(备择假设H1)第一步:构造原假设和备择假设第二步:构造样本统计量0.4:,0.4:10HH)1,0(/NnxZ第三步,根据抽样所得样本数据计算样本统计量数值第四步,将样本统计量值临界值比较,做决策。根据标准正态分布规律,标准正态变量在95%的概率下落入(-1.96,+1.96)之间,显然-4.58没有落入这一区间,小概率事件出现(不足5%),拒绝原假设。此时,我们的结论是认为新生儿体重总体均值不
3、是不是4.0公斤。58.49/4.0439.3/nxZ8.1.2假设检验中的基本概念1.原假设(Null Hypothesis)与备择假设(Alternative Hypothesis)原假设是对于总体参数所做的陈述,也有叫做零假设、虚无假设等等,原假设是研究着想予以否定的假设。而研究者通过搜集样本数据想予以证明或支持的假设称为备择假设,备择假设也是我们的研究假设。如果能够得出与原假设相违背的结论,则拒绝原假设(接受备择假设),否则不能拒绝原假设。例8.2、在企业持续生产的生产线上,质量控制人员定期对某个金属零件的孔径进行检查,以确定金属零件的孔径是否为3.0厘米。如果孔径大于或小于3.0厘米
4、均表示生产线失去控制,试表述在这一检验过程中,检验人员的原假设和备择假设。解:根据上面的陈述,在正常生产条件下,金属零件孔径 cm,此时生产线处于控制状态。研究者最关心或者最想证明的是金属零件孔径大于或小于3.0厘米。0.3:0H0.3:1H例8.3、某厂家生产一种新型轮胎,厂家广告声称其平均使用里程超过25000公里。对一个由16个轮胎组成的随机样本做了试验,得到其样本平均值和标准差分别为27000公里和4000公里。假定轮胎寿命服从正态分布,试表述在这一检验过程中的原假设和备择假设。解:根据上面的陈述,要能够证明轮胎平均使用里程大于25000公里,则应该处于备择假设的位置,那么与之相反的应
5、该处于原假设,所以:(厂家广告不真实)(厂家广告真实)25000:0H25000:1H例8.4、根据统计,某个工作岗位上平均每周的事故次数为5.5次,研究者为了降低事故发生率,重新设定了工作流程和新的安全计划,为了检验新的方案是否降低了事故发生率,试表述在这一检验过程中的原假设和备择假设。解:根据上面的陈述,要能够降低事故发生率,这也是研究者最关心的,因此处于备择假设位置。(事故频率没有降低)(事故频率得到有效降低)5.5:0H5.5:1H2.显著性水平(level of significance)和临界值在例8.1中,样本统计量仍有5%的概率落入区间(-1.96,+1.96)之外,拒绝原假设
6、则意味着可能犯错误,也就是说我们最多还有5%的概率犯“拒绝一个正确原假设”的错误,我们把犯这类错误的概率称为显著性水平(level of significance)。通常在假设检验中,显著性水平是根据研究需要事先给定的,一般取1%,5%或者10%。临界值是显著性水平对应的统计量值。例8.1中 称落入拒绝域 称落入非拒绝域2/|ZZ 2/|ZZ 3.假设检验中的两类错误第一类错误,或弃真错误,即在原假设正确前提下,犯拒绝正确原假设的概率第二类错误,也叫做取伪错误,即我们没有拒绝错误的原假设,法官审判审判(原假设无罪)假设检验(原假设H0)裁决结果实际情况决策结果实际情况无罪有罪H0为真H0为假无
7、罪正确错误未拒绝 正确决策(1-a)第类错误()有罪错误正确拒绝第类错误(a)正确决策(1-)4、p-值(p-value)在例8.1中,由于|Z|=4.58Z0.025=1.96拒绝原假设,此时犯第一类错误的概率不超过5%,但是到底真实犯第一类错的概率是多少呢?当原假设正确时,|Z|仍有可能大于4.58,因此p值即P(|Z|4.58),所以p值是一个概率值,可以认为是犯第一类错误(弃真错误)的概率,通俗的可以理解为,按照所取得的样本计算的统计量值判断,原假设为真的概率为p。当原假设正确时,|Z|仍有可能大于4.58,因此p值即P(|Z|4.58),所以p值是一个概率值,可以认为是犯第一类错误(
8、弃真错误)的概率,通俗的可以理解为,按照所取得的样本计算的统计量值判断,原假设为真的概率为p。5.单尾检验中的接受域和拒绝域 左尾检验 右尾检验00:H00:H6、假设检验决策规则1)根据显著性水平 查表取得临界值给定显著性水平,查表得出相应的临界值Za(单尾检验)或Za/2(双尾检验),根据总体分布情况、样本容量大小等也会用到ta(单尾检验)或 ta/2(双尾检验)2)比较,观察统计量值落入拒绝域还是非拒绝域将检验统计量的值与 水平的临界值进行比较,作出决策(注意单尾检验临界值的正负号)。双侧检验:|统计量|临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H08.2 总体平均数的假设检验8.
9、2.1检验统计量的确定1样本量总体服从正态分布时,样本均值服从正态分布。总体未服从正态分布,样本容量足够大时,样本均值仍然近似服从正态分布。当总体标准差未知时,样本容量足够大(大于30),可以用样本标准差s代替总体标准差2、样本标准差是否已知在小样本情况下,如果总体标准差 已知,根据前面的分析样本统计量仍然服从正态分布,可采用Z统计量作为检验统计量。如果总体标准差未知,需要用s来替代总体标准差,这时由于样本标准差的随机性,使得样本统计量具有更大的随机性,根据第6章的证明,需采用t统计量,计算公式:nsxt/08.2.2 均值的双尾检验例8.5 有一台生产金属零件的加工机床,零件的直径平均值为0
10、.5cm,假设在一段时间内生产的零件中取得n=50的样本,测量得到样本平均值为0.46cm和标准差s=0.075cm。试以5%的显著性水平检验机床生产状态是否正常。解:第一步构造假设H0:0.5 (机床生产状态正常)H1:0.5 (机床生产状态不正常)第二步:构造样本统计量,用s替代总体标准差,由于n30,可以采用Z统计量第三步,根据抽样所得样本数据计算样本统计量数值,由于是双尾检验,故根据显著性水平 查 Za/2=Z0.05/2=1.9677.350/075.05.046.0/nsxZ第四步,将样本统计量值临界值比较,做决策。|Z|=3.77Z0.025=1.96因此,检验统计量落入拒绝域,
11、故拒绝原假设,接受备择假设,有充足理由说明机床生产状态不正常。在本例中,由于用s替代总体标准差,用Z统计量的原因是当n较大时正态统计量的与t统计量的近似程度较好。如果我们用t统计量,则更加准确一些,只是t统计量本身有自由度,需要查表,但是在有计算机条件下,查表并不困难。因此,上面的例子如若用t统计量,t值仍然是-3.77,只是第三步查表时需要查 t0.025(49)=2.0103.772.010,结论是一致的。8.2.3均值的单尾检验1.左尾检验例8.7、一位餐厅总经理为了减少顾客点单后等候的时间,采用了一种新的电子菜单点单流程。在传统点单情况下,顾客的平均等待时间为16分钟,采用新的流程后,
12、对随机36名顾客等待时间做了记录,得到平均等待时间为11.2分钟,标准差s为6分钟,试以0.05的显著性水平检验顾客等待时间是否有显著下降。解:由于餐厅经理最关心等待时间下降,即,因此想要验证的结论出与备择假设,所以,第一步构造假设:H0:18(等待时间没有显著下降)H1:18(等待时间显著下降)第二步,计算统计量。由于用样本标准差s替代总体标准差,统计量:8.436/6162.11/0nsxt由于是左侧检验(犯错误的概率在左侧),查 t0.05(35)=1.6896将t=-4.8和临界值作比较t=-4.8t25000(厂家广告真实)第二步,计算t统计量第三步,根据给定的显著性水平0.05和0
13、.01查t临界值当显著性水平取a=0.05时,t=2t0.05(15)=1.7531,故拒绝原假设,接受备择假设,说明厂家广告为真。当显著性水平a取0.01时,t=25和n(1-p)5 时,因此,检验统计量可以采用,)1(,(nNpnpZ)1(0001.双尾检验例8.10 一个市场调研公司声称他们通过邮件回访了8%的产品用户。为了检验这一说法是否正确。现随机取得了该产品用户中的500人作为样本,其中有25人表示接受到市场调研公司的回访,试以5%的显著性水平检验这一说法的正确性。解:第一步,做假设H0:=8%H1:8%第二步,计算样本统计量由于|Z|=2.47 Z0.025=1.96,故落入拒绝
14、域,拒绝原假设,接受备择假设,说明该市场调研公司的回访比例不是8%。根据Excel中的标准正态分布函数NORMSDIST查得p-value是0.01350.4(2010年比例有提高)样本统计量由于 Z=1.68Z0.05=1.64,故拒绝原假设,说明2010年周末看电视的家庭主妇收看综合娱乐节目的比例高于2009年。P-value可以通过查正态分布表,即P(Z1.68)=0.0465。68.1120/6.04.04.0475.0)1(000npZ8.4方差的假设检验根据第6章样本方差的分布规律(公式6.6),若总体方差为02,则方差的检验统计量可以采用:其中,样本方差2022)1(sn 1)(
15、22nxxs例8-12 在罐头食品包装过程中,不仅每罐的平均装填量很重要,而且装填量的方差同样需得到控制。如果装填量的方差过大,就会出现尽管平均值满足需要,但是有些罐头装填量太多,而又有些罐头装填量则太少。假定根据企业产品质量标准,规定平均值为8盎司的罐头装填量的标准差应小于0.1盎司,质检人员在生产线上随机抽样得到10个罐头,并测得样本数据如下:7.96,7.90,7.98,8.01,7.97,7.96,8.03,8.02,8.04,8.02。试以显著性水平 0.05检验装填量的方差是否满足要求。解:装填量的方差要满足要求,即方差小于0.1H0:2 0.1 (装填量方差不符合要求)H1:20
16、.1 (装填量方差符合要求)2=1.66Z0.025=1.96,所以拒绝原假设,接受备择假设,证据表明计算机焦虑程度在不同性别之间存在显著差异。3095.2)7242.910035.13(25.3626.40)()()-(222221212121nsnsxxZ例8.14 某银行在市中心CBD的营业网点上,观察每天中午饭时间(12:00-下午1:00)顾客的等待时间,记录下顾客从快进大厅直到到柜台接受服务的时间,随机取得的15个样本数据(单位:分钟),4.21,5.55,3.02,5.13,4.77,2.34,3.54,3.20,4.50,6.10,0.38,5.12,6.46,6.19,3.7
17、9。假定这家银行在郊区某营业网点按照同样的方法取得15个样本数据:9.66,5.90,8.02,5.79,8.73,3.82,8.01,8.35,10.49,6.68,5.64,4.08,6.17,9.91,5.47。假定等待时间服从正态分布,且两个营业网点等待时间的方差相等,试以0.05的显著性水平检验两个网点顾客的平均等待时间是否相等?CBD市郊平均4.2866666677.114666667方差2.6829952384.335512381观测值1515合并方差3.50925381 假设平均差0 df28 t Stat-4.134306277 P(T=t)单尾0.00014642 t 单尾
18、临界1.701130908 P(T=t)双尾0.000292839 t 双尾临界2.048407115 8.5.2 两个总体均值之差的假设检验:匹双样本根据我们第7章区间估计中,关于匹配样本均值之差的抽样分布规律的介绍,根据匹配样本进行均值之差假设检验时检验统计量可采用例8.15 为了考察消费者对两类跑步鞋耐用性的评价,有10名消费者分别使用了A、B两种跑步鞋并举录下使用时间(单位:周),下面的数据(见表8-7)是否支持A类鞋的使用寿命更长?取显著性水平0.05。nsDdtd/表8-7 消费者使用两类鞋的时间(单位:周)12345678910A27351939343215261817B2328
19、1631383017221516di4738-42-2431Excel运算的结果AB平均26.223.6方差73.9555555662.04444444观测值1010泊松相关系数0.905112025 假设平均差0 df9 t Stat2.247922629 P(T=t)单尾0.025588328 t 单尾临界1.833112923 P(T=t)双尾0.051176655 t 双尾临界2.262157158 8.5.3 两个总体比例之差的假设检验1、总体比例差值为0时,即1=2,检验统计量:2、总体比例差值不为0时,即1 2,检验统计量:)11)(1(2121nnppppZ212211nnpn
20、pnp222111)1()1(21nppnpppp22211121212121)1()1()()()()(21nppnppppppZpp8.5.4 两个总体方差之比的假设检验在两个总体服从正态分布的条件下,根据方差之比的抽样分布因此,当假设两个总体方差相等,即 21=22时,构造检验统计量:)1,1(/2122212221 nnFss2221ssF 例8.18 一家造纸公司的质量管理部门需要每天定时测量纸的明澄度(一种反映纸张对光线反射程度的指标),有两台仪器在测量过程中产生了测量误差,经质检员调整后,使得对测量样纸而言,他们的平均值相等。质检人员更关心那一台机器测量误差更小,测量结果更稳定。
21、在采用两台仪器对同一样纸进行了5次测量后得到如下数据,测量结果能否证明仪器2的精度比仪器1低(测量值的方差越大,精度越低)。检验显著性水平取0.05。仪器1仪器229283028302624303228解:由表中数据计算得:s12=1,s22=10 (仪器2精度不比仪器1低)(仪器2精度比仪器1低)22210:H22211:H样本统计量值查表:由于故拒原假设,接受备择假设。数据支持仪器2精度比仪器1低。1.01012221ssF1565.0388.61)4,4(1)4,4(05.095.0FF)4,4(95.0FF 8.6 参数估计和假设检验的关系参数估计和假设检验的理论基础都是抽样分布规律,因此可以通过参数估计的方法解决假设检验的问题。对于在显著性水平a下进行参数检验,就相当于在置信水平 1-a下进行参数的区间估计。以平均值的参数检验为例,假设,要判断这一假设=0是否正确,只需依据样本均值 给出总体均值 的 置信区间,观察这一区间中是否包含关于总体均值的假设值0,如果包含总体参数假设值,则不能拒绝原假设,否则拒绝原假设。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。