1、w 本章学习目的本章学习目的w 理解理解原假设、备择假设、两类错误、单侧检验、双侧检验、方差分析等概念。w 掌握掌握三种不同的实际情况下陈述正确性、研究性、决策建立假设检验的方法。w 掌握掌握总体方差已知或未知时正态总体的均值假设检验和总体比例的假设检验。w 本章重难点提示本章重难点提示 w 重点重点是三种不同情况下的假设检验方法,总体方差已知时正态总体均值和总体比例的假设检验。w 难点难点是总体方差未知时正态总体均值的假设检验和方差分析。 第一节第一节 假设检验假设检验 一、假设检验的概念一、假设检验的概念 假设假设(hypothesis)(hypothesis),又称统计假设,是对总体参数
2、的具体数值所作的陈述。 假设检验假设检验(hypothesis test)(hypothesis test) 是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。 原假设与备择假设原假设与备择假设 原假设原假设(null hypothesis)(null hypothesis),又称零假设,用 表示,是指研究者想收集证据予以反对的假设。 备择假设备择假设(alternative hypothesis)(alternative hypothesis),用 或 表示,是指研究者想收集证据予以支持的假设,它与原假设陈述的内容相反。0H1HH假设检验的三种类型假设检验的三种类型 1.1
3、.对陈述正确性的检验对陈述正确性的检验 在这种情况下,原假设通常是基于假定的陈述是正确的。然后建立备择假设,为拒绝提供统计证据,从而证明这个假定的陈述是错误的。2.2.对研究性假设的检验对研究性假设的检验 在研究性假设检验的调查研究中,应该建立原假设和备择假设,并用备择假设来表示研究性假设,这样如果拒绝,将支持样本所得出的结论以及应该采取某些行动。3.3.对决策情况下的检验对决策情况下的检验 在决策情况下的检验研究中,决策者必须从两种措施中挑选其中一种,无论是接受还是拒绝,都必须采取一定的措施。 假设检验的三种形式假设检验的三种形式 设 表示在原假设和备择假设中考虑的某一特定数值, 表示总体的
4、实际值。对总体 的假设检验一定要采取下面的三种形式之一 : 00H:10H:00H:10H:00H :10H :0 拒绝域与检验统计量拒绝域与检验统计量w 拒绝域拒绝域是指能够作出拒绝原假设这一结论的所有可能的样本取值范围。w 检验统计量检验统计量是根据样本数据计算出来的,并据以对原假设和备择假设作出决策的某种样本统计量。 单侧检验与双侧检验单侧检验与双侧检验w 单侧检验单侧检验是指检验统计量的取值位于其抽样分布的某一侧范围内时拒绝原假设,也就是说抽样分布的某一侧构成了拒绝域。w 双侧检验双侧检验是指检验统计量的取值位于其抽样分布的任何一侧范围内时拒绝原假设,也就是说抽样分布的左右两侧共同构成
5、了拒绝域。二、假设检验中的两类错误二、假设检验中的两类错误*w 第第类错误类错误/ /弃真错误弃真错误 (type error)(type error) 当原假设为真时拒绝原假设。犯第类错误的概率通常记为 。w 第第类错误类错误/ /取伪错误取伪错误(type error)(type error) 当原假设为假时没有拒绝原假设。犯第类错误的概率通常记为 。w 在统计实践中,进行假设检验时一般先控制第类错误发生的概率,并确定犯第类错误的概率最大值,称为检验的显著性水平显著性水平。显著性水平一般选择为0.05和0.01。 假设检验的步骤假设检验的步骤1.确定原假设和备择假设原假设和备择假设;2.选
6、择检验统计量检验统计量;3.确定检验的显著性水平显著性水平 ;4.用显著性水平来确定拒绝原假设 的检验统计量的临界值、拒绝域临界值、拒绝域;5.根据样本数据,计算检验统计量的值计算检验统计量的值;6.将统计量的值与临界值进行比较将统计量的值与临界值进行比较,并作出决策:若统计量的值落在拒绝域内,拒绝原假设 ,否则不拒绝原假设 。 或或根据第5步的检验统计量的值计算计算 值值。运用 值来确定是否拒绝。0H0H0Hpp 总体方差已知时正态总体均值的假设检验总体方差已知时正态总体均值的假设检验 当总体方差 已知,用正态分布来检验总体均值的假设值的情况如下: 当样本数 (大样本)时的任意分布总体,(根
7、据中心极限定理); 当样本数 (小样本)但是总体是正态分布的。230n 30n 例例8-18-1 某公司称其应收账金额的均值为RMB260.00,审计师希望通过选取一个的样本计算样本均值来检验是否如此。只有当样本均值与RMB260.00的假设值差别较大时,审计师才会拒绝这个假设,已知应收账款金额的标准差为 ,计算0.05显著性水平下假设检验的样本均值临界值。43.00示例示例计算过程计算过程假设:显著性水平:检验统计量: , 的样本的 因此,为了拒绝原假设,这个样本均值的值必须比RMB 245.95小或者比RMB 274.05大。所以,在双侧检验(见下图8-1)中有两个拒绝域。01:260.0
8、0 ;:260.00HH0.0536n 43.00X0243.00260.001.9636260.0014.05245.95 274.05X 样本均值的临界值 =图8-1 双边检验的拒绝域与接受域 例例8-28-2 在例8-1的假设检验中,如果样本的均值为 ,当显著性水平为0.05时,原假设是否被拒绝。 当 时,对应于的双侧检验的临界值 检验统计量的值为 因为 ,落在拒绝域内,所以否定原假设,也就是说有95的可靠程度否定原假设。如果将样本均值与图8-1中均值的临界值比较,将得到相同的结论。0.050.02521.96 0.02521.96 0240.00260.002.7943.0036XX
9、240.00X 2.791.96 图8-2 双边检验的拒绝域与接受域 例例8-38-3 某商场销售一种产品,原每周销售量服从平均值为75,方差为14的正态分布。销售方案更新后,为了考察销售量是否提高,抽查了6周销售量,求得平均销售量为78,假定方差不变,问在显著性水平0.05下,销售方案更新后对周销售量是否有显著提高? 示例示例w 假设假设: 左单边检验左单边检验w 显著性水平显著性水平:w 检验统计量检验统计量: , 的样本的 值w 由于总体服从方差已知的正态分布,所以在原假设下,检验统计量w 当 时,对应的临界值为 因为 ,故否定原假设,这说明销售方案更新后,周销售量有明显提高。 01:7
10、5 ;:75HH0.056n214078751.964146Xn 0.050.051.6451.9641.645 计算过程计算过程 总体方差未知时正态总体均值的假设检验总体方差未知时正态总体均值的假设检验w 如果样本数 ,根据中心极限定理,可以假定抽样分布近似为正态概率分布;w 如果样本数 ,但均值的抽样分布是正态分布时。w 无论哪一种情况,都应当使用T分布计算标准的检验统计量,在计算检验统计量时,我们用样本标准差 来代替总体标准差 。w 检验统计量 30n30ns00XXXtssn 例例8-48-4 某品牌笔记本电脑的说明书声称电池平均充电次数可达4 200次。为验证其真实性,现随机抽取样本
11、调查,结果显示平均充电次数是4200次,样本标准差为200小时。若一般电脑的电池充电次数服从正态分布,在5%的显著性水平下,检验说明书是否属实?w 假设假设: 右单侧检验右单侧检验w 显著性水平显著性水平:w 检验统计量检验统计量: , 的样本的t 值w 由于总体服从方差未知的正态分布,所以在原假设下,检验统计量 01:4 200;:4 200HH0.0510n 200s 04 0004 2003.1610010Xtsn w当 时,w对应的临界值为w因为 w所以原假设被拒绝,接受备择假设:可以认为电池的真实充电次数少于4 200次,产品说明不属实。3.161.833t 0.050.050.05
12、(1)(9)1.833tnt 总体比例的假设检验总体比例的假设检验w 总体比例又称总体成数,是指总体中具有某种相同特征的单位数所占的比例。w 一般用 来表示总体比例, 表示总体比例的某一特定假设值。总体中的某种特征可以是数值型的,如一定的重量、一定的长度或一定的规格等;也可以是品质型的,如男女性别、学历等级、城市农村等。 0PP总体比例的假设检验步骤:w 建立总体比例检验的原假设和备择假设;w 用样本比例 和样本标准差 的来计算检验统计量 的值, 因为是大样本,中心极限定理保证了统计量服从正态分布,那么统计量z就近似服从正态分布。w 将检验统计量的值与临界值相比较,确定是否应该拒绝原假设。 p
13、p0pp Pp 例例8-58-5 某保龄球馆在过去几个月中,有20的顾客是女性。为了提高女顾客比例,球馆采取了一些措施来吸引女性保龄球手。一周后随机抽取400名球手作为样本,其中100名女球手。该球馆经理要据此判断:在0.05的显著性水平下,该球馆女性保龄球手的比例是否提高?示例示例w 假设假设: w 因为因为 w 所以为大样本分布所以为大样本分布,检验统计量 近似服从正态分布。样本数据显示 00.20HP:10.20HP :400 0.2805nP 14001 0.23205nP 1 0 00 .2 54 0 0p 00.250.200.052.50.0210.2 10.2400pPPPn
14、解题过程解题过程w在显著性水平 情况下,查表可知,w因为 ,拒绝原假设 。所以,该保龄球馆的经理可以得出结论:女性保龄球手的比例有所提高。0.050 .0 51 .6 4 51.645 0H第二节第二节 方差分析方差分析一、方差分析的基本问题一、方差分析的基本问题 概念概念 方差分析是检验几个总体均值之间是否存在差别时最常用的统计方法,其基本原理是英国统计学家罗纳德A费希尔(Ronald A Fisher)在进行实验设计时为了解释试验数据而首先引入的。方差分析的原假设是多个总体均值彼此相等,抽样方法是独立地从每个分类范畴(即处理水平)中取样。 方差分析的基本假设方差分析的基本假设w 每个总体都
15、应服从正态分布每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。w 各个总体的方差必须相同。各个总体的方差必须相同。也就是说,各组观察数据是从具有相同方差的总体中抽取的。w 观察值之间是相互独立的观察值之间是相互独立的。二、方差分析二、方差分析w 在方差分析中,我们将那些影响实验指标的条件称为因素因素,而将因素所处的条件称为水水平平。w 如果所研究的问题只涉及一个影响因素,则称这样的方差分析为单因素分析单因素分析;w 如果所研究的问题涉及多个影响因素,则称为多因素分析多因素分析。w 单因素方差分析只检验一个变量的影响单因素方差分析只检验一个变量的影响,是最简单的形式的方差分析。它可以检验两个或两个以上的样本均值之间的差异。本章小结本章共两节,主要介绍了假设检验和方差分析等内容。1.假设检验介绍了假设检验的概念、两类错误、单侧检验、双侧检验等检验方法,重点介绍了正态总体均值、总体比例的检验方法。2.方差分析介绍了方差分析的概念和基本假设,重点介绍单因素方差分析的方法。 END