地质数据处理课件:7-假设检验.ppt

上传人(卖家):罗嗣辉 文档编号:2057491 上传时间:2022-01-26 格式:PPT 页数:131 大小:1.35MB
下载 相关 举报
地质数据处理课件:7-假设检验.ppt_第1页
第1页 / 共131页
地质数据处理课件:7-假设检验.ppt_第2页
第2页 / 共131页
地质数据处理课件:7-假设检验.ppt_第3页
第3页 / 共131页
地质数据处理课件:7-假设检验.ppt_第4页
第4页 / 共131页
地质数据处理课件:7-假设检验.ppt_第5页
第5页 / 共131页
点击查看更多>>
资源描述

1、假 设 检 验洪金益中南大学地学院地质数据处理基础7第七章 假设检验第一节第一节 假设检验的一般问题假设检验的一般问题 第二节第二节 一个正态总体的参数检验一个正态总体的参数检验第三节第三节 两个正态总体的参数检验两个正态总体的参数检验第四节第四节 假设检验中的其他问题假设检验中的其他问题假设检验在统计方法中的地位 统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验学习目标1. 了解假设检验的基本思想了解假设检验的基本思想 2. 掌握假设检验的步骤掌握假设检验的步骤3. 能对实际问题作假设检验能对实际问题作假设检验4. 利用置信区间进行假设检验利用置信区间进行假设

2、检验5. 利用利用P - 值进行假设检验值进行假设检验第一节 假设检验的一般问题1假设检验的概念假设检验的概念2假设检验的步骤假设检验的步骤3假设检验中的小概率原理假设检验中的小概率原理4假设检验中的两类错误假设检验中的两类错误5双侧检验和单侧检验双侧检验和单侧检验假设检验的概念与思想什么是假设? 对总体参数的一种看法 总体参数包括总体均值总体均值、比例比例、方差方差等 分析之前之前必需陈述什么是假设检验?1. 概念概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立2. 类型类型参数假设检验非参数假设检验3. 特点特点采用逻辑上的反证法依据统计上的小概率原理假设检验的

3、基本思想m m = 50假设检验的过程(提出假设抽取样本作出决策)我认为。我认为。 拒绝假设拒绝假设! 别无选择别无选择.提出原假设和备择假设 什么是原假设?什么是原假设?(Null Hypothesis)1.待检验的假设,又称“0假设”;2.如果错误地作出决策会导致一系列后果;3.总是有等号 , 或 ;4.表示为 H0H0:m 某一数值 指定为 = 号,即 或 例如, H0:m 60000元(某金属价格) 什么是备择假设?什么是备择假设?(Alternative Hypothesis)1.与原假设对立的假设2.总是有不等号: , 或 3.表示为 H1H1:m 某一数值,或m 某一数值例如,

4、H1:m 60000元,或m 60000元 什么检验统计量?什么检验统计量?1.用于假设检验问题的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知3.检验统计量的基本形式为规定显著性水平 什么显著性水平?什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为 (alpha)常用的 值有0.01, 0.05, 0.104.由研究者事先确定作出统计决策1. 计算检验的统计量2. 根据给定的显著性水平,查表得出相应的临界值Z或Z/23. 将检验统计量的值与 水平的临界值进行比较4. 得出接受或拒绝原假设的结论假设检验中

5、的小概率原理假设检验中的小概率原理 什么小概率?什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率;2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设;3.小概率由研究者事先确定。假设检验中的两类错误1.第一类错误(弃真错误)第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为 (Beta)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为

6、真H0为假为假接受接受H01 - 第二类错第二类错误误( ()拒绝拒绝H0第一类错第一类错误误( ()功效功效(1-(1-) 错误和 错误的关系你不能同时减你不能同时减少两类错误少两类错误!影响 错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当 减少时增大3.总体标准差 当 增大时增大4.样本容量 n当 n 减少时增大双侧检验和单侧检验双侧检验与单侧检验 (假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0m m = m m0 0m m m m0 0m m m m0 0H1m m m m0 0m m m m0 0双侧检验(原

7、假设与备择假设的确定)1. 双侧检验属于决策中的假设检验决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施2. 例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格3. 建立的原假设与备择假设应为 H0: m m 10 H1: m m 10双侧检验(确定假设的步骤)1. 例如问题为: 检验该企业生产的零件平均长度为4厘米2.步骤从统计角度陈述问题 (m = 4)从统计角度提出相反的问题 (m 4)必需互斥和穷尽提出原假设 (m = 4)提出备择假设 (m 4)有 符号 提出原假设: H0: m = 4 提出备择假设: H1: m 4

8、双侧检验(例子)双侧检验(显著性水平与拒绝域 ) /2 双侧检验(显著性水平与拒绝域 ) /2 双侧检验(显著性水平与拒绝域 ) /2 双侧检验(显著性水平与拒绝域 ) /2 单侧检验(原假设与备择假设的确定) 检验检验研究中的假设研究中的假设1. 将所研究的假设作为备择假设H12. 将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设3. 先确立备择假设H1单侧检验(原假设与备择假设的确定)q 例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上属于研究中的假设建立的原假设与备择假设应为 H0: m m 1500 H1: m m 15

9、00q 例如,改进生产工艺后,会使产品的废品率降低到2%以下属于研究中的假设建立的原假设与备择假设应为 H0: m m 2% H1: m m 2%单侧检验(原假设与备择假设的确定)检验检验某项声明的有效性某项声明的有效性1. 将所作出的说明(声明)作为原假设2. 对该说明的质疑作为备择假设3. 先确立原假设H0 除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的单侧检验(原假设与备择假设的确定)q 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的建立的原假设与备择假设应为 H0

10、: m m 1000 H1: m m 1000 提出原假设: H0: m 1000 选择备择假设: H1: m 1000 单侧检验(例子) 提出原假设: H0: m 25 选择备择假设: H1: : m 25 单侧检验(例子)单侧检验(显著性水平与拒绝域 ) 左侧检验(显著性水平与拒绝域 ) 观察到的样本统计量观察到的样本统计量左侧检验(显著性水平与拒绝域 ) 右侧检验(显著性水平与拒绝域 ) 右侧检验(显著性水平与拒绝域 ) 第二节 一个正态总体的参数检验一一. 总体方差已知时的均值检验总体方差已知时的均值检验二二. 总体方差未知时的均值检验总体方差未知时的均值检验三三. 总体比例的假设检验

11、总体比例的假设检验一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾) t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾) 2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差检验的步骤 陈述原假设 H0 陈述备择假设 H1 选择显著性水平 选择检验统计量 选择n 给出临界值 搜集数据 计算检验统计量 进行统计决策 表述决策结果总体方差已知时的均值检验(双尾 Z 检验)一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾) t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾) 2 2检验检验(单尾和双尾)

12、(单尾和双尾)均值均值一个总体一个总体比例比例方差方差均值的双尾 Z 检验 (2 已知)1.假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30)2.原假设为:H0: m=m0;备择假设为:H1:m m03.使用z-统计量均值的双尾 Z 检验(实例)【例【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为m0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05)均值的双尾 Z 检验(计算结果)

13、 H0: m m = 0.081 H1: m m 0.081 = 0.05 n = 200 临界值临界值(s):总体方差已知时的均值检验(单尾 Z 检验)均值的单尾 Z 检验 (2 已知)1. 假定条件总体服从正态分布若不服从正态分布,可以用正态分布来近似 (n30)2. 备择假设有符号3. 使用z-统计量均值的单尾 Z 检验(提出假设)均值的单尾Z检验 (实例)【例【例】某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡? (

14、0.05)均值的单尾Z检验 (计算结果) H0: m m 1000 H1: m m 1020 = 0.05n = 16临界值临界值(s):检验统计量检验统计量: 决策决策:结论结论:总体方差未知时的均值检验(双尾 t 检验)一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾) t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾) 2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差均值的双尾 t 检验(2 未知)1.假定条件总体为正态分布如果不是正态分布, 只有轻微偏斜和大样本 (n 30)条件下2.使用t 统计量均值的双尾 t 检验

15、 (实例)【例【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?均值的双尾 t 检验 (计算结果)H0: m m = 1000H1: m m 1000 = 0.05df = 9 - 1 = 8临界值临界值(s):检验统计量检验统计量: 决策:决策:结论:结论:总体方差未知时的均值检验(单尾 t 检验)均值的单尾 t 检验(实例) 【例【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40

16、000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05)均值的单尾 t 检验 (计算结果)H0: m m 40000H1: m m 40000 = 0.05df = 20 - 1 = 19临界值临界值(s):检验统计量检验统计量:决策决策: 结论结论: 总体比例的假设检验(Z 检验)适用的数据类型离散数据离散数据 连续数据连续数据数值型数据数值型数据数数 据据品质数据品质数据一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾) t

17、 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾) 2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差一个总体比例的 Z 检验1. 假定条件有两类结果总体服从二项分布可用正态分布来近似2. 比例检验的 z 统计量一个总体比例的 Z 检验 (实例)【例【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信? ( = 0.05)一个样本比例的 Z 检验 (结果)H0: p = 0.3H1: p 0.3 = 0.05n = 200临界值临界值(s):.025.025总体

18、方差的检验(2 检验)一个总体的检验Z 检验检验(单尾和双尾)(单尾和双尾) t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾) 2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差方差的卡方 (2) 检验1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.原假设为 H0: 2 = 024.检验统计量卡方 (2)检验实例【例【例】根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?( 0.05 )

19、卡方 (2) 检验 计算结果H0: 2 = 0.0025H1: 2 0.0025 = 0.05df = 20 - 1 = 19临界值临界值(s):第三节 两个正态总体的参数检验一一. 两个总体参数之差的抽样分布两个总体参数之差的抽样分布2两个总体均值之差的检验两个总体均值之差的检验3假设检验中相关样本的利用假设检验中相关样本的利用4两个总体比例之差的检验两个总体比例之差的检验两个正态总体的参数检验两个总体的检验两个总体的检验Z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)Z 检验检验F 检验检验均值均值比例比例方差方差两个独立样本的均值检验两个独立样本之差的

20、抽样分布 m m1 1总体总体1 2 m m2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2m m1- 1- m m2 2两个总体均值之差的Z检验 (12、 22 已知)1.假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230)2.原假设:H0: m1- m2 =0;备择假设:H1: m1- m2 03.检验统计量为两个总体均值之差的Z检验 (假设的形式)假设假设

21、研究的问题研究的问题没有差异没有差异有差异有差异均值均值1 1 均值均值2 2均值均值1 1 均值均值2 2H0H1两个总体均值之差的Z检验 (例子) 有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8 8公斤,第二种方法的标准差为1010公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n n1 1=32=32,n n2 2=40=40,测得x2= 5050公斤,x1= 4444公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( ( =0.05)=0.05)两个总体均值之差的Z检验(计算结果)H0: m

22、m1 1- m m2 2 = 0H1: m m1 1- m m2 2 0 = 0.05n1 = 32,n2 = 40临界值临界值(s):两个总体均值之差的 t 检验 (12、 22未知)1.检验具有等方差的两个总体的均值2.假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等12 223.检验统计量两个总体均值之差的 t 检验 (例子)两个总体均值之差的 t 检验(计算结果)H0: m m1 1- m m2 2 0H1: m m1 1- m m2 2 0 = 0.05n1 = 10,n2 = 8临界值临界值(s):两个相关(配对或匹配)样本的均值检验两个总体均值之差

23、的检验(配对样本的 t 检验)1.检验两个相关总体的均值 配对或匹配 重复测量 (前/后)2.利用相关样本可消除项目间的方差3.假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 )配对样本的 t 检验 (假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异总体总体1 1 总体总体2 2总体总体1 1 总体总体2 2H0m mD = 0m mD 0m mD 0H1m mD 0m mD 0配对样本的 t 检验(数据形式)观察序号观察序号样本样本1 1样本样本2 2差值差值1x 11x 21D1 = x 11 - x 212x 12x

24、 22D1 = x 12 - x 22M MM MM MM Mix 1ix 2iD1 = x 1i - x 2iM MM MM MM Mnx 1nx 2nD1 = x 1n- x 2n配对样本的 t 检验(检验统计量)【例【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:配对样本的 t 检验(例子)训练前训练前94.5101110103.59788.596.5101104116.5训练后训练后8589.5101.5968680.58793.593102样本差值计算

25、表样本差值计算表训练前训练前训练后训练后差值差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计合计98.5配对样本的 t 检验(计算表)配对样本的 t 检验(计算结果)H0: m m1 m m2 8.5H1: m m1 m m2 8.5 = 0.05df = 10 - 1 = 9临界值临界值(s):配对样本的 t 检验(计算结果)两个总体比例之差的检验 (Z 检验)1.假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似2.检验统计

26、量两个总体比例之差的Z检验两个总体比例之差的检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异比例比例1 1 比例比例2 2比例比例1 1 比例比例2 2H0P1P2 = 0P1P2 0P1P2 0H1P1P2 0P1P20两个总体比例之差的Z检验 (例子)两个总体比例之差的Z检验(计算结果)H0: P1 1- P2 2 0H1: P1 1- P2 2 0 = 0.05n1 = 60,n2 = 40临界值临界值(s):第四节 假设检验中的其他问题一一. 用置信区间进行检验用置信区间进行检验2利用利用P - 值进行检验值进行检验利用置信区间进行假设检验利用置信区间进行假设

27、检验(双侧检验)1.求出双侧检验均值的置信区间利用置信区间进行假设检验(左侧检验)1. 求出单边置信下限利用置信区间进行假设检验(右侧检验)1. 求出单边置信上限利用置信区间进行假设检验 (例子)利用置信区间进行假设检验(计算结果)H0: m m = 1000H1: m m 1000 = 0.05n = 49临界值临界值(s):利用 P-值进行假设检验观察到的显著性水平 P-值什么是 P 值?(P-Value)1.是一个概率值2.如果我们假设原假设为真,P-值是观测到的样本均值不同于(或 ) 实测值的概率左侧检验时,P-值为曲线上方小于等于小于等于检验统计量部分的面积右侧检验时,P-值为曲线上

28、方大于等于大于等于检验统计量部分的面积3.被称为观察到的(或实测的)显著性水平H0 能被拒绝的的最小值利用 P 值进行决策1. 单侧检验若p-值 ,不能拒绝 H0若p-值 , 拒绝 H02. 双侧检验若p-值 /2, 不能拒绝 H0若p-值 /2, 拒绝 H0双尾 Z 检验 (P-值计算实例) 【例【例】儿童食品厂生产的盒装儿童食品每盒的标准重量为368克。现从某天生产的一批食品中随机抽取25盒进行检查,测得每盒的平均重量为 x = 372.5克。企业规定每盒重量的标准差为15克。确定P - 值。双尾 Z 检验 (P-值计算结果)双尾 Z 检验 (P-值计算结果)双尾 Z 检验 (P-值计算结

29、果)双尾 Z 检验 (P-值计算结果)双尾 Z 检验 (P-值计算结果)双尾 Z 检验 (P-值计算结果)双尾 Z 检验 (P-值计算结果)单尾 Z 检验 (P-值计算结果)【例【例】儿童食品厂生产的某种盒装儿童食品,规定每盒的重量不低于368克。现从某天生产的一批食品中随机抽取25盒进行检查,测得每盒的平均重量为x=372.5克。企业规定每盒重量的标准差为15克。确定P-值。单尾 Z 检验 (P-值计算结果)双尾 Z 检验 (P-值计算结果)单尾 Z 检验 (P-值计算结果)用备择假设找出方向单尾 Z 检验 (P-值计算结果)单尾 Z 检验 (P-值计算结果)单尾 Z 检验 (P-值计算结果)单尾 Z 检验 (P-值计算结果)1 p-值值 = .0668单尾 Z 检验 (P-值计算结果)本章小节1. 假设检验的概念和类型假设检验的概念和类型 2. 假设检验的过程假设检验的过程3. 基于一个样本的假设检验问题基于一个样本的假设检验问题4. 基于两个样本的假设检验问题基于两个样本的假设检验问题5. 利用置信区间进行假设检验利用置信区间进行假设检验6. 利用利用p - 值进行假设检验值进行假设检验结结 束束

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(地质数据处理课件:7-假设检验.ppt)为本站会员(罗嗣辉)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|