假设检验-课件.ppt

上传人(卖家):晟晟文业 文档编号:4258266 上传时间:2022-11-23 格式:PPT 页数:75 大小:444.07KB
下载 相关 举报
假设检验-课件.ppt_第1页
第1页 / 共75页
假设检验-课件.ppt_第2页
第2页 / 共75页
假设检验-课件.ppt_第3页
第3页 / 共75页
假设检验-课件.ppt_第4页
第4页 / 共75页
假设检验-课件.ppt_第5页
第5页 / 共75页
点击查看更多>>
资源描述

1、 假设检验假设检验假设检验参数估计 统计推断在总体理论分布和小概率原理的基础上,通过提出假设、确定显著水平、计算统计数、做出推断等步骤来完成在一定概率意义上的推断。会出现两类错误。参数估计又分为区间估计和点估计,与假设检验比较,二者主要是表示结果的形式不同,其本质是一样的。常见的假设检验有:一样个本平均数的检验两个样本平均数的检验频率检验方差检验U检验或Z检验t检验卡方检验F检验1 假设检验概述假设检验概述Hypothesis test 假设检验假设检验参数假设检验参数假设检验非参数假设检验非参数假设检验总体分布已知,总体分布已知,检验关于未知参数检验关于未知参数的某个假设的某个假设总体分布未

2、知时的总体分布未知时的假设检验问题假设检验问题 一、解决的基本问题一、解决的基本问题 利用利用两组样本信息两组样本信息,根据一定概率对总体参数或分布的某,根据一定概率对总体参数或分布的某一假设作出拒绝或保留的决断一假设作出拒绝或保留的决断.。一个质量检验例子:一个质量检验例子:本章讨论参数假设检验本章讨论参数假设检验.生产流水线上罐装可生产流水线上罐装可乐不断地封装,然后装箱乐不断地封装,然后装箱外运外运.怎么知道这批罐装怎么知道这批罐装可乐的容量是否合格呢?可乐的容量是否合格呢?把每一罐都打开倒入量杯把每一罐都打开倒入量杯,看看容量是否合于标准看看容量是否合于标准.这样做显然这样做显然不行!

3、不行!罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.每隔一定时间,抽查若干罐每隔一定时间,抽查若干罐.如每隔如每隔1小时,小时,抽查抽查5罐,得罐,得5个容量的值个容量的值X1,X5,根根据这些值来判断生产是否正常据这些值来判断生产是否正常.通常的办法是进行抽样检查通常的办法是进行抽样检查.(二)备择假设(二)备择假设(alternative hypothesis),与原假设相对立),与原假设相对立(相反相反)的假设。的假设。一般为研究者想收集数据予以证实自己观点的假设。一般为研究者想收集数据予以证实自己观点的假设。用用H1表示。表示。0 H0:(=

4、355)0 例例:H1:0H0(三)两类假设建立原则三)两类假设建立原则 1、H0与与H1必须成对出现必须成对出现 2、通常先确定备择假设,再确定原假设、通常先确定备择假设,再确定原假设 3、假设中的等号、假设中的等号“=”总是放在原假设中总是放在原假设中 例:予以检验的问题是例:予以检验的问题是“生产过程是否正常?生产过程是否正常?”,研究者,研究者想收集证据检验想收集证据检验“生产过程不正常生产过程不正常”。(*正常时就正常时就无必要检查!)无必要检查!)H1:350H0:350三、假设检验的原理,三、假设检验的原理,如何判断原假设如何判断原假设H0 是否成立呢?是否成立呢?在实践中普遍采

5、用小概率原则:在实践中普遍采用小概率原则:小概率事件在一次试验中基本上不会小概率事件在一次试验中基本上不会发生发生.如果在如果在H0条件下发生了小概率事条件下发生了小概率事件,则认为件,则认为H0不正确不正确四、双侧检验和单侧检验(一)双侧检验与单侧检验一)双侧检验与单侧检验(三类三类假设的形式,以均值为例假设的形式,以均值为例)(二)双侧检验(二)双侧检验定义:只强调差异而不强调方向性的检验称为双侧检验。定义:只强调差异而不强调方向性的检验称为双侧检验。例:某种零件的尺寸,要求其平均长度为例:某种零件的尺寸,要求其平均长度为10厘米,大于或厘米,大于或小于小于10厘米均属于不合格。厘米均属于

6、不合格。建立的原假设与备择假设应为建立的原假设与备择假设应为 H0:1 1 10 H1:1 1 102、双侧检验的显著性水平与拒绝域、双侧检验的显著性水平与拒绝域 如果统计量的值界于左、右临界值间,则如果统计量的值界于左、右临界值间,则H0成立;成立;如果大于右临界值或小于左临界值,如果大于右临界值或小于左临界值,H0不成立。不成立。a a/2(三)单侧检验 1、定义:强调方向性的检验叫单侧检验。目的在于检验研、定义:强调方向性的检验叫单侧检验。目的在于检验研究对象是高于(右尾检验)或低于某一水平(左尾检究对象是高于(右尾检验)或低于某一水平(左尾检验)。验)。2、左尾检验(左侧检验)、左尾检

7、验(左侧检验)例如例如:改进生产工艺后,会使产品的生产时间降低到改进生产工艺后,会使产品的生产时间降低到2小时以下小时以下建立的原假设与备择假设应为建立的原假设与备择假设应为 H0:1 1 2 2 H1:1 1 2单下尾检验(左侧检验)显著性水平与拒绝域单下尾检验(左侧检验)显著性水平与拒绝域:如果统计量的值大于左临界值,则如果统计量的值大于左临界值,则H0成立;如果小于左临界值,成立;如果小于左临界值,H0不成不成立。立。3、右侧检验、右侧检验检验研究对象是否高于某一水平。检验研究对象是否高于某一水平。例:采用新技术生产后,将会使产品的使用寿命明显延长例:采用新技术生产后,将会使产品的使用寿

8、命明显延长到到15001500小时以上小时以上 建立的原假设与备择假设应为 H0:1 1 1500 H1:1 1 1500右侧检验显著性水平与拒绝:右侧检验显著性水平与拒绝:如果统计量值小于右临界值,则如果统计量值小于右临界值,则H0成立;如果大于右临界值,成立;如果大于右临界值,H0不成立。不成立。接受域接受域 如果如果H0实际上为真,但统计量的实实际上为真,但统计量的实测值落入了否定域,从而作出否定测值落入了否定域,从而作出否定H0的的结论,那就犯了结论,那就犯了“以真为假以真为假”的错误的错误.如果如果H0不成立,但统计量的不成立,但统计量的实测值未落入否定域,从而没有实测值未落入否定域

9、,从而没有作出否定作出否定H0的结论,即接受了错的结论,即接受了错误的误的H0,那就犯了那就犯了“以假为真以假为真”的错误的错误.请看下表请看下表a/2a/2H0 真真H0 不真不真6062.56567.57072.57567.57072.57577.58082.5两类错误的关系两类错误的关系 两类错误是互相关联的,两类错误是互相关联的,当样本容当样本容量固定时,一类错误概率的减少导致另量固定时,一类错误概率的减少导致另一类错误概率的增加一类错误概率的增加.要同时降低两类错误的概率要同时降低两类错误的概率 ,或,或者要在者要在 不变的条件下降低不变的条件下降低 ,需要增,需要增加样本容量加样本

10、容量.a aa a 六、假设检验的过程与步骤六、假设检验的过程与步骤1、假设检验的过程(提出假设抽取样本作出决策)我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设!别无选择别无选择.2、假设检验的步骤、假设检验的步骤 提出原假设和备择假设提出原假设和备择假设 确定适当的计算检验统计量的公式确定适当的计算检验统计量的公式 规定显著性水平规定显著性水平 由样本信息,计算检验统计量的值由样本信息,计算检验统计量的值 作出统计决策作出统计决策提出原假设和备择假设提出原假设和备择假设1、提出原假设与备择假设。提出原假设与备择假设。H0、H1是对立的,是对立的,“先先将研究者收集

11、证据要证明的观点定为将研究者收集证据要证明的观点定为H1,再提,再提出出H0”。2、三种假设形式、三种假设形式 H0:参数参数 某值某值 H H1 1:参数参数 某值某值 双侧检验双侧检验H0:参数参数 某值某值 H H1 1:参数参数 某值某值 右尾检验右尾检验H0 :参数:参数 某值某值 H H1 1:参数参数 时,时,H0成立成立 多重检验及校正 在同一研究中,有时我们会用到二次或多次显著性检验,从上表可以看出,如果我们将显著性水平确定为=0.05水平,做一次显著性检验后我们只能保证有95%的研究结果与真值是一致的;如果做两次显著性检验后,研究结果与真值的符合程度就会降至95%*95%=

12、90.25,当我们进行5次显著性检验后,就会降至77.4%,即在5次显著性检验后,由水平所得到的显著性检验结果的可靠性只有3/4的可靠性。校正方法1:Bonferroni 校正法-如果研究中进行了n次显著性检验,则将每次显著性检验的水平降至0.05的n分之一倍。*或实验结果的P值的n倍,与0.05比较校正方法2:Newman-Keuls检验法(SNK,检验)校正方法3:最小显著差法(LSD法)校正方法4:Q-value 检验 在同一个研究中,所有显著性检验的p值的分布也是随机的,符合一定的分布规律,因此可以通过这个特点对所得到的所有p值进行校正,使之与总体相一致。2 样本平均数的假设检验样本平

13、均数的假设检验检验问题:检验问题:用从总体中用从总体中抽取的一个样抽取的一个样本的均值,检本的均值,检验该总体均值验该总体均值是否等于某个是否等于某个值。值。一、单样本均值显著性检验(一、单样本均值显著性检验(One-sample t test)例:例:食品安全要求防腐剂添加量必食品安全要求防腐剂添加量必须低于须低于0.1g/kg,如何检验市场中投,如何检验市场中投放的康氏方便面是否达标?放的康氏方便面是否达标?方案:随机抽检方案:随机抽检20盒盒 得到样本得到样本“防腐剂添加量均防腐剂添加量均值值”与与0.1g/kg比较比较 得出结论得出结论*SPSS分析分析*方法1:总体方差已知时的检验1

14、 1、假定条件、假定条件总体服从正态分布总体服从正态分布若不服从正态分布若不服从正态分布,可用正态分布来近似可用正态分布来近似(n 30)30)2 2、原假设、原假设:H0:=0 0 备择假设备择假设:H1:0 03.使用使用z-统计量:统计量:)1,0(0Nnxz方法2:总体方差未知时的均值检验*(2 未知,小样本)1.假定条件假定条件 总体为正态分布总体为正态分布 2.使用使用t 统计量统计量)1(0ntn-1sxt方法3:近似正态分布的检验 1 t检验时,样本大于30 2 总体非正态分布,样本大于300nsxZ 方法总结1、需要依据不同的数据特点选择不同的分析方法、需要依据不同的数据特点

15、选择不同的分析方法2、特点分析、特点分析1:检验数据分布是否为正态分布?:检验数据分布是否为正态分布?3、特点分析、特点分析2:抽样数据样本是大样本还是小样本?:抽样数据样本是大样本还是小样本?单样本检验的单样本检验的SPSS分析操作分析操作 1、检验数据分布是否为正态分布(非参数统计分析、检验数据分布是否为正态分布(非参数统计分析)2、无论是大样本还是小样本、无论是大样本还是小样本 SPSS菜单:菜单:Analyzecompare meanone-sample t test 输入输入0值(值(test value)与显著性水平()与显著性水平(confidence interval)值)值

16、3、读取结果:、读取结果:用用sig.值与值与0.05比较进行决策。比较进行决策。*单样本检验结果读取实例单样本检验结果读取实例检验问题:检验问题:用两个样本平均数用两个样本平均数之间的差异值之间的差异值 X1-X2检验所代表的检验所代表的两个总体之间两个总体之间u1-u2是否有差异?是否有差异?二、平均数差值的显著性检验二、平均数差值的显著性检验例:例:如何检验某种新型降压药的治如何检验某种新型降压药的治疗效果?疗效果?方案:病例方案:病例-对照研究对照研究 随机将高血压病人分为两组随机将高血压病人分为两组 或用同一组病人服药前、后或用同一组病人服药前、后 得到两个样本均值差异值得到两个样本

17、均值差异值 检验其是否等于检验其是否等于“0”得出结论得出结论*SPSS分析分析*数据获取与分析方案数据获取与分析方案 方案方案1:随机分组随机分组服药组服药后平均血压值服药组服药后平均血压值统计分析方法:独立样本检验(统计分析方法:独立样本检验(Independent-samples t test)方案方案2:配对分组配对分组服药组服药前平均血压值服药组服药前平均血压值统计分析方法:配对样本检验(统计分析方法:配对样本检验(Paired-samples t test)未服药组平均血压值未服药组平均血压值服药组服药后平均血压值服药组服药后平均血压值(一)独立样本检验(一)独立样本检验(Inde

18、pendent-samples t test)用于处理生物学研究中比较不同处理效应用于处理生物学研究中比较不同处理效应的差异显著性的差异显著性。数据资料数据资料中,两个样本的各个变量从各自中,两个样本的各个变量从各自总体中抽取,两个样本之间变量没有任何关总体中抽取,两个样本之间变量没有任何关联,即两个抽样样本彼此独立,不论两个样联,即两个抽样样本彼此独立,不论两个样本容量是否相同。本容量是否相同。假定条件假定条件两个样本是独立的随机样本两个样本是独立的随机样本两个两个总体都是正态分布总体都是正态分布若不是正态分布若不是正态分布,可以用正态分布来近似可以用正态分布来近似(n1 1 3030和和

19、n2 2 30)30)原假设原假设 H0:1 1 2 2=0 0 备择假设:备择假设:H1:1 1 2 2 0 0检验统计量检验统计量2221212121)()(nnxxz2221212121)()(nsnsxxz或或方法1:两个总体方差都已知(或方差未知大样本两个总体方差都已知(或方差未知大样本)有两种方法可用于制造某种以抗拉强度为重要特有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为产出的产品其抗拉强度的标准差为8公斤,第二公斤,第二种方法的标准差为种方法的标准差为10公斤。从两种方

20、法生产的产公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得测得 x2=50公斤,公斤,x1=44公斤公斤。问这两种方法生产的产品平均抗拉强度是否有。问这两种方法生产的产品平均抗拉强度是否有显著差别?显著差别?(a a=0.05)例题例题 计算结果计算结果 H0:1 1-2 2=0 H1:1 1-2 2 0 a a=0.05 n1=32,n2=40 临界值临界值(s):83.240100326404050)()(2221212121nnxxz两个总体方差未知,但相等。两个总体方差未知,但相等。(1)假定条件假定条件两

21、个样本是独立随机样本两个样本是独立随机样本两个两个总体都是正态分布总体都是正态分布两个总体方差未知但相等两个总体方差未知但相等 1 12 2 2 22 2 (样本方差差异不显著)(样本方差差异不显著)(2 2)假设:原假设假设:原假设?备择假设备择假设?(3)检验统计量检验统计量21212111)()(nnsxxtp2)1()1(212222112nnsnsnSp方法方法2:两个总体方差未知,小样本:两个总体方差未知,小样本dfdf=n=n1 1+n+n2 2-2-2例:用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大鼠的增重量(g)高蛋白组:134、146、106、119、1

22、24、161、107、83、113、129、97、123;低蛋白组:70、118、101、85、107、132、94;试问两种饲料饲养是否有差别?假设方差相等 假设 H0:1=2 H1:1 2 检验计算:结论:在t分布中,当df=17时,t0.05=2.112.7,33.425,0.10112,97.451,7.12022221211nsxnsx57.442)1()1()1()1(212221212nnnsnssp005.101121nnsp916.1112121nnsxxtp例题例题(计算结果)计算结果)H0:1 1-2 2 0 H1:1 1-2 2 0 a a=0.05 n1=10,n2=

23、8 临界值临界值(s):576.18110137.1106.171.2611)()(212121nnsxxtp 两个总体方差未知,但不相等(齐性)两个总体方差未知,但不相等(齐性)(1)假定条件假定条件 两个样本是独立的随机样本两个样本是独立的随机样本 两个两个总体都是正态分布总体都是正态分布 两个总体方差未知但不相等两个总体方差未知但不相等 1 12 2 2 22 2(样本方差差异显著)(样本方差差异显著)(2 2)假设:原假设假设:原假设?备择假设备择假设?(3)检验统计量检验统计量2221212121)()(nsnsxxt独立样本差异性检验独立样本差异性检验SPSS操作操作 SPSS菜单

24、命令:菜单命令:Analyze compare mean Independent-samples t test 输入检验变量、分组编号输入检验变量、分组编号 读取结果:读取结果:用用sig.值与值与0.05比较进行决策。比较进行决策。*独立样本差异性检验结果分析独立样本差异性检验结果分析(二)配对样本检验(二)配对样本检验(Paired-samples t test)要求两个样本间配偶成对,每一对除随机地给予不同处理外,其他试验条件尽量一致。检验两个相关总体的均值检验两个相关总体的均值 配对或匹配配对或匹配 重复测量重复测量(前前/后后)假定条件假定条件 两个总体都服从正态分布两个总体都服从正

25、态分布 如果不服从正态分布,可用正态分布来近似如果不服从正态分布,可用正态分布来近似(n1 30,n2 30)配对样本的 t 检验(数据形式)例:在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两差试验动物用随机分配法在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定其肝中的维生素A的含量,其结果如下表,试检验两组饲料对试验动物肝中维生素A含量的作用是否有显著差异。配对样本的 t 检验(检验统计量)DDDnsDxt0DniiDnDx11)(12DniDiDnxDs【例例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可一个以减肥为主要目

26、标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查公斤以上。为了验证该宣称是否可信,调查人员随机抽取了人员随机抽取了10名参加者,得到他们的体重记录如下表:名参加者,得到他们的体重记录如下表:配对样本的 t 检验(例子)配对样本的 t 检验(计算表)计算表)配对样本的 t 检验(计算结果)计算结果)85.9105.981DniiDnDx199.2110525.431)(12DniDiDnxDs H0:1 2 8.5 H1:1 2 8.5 a a=0.05 df=10-1=9 临界值临界值(s):配对样本的 t 检验(计

27、算结果)计算结果)94.110199.25.885.90DDDnsDxt配对样本差异性检验配对样本差异性检验SPSS操作操作 SPSS菜单:菜单:Analyze compare mean Paired-samples t test 输入配对的检验变量输入配对的检验变量 读取结果:读取结果:用用sig.值与值与0.05比较进行决策。比较进行决策。*配对配对样本差异性检验结果分析样本差异性检验结果分析3 样本率的假设检验样本率的假设检验一、单样本率的检验一、单样本率的检验 研究问题研究问题 用用1个总体中抽样样本计算出的率,检验该总体个总体中抽样样本计算出的率,检验该总体率是否等于某个值。率是否等

28、于某个值。必须有一个总体报告率值或标准率值。必须有一个总体报告率值或标准率值。方法:方法:假定条件假定条件样本为大样本样本为大样本总体近似服从正态分布总体近似服从正态分布假设:假设:H0:p p=p p0 0;H1:p p p p 0 0 使用使用z-统计量:统计量:npz/)1(000ppp例:有一批蔬菜种子的平均发芽率为0.85,现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,试检验种衣剂对种子发芽有无效果。H0:p=p0=0.85;H1:p p0 检验计算:4)推断:在Z分布中,Z0.05=1.965.20.0160.85-0.89/)1(000npzppp二、双样本率的差

29、异检验二、双样本率的差异检验 研究问题研究问题 用两个总体中抽样样本计算出的率的差值,检验两个总用两个总体中抽样样本计算出的率的差值,检验两个总体率是否相等。体率是否相等。例:研究地势对小麦锈病发病的影响,调查低洼地麦田378株,其中锈病342株,调查高坡地麦田396株,其中锈病株313株,试比较两块麦田锈病发病率是否有显著性差异。JAMA,2008;299(20):2401-2405.doi:10.1001/jama.299.20.2401 方法方法1:假定条件假定条件样本为大样本,总体近似服从正态分布样本为大样本,总体近似服从正态分布,且为独且为独立样本立样本 使用使用z-统计量:统计量:

30、)11(2121nnpqppz212211nnnpnpp*P1、p2分别为两个样本的率,分别为两个样本的率,p为二者的联合比率为二者的联合比率 方法方法2:使用使用z-统计量:统计量:22211121)(nqpnqpdppz 率的差异性检验率的差异性检验SPSS分析分析 _采用卡方检验采用卡方检验3双样本方差齐性检验)双样本方差齐性检验)(一)研究问题(一)研究问题 用两个总体中抽样样本计算出的方差,检验两个总体方差用两个总体中抽样样本计算出的方差,检验两个总体方差是否相等。是否相等。例:对技改前、后产品方差改变情况的检验。例:对技改前、后产品方差改变情况的检验。1 1、假定条件、假定条件样本为大样本,总体服从正态分布样本为大样本,总体服从正态分布,且为独立样本且为独立样本2 2、H0:两总体方差相等(齐性)两总体方差相等(齐性)H1:两总体方差不相等(不齐性)两总体方差不相等(不齐性)使用使用F-统计量:统计量:21222221ssFssFF或较大样本的方差较大样本的方差3双样本方差齐性检验)双样本方差齐性检验)双样本方差齐性检验双样本方差齐性检验SPSS操作操作

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(假设检验-课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|