数据分析技术课件第5章假设检验.pptx

上传人(卖家):晟晟文业 文档编号:3705312 上传时间:2022-10-06 格式:PPTX 页数:33 大小:2.92MB
下载 相关 举报
数据分析技术课件第5章假设检验.pptx_第1页
第1页 / 共33页
数据分析技术课件第5章假设检验.pptx_第2页
第2页 / 共33页
数据分析技术课件第5章假设检验.pptx_第3页
第3页 / 共33页
数据分析技术课件第5章假设检验.pptx_第4页
第4页 / 共33页
数据分析技术课件第5章假设检验.pptx_第5页
第5页 / 共33页
点击查看更多>>
资源描述

1、 第第5 5章章 假设检验假设检验目录Contents假设检验概述假设检验方法均值过程单样本T检验独立样本T检验配对样本T检验假设检验概述假设检验概述知识目标:了解假设检验的概念与种类;能力目标:掌握假设检验的基本思想;素质目标:具备良好的职业道德,诚实守信。01PART知识导入知识导入 某豆制品生产企业试图鼓动消费者在早餐中尽量多地食用豆制品,以获得更好的市场利润。于是他们大力宣传:“早上要多吃豆制品,这样有助于减肥!”为了验证这个说法,调查者随机选取了35个人,询间他们早餐和午餐的通常食谱,并根据食谱将他们分为两类:一类为经常豆制品食用者(A类),一类为非经常豆制品食用者(B类),然后测度

2、每人午餐的热量摄取量。经过一段时间的跟踪调查,得到的结果如下所示。食用者类型食用者类型热量摄取量热量摄取量A568 681 636 607 555 496 540 539 529 562 589 646 596 617 584B650 630 628 624 711 723 569 632 688 580 569 596 706 563 480 651 709 622 637 617“多吃豆制品有助于减肥多吃豆制品有助于减肥”这一说法是否成立呢?这一说法是否成立呢?概率分布函数概率分布概率概率是反映概率是反映随机随机事件事件出现的可能出现的可能性大小性大小。随机事件是指在相同条件下,可能出现也

3、可能不出现的事件。概率分布是指用于概率分布是指用于表述随机事件结果表述随机事件结果取值的概率规律。取值的概率规律。事件的概率表示了一次试验中某一个结果发生的可能性大小。概率分布函数是概率分布函数是描述随机变量取描述随机变量取值分布规律的数值分布规律的数学表示学表示。例如:例如:统计学基础统计学基础xdxxfF)()x(在统计学中,正态分布是许多统计分析方法的理论基础。无论是本章所讲的假设检验还是后续的方差分析、相关与回归等内容,均要求分析的指标服从正态分布正态分布。因此,我们需要重点了解一下正态分布的概率密度函数及其特征。正态分布重点知识重点知识正态分布的概率密度函数是正态分布的概率密度函数是

4、:222)(21)(xexf正态曲线呈钟型,两头低,中间高,曲线与横轴间的面积总等于1;正态曲线关于均值对称,在均值处达到最大值,在正(负)无穷远处取值为0;随机变量的取值邻近均值的概率越大,远离均值的概率越小;方差越小,分布越集中在均值附近;方差越大,分布越分散。01020304请思考:正态分布的概率分布图具有哪些特征?请思考:正态分布的概率分布图具有哪些特征?图图5-1 5-1 正态分布正态分布概率分布图概率分布图 假设检验假设检验也叫显著性检验,是以小概率反证法的逻辑推理,判断假设是也叫显著性检验,是以小概率反证法的逻辑推理,判断假设是否成立的统计方法否成立的统计方法。它首先假设样本对应

5、的总体参数(或分布)与某个已知总体参数(或分布)相同,然后根据统计量的分布规律来分析样本数据,利用样本信息判断是否支持这种假设,并对检验假设做出取舍抉择,做出的结论是概率性的,不是绝对的肯定或否定。假设检验假设检验概念假设检验概念【案例分析】【案例分析】可口可乐标签的承诺是否可信?可口可乐标签的承诺是否可信?假如可口可乐生产的一种瓶装雪碧,其标签上标注的容量为250毫升,标准差为4毫升。如果从市场上随机抽取50瓶,发现其平均含量为248毫升,那么标签上的承诺是否可信?这时,我们就可以假设“可口可乐标签的承诺是可信”或者“可口可乐标签的承诺不可信”,然后通过样本数据进行检验分析来检测假设是否正确

6、,从而做出最终的判断,这就是我们所谓的假设检验。假设检验种类假设检验种类我们都知道在数据轴上有正负方向。在某些情况下,某些假设问题是具有方向性的。通常来说,所谓的方向性有两种情况:一种是所观察的数值越大越好;另一种情况是所观察的数值越小越好。根据检验的实际需求不同,单侧检验中可能会出现不同的方向。单侧检验双侧检验双侧检验,就是指当统计分析的目的是要检验样本平均数与总体平均数,或样本成数有没有显著差异,而不问差异的方向是否是正差还是负差时,所采用的一种统计检验方法。例如,要检验车间技术改进后的产品单位成本总体均值与技术改进前的产品单位成本总体均值是否有什么不同。假设检验的基本思想假设检验的基本思

7、想 假设检验的基本思想是对总体数值设定某种假设,以小概率事件小概率事件不发生为基准,运用反证法思想反证法思想,按照总体数值的假设,并根据所获取的样本数据,通过样本统计量的分布,得出小概率事件在某一次试验或者观测中发生与否的现象,从而对总体数值进行分析及对其原先设定的假设作出拒绝与否的判断。04030201统计学基础知识:概率、概率统计学基础知识:概率、概率分布以及概率分布函数等;分布以及概率分布函数等;假设检验是假设检验是以小概率反证法的逻以小概率反证法的逻辑推理,判断假设是否成立的统辑推理,判断假设是否成立的统计计方法;方法;假设检验的种类分为单侧和假设检验的种类分为单侧和双侧检验;双侧检验

8、;假设检验的基本假设检验的基本思想。思想。本节课教学内容总结本节课教学内容总结 假设检验的分析方法假设检验的分析方法知识目标:了解假设检验的原理;能力目标:掌握假设检验的基本步骤和两类错误;素质目标:具备良好的职业道德,诚实守信。02PART案例讲解案例讲解下面将使用假设检验的分析方法来解决上述问题。下面将使用假设检验的分析方法来解决上述问题。第一步,根据问题的实际情况,提出第一步,根据问题的实际情况,提出原假设原假设H H0 0和和备选假设备选假设H H1 1。假设检验的基本步骤假设检验的基本步骤第二第二步,选取适当的显著步,选取适当的显著水平。水平。在假设检验中,显著性水平是指当原假设成立

9、时,人们却把它拒绝了的概率或风险,犯这种错误的概率用 表示。实际检验中,通常取值为0.05。第三第三步,选定检验统计量并分析拒绝域的步,选定检验统计量并分析拒绝域的形式。形式。案例中可选定如下统计量:假设检验的基本步骤假设检验的基本步骤第四第四步,确定接受域与拒绝域步,确定接受域与拒绝域。由于Z服从标准正态分布,认为给定显著性水平 =0.05,过查标准正态分布表可知临界值为1.96,则拒绝域可表示为 。)(1,020NnuxZ96.1|21uuuW第五第五步,计算统计量的值,根据拒绝域作出决策步,计算统计量的值,根据拒绝域作出决策。在案例中,如果抽样值|u|1.96,则接受原假设H0,拒绝备选

10、假设H1;如果抽样值|u|1.96,则拒绝原假设H0,接受备选假设H1。假设检验的基本步骤假设检验的基本步骤根据计算结果,|u|=|-3.536|=3.5361.96,说明一次抽样的样本统计量落在拒绝域内,此时小概率事件在一次抽样中发生了,利用反证法思想得出矛盾现象,则拒绝原假设H0。原假设H0实际是正确或者成立的,但却错误的拒绝了H0,这样就犯了“误拒”的错误,通常称之为第类错误或拒真错误,犯第类错误的概率记为 。误拒 错误误受错误原假设H0实际是不正确或者不成立的,但却错误的接受了H0,这样就犯了“误受”的错误,通常称之为第类错误或取伪错误,犯第类错误的概率记为。假设检验假设检验的两类错误

11、的两类错误假设检验假设检验的两类错误的两类错误对原假设的判断假设本身的真假情况原假设H0成立原假设H0不成立接受原假设H0 决策正确 “误受”错误 拒绝原假设H0 “误拒”错误 决策正确)(1p)(p)(p)(1p对原假设的判断与假设本身的真假的关系对原假设的判断与假设本身的真假的关系如果减少犯第如果减少犯第类错误的概率,就会增大犯第类错误的概率,就会增大犯第类错误的概率类错误的概率;如果如果减少犯第减少犯第类错误的概率,就会增大犯第类错误的概率,就会增大犯第类错误的概率。类错误的概率。均值过程均值过程知识目标:了解均值的基本概念;能力目标:掌握均值过程的基本思想;素质目标:具备良好的职业道德

12、,诚实守信。03PART 均值均值,亦称为平均数,是表示一组数据集中趋势的量数,是指在一组数据,亦称为平均数,是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数中所有数据之和再除以这组数据的个数。均值是反映数据集中趋势的一项指标,解答均值相关问题的关键在于确定“总数量”以及和总数量对应的总份数。根据“总数量”的不同,我们把均值分别确认为样本均值和总体均值。其中,样本均值是指在总体中的样本数据的均值;而总体均值又称为总体的数学期望或简称期望,是描述随机变量取值平均状况的数字特征。均值的基本概念均值的基本概念 (1 1)计算思路相同:两个均值的计算思路都是用所测量的群体

13、的某指标的)计算思路相同:两个均值的计算思路都是用所测量的群体的某指标的总和除以群体个数;总和除以群体个数;(2 2)反映的都是数据的集中趋势。样本均值和总体均值都是反映数据集中)反映的都是数据的集中趋势。样本均值和总体均值都是反映数据集中趋势的一项指标;趋势的一项指标;(3 3)两者一般情况下不完全相等,样本是对总体的推测。)两者一般情况下不完全相等,样本是对总体的推测。样本只是总体的一部分,样本取自总体,可以反映总体的特征,因此样本平均值也会比较接近于总体平均值,恰好等于总体平均值的机会很少。一般情况下样本均值与总体均值之间会有些差异。样本均值与总体均值的关系样本均值与总体均值的关系 单样

14、本单样本t t检验检验知识目标:了解单样本t检验的基本思想;能力目标:掌握单样本t检验的基本步骤;素质目标:具备良好的职业道德,诚实守信。04PART 单单样本样本t t检验的目的是利用来自某单个总体的样本数据,推断该总体的均值检验的目的是利用来自某单个总体的样本数据,推断该总体的均值是否与假设的检验值之间存在显著性差异是否与假设的检验值之间存在显著性差异。比如,在一批产品中选取部分产品进行成本检验,以样本检验结果推断总体,再与假设检验值比较,类似审计抽样检验;或在一批产品中选取从不同地区的产品销量作为检验样本,测试样本的销售情况,以样本检验结果推断总体,再与假设检验值比较,得出是否与预期保持

15、大致一致的结果。单样本单样本t检验的基本思想检验的基本思想单样本单样本t检验的检验的基本步骤基本步骤 独立样本独立样本t t检验检验知识目标:了解独立样本t检验的基本概念;能力目标:掌握独立样本t检验的基本步骤;素质目标:具备良好的职业道德,诚实守信。05PART 在进行数据分析时,我们经常会遇到比较两类人或两个类别在某些观察方面是否存在差异的实际问题,这种问题从数据建模的角度讲,就是比较两个总体是否具有相同分布的问题。两两独立样本独立样本t t检验(各实验处理组之间毫无相关存在,即为独立样本)的目检验(各实验处理组之间毫无相关存在,即为独立样本)的目的是利用来自两个非相关样本总体的独立样本的

16、是利用来自两个非相关样本总体的独立样本,推断两个总体的均值是否存在显推断两个总体的均值是否存在显著差异著差异。例如男生和女生的高中学习能力、产品A和产品B的销量是否有差异等。独立样本独立样本t检验的检验的基本思想基本思想独立样本独立样本t检验检验的基本步骤的基本步骤情形一情形一独立样本独立样本t检验检验的基本步骤的基本步骤情形二情形二 配对样本配对样本t t检验检验知识目标:了解配对样本t检验的基本概念;能力目标:掌握配对样本t检验的基本思想;素质目标:具备良好的职业道德,诚实守信。06PART 匹配样本就是两个样本是配对的,其观察值数目相同,其观察值的顺序不能随意更改。匹配样本检验的思想出发点在于对试验前后样本的差值情况进行检验,如果两个匹配总体均值不存在显著性差异,则两个匹配样本均值之差应该与零不存在显著性差异。匹配匹配样本的检验方法主要用于检验两个相关样本是否来自具有相同均值的样本的检验方法主要用于检验两个相关样本是否来自具有相同均值的正态总体,即推断两个匹配总体的均值是否存在显著性差异,正态总体,即推断两个匹配总体的均值是否存在显著性差异,比如减肥药服药前后体重比较检验、培训前后学生成绩分数比较检验、某种教学方法是否对教学有效等。配对样本配对样本t检验的基本思想检验的基本思想配对配对样本样本t检验检验的基本步骤的基本步骤配对配对样本样本t检验检验的基本步骤的基本步骤

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(数据分析技术课件第5章假设检验.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|