新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件.pptx

上传人(卖家):副主任 文档编号:6890469 上传时间:2023-08-18 格式:PPTX 页数:17 大小:1.64MB
下载 相关 举报
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件.pptx_第1页
第1页 / 共17页
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件.pptx_第2页
第2页 / 共17页
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件.pptx_第3页
第3页 / 共17页
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件.pptx_第4页
第4页 / 共17页
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件.pptx_第5页
第5页 / 共17页
点击查看更多>>
资源描述

1、1.通过实例,通过实例,制作、制作、理解理解22列联表的统计意义列联表的统计意义.2.理解判断两个分类变量是否有关系的常用方法理解判断两个分类变量是否有关系的常用方法.课标要求素养要求通过学习通过学习22列联表,提升数学抽象、列联表,提升数学抽象、数据建模数据建模及数据分析素养及数据分析素养.重难点制作理解列联表、理解利用抽样数据频率得出结论的可靠性制作理解列联表、理解利用抽样数据频率得出结论的可靠性问题导学 前面两节所讨论的变量,如人的身高、树的胸径、树的高度、短跑100m世界纪录和创纪录的时间等,都是数值变量,数值变量的取值为实数.其大小和运算都有实际含义.在现实生活中,人们经常需要回答一

2、定范围内的两种现象或性质之间是否存在关联性或相互影响的问题.例如,就读不同学校是否对学生的成绩有影响,不同班级学生用于体育锻炼的时间是否有差别,吸烟是否会增加患肺癌的风险,等等,本节将要学习的独立性检验方法为我们提供了解决这类问题的方案。在讨论上述问题时,为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等.在很多时候,这些数值只作为编号使用,并没有通常的大小和运算意义,本节我们主要讨论取值于0,1的分类变量的关联性问题.问题探究问题1.为了有

3、针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查,全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼。你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?为了清楚起见,我们用表格整理数据性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计3208041124 在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将下表这种形式的数据统计表称为2

4、2列联表(contingency table).22列联表给出了成对分类变量数据的交叉分类频数,以右表为例,它包含了X和Y的如下信息:最后一行的前两个数分别是事件Y=0和Y=1中样本点的个数;最后一列的前两个数分别是事件X=0和X=1中样本点的个数;中间的四个格中的数是表格的核心部分,给出了事件X=x,Y=y(x,y=0,1)中样本点的个数;右下角格中的数是样本空间中样本点的总数。概念解析性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计32080411241.分类变量分类变量我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,

5、这类随机变我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为量称为_,分类变量的取值可以用,分类变量的取值可以用_表示表示.分类变量分类变量实数实数2.22列联表及随机事件的概率列联表及随机事件的概率(1)22列联表:如果随机事件列联表:如果随机事件X与与Y的样本数据如下表格形式的样本数据如下表格形式XY合计Y0Y1X0ababX1cdcd合计acbdabcd在这个表格中,核心的数据是中间的在这个表格中,核心的数据是中间的4个格子,个格子,所以这样的表格通常称为所以这样的表格通常称为22列联表列联表.例1.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取8

6、8名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀,试分析两校学生中数学成绩优秀率之间是否存在差异.学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788 表是关于分类变量X和Y的抽样数据的22列联表:最后一行的前两个数分别是事件(Y=0)和(Y=1)的频数;最后一列的前两个数分别是事件(X=0)和(X=1)的频数;中间的四个格中的数是事件(X=x,Y=y)(x,y=0,1)的频数;典例解析我们可以用等高堆积条形图直观地展示上述计算结果,如图所示 左边的蓝色和红色条的高度分别是甲校

7、学生中数学成绩不优秀和数学成绩优秀的频率;右边的蓝色和红色条的高度分别是乙校学生中数学成绩不优秀和数学成绩优秀的频率,通过比较发现,两个学校学生抽样数据中数学成绩优秀的频率存在差异,甲校的频率明显高于乙校的频率,依据频率稳定于概率的原理,我们可以推断P(Y=1|X=0)P(Y=1|X=1).也就是说,如果从甲校和乙校各随机选取一名学生,那么甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率,因此,可以认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高。学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788

8、2.两个分类变量之间关联关系的定性分析的方法:等高堆积条形图可以展示列联表数据的频率特征,能够直观地反映出两个分类变量间是否相互影响.概念解析【例子例子】在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解解根据题目给出的数据作出如下的列联表:根据题目给出的数据作出如下的列联表:色盲不色盲合计男38442480女6514520合计449561 000根据列联表作出相应的等高堆积条形图:根据列联表作出相应的等高堆积条形图:从等高堆积条形图来看,在男人中患色盲的比例要比在女人从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多

9、,因此,我们认为患色盲与性别是有中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的关系的.利用等高堆积条形图判断两个分类变量是否相关的步骤:利用等高堆积条形图判断两个分类变量是否相关的步骤:思维升华问题:你认为以上例子中“两校学生的数学成绩优秀率存在差异”等结论是否有可能是错误的?有可能 “两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.有可能出现这种情况:在随机抽取的这个样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时

10、,犯错误的可能性会较大.因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算.问题探究课堂小结1.牢记牢记3个知识点个知识点(1)分类变量的概念;分类变量的概念;(2)22列联表;列联表;(3)等高堆积条形图等高堆积条形图.2.掌握掌握2个方法个方法(1)用用22列联表分析两分类变量间关系的方法;列联表分析两分类变量间关系的方法;(2)用等高堆积条形图分析两分类变量间关系的方法用等高堆积条形图分析两分类变量间关系的方法.3.注意注意1个易错点个易错点作作22列联表时,关键是对涉及的变量分清类别,计算时要准确无误列联表时,关键是对涉及的变量分清类别,计算时要准确无误.4.要理解通过抽样数据得出的结论是有误差的,我们下一节将进一步学习如何评估结论的可靠性。课后练习:教材127、128,教学设计后的作业。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 人教A版(2019) > 选择性必修 第三册
版权提示 | 免责声明

1,本文(新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件.pptx)为本站会员(副主任)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|