第八章 §8.3 列联表与独立性检验.pptx

上传人(卖家):四川天地人教育 文档编号:1668041 上传时间:2021-08-20 格式:PPTX 页数:79 大小:1.60MB
下载 相关 举报
第八章 §8.3 列联表与独立性检验.pptx_第1页
第1页 / 共79页
第八章 §8.3 列联表与独立性检验.pptx_第2页
第2页 / 共79页
第八章 §8.3 列联表与独立性检验.pptx_第3页
第3页 / 共79页
亲,该文档总共79页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、8.3列联表与独立性检验 第八章成对数据的统计分析 本资料分享自千人QQ群323031380 期待你的加入与分享 学习目标 XUE XI MU BIAO 1.通过实例,理解22列联表的统计意义. 2.通过实例,了解22列联表独立性检验及其应用. 内 容 索 引 知识梳理 题型探究 随堂演练 课时对点练 1知识梳理 PART ONE 为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的 现象或性质,这类随机变量称为分类变量.分类变量的取值可以用_ 表示. 知识点一分类变量 实数 知识点二22列联表 1.22列联表给出了成对分类变量数据的 . 2.定义一对分类变量X和Y,我们整理数据如下表

2、所示: X Y 合计 Y0Y1 X0abab X1cdcd 合计acbdnabcd 像这种形式的数据统计表称为22列联表. 交叉分类频数 知识点三独立性检验 1.定义:利用2的取值推断分类变量X和Y 的方法称为2独立性 检验,读作“卡方独立性检验”.简称独立性检验. 2.2 ,其中nabcd. 3.独立性检验解决实际问题的主要环节 (1)提出零假设H0:X和Y相互独立,并给出在问题中的解释. (2)根据抽样数据整理出22列联表,计算2的值,并与临界值x比较. (3)根据检验规则得出推断结论. (4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和 Y间的影响规律. 是否独立 思考

3、独立性检验与反证法的思想类似,那么独立性检验是反证法吗? 答案不是.因为反证法不会出错,而独立性检验依据的是小概率事件 几乎不发生. 1.分类变量中的变量与函数的变量是同一概念.() 2.等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中 2取值则可通过统计表从数据上说明两分类变量的相关性的大小.() 3.事件A与B的独立性检验无关,即两个事件互不影响.() 4.2的大小是判断事件A与B是否相关的统计量.() 思考辨析 判断正误 SI KAO BIAN XI PAN DUAN ZHENG WU 2题型探究 PART TWO 一、等高堆积条形图的应用 例1为了解铅中毒病人与尿棕色素为阳

4、性是否有关系,分别对病人组 和对照组的尿液作尿棕色素定性检查,结果如下: 组别 尿棕色素 合计 阳性数阴性数 铅中毒病人29736 对照组92837 合计383573 试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素 阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系? 解等高堆积条形图如图所示: 其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳 性的频率. 由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率 差异明显,因此铅中毒病人与尿棕色素为阳性有关系. 反思 感悟 等高堆积条形图的优劣点 (2)劣点:不能给出推断“两个分类变量有关系”犯错误的概率

5、. 跟踪训练1网络对现代人的生活影响较大,尤其是对青少年,为了解 网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随 机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期 末考试不及格,而另外800人中有120人不及格.利用等高堆积条形图判 断学生学习成绩与经常上网有关吗? 解根据题目所给的数据得到如下22列联表: 学习成绩 上网 合计 经常不经常 不及格80120200 及格120680800 合计2008001 000 得出等高堆积条形图如图所示: 比较图中阴影部分高可以发现经常上网不及格的频率明显高于经常上网 及格的频率,因此可以认为学习成绩与经常上

6、网有关. 命题角度1有关“相关的检验” 例2某校对学生课外活动进行调查,结果整理成下表:试根据小概率值 0.005的独立性检验,分析喜欢体育还是文娱与性别是否有关系. 二、由2进行独立性检验 性别 喜欢 合计 体育文娱 男生212344 女生62935 合计275279 解零假设为H0:喜欢体育还是喜欢文娱与性别没有关系. a21,b23,c6,d29,n79, 根据小概率值0.005的独立性检验,我们推断H0不成立,即认为喜欢 体育还是喜欢文娱与性别有关. 反思 感悟 用2进行“相关的检验”步骤 (1)零假设:即先假设两变量间没关系. (2)计算2:套用2的公式求得2值. (3)查临界值:结

7、合所给小概率值查得相应的临界值x. (4)下结论:比较2与x的大小,并作出结论. 跟踪训练2甲、乙两机床加工同一种零件,抽检得到它们加工后的零 件尺寸x(单位:cm)及个数y,如下表: 零件尺寸x1.011.021.031.041.05 零件 个数y 甲37893 乙7444a 由表中数据得y关于x的经验回归方程为 91100 x(1.01x1.05), 其中合格零件尺寸为1.030.01(cm). 完成下面列联表,并依据小概率值0.01的独立性检验,分析加工零件 的质量与甲、乙是否有关. 机床加工 零件的质量 合计 合格零件数不合格零件数 甲 乙 合计 所以a11.由于合格零件尺寸为1.03

8、0.01 cm, 故甲、乙加工的合格与不合格零件的数据表为: 机床加工 零件的质量 合计 合格零件数不合格零件数 甲24630 乙121830 合计362460 零假设为H0:加工零件的质量与甲、乙无关. 因为2106.635x0.01,根据小概率值0.01的独立性检验,我们推 断H0不成立. 即认为加工零件的质量与甲、乙有关. 命题角度2有关“无关的检验” 例3下表是某届某校本科志愿报名时,对其中304名学生进入高校时是 否知道想学专业的调查表: 知道想学专业不知道想学专业合计 男生63117180 女生4282124 合计105199304 根据表中数据,则下列说法正确的是_.(填序号)

9、性别与知道想学专业有关; 性别与知道想学专业无关; 女生比男生更易知道所学专业. 所以性别与知道想学专业无关. 反思 感悟 独立性检验解决实际问题的主要环节 (1)提出零假设H0:X和Y相互独立,并给出在问题中的解释. (2)根据抽样数据整理出22列联表,计算2的值,并与临界 值x比较. (3)根据检验规则得出推断结论. (4)在X和Y不独立的情况下,根据需要,通过比较相应的频率, 分析X和Y间的影响规律. 跟踪训练3某省进行高中新课程改革,为了解教师对新课程教学模式 的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用 情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教

10、师30人. 老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对 新课程教学模式赞同的有24人,不赞同的有6人. (1)根据以上数据建立一个22列联表; 解22列联表如下表所示: 教师年龄 对新课程教学模式 合计 赞同不赞同 老教师101020 青年教师24630 合计341650 (2)试根据小概率值0.01的独立性检验,分析对新课程教学模式的赞 同情况与教师年龄是否有关系. 解零假设为H0:对新课程教学模式的赞同情况与教师年龄无关. 4.9636.635x0.01, 所以有99%以上的把握认为“销售人员具有相关大学学历与能按时完成 销售任务是有关系的”. 12345 1.知识

11、清单: (1)分类变量. (2)22列联表. (3)等高堆积条形图. (4)独立性检验,2公式. 2.方法归纳:数形结合. 3.常见误区:对独立性检验的原理不理解,导致不会用2分析问题. 课堂小结 KE TANG XIAO JIE 4课时对点练 PART FOUR 1.观察下列各图,其中两个分类变量x,y之间关系最强的是 基础巩固 12345678910 11 12 13 14 15 16 解析观察等高堆积条形图易知D选项两个分类变量之间关系最强. 2.(多选)给出下列实际问题,其中用独立性检验可以解决的问题有 A.两种药物治疗同一种病是否有区别 B.吸烟者得肺病的概率 C.吸烟是否与性别有关

12、系 D.网吧与青少年的犯罪是否有关系 解析独立性检验是判断两个分类变量是否有关系的方法,而B是概率 问题,故选ACD. 12345678910 11 12 13 14 15 16 3.为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度) 的关系,运用22列联表进行独立性检验,经计算28.01,则所得到 的统计学结论是认为“性别与喜欢乡村音乐有关系”的把握约为 A.0.1% B.0.5% C.99.5% D.99.9% 解析因为28.017.879x0.005, 所以认为性别与喜欢乡村音乐有关系的把握有99.5%. 12345678910 11 12 13 14 15 16 4.某同学

13、寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如 下22列联表: 年龄 饮食习惯 合计 偏爱蔬菜偏爱肉类 50岁以下4812 50岁以上16218 合计201030 则可以说其亲属的饮食习惯与年龄有关的把握为 A.95% B.99%C.99.5% D.99.9% 12345678910 11 12 13 14 15 16 所以有99.5%的把握认为其亲属的饮食习惯与年龄有关. 12345678910 11 12 13 14 15 16 5.考察棉花种子处理情况跟生病之间的关系得到下表数据: 种子 种子 合计 处理未处理 得病32101133 不得病61213274 合计93314407

14、 根据以上数据,可得出 A.种子是否经过处理跟生病有关 B.种子是否经过处理跟生病无关 C.种子是否经过处理决定是否生病 D.以上都是错误的 12345678910 11 12 13 14 15 16 0.1643.841,所以判定主修统计专业与 性别有关系,那么这种判断出错的可能性最大为_.5% 12345678910 11 12 13 14 15 16 解析因为23.841x0.05, 所以依据小概率值0.05的独立性检验, 认为主修统计专业与性别有关,出错的可能性最大为5%. 12345678910 11 12 13 14 15 16 9.在某测试中,卷面满分为100分,60分为及格,为

15、了调查午休对本次测 试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生 进行了测试成绩的统计,数据如下表所示: 分数段2940 4150 5160 6170 7180 8190 91100 午休考生 人数 23473021143114 不午休考 生人数 1751671530173 12345678910 11 12 13 14 15 16 (1)根据上述表格完成列联表; 人数 合计 及格人数不及格人数 午休 不午休 合计 12345678910 11 12 13 14 15 16 解22列联表如下表所示: 人数 合计 及格人数不及格人数 午休80100180 不午休65135200

16、 合计145235380 12345678910 11 12 13 14 15 16 (2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义? 人数 合计 及格人数不及格人数 午休80100180 不午休65135200 合计145235380 12345678910 11 12 13 14 15 16 由P1P2,可以粗略判断午休与考生考试及格有关系,并且午休的及格 率高, 所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态. 12345678910 11 12 13 14 15 16 10.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问 卷调查得到了如下的2

17、2列联表: 性别 打篮球 合计 喜爱不喜爱 男生6 女生10 合计48 已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为 . (1)请将上面的22列联表补充完整(不用写计算过程); 12345678910 11 12 13 14 15 16 解列联表补充如下: 性别 打篮球 合计 喜爱不喜爱 男生22628 女生101020 合计321648 12345678910 11 12 13 14 15 16 (2)根据小概率值0.05的独立性检验,能否据此推断喜爱打篮球与性 别有关? 解零假设H0:喜爱打篮球与性别无关, 根据小概率值0.05的独立性检验,我们推断H0不成立, 即认为喜爱

18、打篮球与性别有关. 12345678910 11 12 13 14 15 16 (3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X, 求X的分布列与均值. 解喜爱打篮球的女生人数X的可能取值为0,1,2. 故X的分布列为 12345678910 11 12 13 14 15 16 综合运用 11.(多选)下列关于回归分析与独立性检验的说法不正确的是 A.回归分析和独立性检验没有什么区别 B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变 量之间的不确定关系 C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是 否具有某种关系的一种检验 D.独立性检验可

19、以100%确定两个变量之间是否具有某种关系 解析由回归分析及独立性检验的特点知,选项C正确. 12345678910 11 12 13 14 15 16 12.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有 色盲.下列说法正确的是 A.男人、女人中患色盲的频率分别为0.038和0.006 C.男人中患色盲的比例比女人中患色盲的比例大,可以认为患色盲与性 别是有关的 D.调查人数太少,不能说明色盲与性别有关 12345678910 11 12 13 14 15 16 故认为患色盲与性别是有关的. 12345678910 11 12 13 14 15 16 13.某人研究中学

20、生的性别与成绩、视力、智商、阅读量这4个变量的关 系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关 联的可能性最大的变量是 表1 性别 成绩 合计 不及格及格 男61420 女102232 合计163652 12345678910 11 12 13 14 15 16 表2 性别 视力 合计 好不好 男41620 女122032 合计163652 12345678910 11 12 13 14 15 16 表3 性别 智商 合计 偏高正常 男81220 女82432 合计163652 12345678910 11 12 13 14 15 16 表4 性别 阅读量 合计 丰富不丰

21、富 男14620 女23032 合计163652 A.成绩 B.视力C.智商 D.阅读量 12345678910 11 12 13 14 15 16 12345678910 11 12 13 14 15 16 14.世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜 欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了 50人,所得数据制成如下列联表: 年龄 西班牙队 合计 不喜欢喜欢 高于40岁pq50 不高于40岁153550 合计ab100 12345678910 11 12 13 14 15 16 若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概

22、率 为 ,则有超过_的把握认为年龄与西班牙队的被喜欢程度有关. 临界值表: 0.100.050.0100.0050.001 x2.7063.8416.6357.87910.828 95% 12345678910 11 12 13 14 15 16 解析设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A, 所以q25,p25,a40,b60. 故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关. 12345678910 11 12 13 14 15 16 拓广探究 15.(多选)有两个分类变量X,Y,其22列联表如下所示: X Y 合计 Y1Y2 X1A20a20 X215a30a4

23、5 合计155065 其中a,15a均为大于5的整数,若依据小概率值0.05的独立性检验, 认为X,Y有关,则a的值为 A.6 B.7C.8 D.9 12345678910 11 12 13 14 15 16 根据a5且15a5,aZ, 求得当a8或9时满足题意. 12345678910 11 12 13 14 15 16 16.“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人 对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路 人进行了问卷调查,得到了如下列联表: 态度 性别 合计 男性女性 反感10 不反感8 合计30 已知在这30人中随机抽取1人抽到反感“ 中国

24、式过马路” 的路人的概率是 . 12345678910 11 12 13 14 15 16 (1)请将上面的列联表补充完整(直接写结果,不需要写求解过程),并 据此资料分析反感“中国式过马路”与性别是否有关? 12345678910 11 12 13 14 15 16 解 态度 性别 合计 男性女性 反感10616 不反感6814 合计161430 零假设为H0,反感“中国式过马路”与性别无关, 所以,没有充足的理由认为反感“中国式过马路”与性别有关. 12345678910 11 12 13 14 15 16 (2)若从这30人中的女性路人中随机抽取2人参加一活动,记反感“中 国式过马路”的人数为X,求X的分布列和均值. 12345678910 11 12 13 14 15 16 解X的可能取值为0,1,2, 所以X的分布列为 12345678910 11 12 13 14 15 16 本课结束 更多精彩内容请登录:

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 高考专区 > 一轮复习
版权提示 | 免责声明

1,本文(第八章 §8.3 列联表与独立性检验.pptx)为本站会员(四川天地人教育)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|