1、32独立性检验的基本思想及其初步应用1了解分类变量的意义2了解22列联表的意义3了解随机变量K2的意义4通过对典型案例分析,了解独立性检验的基本思想和方法.122列联表的意义(重点)2随机变量K2的计算及应用(重点)3独立性检验的基本思想(难点)饮用水的质量是人类普遍关心的问题据统计,饮用优质水的518人中,身体状况优秀的有466人;饮用水质一般的312人中,身体状况优秀的有218人人的身体健康状况与饮用水的质量有关系吗?122列联表(1)分类变量的定义变量的不同“值”表示,像这样的变量称为分类变量(2)22列联表的定义假设有两个分类变量X和Y,它们的取值分别为 和,其样本频数列联表(也称为2
2、2列联表)为:个体所属的不同类别x1,x2y1,y2y1y2总计x1ababx2cdcd总计acbdabcdabcd 3独立性检验的定义及判断方法(1)独立性检验的定义利用随机变量K2来判断“”的方法,称为独立性检验(2)独立性检验的方法有列联表法、等高条形图法及K2公式法两个分类变量有关系1如果根据性别与是否爱好运动的列联表得到K23.8523.841,所以判断性别与运动有关,那么这种判断犯错的可能性不超过()A2.5%B0.5%C1%D5%解析:P(K23.841)0.05,故“判断性别与运动有关”出错的可能性为5%.答案:D2假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y
3、2,其22列联表为:y1y2总计x1ababx2cdcd总计acbdabcd对同一样本,以下数据能说明X与Y有关的可能性最大的一组为()Aa5,b4,c3,d2 Ba5,b3,c4,d2Ca2,b2,c4,d5 Da2,b3,c4,d5解析:对于同一样本,|adbc|越小,说明x与y相关性越弱,而|adbc|越大,说明x与y相关性越强,通过计算知,对于A,B,D都有|adbc|1012|2.对于选项C,有|adbc|158|7,显然72.答案:C3统计推断,当_时,有95%的把握说事件A和B有相关关系;当_时,认为没有充分的证据显示事件A与B是有相关关系的解析:结合K2临界值表可知,当K23.
4、841时有95%的把握说事件A与B有关;当K22.706时认为没有充分的证据显示事件A与B是有关的答案:K23.841K22.7064巴西医生马廷恩收集犯有各种贪污、受贿罪的官员与廉洁官员寿命的调查资料:500名贪官中有348人的寿命小于平均寿命,152人的寿命大于或等于平均寿命;590名廉洁官员中有93人的寿命小于平均寿命,497人的寿命大于或等于平均寿命这里,平均寿命是指“当地人均寿命”能否在犯错误的概率不超过0.01的前提下认为官员在经济上是否清廉与他们寿命的长短之间有关系?解析:据题意列22列联表如下:(2019湖南高考)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的
5、列联表:男女总计爱好402060不爱好203050总计6050110P(K2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C有99%以上的把握认为“爱好该项运动与性别有关”D有99%以上的把握认为“爱好该项运动与性别无关”解析:根据独立性检验的定义,由K27.86.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选C.答案:C在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:
6、男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人请你根据所给数据,能否在犯错误不超过0.1的前提下认为在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机?解题过程根据题意,列出22列联表如下:晕机不晕机总计男乘客243155女乘客82634总计325789题后感悟解独立性检验问题的基本步骤(1)认真读题,指出相关数据,得出22列联表;(2)根据22列联表中的数据,计算K2的观测值k;(3)通过观测值k与临界值k0的比较;(4)在犯错误的概率不超过的前提下能否推断“X与Y有关系”1.磨牙不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每晚都磨
7、牙与肠道中有寄生虫有关吗?肠道中有寄生虫肠道中没有寄生虫合计每晚都磨牙22430254不磨牙241 3551 379合计2481 3851 633某校在高三数学测试后,随机抽取部分学生进行测试成绩统计,抽取出来的所有学生,按男、女分为两组,得到如下数据:据此资料是否认为男生比女生成绩差成绩小于90分成绩不小于90分合计男生3070100女生2575100合计55145200题后感悟(1)给出的随机变量K2的值k,其值越大,说明“X与Y有关系”成立的可能性越大,其值越小,说明“X与Y有关系”成立的可能性越小(2)若k2.706,则认为学生成绩与性别有关2.为了探究学生选报文、理科是否与对外语的兴
8、趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人试分析学生选报文、理科与对外语的兴趣是否有关?解析:根据题目所给的数据得到如下列联表:理科文科总计有兴趣13873211无兴趣9852150总计236125361在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人进行问卷调查,只有80人志愿加入国家西部建设,而国家公布实施西部开发战略后,随机抽取1 200名应届大学毕业生进行问卷调查,有400人志愿加入国家西部建设问:实施西部开发战略的公布是否对应届大学毕业生的选择产生了影
9、响?规范解答据题意列出22列联表如下表:6分志愿者非志愿者总计开发战略公布前809201 000开发战略公布后4008001 200总计4801 720 2 200题后感悟解此类问题的基本思路:一、先判断题目是不是判断两分类变量的相关关系;二、列22列联表,确定a,b,c,d的值;三、求K2的观测值;四、由K2值判断两分类变量的相关关系3.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件试分别用列联表、等高条形图、独立性检验的方法分析监督员甲对产品质量好坏
10、有无影响能否在犯错误的概率不超过0.001的前提下认为质量监督员甲在不在生产现场与产品质量好坏有关系?解析:(1)22列联表如下:合格品数次品数总计甲在生产现场9828990甲不在生产现场49317510总计1 475251 500由列联表可得|adbc|982174938|12 750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”(2)相应的等高条形图如图所示图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样本中次品数的频率从图中可以看出,甲不在生产现场样本中次品数的频率明显高于甲在生产现场样本中次品数的频率因此可以认为质量监督员甲在不在生产现场与产品质量
11、好坏有关系1如何分析两个分类变量的相关关系?(1)通过图形直观判断两个分类变量是否相关,如等高条形图(2)独立性检验通过22列联表,计算K2的观测值,定量判断,“两个分类变量有关系”这一结论成立的可信程度提醒这里所说的“变量”和“值”不一定是具体的数值例如性别变量,其取值为男和女两种2独立性检验的基本思想与反证法的思想有何相似之外?反证法独立性检验要证明结论A要确认“两个分类变量有关系”在A不成立的前提下进行推理假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下计算K2推出矛盾意味着结论A成立由观测数据计算得到的K2的观测值k很大,则在一定可信程度上说明假设不合理没有找到矛盾,不能对A下任何结论,即反证法不成立根据随机变量K2的含义,可以通过概率P(K2k0)的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一结论成立的可信程度有多大为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,数据如表,试问吸烟量与年龄是否有关?年龄合计不超过40岁超过40岁吸烟量不多于20支/天501565吸烟量多于20支/天102535合计6040100【错因】由于对22列联表中a、b、c、d的位置不确定,在代入公式时取错了数值,导致计算结果的错误练考题、验能力、轻巧夺冠
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。