1、1.2 独立性检验的基本思想及其初步应用1.1.掌握掌握2 22 2列联表的独立性检验,能利用给出的数据列出列联列联表的独立性检验,能利用给出的数据列出列联表并会求表并会求K K2 2的观测值的观测值.2.2.了解独立性检验的基本思想和方法了解独立性检验的基本思想和方法.1.1.本节课的重点是理解独立性检验的基本思想及实施步骤本节课的重点是理解独立性检验的基本思想及实施步骤.2.2.本节课的难点是了解随机变量本节课的难点是了解随机变量K K2 2的含义和根据的含义和根据K K2 2的值得出结的值得出结论的意义论的意义.1.1.分类变量分类变量变量的不同变量的不同“值值”表示个体所属的,像这样的
2、变量表示个体所属的,像这样的变量称为分类变量称为分类变量.2.2.列联表列联表(1)(1)定义:列出的两个分类变量的,称为列联表定义:列出的两个分类变量的,称为列联表.不同类别不同类别频数表频数表(2)2(2)22 2列联表:列联表:一般地,假设两个分类变量一般地,假设两个分类变量X X和和Y Y,它们的取值分别为,它们的取值分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2,其样本频数列联表其样本频数列联表(称称2 22 2列联表列联表)为为y y1 1y y2 2总计总计x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b
3、+c+da+b+c+d3.3.独立性检验独立性检验(1)(1)定义:利用随机变量定义:利用随机变量K K2 2来判断来判断“两个分类变量有关系两个分类变量有关系”的的方法称为两个分类变量的独立性检验方法称为两个分类变量的独立性检验.(2)(2)公式:公式:K K2 2其中其中n=n=.2n(adbc)(ab)(cd)(ac)(bd)a+b+c+da+b+c+d1.1.在独立性检验中,计算得在独立性检验中,计算得k=29.78,k=29.78,在判断变量相关时,在判断变量相关时,P(KP(K2 26.635)0.016.635)0.01的含义是什么?的含义是什么?提示:提示:P(KP(K2 26
4、.635)0.016.635)0.01的含义是在犯错误的概率不超过的含义是在犯错误的概率不超过0.010.01的前提下认为两个变量相关的前提下认为两个变量相关.2.2.列联表中列联表中ad-bcad-bc的值与两个分类变量之间相关的强弱有的值与两个分类变量之间相关的强弱有什么关系?什么关系?提示:提示:在列联表中,若两个分类变量没有关系,则在列联表中,若两个分类变量没有关系,则|ad-bc|ad-bc|00,所以,所以ad-bcad-bc的值越小,两个分类变量之间的关系越的值越小,两个分类变量之间的关系越弱;弱;ad-bcad-bc的值越大,两个分类变量之间的关系越强的值越大,两个分类变量之间
5、的关系越强.3.3.作散点图的主要目的是作散点图的主要目的是.【解析】【解析】散点图可以形象地展示两个变量之间的关系,所以它散点图可以形象地展示两个变量之间的关系,所以它的主要目的就是直观了解两个变量之间的关系的主要目的就是直观了解两个变量之间的关系.答案:答案:直观了解两个变量之间的关系直观了解两个变量之间的关系4.4.若由一个若由一个2 22 2列联表中的数据计算得列联表中的数据计算得K K2 2的观测值的观测值k=4.013,k=4.013,则则认为认为“两个变量有关系两个变量有关系”犯错误的概率不超过犯错误的概率不超过.【解析】【解析】P(KP(K2 23.841)0.053.841)
6、0.05,认为认为“两个变量有关系两个变量有关系”犯错误的概率不超过犯错误的概率不超过0.05.0.05.答案:答案:0.050.051.1.对于对于“分类变量分类变量”的理解的理解(1)(1)这里的这里的“变量变量”和和“值值”都应作为都应作为“广义广义”的变量和值进的变量和值进行理解行理解.例如,对于性别变量,其取值为男和女两种例如,对于性别变量,其取值为男和女两种.那么这里那么这里的变量指的是性别,同样这里的的变量指的是性别,同样这里的“值值”指的是指的是“男男”和和“女女”.因此,这里所说的因此,这里所说的“变量变量”和和“值值”不一定取的是具体的数值不一定取的是具体的数值.2.2.独
7、立性检验与反证法的异同点独立性检验与反证法的异同点独立性检验的思想来自于统计学的假设检验思想,它与反证法独立性检验的思想来自于统计学的假设检验思想,它与反证法类似,假设检验和反证法都是先假设结论不成立,然后根据是类似,假设检验和反证法都是先假设结论不成立,然后根据是否能够推出否能够推出“矛盾矛盾”来断定结论是否成立来断定结论是否成立.但二者但二者“矛盾矛盾”的的含义不同,反证法中的含义不同,反证法中的“矛盾矛盾”是指不符合逻辑的事件的发生;是指不符合逻辑的事件的发生;而假设检验中的而假设检验中的“矛盾矛盾”是指不符合逻辑的小概率事件的发生,是指不符合逻辑的小概率事件的发生,即在结论不成立的假设
8、下,推出利用结论成立的小概率事件的即在结论不成立的假设下,推出利用结论成立的小概率事件的发生发生.3.3.判断两个分类变量是否有关系的两种方法比较判断两个分类变量是否有关系的两种方法比较判断两个分类变量是否有关系的两种方法是:等高条形图和独判断两个分类变量是否有关系的两种方法是:等高条形图和独立性检验立性检验.(1)(1)通过等高条形图,可以粗略地判断两个分类变量是否有关通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度系,但是这种判断无法精确地给出所得结论的可靠程度.(2)(2)利用独立性检验来判断两个分类变量是否有关系,能够精利用独立性检验来
9、判断两个分类变量是否有关系,能够精确地给出这种判断的可靠程度,也常与图形分析法结合确地给出这种判断的可靠程度,也常与图形分析法结合.等高条形图的应用等高条形图的应用【技法点拨】【技法点拨】1.1.判断两个分类变量是否有关系的两个常用方法判断两个分类变量是否有关系的两个常用方法(1)(1)利用数形结合思想,借助等高条形图来判断两个分类变量利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法是否相关是判断变量相关的常见方法.(2)(2)一般地,在等高条形图中,与一般地,在等高条形图中,与 相差越大,两个分相差越大,两个分类变量有关系的可能性就越大类变量有关系的可能性就
10、越大.aabccd2.2.利用等高条形图判断两个分类变量是否相关的步骤利用等高条形图判断两个分类变量是否相关的步骤【典例训练】【典例训练】1.1.从发生交通事故的司机中抽取从发生交通事故的司机中抽取2 0002 000名司机作随机样本,根据名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:整理如下:有责任有责任无责任无责任总计总计有酒精有酒精650650150150800800无酒精无酒精7007005005001 2001 200总计总计1 3501 3506506502 0002 000相应的等高条形
11、图如图所示相应的等高条形图如图所示.试结合等高条形图分析血液中含试结合等高条形图分析血液中含有酒精与对事故负有责任是否有关系有酒精与对事故负有责任是否有关系.2.2.某学校对高三学生进行了一项调查发现:在平时的模拟考试某学校对高三学生进行了一项调查发现:在平时的模拟考试中,性格内向的学生中,性格内向的学生426426人中有人中有332332人在考前心情紧张,性格外人在考前心情紧张,性格外向的学生向的学生594594人中有人中有213213人在考前心情紧张人在考前心情紧张.作出等高条形图,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系利用图形判断考前心情紧张与性格类别是否有关系.【
12、解析】【解析】1.1.比较来说,两者差距较大,在比较来说,两者差距较大,在“有酒精有酒精”和和“无酒无酒精精”两个矩形中,阴影部分的面积不同,由此可以看出在某种两个矩形中,阴影部分的面积不同,由此可以看出在某种程度上认为血液中含有酒精与对事故负有责任有关系程度上认为血液中含有酒精与对事故负有责任有关系.2.2.作列联表如下:作列联表如下:性格内向性格内向性格外向性格外向总计总计考前心情紧张考前心情紧张332332213213545545考前心情不紧张考前心情不紧张9494381381475475总计总计4264265945941 0201 020相应的等高条形图如图所示,相应的等高条形图如图所
13、示,图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出,考前紧张的样本中性格内向占的比的比例,从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关前紧张与性格类型有关.【归纳】【归纳】等高条形图的作法及作用小结等高条形图的作法及作用小结.提示提示:1.1.首先作首先作2 22 2列联表,注意对涉及的变量分清类别列联表,注意对涉及的变量分清类别;其次其次要注意计算的准确性要注意计算的准确性;第三画
14、等高条形图,注意各变量的顺序第三画等高条形图,注意各变量的顺序与所画位置与所画位置.2.2.通过等高条形图可以粗略地判断两个分类变量是否有关系,通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的可靠程度但无法精确地给出所得结论的可靠程度.【变式训练】【变式训练】为了了解铅中毒病人是否有尿棕色素增加现象,为了了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下表,问铅中毒病人组和对照组的尿棕色素阳性数有无差别?表,问铅中毒病人组和对照组的尿棕色素阳性数有无差别?组别组别阳性数
15、阳性数 阴性数阴性数总计总计铅中毒铅中毒病人组病人组29297 73636对照组对照组9 928283737总计总计383835357373【解析】【解析】根据列联表作出等高条形图根据列联表作出等高条形图(如图如图).).由图形可知,铅由图形可知,铅中毒病人组与对照组相比较,尿棕色素为阳性差异明显,因此中毒病人组与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系铅中毒病人与尿棕色素为阳性存在相关关系.独立性检验独立性检验【技法点拨】【技法点拨】解决一般的独立性检验问题的步骤解决一般的独立性检验问题的步骤【典例训练】【典例训练】1.(20121.(2012武汉高二
16、检测武汉高二检测)在独立性检验中,若随机变量在独立性检验中,若随机变量K K2 2的观的观测值测值k6.635k6.635,则,则()()(A)X(A)X与与Y Y有关系,犯错的概率不超过有关系,犯错的概率不超过1%1%(B)X(B)X与与Y Y有关系,犯错的概率超过有关系,犯错的概率超过1%1%(C)X(C)X与与Y Y没有关系,犯错的概率不超过没有关系,犯错的概率不超过1%1%(D)X(D)X与与Y Y没有关系,犯错的概率超过没有关系,犯错的概率超过1%1%2.(20122.(2012厦门高二检测厦门高二检测)在对人们休闲方式的一次调查中,共在对人们休闲方式的一次调查中,共调查调查1201
17、20人,其中女性人,其中女性7070人、男性人、男性5050人人.女性中有女性中有4040人主要的休人主要的休闲方式是看电视,另外闲方式是看电视,另外3030人主要的休闲方式是运动;男性中有人主要的休闲方式是运动;男性中有2020人主要的休闲方式是看电视,另外人主要的休闲方式是看电视,另外3030人主要的休闲方式是运人主要的休闲方式是运动动.(1)(1)根据以上数据建立一个根据以上数据建立一个2 22 2的列联表;的列联表;(2)(2)休闲方式与性别是否有关?休闲方式与性别是否有关?【解析】【解析】1.1.选选A.k6.635.A.k6.635.说明两个变量说明两个变量X X与与Y Y有关系,
18、这种有关系,这种说法犯错误的概率不超过说法犯错误的概率不超过0.010.01,即,即1%1%,故选,故选A.A.2.(1)22.(1)2的列联表为的列联表为 性性 别别 看电视看电视运动运动总计总计女性女性404030 30 7070男性男性202030305050总计总计60606060120 120 休休 闲闲 方方 式式(2)(2)计算计算K K2 2的观测值为的观测值为而而2.7062.7063.4293.4293.841,3.841,因为因为P(KP(K2 22.706)0.10,P(K2.706)0.10,P(K2 23.841)0.05,3.841)0.05,所以,在犯错误的概率
19、不超过所以,在犯错误的概率不超过0.100.10的前提下,认为休闲方式与的前提下,认为休闲方式与性别有关性别有关.2120(40 3020 30)24k3.429.70 50 60 607【互动探究】【互动探究】本题条件不变的情况下,画出等高条形图本题条件不变的情况下,画出等高条形图.【解析】【解析】【思考】【思考】1.1.求求k k的值的关键是什么?的值的关键是什么?2.k2.k的大小对的大小对“两个变量有关两个变量有关”有什么影响?有什么影响?提示提示:1.1.求求K K2 2的观测值的观测值k k的关键是要准确列出的关键是要准确列出2 22 2列联表,即找列联表,即找准表达式中的各个量的
20、数值准表达式中的各个量的数值.2.2.利用利用K K2 2的观测值进行独立性检验可以精确地给出这种判断的的观测值进行独立性检验可以精确地给出这种判断的可靠程度,而且可靠程度,而且k k的值越大,说明的值越大,说明“X X与与Y Y有关系有关系”成立的可能成立的可能性越大性越大.【变式训练】【变式训练】(2012(2012琼海高二检测琼海高二检测)为了调查某地区老年人是为了调查某地区老年人是否需要志愿者帮助,用简单随机抽样方法从该地区调查了否需要志愿者帮助,用简单随机抽样方法从该地区调查了500500位老年人,结果如下:位老年人,结果如下:是否需要帮助是否需要帮助男男女女总计总计需要需要4040
21、30 30 70 70 不需要不需要160160270270430430总计总计200200300300500500性性 别别(1)(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比估计该地区老年人中,需要志愿者提供帮助的老年人的比例例.(2)(2)能否在犯错误的概率不超过能否在犯错误的概率不超过0.010.01的前提下认为该地区的老的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?年人是否需要志愿者提供帮助与性别有关?附:附:P(KP(K2 2k)k)0.0500.0500.0100.0100.0010.001k k3.8413.8416.6356.63510.82810.8
22、2822n(adbc)K(ab)(cd)(ac)(bd)【解析】【解析】(1)(1)需要帮助的老年人的比例估计值为需要帮助的老年人的比例估计值为(2)(2)P(KP(K2 26.635)0.0106.635)0.010在犯错误的概率不超过在犯错误的概率不超过0.010.01的前提下认为该地区的老年人是的前提下认为该地区的老年人是否需要帮助与性别有关否需要帮助与性别有关.70100%14%.50022500(4027030 160)K9.967 6.635200 300 70430 独立性检验的综合应用独立性检验的综合应用【技法点拨】【技法点拨】判断两个变量是否有关的三种方法判断两个变量是否有关
23、的三种方法【典例训练】【典例训练】1.1.某高校某高校“统计初步统计初步”课程的教师随机调查了选该课的一些学课程的教师随机调查了选该课的一些学生情况,具体数据如下表:生情况,具体数据如下表:专业专业性别性别非统计专业非统计专业统计专业统计专业男男13131010女女7 72020为了判断主修统计专业是否与性别有关系,根据表中的数据,为了判断主修统计专业是否与性别有关系,根据表中的数据,得到得到因为因为P(k3.841)=0.05P(k3.841)=0.05,所以判定主修统计专业与性别有关,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为系,那么这种判断出错的可能性为_._.2501
24、3 20 10 7k4.84423 2720 30()2.2.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,现统计数据如下:甲在生产现场时,990990件产品中有合格品件产品中有合格品982982件,次品件,次品8 8件;甲不在生产现场时,件;甲不在生产现场时,510510件产品中有合格品件产品中有合格品493493件,次品件,次品1717件件.试分别用列联表、等高条形图、独立性检验的试分别用列联表、等高条形图、独立性检验的方法分析监督员甲对产品质量好坏有无影响方法分析监督员甲对产品质量好坏有无影响.
25、能否在犯错误的能否在犯错误的概率不超过概率不超过0.0010.001的前提下,认为质量监督员甲是否在生产现的前提下,认为质量监督员甲是否在生产现场与产品质量有关?场与产品质量有关?【解析】【解析】1.1.根据独立性检验的思想,假设没关系正确的可根据独立性检验的思想,假设没关系正确的可能性为能性为5%5%,所以,判断有关系错误的可能性也为,所以,判断有关系错误的可能性也为5%.5%.答案答案:5%5%2.(1)22.(1)22 2列联表如下:列联表如下:由列联表可得由列联表可得ad-bc|=|982ad-bc|=|98217-49317-4938|=12 750.8|=12 750.相差较大,可
26、在某种程度上认为相差较大,可在某种程度上认为“质量监督员甲是否在现场与质量监督员甲是否在现场与产品质量有关系产品质量有关系”.合格品数合格品数次品数次品数总计总计甲在生产现场甲在生产现场9829828 8990990甲不在生产现场甲不在生产现场4934931717510510总计总计1 4751 47525251 500 1 500(2)(2)画等高条形图画等高条形图.如图可知,在某种程度上认为如图可知,在某种程度上认为“质量监督员甲是否在生产现场质量监督员甲是否在生产现场与产品质量有关系与产品质量有关系”.(3)(3)由由2 22 2列联表中数据,计算得到列联表中数据,计算得到K K2 2的
27、观测值为的观测值为 因此,在犯错误的因此,在犯错误的概率不超过概率不超过0.0010.001的前提下,认为质量监督员甲在不在生产现的前提下,认为质量监督员甲在不在生产现场与产品质量好坏有关系场与产品质量好坏有关系.21 500(982 17493 8)k13.09710.828,990 510 1 475 25【想一想】【想一想】在独立性检验中,容易出现的错误有哪些?在独立性检验中,容易出现的错误有哪些?提示提示:容易因不能准确列出列联表而犯错误;容易因不能准确列出列联表而犯错误;用等高条形图粗略估计代替准确结论而犯错误;用等高条形图粗略估计代替准确结论而犯错误;由于记错由于记错K K2 2公
28、式、计算出错而犯错误;公式、计算出错而犯错误;由于不能利用由于不能利用K K2 2的值与临界值的值与临界值k k0 0比较而出错比较而出错.【变式训练】【变式训练】对某校学生进行心理障碍测试得到如下列联表:对某校学生进行心理障碍测试得到如下列联表:试说明在这三种心理障碍中哪一种与性别关系最大?试说明在这三种心理障碍中哪一种与性别关系最大?【解题指南】【解题指南】分别计算三种心理障碍的分别计算三种心理障碍的K K2 2观测值观测值k k1 1,k k2 2,k k3 3,比较它们的值与比较它们的值与3.8413.841的关系,回答问题的关系,回答问题.焦虑焦虑说谎说谎懒惰懒惰总计总计女生女生5
29、5101015153030男生男生2020101050508080总计总计252520206565110110【解析】【解析】对于上述三种心理障碍分别构造三个随机变量对于上述三种心理障碍分别构造三个随机变量K K2 2的观的观测值:测值:k k1 1,k,k2 2,k,k3 3,则则所以,在犯错误的概率不超过所以,在犯错误的概率不超过0.050.05的前提下,认为焦虑与性别的前提下,认为焦虑与性别无关,说谎与性别有关,懒惰与性别无关无关,说谎与性别有关,懒惰与性别无关.2223110(10 7020 10)k6.366 3.841,30 80 20 90110(15 30 15 50)k1.4
30、10 3.841.30 80 65 4521110(5 6025 20)k0.863 3.841,30 80 25 85【规范解答】【规范解答】独立性检验独立性检验【典例】【典例】(12(12分分)(2012)(2012荆州高二检测荆州高二检测)调查某医院某段时间内调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为晚上的男婴为2424人,女婴为人,女婴为8 8人;出生时间在白天的男婴为人;出生时间在白天的男婴为3131人,女婴为人,女婴为2626人人.(1)(1)将下面的将下面的2 22 2列联表补充完整
31、;列联表补充完整;性别性别晚上晚上白天白天总计总计男婴男婴女婴女婴总计总计 出出 生生 时时 间间(2)(2)能否在犯错误的概率不超过能否在犯错误的概率不超过0.10.1的前提下认为婴儿性别与出的前提下认为婴儿性别与出生时间有关系?生时间有关系?P(KP(K2 2k)k)0.150.150.100.100.050.05k k2.0722.0722.7062.7063.8413.84122n(adbc)K(ab)(cd)(ac)(bd)【解题指导】【解题指导】【规范解答】【规范解答】(1)(1)66分分性别性别晚上晚上白天白天总计总计男婴男婴24 24 31315555女婴女婴8 8262634
32、34总计总计 323257578989出出 生生 时时 间间(2)(2)由所给数据计算由所给数据计算K K2 2的观测值的观测值 8 8分分根据临界值表知根据临界值表知P(KP(K2 22.706)0.10.2.706)0.10.9 9分分因此在犯错误的概率不超过因此在犯错误的概率不超过0.10.1的前提下认为婴儿的性别与出的前提下认为婴儿的性别与出生的时间有关系生的时间有关系.1212分分289(24 2631 8)3.68955 34 32 5k2.70.76【阅卷人点拨】【阅卷人点拨】通过阅卷后分析,对解答本题的失分警示和解通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:题启示总
33、结如下:(注:此处的注:此处的见规范解答过程见规范解答过程).).失失分分警警示示 在解答过程中,若在解答过程中,若处和处和处插入表格处表中数据处插入表格处表中数据填写错误,会直接导致合计出错,也会直接导致填写错误,会直接导致合计出错,也会直接导致k k值值求错,这种情况最多给求错,这种情况最多给3 3分分.在解答中,若在解答中,若处公式记混,会导致处公式记混,会导致k k值出错,使得值出错,使得独立性检验出错,这种情况,只能给第独立性检验出错,这种情况,只能给第(1)(1)问的分数问的分数6 6分分解解题题启启示示(1)(1)错误填写错误填写2 22 2列联表,导致出错;列联表,导致出错;(
34、2)(2)记准记准K K2 2的计算公式,不至于因错记公式而出错;的计算公式,不至于因错记公式而出错;(3)(3)正确回答独立性检验的结论正确回答独立性检验的结论.【规范训练】【规范训练】(12(12分分)(2012)(2012大庆高二检测大庆高二检测)调查在调查在2 23 3级风时级风时的海上航行中男女乘客的晕船情况,共调查了的海上航行中男女乘客的晕船情况,共调查了7171人,其中女性人,其中女性3434人,男性人,男性3737人人.女性中有女性中有1010人晕船,另外人晕船,另外2424人不晕船;男性人不晕船;男性中有中有1212人晕船,另外人晕船,另外2525人不晕船人不晕船.判断晕船是
35、否与性别有关系判断晕船是否与性别有关系.【解题设问】【解题设问】(1)(1)本题两个分类变量是什么?本题两个分类变量是什么?_.(2)(2)题中数据取值明确吗?题中数据取值明确吗?_.性别和是否晕船性别和是否晕船明确明确 性别性别晕船晕船不晕船不晕船总计总计女女101024243434男男121225253737总计总计222249497171【规范答题】【规范答题】列出列出2 22 2的列联表:的列联表:88分分晕晕 船船 情情 况况计算计算 1111分分因为因为k k2.706,2.706,所以在样本数据中没有发现足够的证据支持结所以在样本数据中没有发现足够的证据支持结论论“晕船与性别有关
36、系晕船与性别有关系”.1212分分271(25 10 1224)k0.082249 37 341.1.在研究两个分类变量之间是否有关时,可以粗略地判断两个在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是分类变量是否有关的是()()(A)(A)散点图散点图 (B)(B)等高条形图等高条形图(C)2(C)22 2列联表列联表 (D)(D)以上均不对以上均不对【解析】【解析】选选B.B.等高条形图可以粗略地判断两个分类变量之间是等高条形图可以粗略地判断两个分类变量之间是否有关否有关.2.2.分类变量分类变量X X和和Y Y的列联表如下,则下列说法中正确的是的列联表如下,则下列
37、说法中正确的是()()(A)ad-bc(A)ad-bc越小,说明越小,说明X X与与Y Y关系越弱关系越弱(B)ad-bc(B)ad-bc越大,说明越大,说明X X与与Y Y关系越强关系越强(C)(ad-bc)(C)(ad-bc)2 2越大,说明越大,说明X X与与Y Y关系越强关系越强(D)(ad-bc)(D)(ad-bc)2 2越接近于越接近于0 0,说明,说明X X与与Y Y关系越强关系越强Y Y1 1Y Y2 2总计总计X X1 1a ab ba+ba+bX X2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d【解析】【解析】选选C.C.(ad-
38、bc)(ad-bc)2 2越大,则越大,则K K2 2越大,越大,X X与与Y Y关系越强,故选关系越强,故选C.C.22(abcd)(adbc)K,(ab)(cd)(ac)(bd)3.3.在吸烟与患肺病这两个分类变量的计算中,下列说法中正确在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是的是()()(A)(A)若随机变量若随机变量K K2 2的观测值的观测值k k6.635,6.635,我们说吸烟与患肺病有关我们说吸烟与患肺病有关的概率为的概率为0.990.99,则某人吸烟,那么他可能患有肺病的概率为,则某人吸烟,那么他可能患有肺病的概率为0.990.99(B)(B)若从统计量中求出
39、吸烟与患肺病有关的概率为若从统计量中求出吸烟与患肺病有关的概率为0.990.99,则在,则在100100个吸烟者中必有个吸烟者中必有9999人患有肺病人患有肺病(C)(C)若从统计量中求出吸烟与患肺病有关的概率为若从统计量中求出吸烟与患肺病有关的概率为0.950.95,是指,是指推断错误的概率为推断错误的概率为0.050.05(D)(D)以上说法均错误以上说法均错误【解析】【解析】选选C.C.根据随机变量根据随机变量K K2 2的意义可知,的意义可知,A A与与B B均错误,均错误,C C正正确确.4.4.某班主任对全班某班主任对全班5050名学生进行了一次调查,所得数据如表:名学生进行了一次
40、调查,所得数据如表:由表中数据计算得到由表中数据计算得到K K2 2的观测值的观测值k5.059,k5.059,于是于是_(_(填填“能能”或或“不能不能”)在犯错误的概率不超过在犯错误的概率不超过0.010.01的前提下认为的前提下认为性别与按时完成作业有关性别与按时完成作业有关.按时完成作业按时完成作业不按时完成作业不按时完成作业总计总计男男18189 92727女女8 815152323总计总计262624245050【解析】【解析】查表知若要在犯错误的概率不超过查表知若要在犯错误的概率不超过0.010.01的前提下认为的前提下认为性别与按时完成作业有关,则临界值性别与按时完成作业有关,
41、则临界值k k0 0=6.635.=6.635.本题中,本题中,kk5.0595.0596.6356.635,所以不能在犯错误的概率不超过,所以不能在犯错误的概率不超过0.010.01的前提下的前提下认为性别与按时完成作业有关认为性别与按时完成作业有关.答案:答案:不能不能5.5.在对人们饮食习惯的一次调查中,共调查了在对人们饮食习惯的一次调查中,共调查了124124人,其中六人,其中六十岁以上的十岁以上的7070人,六十岁以下的人,六十岁以下的5454人人.六十岁以上的人中有六十岁以上的人中有4343人的饮食以蔬菜为主,另外人的饮食以蔬菜为主,另外2727人则以肉类为主;六十岁以下的人则以肉类为主;六十岁以下的人中有人中有2121人饮食以蔬菜为主,另外人饮食以蔬菜为主,另外3333人则以肉类为主人则以肉类为主.请根据请根据以上数据作出饮食习惯与年龄的列联表以上数据作出饮食习惯与年龄的列联表.【解析】【解析】2 22 2列联表如下:列联表如下:年龄年龄饮食习惯饮食习惯年龄在六年龄在六十岁以上十岁以上年龄在六年龄在六十岁以下十岁以下总计总计饮食以蔬菜为主饮食以蔬菜为主434321216464饮食以肉类为主饮食以肉类为主272733336060总计总计70705454124 124