1、9.2独立性检验 第9章统计一、22列联表问题某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病.根据这些数据能否断定:患呼吸道疾病与吸烟有关?提示为了研究这个问题,我们将上述数据用表表示如下:患病未患病合计吸烟37183220不吸烟21274295合计58457515知识梳理一般地,对于两个分类变量和,有两类取值,即类A和类B(如吸烟与不吸烟);也有两类取值,即类
2、1和类2(如患呼吸道疾病和未患呼吸道疾病).我们得到如下列联表所示的抽样数据:合计类1类2类Aabab类Bcdcd合计acbdabcd上述表格称为22列联表.注意点:注意点:列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅研究两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表称为22列联表.例1(1)某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行一次检测,试验班与对照班成绩统计如22列联表所示(单位:人),则其中m_,n_.80分及80分以上80分以下合计试验班321850对照班24m50合计5644n26100(2)在一项有关医疗保健的
3、社会调查中,发现调查的男性有530人,女性有670人,其中男性中喜欢吃甜食的有117人,女性中喜欢吃甜食的有492人,请作出性别与是否喜欢吃甜食的22列联表.解22列联表如下:喜欢吃甜食不喜欢吃甜食合计男117413530女492178670合计6095911 200跟踪训练1在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,试作出性别与色盲的列联表.解根据题目所给的数据作出如下的列联表.色盲性别患色盲不患色盲合计男38442480女6514520合计449561 000二、独立性检验独立性检验1.定义:用2统计量研究两个变量X和Y是否有关的方法称为独立性检验.2.2统计量
4、:2_.知识梳理3.独立性检验的步骤要推断“与有关系”,可按下面的步骤进行:(1)提出假设H0:与没有关系;(2)根据22列联表及2公式,计算2的值;(3)根据临界值,作出判断.其中临界值如表所示:P(2x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.455 0.7081.3232.0722.7063.8415.0246.6357.87910.828例如:(1)若210.828,则有99.9%的把握认为“与有关系”;(2)若26.635,则有99%的把握认为“与有关系”;(3)若22.706,则有90%的把握认为“与有关系”;(4)若22.
5、706,则认为没有充分的证据显示“与有关系”,但也不能作出结论“H0成立”,即与没有关系.注意点:注意点:独立性检验的基本思想类似于反证法,我们可以利用独立性检验来考察两个对象是否有关,并且能较精确地给出这种判断的把握程度.角度1对独立性检验的理解例2在吸烟与患肺癌是否相关的研究中,下列说法正确的是A.若26.635,我们有99%的把握认为吸烟与患肺癌有关,则在100个 吸烟的人中必有99个人患肺癌B.由独立性检验可知,当有99%的把握认为吸烟与患肺癌有关时,若某 人吸烟,则他有99%的可能患有肺癌C.通过计算得到23.841,是指有95%的把握认为吸烟与患肺癌有关联D.以上三种说法都不正确解
6、析若26.635,我们有99%的把握认为吸烟与患肺癌有关,而不是在100个吸烟的人中必有99个人患肺癌,故A不正确;99%是指吸烟与患肺癌有关的概率,而不是吸烟的人有99%的可能患有肺癌,故B不正确.C显然正确,D不正确.反思感悟2x0的实质就是两个变量相关的概率为1P(2x0).角度2由2进行独立性检验例3某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病(阳性是指工人患皮肤病)人数如下:阳性例数阴性例数合计新防护服57075旧防护服101828合计158810
7、3问这种新防护服对预防工人患职业性皮肤炎是否有效?并说明你的理由.解提出假设H0:新防护服对预防皮肤炎没有明显效果.根据列联表中的数据可求得因为H0成立时,210.828的概率约为0.001,而这里213.82610.828,所以我们有99.9%的把握认为新防护服比旧防护服对预防工人患职业性皮肤炎有效.跟踪训练2(1)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下22列联表:理科文科合计男131023女72027合计20305095%解由题意,可得22列联表如下:看营养说明不看营养说明合计男同胞27936女同胞162036合计432972提出假设H0:购物市民的性
8、别与是否看营养说明之间没有关系.根据列联表中的数据,可以求得当H0成立时,26.635的概率约为0.01,有99%的把握认为购物市民的性别和是否看营养说明之间有关系.三、独立性检验与概率统计的综合应用例4电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,并根据调查结果绘制了观众日均收看该体育节目时间的频率分布直方图如图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的22列联表,并据此资料推断“体育迷”与性别是否有关?非体育迷体育迷合计男 女1055合计 P(2x0)0.100.050.01x02.7063.841
9、6.635解由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而22列联表如下:非体育迷体育迷合计男301545女451055合计7525100提出假设H0:“体育迷”与性别无关.将22列联表中的数据代入公式计算,得因为当H0成立时,22.706的概率约为0.1,所以我们有90%的把握认为“体育迷”与性别有关.(2)将上述调查所得的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的概率分布、均值E(X)和方差V(X).P(2x0)0.100.050.01x02.706
10、3.8416.635跟踪训练3为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的22列联表:喜爱打篮球不喜爱打篮球合计男生6 女生10 合计48(1)请将上面的22列联表补充完整;(不用写计算过程)解列联表补充如下:喜爱打篮球不喜爱打篮球合计男生22628女生101020合计321648(2)能否有95%的把握认为喜爱打篮球与性别有关?说明你的理由;解能.理由如下:提出假设H0:喜爱打篮球与性别无关.因为当H0成立时,23.841的概率约为0.05,所以有95%的把握认为喜爱打篮球与性别有关.(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的
11、概率分布与均值.故X的概率分布为随堂演练1.下面是一个22列联表:1234XY合计Y0Y1X0a2173X182533合计b46 则表中a,b处的值分别为A.94,96 B.52,50 C.52,60 D.54,52解析a2173,a52,ba852860.12342.(多选)给出下列实际问题,其中用独立性检验可以解决的问题有A.两种药物治疗同一种病是否有区别B.吸烟者得肺病的概率C.吸烟是否与性别有关系D.网吧与青少年的犯罪是否有关系解析独立性检验是判断两个分类变量是否有关系的方法,而B是概率问题,故选ACD.12343.为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,
12、运用22列联表进行独立性检验,经计算28.01,则所得到的统计学结论是认为“性别与喜欢乡村音乐有关系”的把握约为A.0.1%B.0.5%C.99.5%D.99.9%解析因为28.017.879,所以认为性别与喜欢乡村音乐有关系的把握有99.5%.12344.考察棉花种子是否经过处理跟得病之间的关系,得如下表所示的数据:种子处理种子未处理合计得病32101133不得病61213274合计93314407根据以上数据得2的值是_.0.164得20.164.对点练习基础巩固12345678910 11 12 13 14 151.如果有95%的把握判断事件A与B有关系,那么具体计算出的数据A.23.8
13、41 B.26.635 D.26.635时,有99%的把握认为A与B有关系;当23.841时,有95%的把握认为A与B有关系;当22.706时,有90%的把握认为A与B有关系;当22.706时,就没有充分的证据认为A与B有关系.故选A.2.在对某小学的学生进行吃零食的调查中,得到如下表数据:12345678910 11 12 13 14 15 16根据上述数据分析,我们得出的2约为A.2.072 B.2.334 C.3.957 D.4.514吃零食不吃零食合计男学生273461女学生122941合计396310212345678910 11 12 13 14 15 163.假设有两个分类变量X
14、与Y,它们的可能取值分别为X1,X2和Y1,Y2,其22列联表为:则当m取下面何值时,X与Y的关系最弱A.8 B.9 C.14 D.19Y1Y2X11018X2m26解析由102618m,解得m14.4,所以当m14时,X与Y的关系最弱.12345678910 11 12 13 14 15 164.(多选)分类变量X和Y的列联表如下:则下列说法不正确的是A.adbc越小,说明X与Y关系越弱B.adbc越大,说明X与Y关系越强C.(adbc)2越大,说明X与Y关系越强D.(adbc)2越接近于0,说明X与Y关系越强Y1Y2合计X1ababX2cdcd合计acbdabcd12345678910 1
15、1 12 13 14 15 16解析|adbc|越小,说明X与Y关系越弱,|adbc|越大,说明X与Y关系越强.12345678910 11 12 13 14 15 165.某班主任对全班50名学生进行了作业量的调查,数据如下表:则推断“学生的性别与认为作业量大有关”的概率约为A.99%B.99.5%C.95%D.99.9%性别作业量合计大不大男生18927女生81523合计26245012345678910 11 12 13 14 15 16解析由公式得学生的性别与认为作业量大有关的概率约为95%.12345678910 11 12 13 14 15 166.(多选)某校计划在课外活动中新增
16、攀岩项目,为了解学生喜欢攀岩和性别是否有关联,面向学生开展了一次随机调查,其中参加调查的男、女生人数相同,男生喜欢攀岩的占80%,女生不喜欢攀岩的占70%,则A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多C.若参与调查的男、女生人数均为100,则依据独立性检验的思想认为 喜欢攀岩和性别有关联D.无论参与调查的男、女生人数为多少,都可以依据独立性检验的思 想认为喜欢攀岩和性别有关联12345678910 11 12 13 14 15 16解析由题意设参加调查的男、女生人数均为m,则得到如下22列联表:所以参与调查的学生中喜欢攀岩
17、的男生人数比喜欢攀岩的女生人数多,参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,故A正确,B错误.由列联表中的数据,计算得到喜欢攀岩不喜欢攀岩合计男生0.8m0.2mm女生0.3m0.7mm合计1.1m0.9m2m12345678910 11 12 13 14 15 16当m100时,所以当参与调查的男、女生人数均为100时,依据独立性检验,我们有99.9%的把握判断喜欢攀岩和性别有关联,故C正确,D错误,故选AC.12345678910 11 12 13 14 15 167.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算227.63,根据这一数据分析,我们有理由认为打鼾与
18、患心脏病是_的.(填有关、无关)有关解析227.6310.828,有理由认为打鼾与患心脏病是有关的.12345678910 11 12 13 14 15 168所以10.471.3x0,解得x8.05,所以该台机器使用8年最合算.12345678910 11 12 13 14 15 169.下表是一次针对高三学生的调查所得数据,试问:能否有97.5%的把握认为学生总成绩不好与数学成绩不好有关系?总成绩不好总成绩好合计数学成绩不好47812490数学成绩好39924423合计8773691312345678910 11 12 13 14 15 16解提出假设H0:学生总成绩不好与数学成绩不好没有
19、关系.根据列联表中的数据,经计算得到所以我们有97.5%的把握认为学生总成绩不好与数学成绩不好有关系.12345678910 11 12 13 14 15 1610.某中学对高二甲、乙两个同类班级进行“加强语文阅读理解训练,对提高数学应用题得分率的作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:60分以下6170分7180分8190分91100分甲班(人数)31161218乙班(人数)78101015现规定平均成绩在8
20、0分以上(不含80分)的为优秀.12345678910 11 12 13 14 15 16(1)试分析估计两个班级的优秀率;解由题意知,甲、乙两班均有学生50人,所以甲、乙两班的优秀率分别为60%和50%.12345678910 11 12 13 14 15 16(2)由以上统计数据填写下面22列联表,根据以上数据,能否有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助?P(2x0)0.0500.0100.001x03.8416.63510.828优秀人数非优秀人数合计甲班 乙班 合计 12345678910 11 12 13 14 15 16解优秀人数非优秀人数合计甲
21、班302050乙班252550合计5545100提出假设H0:加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助.12345678910 11 12 13 14 15 16所以由参考数据知,没有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助.综合运用12345678910 11 12 13 14 15 1611.下列关于回归分析与独立性检验的说法正确的是A.回归分析和独立性检验没有什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个 变量之间的不确定关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量 是否具有某种关系的一种检验D
22、.独立性检验可以100%确定两个变量之间是否具有某种关系解析由回归分析及独立性检验的特点知,选项C正确.12345678910 11 12 13 14 15 1612.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是A.男人、女人中患色盲的频率分别为0.038和0.006C.男人中患色盲的比例比女人中患色盲的比例大,可以认为患色盲与性 别是有关的D.调查人数太少,不能说明色盲与性别有关12345678910 11 12 13 14 15 1612345678910 11 12 13 14 15 1613.通过市场调查,得到某种产品的资金投入x(单位:万
23、元)与获得的利润y(单位:万元)的数据,如表所示:4.74资金投入x23456利润y0.40.611.21.812345678910 11 12 13 14 15 16即获得利润大约为4.74万元.14.下面是一个22列联表:y1y2合计x1a2170 x25c30合计bd100则bd_,2_.(保留小数点后3位)824.047解析由22列联表得:a49,b54,c25,d46.bd54468.12345678910 11 12 13 14 15 16拓广探究5678910 11 12 13 14 15 1615.(多选)有两个分类变量x,y,其22列联表如下所示:1234y1y2合计x1a2
24、0a20 x215a30a45合计155065其中a,15a均为大于5的整数,现有95%的把握认为x,y有关,则a的值为A.6 B.7 C.8 D.95678910 11 12 13 14 15 16解析由题意可知1234aZ,求得当a8或9时满足题意.16.“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:态度性别合计男性女性反感10 不反感8 合计3012345678910 11 12 13 14 15 1612345678910 11 12 13 14 15 16(1)请将上面的列联表补充完整(直接写结果,不需要写求解过程),并据此资料分析反感“中国式过马路”与性别是否有关?12345678910 11 12 13 14 15 16解态度性别合计男性女性反感10616不反感6814合计161430所以,没有充足的理由认为反感“中国式过马路”与性别有关.12345678910 11 12 13 14 15 16(2)若从这30人中的女性路人中随机抽取2人参加一活动,记反感“中国式过马路”的人数为X,求X的概率分布和均值.12345678910 11 12 13 14 15 16解X的可能取值为0,1,2,所以X的概率分布为谢谢观看