1、北师大版高中数学选修1-2课件22.2 独立性检验2.3 独立性检验的基本思想2.4 独立性检验的应用人们都认可人们都认可“吸烟具有危害性吸烟具有危害性”,那么,人们认可这,那么,人们认可这个观点,有什么根据么?吸烟是否对患肺癌有影响呢?个观点,有什么根据么?吸烟是否对患肺癌有影响呢?下面我们用数学知识来分析一下,这个观点是否具有下面我们用数学知识来分析一下,这个观点是否具有科学根据科学根据1.1.掌握利用掌握利用2 22 2列联表进行独立性检验,会用列联表进行独立性检验,会用2 22 2列联表解决实际问题列联表解决实际问题.(重点)(重点)2.2.了解独立性检验的基本思想及实施步骤了解独立性
2、检验的基本思想及实施步骤.(重点)(重点)3.3.掌握独立性检验的简单应用掌握独立性检验的简单应用(难点)(难点)探究点探究点1 1 独立性检验独立性检验为了调查吸烟与患肺癌是否有联系,某机构随机调为了调查吸烟与患肺癌是否有联系,某机构随机调查了查了6 5786 578人,得到表中的数据(单位:人)人,得到表中的数据(单位:人)患肺癌患肺癌不患肺癌不患肺癌吸烟吸烟56561 9321 932不吸烟不吸烟23234 5674 5672 22 2列联表列联表这一问题称为这一问题称为2 22 2列联表的独立性检验列联表的独立性检验.患肺癌情况患肺癌情况吸烟情况吸烟情况思考:思考:如何根据表格中的数据
3、来判断吸烟与患肺如何根据表格中的数据来判断吸烟与患肺癌是否有联系?癌是否有联系?为了讨论的方便,我们引入以下记号:为了讨论的方便,我们引入以下记号:变量变量A A:A A1 1=吸烟,吸烟,变量变量B B:B B1 1=患肺癌,患肺癌,.B12未患肺癌B计算得如下表格:计算得如下表格:患肺癌患肺癌B B1 1未患肺癌未患肺癌B B2 2总计总计吸烟吸烟A A1 156561 9321 9321 9881 988不吸烟不吸烟A A2 223234 5674 5674 5904 590总计总计79796 4996 4996 5786 578我们假设吸烟与患肺癌是独立的,即吸烟不影响患我们假设吸烟与
4、患肺癌是独立的,即吸烟不影响患肺癌肺癌.根据直观的经验,我们把吸烟人群中患肺癌的根据直观的经验,我们把吸烟人群中患肺癌的人所占百分比,与不吸烟人群中患肺癌的人所占百人所占百分比,与不吸烟人群中患肺癌的人所占百分比作比较分比作比较.如果吸烟不影响患肺癌,就意味着,无如果吸烟不影响患肺癌,就意味着,无论吸烟与否,患肺癌的人所占的百分比应该是基本论吸烟与否,患肺癌的人所占的百分比应该是基本一样的,就此题而言:一样的,就此题而言:患肺癌情况患肺癌情况吸烟情况吸烟情况通过表格中的数据计算可得通过表格中的数据计算可得吸烟人群中患肺癌的人所占百分比是:吸烟人群中患肺癌的人所占百分比是:不吸烟人群中患肺癌的人
5、所占百分比是:不吸烟人群中患肺癌的人所占百分比是:结论:结论:吸烟人群中患肺癌的人所占的百分比,与不吸吸烟人群中患肺癌的人所占的百分比,与不吸烟人群中患肺癌的人所占百分比不等,且相差较大烟人群中患肺癌的人所占百分比不等,且相差较大.由此我们可以推断,开始的假设是不成立的由此我们可以推断,开始的假设是不成立的.也就是也就是说,患肺癌与吸烟是有关系的说,患肺癌与吸烟是有关系的.由吸烟人群中患肺癌由吸烟人群中患肺癌的人所占的百分比较多,我们认为吸烟会对肺癌的发的人所占的百分比较多,我们认为吸烟会对肺癌的发病率造成一定的影响病率造成一定的影响.562.82%1 988 230.50%4 590 另一方
6、面,如果吸烟与患肺癌是独立的,那么有另一方面,如果吸烟与患肺癌是独立的,那么有)()()(1212BPAPBAP都成立,由上表数据可得:都成立,由上表数据可得:患肺癌情况患肺癌情况吸烟情况吸烟情况既吸烟又患肺癌的人频率为:既吸烟又患肺癌的人频率为:吸烟的人频率为:吸烟的人频率为:%20.1657879患肺癌的人频率为:患肺癌的人频率为:%8 5.0%3 6.0%2 0.1%2 2.3 0)()()(1111BPAPBAP显然显然两边相差很大,可以估计两边相差很大,可以估计结论:结论:患肺癌与吸烟有关患肺癌与吸烟有关.设设 A,B A,B为两个变量,每个变量都可取两个值,为两个变量,每个变量都可
7、取两个值,变量变量A A:变量变量B B:,1A=;1A2B,1B=.1Bd c b a n 【概括总结概括总结】B BA AB B1 1B B2 2总计总计A A1 1a ab b_A A2 2c cd dc+dc+d总计总计a+ca+c_n=_n=_a+ba+ba+b+c+da+b+c+db+db+d设设,用,用 估计估计 ,估计估计 ,估计估计 .)(11BAP)(1APnanba nca)(1BPncanbana若有式子若有式子,ndbnbanb,则可认为则可认为 与与 独立独立.2Bd c b a n 同理,若同理,若 则可认为则可认为A A1 1与与B B2 2独立;若独立;若 则
8、可认为则可认为A A2 2与与B B1 1独立;若独立;若则可认为则可认为A A2 2与与B B2 2独立独立.,ncandcnc,ndbndcnd在在 中,中,由于由于 ,表表示的是频率,不同于概率,即使变量之间独立示的是频率,不同于概率,即使变量之间独立,式子两式子两边也不一定恰好相等,但是当两边相差很大时,变量边也不一定恰好相等,但是当两边相差很大时,变量之间就不独立之间就不独立.nba nca)(1BP考察棉花种子经过处理跟棉花生病之间的关系,考察棉花种子经过处理跟棉花生病之间的关系,得到数据如下:得到数据如下:ncanbana则判断种子处理与得病之间的独立性则判断种子处理与得病之间的
9、独立性.【练一练】【练一练】种子处理情况种子处理情况得病情况得病情况解:解:由题意可知由题意可知a=32a=32,b=101b=101,c=61c=61,d=213d=213,从而,从而a320.078 6,n407 ab ac133930.074 7,nn407 407 可得可得 ,所以,所以种子处理与得病种子处理与得病之间是独立的之间是独立的.aabcnnna在上面吸烟是否对患肺癌有影响的问题中在上面吸烟是否对患肺癌有影响的问题中探究点探究点2 2 独立性检验的基本思想独立性检验的基本思想,aabacnnn,babbdnnn,ccdacnnn222()()a a b a cb a b b
10、dnnnnnnna b a ca b b dnnnn当上面的值较大时,变量当上面的值较大时,变量A,BA,B不独立不独立.思考:思考:当这些量多大时才能说明变量间不独立呢?当这些量多大时才能说明变量间不独立呢?我们能不能选择一个量,用它的大小来检验变量之我们能不能选择一个量,用它的大小来检验变量之间是否独立呢?间是否独立呢?22()()ccdacdcdbdnnnnnncdaccdbdnnnn22().()()()()n adbcab cd ac bd2统计学家选取以下统计量,用它的大小来检验变统计学家选取以下统计量,用它的大小来检验变量之间是否独立:量之间是否独立:当当2较大较大时,说明时,说
11、明变量之间变量之间不独立不独立.当数据量较大时,在统计中,用以下结果对变量的独当数据量较大时,在统计中,用以下结果对变量的独立性进行判断立性进行判断.1.1.如果如果 2.706,2.706,没有充分的证据判定变量没有充分的证据判定变量A,BA,B有关联,有关联,可以认为变量可以认为变量A A,B B是没有关联的;是没有关联的;3.3.如果如果3.8413.841,有,有95%95%的把握判定变量的把握判定变量A,BA,B有关联有关联;2.2.如果如果2.7062.706,有,有90%90%的把握判定变量的把握判定变量A,BA,B有关联有关联;4.4.如果如果6.6356.635,有,有99%
12、99%的把握判定变量的把握判定变量A,BA,B有关联有关联.患肺癌患肺癌B B1 1未患肺癌未患肺癌B B2 2总计总计吸烟吸烟A A1 156561932193219881988不吸烟不吸烟A A2 223234567456745904590总计总计79796499649965786578对于吸烟和患肺癌的问题对于吸烟和患肺癌的问题26578(56 4567 1932 23)62.6986.635.1988 4590 79 6499所以有所以有99%99%以上的把握认为吸烟与患肺癌是有关的以上的把握认为吸烟与患肺癌是有关的.患肺癌情况患肺癌情况吸烟情况吸烟情况思考:思考:在进行在进行2 2运
13、算,判断变量相关时,运算,判断变量相关时,若若2 2=56.632=56.632,P P(2 26.635)0.016.635)0.01和和P P(2 23.841)0.053.841)0.05,哪种说法是正确的?,哪种说法是正确的?提示:提示:两种说法均正确两种说法均正确.P.P(2 26.635)0.016.635)0.01的含的含义是有义是有99%99%以上的把握认为两变量相关;而以上的把握认为两变量相关;而P P(2 23.841)0.053.841)0.05的含义是有的含义是有95%95%以上的把握认为以上的把握认为两变量相关两变量相关.参加体育锻炼情况参加体育锻炼情况性别性别喜欢参
14、加喜欢参加体育锻炼体育锻炼不喜欢参加不喜欢参加体育锻炼体育锻炼男男19748女女135120为了了解高中生是否喜欢参加体育锻炼与性别之间为了了解高中生是否喜欢参加体育锻炼与性别之间的关系,调查者随机调查了的关系,调查者随机调查了500500名高中生的情况,名高中生的情况,调查结果如下调查结果如下(单位:人):(单位:人):试问:试问:高中生是否喜欢参加体育锻炼与性别之高中生是否喜欢参加体育锻炼与性别之间有关系吗间有关系吗?【变式练习】【变式练习】解:解:根据表中的数据得根据表中的数据得a=197,b=48,c=135,d=120a=197,b=48,c=135,d=120222n(adbc)(
15、ab)(cd)(ac)(bd)500(197 120 135 48)245 255 332 16842.252 46.635.所以有所以有99%99%以上的把握认为以上的把握认为高中生是否喜欢参加体高中生是否喜欢参加体育锻炼与性别之间是育锻炼与性别之间是有关的有关的.例例1.1.某组织对男女青年是否喜爱古典音乐进行了一某组织对男女青年是否喜爱古典音乐进行了一个调查,调查者随机调查了个调查,调查者随机调查了146146名青年,下表中给出名青年,下表中给出了调查的结果(单位:人):了调查的结果(单位:人):喜爱喜爱不喜爱不喜爱男青年男青年46463030女青年女青年20205050试问:男女青年喜
16、爱古典音乐的程度是否有差异?试问:男女青年喜爱古典音乐的程度是否有差异?探究点探究点3 3 独立性检验的应用独立性检验的应用喜欢古典音乐情况喜欢古典音乐情况青年青年解:解:根据表中的数据计算得下表根据表中的数据计算得下表(单位:人):(单位:人):喜爱喜爱不喜爱不喜爱总计总计男青年男青年464630307676女青年女青年202050507070总计总计6666808014614622146(46 50 30 20)15.0216.635.76 70 66 80所以有所以有99%99%以上的把握认为是否喜爱古典音乐与青年的以上的把握认为是否喜爱古典音乐与青年的性别有关性别有关.喜欢古典音乐情况
17、喜欢古典音乐情况青年青年例例2.2.容易生气的人更有可能患心脏病吗?某机构随机容易生气的人更有可能患心脏病吗?某机构随机调查了调查了2 7962 796人,下表给出了调查的结果(单位:人):人,下表给出了调查的结果(单位:人):患心脏病患心脏病未患心脏病未患心脏病易怒易怒2727606606不易怒不易怒53532 1102 110试问:容易生气的人是否更有可能患心脏病?试问:容易生气的人是否更有可能患心脏病?患心脏病情况患心脏病情况是否易怒是否易怒解:解:根据表中的数据计算得下表根据表中的数据计算得下表(单位:人):(单位:人):患心脏病患心脏病未患心脏病未患心脏病总计总计易怒易怒272760
18、6606633633不易怒不易怒53532 1102 1102 1632 163总计总计80802 7162 7162 7962 796222 796(27 2 110606 53)5.8053.841.633 2 163 80 2 716所以有所以有95%95%以上的把握认为患心脏病与易怒有关以上的把握认为患心脏病与易怒有关.患心脏病情况患心脏病情况是否易怒是否易怒眼睛虹膜颜色眼睛虹膜颜色头发颜色头发颜色蓝色蓝色棕色棕色红红金黄色金黄色1561561212黑色黑色20202424例例3.3.生物学上对于人类头发的颜色与眼睛虹膜的颜生物学上对于人类头发的颜色与眼睛虹膜的颜色是否有关进行了调研,
19、以下是一次调查结果,调色是否有关进行了调研,以下是一次调查结果,调查人数共查人数共212212人,调查记录如表人,调查记录如表(单位:人):(单位:人):试问:头发的颜色与眼睛虹膜的颜色有关吗?试问:头发的颜色与眼睛虹膜的颜色有关吗?解:解:根据表中的数据计算得下表根据表中的数据计算得下表(单位:人):(单位:人):眼睛虹膜颜色眼睛虹膜颜色 头发颜色头发颜色蓝色蓝色棕色棕色总计总计红红金黄色金黄色1561561212168168黑色黑色202024244444总计总计1761763636n=212n=2122 因为因为55.5766.635,55.5766.635,所以有所以有99%99%以上
20、的把握认为以上的把握认为头发的颜色与眼睛虹膜的颜色有关头发的颜色与眼睛虹膜的颜色有关.要推断要推断“和和是否有关系是否有关系”,可按下面的步骤进行:,可按下面的步骤进行:(1 1)根据根据2 22 2列联表得出合计总表列联表得出合计总表;(2 2)用公式计算)用公式计算 的值;的值;(3 3)查对临界值,作出判断)查对临界值,作出判断.2由于抽样的随机性,由样本得到的推断有可能正由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误确,也有可能错误.利用利用 进行独立性检验,可以进行独立性检验,可以对推断的正确性作出估计,样本量对推断的正确性作出估计,样本量n n越大,估计越准确越大,估计
21、越准确.NoImage【总结】【总结】有甲乙两个班级进行一门课程的考试,按照学生考试有甲乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:成绩优秀和不优秀统计成绩后,得到如下列联表:优秀优秀不优秀不优秀甲班甲班10103535乙班乙班7 73838试问:学生的学习成绩与所在的班级有关吗?试问:学生的学习成绩与所在的班级有关吗?【变式练习】【变式练习】成绩成绩班级班级优秀优秀不优秀不优秀总计总计甲班甲班101035354545乙班乙班7 738384545总计总计171773739090解:解:根据表中的数据计算得下表根据表中的数据计算得下表2290(10 3
22、835 7)0.653.17 73 45 45 因为因为0.6532.706,0.6533.841.=4.0133.841.所以有所以有95%95%的把握判定的把握判定两个变量有关联两个变量有关联.2295%95%4.4.根据下表计算根据下表计算 _._.22n(adbc)(ab)(cd)(ac)(bd)2解解:由由 的计算公式,得的计算公式,得21.781.78发病情况发病情况手术情况手术情况2392(39 167 15729)1.78.196 196 68 3245.5.下表是某地区的一种传染病与饮用水的调查表:下表是某地区的一种传染病与饮用水的调查表:试问:这种传染病与饮用水的卫生程度有
23、关吗?试问:这种传染病与饮用水的卫生程度有关吗?得病情况得病情况饮用水卫生程度饮用水卫生程度解:解:根据表中的数据计算得下表根据表中的数据计算得下表22830(52 218466 94)54.216.635.146 684 518 312 所以有所以有99%99%以上的把握认为以上的把握认为这种传染病与饮用水的卫这种传染病与饮用水的卫生程度有关生程度有关.得病情况得病情况饮用水卫生程度饮用水卫生程度B BA AB B1 1B B2 2总计总计A A1 1a ab ba+ba+bA A2 2c cd dc+dc+d总计总计a+ca+cb+db+dn=a+b+c+dn=a+b+c+d根据根据2 22 2列联表中的数据,来判断两个变量列联表中的数据,来判断两个变量A,BA,B是是否独立的问题否独立的问题1.21.22 2列联表的定义列联表的定义变量变量A A:A A1 1,;,;变量变量B:BB:B1 1,用如下数据用如下数据:21AA21BB2.2.统计量统计量2 2的计算公式的计算公式3.3.独立性检验判断方法独立性检验判断方法2 2=2n adbcabcdacbd2 2=人生难免遇风雨,天空难免有阴云,别因雨水湿透衣衫而难过,别为坎坷阻力而叹息,用乐观心态面对人生遭遇,用积极的拼搏迎接雨后的彩虹,相信自己.