独立性检验的基本思想及其初步应用-课件-2.ppt

上传人(卖家):晟晟文业 文档编号:4259441 上传时间:2022-11-23 格式:PPT 页数:33 大小:4.47MB
下载 相关 举报
独立性检验的基本思想及其初步应用-课件-2.ppt_第1页
第1页 / 共33页
独立性检验的基本思想及其初步应用-课件-2.ppt_第2页
第2页 / 共33页
独立性检验的基本思想及其初步应用-课件-2.ppt_第3页
第3页 / 共33页
独立性检验的基本思想及其初步应用-课件-2.ppt_第4页
第4页 / 共33页
独立性检验的基本思想及其初步应用-课件-2.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

1、3.23.2 独立性检验的基本思想独立性检验的基本思想及其初步应用及其初步应用 新课新课新课新课,另习题课、习题见金榜另习题课、习题见金榜3.23.2独立性检验的独立性检验的基本思想及其初步应用基本思想及其初步应用 我们经常听到这些说法:我们经常听到这些说法:l 吸烟对患肺癌有影响;吸烟对患肺癌有影响;l 数学好的人物理一般也很好;数学好的人物理一般也很好;l 是否喜欢数学课程与性别之间有关系;是否喜欢数学课程与性别之间有关系;l 人的血型会决定人的性格;人的血型会决定人的性格;l 星座与人的命运之间有某种联系星座与人的命运之间有某种联系.这些说法都有道理吗?这些说法都有道理吗?1.1.理解独

2、立性检验的基本思想理解独立性检验的基本思想.(重点)(重点)2.2.会从列联表、等高条形图直观判断吸烟与患会从列联表、等高条形图直观判断吸烟与患肺癌肺癌 有关有关.(难点)(难点)3.3.了解随机变量了解随机变量K K2 2的含义的含义,理解独立性检验的基理解独立性检验的基本思想及实施步骤本思想及实施步骤.(难点)(难点)探究点探究点1 1 独立性检验的基本思想独立性检验的基本思想 对于性别变量,其取值为男和女两种对于性别变量,其取值为男和女两种.这种变量这种变量的不同的不同“值值”表示个体所属的不同类别,像这样的变表示个体所属的不同类别,像这样的变量称为量称为 .分类变量在现实生活中是大量存

3、在的,如是否分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等月份等.分类变量分类变量不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟7 7757 77542427 8177 817吸烟吸烟2 0992 09949492 1482 148总计总计9 8749 87491919 9659 965问题:问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了所随机地调查了9 9659 965人,得到如下结果:人,得到如下结果:吸烟与患肺癌列联表(单位:人)吸烟与患肺癌

4、列联表(单位:人)在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是_._.说明:吸烟者和不吸烟者患肺癌的可能性存在差异,说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大吸烟者患肺癌的可能性大.2.28%2.28%在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是_,_,0.54%0.54%通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关:等高等高条形图条形图 通过数据和图形分析,得到结论是:吸烟与患通过数据和图形分析,得到结论是:吸烟与患肺癌有关肺癌有关.那么这种判断是否可靠呢?我们可以通过那么这种判断是否可靠呢?我们可以通过统计分析回答这个问题

5、统计分析回答这个问题.假设假设H H0 0:吸烟与患肺癌之间没有关系:吸烟与患肺癌之间没有关系,吸烟与患肺癌列联表吸烟与患肺癌列联表(单位:人单位:人)不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟a ab ba+ba+b吸烟吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d 如果如果“吸烟与患肺癌没有关系吸烟与患肺癌没有关系”,那么吸烟样,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多例差不多.所所以以acac,a+bc+da+bc+d所所以以 a c+dc a+b,a c+dc a+b,ad

6、bc0.adbc即即,2 22 2n n(a ad d-b bc c)K K=(a a+b b)(c c+d d)(a a+c c)(b b+d d)引入一个随机变量引入一个随机变量 它是检验在多大程度上可以认为它是检验在多大程度上可以认为“两个变量两个变量有关系有关系”的标准的标准.ad-bcad-bc越小,越小,说明吸烟与患肺癌之间的关系越弱说明吸烟与患肺癌之间的关系越弱;ad-bcad-bc越大,越大,说明吸烟与患肺癌之间的关系越强说明吸烟与患肺癌之间的关系越强.其中其中n=a+b+c+dn=a+b+c+d为样本容量为样本容量.不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟7 7757

7、 77542427 8177 817吸烟吸烟2 0992 09949492 1482 148总计总计9 8749 87491919 9659 965通过公式计算通过公式计算22Kk,9 965(7 77549422 099)k56.632.7 8172 148 9 87491上面探究中,的观测值为吸烟与患肺癌列联表(单位:人)吸烟与患肺癌列联表(单位:人)已知在已知在 成立的情况下成立的情况下,0H2(6.635)0.01P K 即在即在 成立的情况下,成立的情况下,K K2 2的观测值大于的观测值大于6.6356.635的概率非常小,近似为的概率非常小,近似为0.010.01,是一个小概率事

8、件,是一个小概率事件.0H思考:思考:这个值到底告诉我们什么呢?这个值到底告诉我们什么呢?现在现在K K2 2的观测值的观测值k k56.63256.632,远远大于,远远大于6.6356.635,所以有理由,所以有理由断定断定H H0 0不成立不成立,即认为即认为“吸烟与患肺癌有关系吸烟与患肺癌有关系”.独立性检验的定义独立性检验的定义:利用随机变量利用随机变量K K2 2来判断来判断“两个分类变量有关系两个分类变量有关系”的方法的方法称为独立性检验称为独立性检验.独立性检验的一般步骤独立性检验的一般步骤:(1 1)假设假设两个分类变量两个分类变量X X与与Y Y没有关系没有关系.(2 2)

9、计算出)计算出K K2 2的观测值的观测值k.k.(3 3)把)把k k的值与的值与临界值临界值比较确定比较确定X X与与Y Y有关的有关的程度或无关系程度或无关系.设有两个分类变量设有两个分类变量X X和和Y Y,它们的取值分别为,它们的取值分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2,其样本频数列联表其样本频数列联表(称为称为2 22 2列联表列联表)为为y y1 1y y2 2总计总计x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d22()()()()n adbcKab cd ac bd(

10、)临界值表:临界值表:20()P Kk 如如P(k10.828)=0.001P(k10.828)=0.001表示在表示在犯错误的概率不犯错误的概率不超过超过0.0010.001的前提下的前提下,认为,认为“X X与与Y Y有关系有关系”.”.如如P(k6.635)=0.010P(k6.635)=0.010表示在表示在犯错误的概率不超犯错误的概率不超过过0.0100.010的前提下的前提下,认为,认为“X X与与Y Y有关系有关系”.”.独立性检验的基本思想类似反证法独立性检验的基本思想类似反证法(1)(1)假设结论不成立假设结论不成立,即即“两个分类变量没有关系两个分类变量没有关系”.(2)(

11、2)在此假设下随机变量在此假设下随机变量K K2 2应该很小应该很小,如果由观测数据如果由观测数据计算得到计算得到K K2 2的观测值的观测值k k很大很大,则在一定程度上说明假则在一定程度上说明假设不合理设不合理.(3)(3)根据随机变量根据随机变量K K2 2的含义的含义,可以通过评价该假设不合可以通过评价该假设不合理的程度理的程度,如由实际计算出的如由实际计算出的k10.828.k10.828.说明假设不说明假设不合理的程度为合理的程度为99.9%,99.9%,即即“两个分类变量有关系两个分类变量有关系”这这一结论成立的可信度约为一结论成立的可信度约为99.9%.99.9%.探究点探究点

12、2 2 独立性检验的初步应用独立性检验的初步应用 例例.在某医院在某医院,因为患心脏病而住院的因为患心脏病而住院的665665名男性名男性病人中病人中,有有214214人秃顶人秃顶,而另外而另外772772名不是因为患心脏病名不是因为患心脏病而住院的男性病人中有而住院的男性病人中有175175人秃顶人秃顶.(1).(1)利用图形判断利用图形判断秃顶与患心脏病是否有关系秃顶与患心脏病是否有关系;(2);(2)能否在犯错误的概率能否在犯错误的概率不超过不超过0.010.01的前提下认为秃顶与患心脏病有关系?的前提下认为秃顶与患心脏病有关系?患心脏病患心脏病患其他病患其他病总计总计秃顶秃顶21421

13、4175175389389不秃顶不秃顶4514515975971 0481 048总计总计6656657727721 4371 437(1)(1)相应的等高条形图如下所示,相应的等高条形图如下所示,秃顶秃顶不秃顶不秃顶不患心脏病不患心脏病患心脏病患心脏病解:解:根据题目所给数据得到如下列联表:根据题目所给数据得到如下列联表:由图可认为秃顶与患心脏病有关系由图可认为秃顶与患心脏病有关系21 437(214 597 175 451)16.3736.635.389 1 048 665 772k 因此,在犯错误的概率不超过因此,在犯错误的概率不超过0.010.01的前提下,的前提下,认为秃顶与患心脏病

14、有关系认为秃顶与患心脏病有关系.(2)(2)根据列联表中的数据,得到根据列联表中的数据,得到y y1 1y y2 2总计总计x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d思考:思考:考察下表,考察下表,定义定义.acWa bcd根据独立性检验原理,如何用根据独立性检验原理,如何用W W构造一个判断构造一个判断X X和和Y Y是是否有关系的规则,否有关系的规则,使得在该规则下把使得在该规则下把“X X和和Y Y没有关系没有关系”错判成错判成“X X和和Y Y有关系有关系”的概率不超过的概率不超过0.010.01

15、?由由W W的定义可以发现:它越大,越有利于结论的定义可以发现:它越大,越有利于结论“X X和和Y Y有关系有关系”;它越小,越有利于结论;它越小,越有利于结论“X X和和Y Y没没有关系有关系”.因此可以建立如下的判断规则:因此可以建立如下的判断规则:当当W W的观测值的观测值0 0时,就判断时,就判断“X X和和Y Y有关有关系系”;否则,判断;否则,判断“X X和和Y Y没有关系没有关系”.这里这里0 0为为正实数,满足如下条件:在正实数,满足如下条件:在“X X和和Y Y没有关系没有关系”的的前提下,前提下,0()0.01.P W 思考:思考:若在若在“X X和和Y Y没有关系没有关系

16、”的情况下有:的情况下有:20P(Kk)0.01,可可以以通通过过来来确确定定吗吗?00k 22()(),()()事事实实上上,n ab cdKWac bd其其中中.nabcd200()(),()()因因此此,等等价价于于即即可可取取ac bdKkWkn ab cd.)()(00dcbandbcak.acWabcd,给出2 22 2n n(a ad d-b bc c)K K=(a a+b b)(c c+d d)(a a+c c)(b b+d d)1.1.独立性检验中的统计假设就是假设两个分类量独立性检验中的统计假设就是假设两个分类量A A,B B()A.A.互斥互斥 B.B.不互斥不互斥C.C

17、.相互独立相互独立 D.D.不独立不独立C C2 2.下列说法中正确的是下列说法中正确的是()独立性检验的基本思想是带有概率性质的反证法;独立性检验的基本思想是带有概率性质的反证法;独立性检验就是独立性检验就是在假设在假设H H0 0下,如果出现一个与下,如果出现一个与H H0 0相相矛盾的小概率事件,矛盾的小概率事件,就推断就推断H H0 0不成立,且该推断犯错不成立,且该推断犯错误的概率不超过这个小概率误的概率不超过这个小概率,则作出拒绝则作出拒绝H H0 0的推断;的推断;独立性检验一定能给出明确的结论独立性检验一定能给出明确的结论 A A.B B.C C.D D.A3 3有两个分类变量

18、有两个分类变量X X与与Y Y的一组数据,由其列联表的一组数据,由其列联表计算得计算得K K2 24.5234.523,则,则认为认为X X与与Y Y有关系是错误的有关系是错误的可信度为可信度为()A A95%95%B B90%90%C C5%5%D D10%10%C4 4在对人们的休闲方式的一次调查中,共调查了在对人们的休闲方式的一次调查中,共调查了124124人,其中女性人,其中女性7070人,男性人,男性5454人,女性中有人,女性中有4343人人主要的休闲方式是看电视,另外主要的休闲方式是看电视,另外2727人主要的休闲方式人主要的休闲方式是运动;男性中有是运动;男性中有2121人主要

19、的休闲方式是看电视,人主要的休闲方式是看电视,另外另外3333人主要的休闲方式是运动人主要的休闲方式是运动(1)(1)根据以上数据建立一个根据以上数据建立一个2 22 2的列联表的列联表.(2)(2)判断休闲方式与性别是否有关系判断休闲方式与性别是否有关系 性别性别看电视看电视运动运动总计总计女女434327277070男男212133335454总计总计64646060124124休闲方式休闲方式(2)(2)假设假设“休闲方式与性别无关休闲方式与性别无关”计算计算K K2 212412443433333272721212 270705454646460606.201.6.201.因为因为K

20、K2 25.0245.024,所以有理由认为假设,所以有理由认为假设“休闲方式与性别休闲方式与性别 无关无关”是不合理的故是不合理的故在犯在犯错误的概率错误的概率不超过不超过 0.0250.025 的的 前提下,前提下,认为性别与休闲方式有关系认为性别与休闲方式有关系 ()独立性检验的一般步骤独立性检验的一般步骤:(1 1)假设两个分类变量)假设两个分类变量X X与与Y Y没有关系;没有关系;(2 2)计算出)计算出K K2 2的观测值的观测值k k;(3 3)把)把k k的值与临界值比较确定的值与临界值比较确定X X与与Y Y有关的程度或有关的程度或无关系无关系.独立性检验基本的思想类似独立

21、性检验基本的思想类似反证法反证法(1)1)假设结论不成立假设结论不成立,即即“两个分类变量没有关系两个分类变量没有关系”.(2)(2)在此假设下随机变量在此假设下随机变量 K K2 2 应该很小应该很小,如果由观测数据如果由观测数据计算得到计算得到K K2 2的观测值的观测值k k很大很大,则在一定程度上说明假设则在一定程度上说明假设不合理不合理.(3)(3)根据随机变量根据随机变量K K2 2的含义的含义,可以通过可以通过评价该假设不合理的程度评价该假设不合理的程度,由实际计算出的由实际计算出的,说明假设合理的程度为说明假设合理的程度为99.9%,99.9%,即即“两个分类变量有两个分类变量有关系关系”这一结论成立的可信度为约为这一结论成立的可信度为约为99.9%.99.9%.当你无法从一楼蹦到三楼时,不要忘记走楼梯.要记住伟大的成功往往不是一蹴而就的,必须学会分解你的目标,逐步实施.课本课本P97练习、习题、练习、习题、。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(独立性检验的基本思想及其初步应用-课件-2.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|