高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 情境互动课型.ppt

上传人(卖家):金钥匙文档 文档编号:429129 上传时间:2020-04-03 格式:PPT 页数:39 大小:1.07MB
下载 相关 举报
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 情境互动课型.ppt_第1页
第1页 / 共39页
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 情境互动课型.ppt_第2页
第2页 / 共39页
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 情境互动课型.ppt_第3页
第3页 / 共39页
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 情境互动课型.ppt_第4页
第4页 / 共39页
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 情境互动课型.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、1.2 独立性检验的基本思想及其初步应用 我们经常听到这些说法:我们经常听到这些说法: 吸烟对患肺癌有影响;吸烟对患肺癌有影响; 数学好的人物理一般也很好;数学好的人物理一般也很好; 性别与是否喜欢数学课程之间有关系;性别与是否喜欢数学课程之间有关系; 人的血型会决定人的性格;人的血型会决定人的性格; 星座与人的命运之间有某种联系;星座与人的命运之间有某种联系; 这些说法都有道理吗?这些说法都有道理吗? 1.1.理解独立性检验的基本思想理解独立性检验的基本思想. .(重点)(重点) 2.2.会从列联表、等高条形图直观判断吸烟与患会从列联表、等高条形图直观判断吸烟与患 肺癌有关肺癌有关. .(难

2、点)(难点) 3.3.了解随机变量了解随机变量K K2 2的含义的含义, ,理解独立性检验的理解独立性检验的 基本思想及实施步骤基本思想及实施步骤. .(难点)(难点) 探究点探究点1 1 独立性检验的基本思想独立性检验的基本思想 对于性别变量,其取值为男和女两种对于性别变量,其取值为男和女两种. .这种变量这种变量 的不同“值”表示的不同“值”表示个体所属的不同类别个体所属的不同类别,这样的变,这样的变 量称为量称为 . . 分类变量在现实生活中是大量存在的,如是否分类变量在现实生活中是大量存在的,如是否 吸烟、是否患肺癌、宗教信仰、国别、年龄、出生吸烟、是否患肺癌、宗教信仰、国别、年龄、出

3、生 月份等月份等. . 分类变量分类变量 吸烟与患肺癌列联表吸烟与患肺癌列联表 不患肺癌不患肺癌 患肺癌患肺癌 总计总计 不吸烟不吸烟 77757775 4242 78177817 吸烟吸烟 20992099 4949 21482148 总计总计 98749874 9191 99659965 问题:问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究为了研究吸烟是否对患肺癌有影响,某肿瘤研究 所随机地调查了所随机地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人) 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是_._. 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,说

4、明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大吸烟者患肺癌的可能性大. . 0.54%0.54% 2.28%2.28% 在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是_,_, 通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关: 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 不吸烟吸烟 患肺癌 不患肺癌 患肺癌患肺癌 比例比例 不患肺癌不患肺癌 比例比例 等高条形图等高条形图 通过数据和图形分析,得到结论是:吸烟与患通过数据和图形分析,得到结论是:吸烟与患 肺癌有关,那么这种判断是否可靠呢?我们

5、可以通肺癌有关,那么这种判断是否可靠呢?我们可以通 过统计分析回答这个问题过统计分析回答这个问题. . 假设假设H H0 0: 吸烟与患肺癌之间没有关系吸烟与患肺癌之间没有关系, , 吸烟与患肺癌列联表吸烟与患肺癌列联表 不患肺癌不患肺癌 患肺癌患肺癌 总计总计 不吸烟不吸烟 a a b b a+ba+b 吸烟吸烟 c c d d c+dc+d 总计总计 a+ca+c b+db+d a+b+c+da+b+c+d 如果“吸烟与患肺癌没有关系”,那么吸烟样如果“吸烟与患肺癌没有关系”,那么吸烟样 本中不患肺癌的比例应该与不吸烟样本中相应的比本中不患肺癌的比例应该与不吸烟样本中相应的比 例差不多例差

6、不多. . 所所以以 acac , , a + bc+da + bc+d 所所以以 a c+dc a+b , a c+dc a+b , adbc 0.adbc 即 2 2 2 2 n(ad-bc)n(ad-bc) K =K = (a+b)(c+d)(a+c)(b+d)(a+b)(c+d)(a+c)(b+d) 引入一个随机变量引入一个随机变量 它是检验在多大程度上可以认为“两个变量有它是检验在多大程度上可以认为“两个变量有 关系”的标准关系”的标准. . adad- -bcbc越小,说明吸烟与患肺癌之间的关系越弱,越小,说明吸烟与患肺癌之间的关系越弱, adad- -bcbc越大,说明吸烟与患肺

7、癌之间的关系越强越大,说明吸烟与患肺癌之间的关系越强. . 其中其中n=a+b+c+dn=a+b+c+d为样本容量为样本容量. . 吸烟与患肺癌列联表吸烟与患肺癌列联表 不患肺癌不患肺癌 患肺癌患肺癌 总计总计 不吸烟不吸烟 77757775 4242 78177817 吸烟吸烟 20992099 4949 21482148 总计总计 98749874 9191 99659965 通过公式计算通过公式计算 2 2 K 9965 (7775 49422099) k56.632. 78172148 9874 91 上面探究中,的观测值为 已知在已知在 成立的情况下,成立的情况下, 0 H 2 (6

8、.635)0.010P K 即在即在 成立的情况下,成立的情况下,K K2 2的观测值大于的观测值大于6.6356.635 的概率非常小,近似为的概率非常小,近似为0.0100.010,是一个小概率事件,是一个小概率事件. . 0 H 思考:思考:这个值到底告诉我们什么呢?这个值到底告诉我们什么呢? 现在现在K K2 2的观测值的观测值k56.632k56.632,远远大于,远远大于6.6356.635,所以,所以 有理由断定有理由断定H H0 0不成立,即认为不成立,即认为“吸烟与患肺癌有关“吸烟与患肺癌有关 系”系”. . 独立性检验的定义独立性检验的定义 利用利用随机变量随机变量K K2

9、 2来判断“两个分类变量有关系”来判断“两个分类变量有关系” 的方法称为的方法称为独立性检验独立性检验. . 独立性检验的一般步骤独立性检验的一般步骤 (1 1)假设假设两个分类变量两个分类变量X X与与Y Y没有关系没有关系; (2 2)计算计算出出K K2 2的观测值的观测值k k; (3 3)把)把k k的值的值与临界值比较与临界值比较确定确定X X与与Y Y有关的程度或无有关的程度或无 关系关系. . 设有两个分类变量设有两个分类变量X X和和Y Y,它们的取值分别为,它们的取值分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2 ,其样本频数列联表其样本频数列联表( (称为称

10、为2 22 2列联表列联表) )为为 y y1 1 y y2 2 总计总计 x x1 1 a a b b a+ba+b x x2 2 c c d d c+dc+d 总计总计 a+ca+c b+db+d a+b+c+da+b+c+d 2 2 ()()()() n adbc K ab cd ac bd () 如如P(kP(k0 010.828)= 0.00110.828)= 0.001表示在犯错误的概率表示在犯错误的概率 不超过不超过0.0010.001的前提下,认为“的前提下,认为“X X与与Y Y有关系有关系”. . 如如P(kP(k0 06.635)= 0.016.635)= 0.01表示在

11、犯错误的概率表示在犯错误的概率不超不超 过过0.010.01的前提下,认为“的前提下,认为“X X与与Y Y有关系有关系”. . 临界值表:临界值表: 0.500.50 0.400.40 0.250.25 0.150.15 0.100.10 0.050.05 0.0250.025 0.0100.010 0.0050.005 0.0010.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 2 0 ()P Kk 0 k 独立性检验的基本思想类似反证法独立性检验的基本思想类似反证法 (1)(1)假设结论不成立假设结论不成

12、立, ,即“两个分类变量没有关系”即“两个分类变量没有关系”. . (2)(2)在此假设下随机变量在此假设下随机变量K K2 2应该很小应该很小, ,如果由观测数据如果由观测数据 计算得到计算得到K K2 2的观测值的观测值k k很大很大, ,则在一定程度上说明假则在一定程度上说明假 设不合理设不合理. . (3)(3)根据随机变量根据随机变量K K2 2的含义的含义, ,可以通过评价该假设不合可以通过评价该假设不合 理的程度理的程度, ,如由实际计算出的如由实际计算出的k10.828.k10.828.说明假设不说明假设不 合理的程度为合理的程度为99.9%,99.9%,即“两个分类变量有关系

13、”这即“两个分类变量有关系”这 一结论成立的可信度为约为一结论成立的可信度为约为99.9%.99.9%. 在一次独立性相关检验中,若能在犯错误的概在一次独立性相关检验中,若能在犯错误的概 率不超过率不超过0.0050.005的前提下认为两个分类变量的前提下认为两个分类变量X X与与Y Y 有关系,则有关系,则k k的取值范围是(的取值范围是( ) A.5.024,6.635) B.6.635,7.879)A.5.024,6.635) B.6.635,7.879) C.7.879,10.828) D.7.879,+ )C.7.879,10.828) D.7.879,+ ) D 【即时训练即时训练

14、】 探究点探究点2 2 独立性检验的初步应用独立性检验的初步应用 例例1 1. .在某医院在某医院, ,因为患心脏病而住院的因为患心脏病而住院的665665名男性名男性 病人中病人中, ,有有214214人秃顶人秃顶. .而另外而另外772772名不是因为患心脏病名不是因为患心脏病 而住院的男性病人中而住院的男性病人中, ,有有175175人秃顶人秃顶. .利用图形判断秃利用图形判断秃 顶与患心脏病是否有关系顶与患心脏病是否有关系. .能否在犯错误的概率不超能否在犯错误的概率不超 过过0 0. .010010的前提下认为秃顶与患心脏病有关系的前提下认为秃顶与患心脏病有关系? 解:解:根据题目所

15、给数据得到如下列联表:根据题目所给数据得到如下列联表: 患心脏病患心脏病 患其他病患其他病 总计总计 秃顶秃顶 214214 175175 389389 不秃顶不秃顶 451451 597597 10481048 总计总计 665665 772772 14371437 相应的等高条形图如下所示,相应的等高条形图如下所示, 秃顶秃顶 不秃顶不秃顶 不患心脏病不患心脏病 患心脏病患心脏病 2 1437(214 597175451) 16.3736.635. 389 1048 665 772 k 因此,在犯错误的概率不超过因此,在犯错误的概率不超过0.0100.010的前提下,的前提下, 认为秃顶与

16、患心脏病有关系认为秃顶与患心脏病有关系. . 根据列联表中的数据,得到根据列联表中的数据,得到 y y1 1 y y2 2 总计总计 x x1 1 a a b b a+ba+b x x2 2 c c d d c+dc+d 总计总计 a+ca+c b+db+d a+b+c+da+b+c+d 思考:思考:考察下表考察下表, 定义定义 . dc c ba a W 根据独立性检验原理根据独立性检验原理,如何用如何用W W构造一个判断构造一个判断X X和和Y Y是是 否有关系的规则否有关系的规则,使得在该规则下把使得在该规则下把“X X和和Y Y没有关系没有关系” 错判成错判成“X X和和Y Y有关系有

17、关系”的概率不超过的概率不超过0 0. .010010? 由由W W的定义可以发现:它越大,越有利于结论的定义可以发现:它越大,越有利于结论 “X X和和Y Y有关系”;它越小,越有利于结论“有关系”;它越小,越有利于结论“X X和和Y Y没没 有关系”有关系”. .因此可以建立如下的判断规则:因此可以建立如下的判断规则: 当当W W的观测值的观测值 0 0时,就判断“ 时,就判断“X X和和Y Y有关有关 系”;否则,判断“系”;否则,判断“X X和和Y Y没有关系”没有关系”. .这里这里 0 0为 为 正实数,满足如下条件:在“正实数,满足如下条件:在“X X和和Y Y没有关系”的没有关

18、系”的 前提下,前提下, 0 ()0.010.P W 思考:思考:若在若在“X X和和Y Y没有关系没有关系”的情况下有的情况下有 ,010. 0)( 0 2 kKP 可可以以通通过过来来确确定定吗吗? 00 k 事事实实上上, 22 ()() , ()() n ab cd KW ac bd 其其 中中.nabcd 2 00 ()() , ()() 因因此此,等等价价于于即即可可取取 ac bd KkWk n ab cd . )( )( 00 dcban dbca k 例例1 1 在某医院,因为患心脏病而住院的在某医院,因为患心脏病而住院的665665名男性名男性 病人中,有病人中,有2142

19、14人秃顶;而另外人秃顶;而另外772772名不是因为患名不是因为患 心脏病而住院的男性病人中,有心脏病而住院的男性病人中,有175175人秃顶人秃顶. .利用利用 图形判断秃顶与患心脏病是否有关系图形判断秃顶与患心脏病是否有关系. .能否在犯错能否在犯错 误的概率不超过误的概率不超过0.010.01的前提下认为秃顶与患心脏的前提下认为秃顶与患心脏 病有关系?病有关系? 【解题关键解题关键】由题意列出由题意列出2 22 2列联表,利用公式求列联表,利用公式求 得得K K2 2后与临界值比较,得出结论后要注意这组数据后与临界值比较,得出结论后要注意这组数据 是来自于住院的病人,而不是随机对全体人

20、群采样是来自于住院的病人,而不是随机对全体人群采样. . 【解析解析】由题意列出由题意列出2 22 2列联表如下:列联表如下: 由公式得由公式得 K K2 216.373. K16.373. K2 2 6.635. 6.635.所以有所以有99.9%99.9%的把握认为“秃的把握认为“秃 顶与患心脏病有关”顶与患心脏病有关”. . 患心脏病患心脏病 不患心脏病不患心脏病 总计总计 秃顶秃顶 214214 175175 389389 不秃顶不秃顶 451451 597597 10481048 总计总计 665665 772772 14371437 2 2 () ()()()() n adbc K

21、 ab cdac bd 有甲乙两个班级进行一门课程的考试,按照学生有甲乙两个班级进行一门课程的考试,按照学生 考试成绩优秀和不优秀统计成绩后,得到如下列考试成绩优秀和不优秀统计成绩后,得到如下列 联表:联表: 优秀优秀 不优秀不优秀 总计总计 甲班甲班 1010 3535 4545 乙班乙班 7 7 3838 4545 总计总计 1717 7373 9090 能否在犯错误的概率不超过能否在犯错误的概率不超过0 0. .0101的前提下认为成的前提下认为成 绩与班级有关绩与班级有关? 【变式练习变式练习】 【解析解析】假设假设H0 :成绩与班级无关:成绩与班级无关. .根据列联表中根据列联表中

22、的数据得:的数据得: 2 90(1038357) 17734545 k 0.6536.635 因此不能在犯错误的概率不超过因此不能在犯错误的概率不超过0 0. .0101的前提下认为的前提下认为 成绩与班级有关成绩与班级有关. . 1.1.下列说法中正确的是下列说法中正确的是( ( ) ) 独立性检验的基本思想是带有概率性质的反证法;独立性检验的基本思想是带有概率性质的反证法; 独立性检验就是选取一个假设独立性检验就是选取一个假设H H0 0条件下的小概率事件,条件下的小概率事件, 若在一次试验中该事件发生了,这是与实际推断相抵触若在一次试验中该事件发生了,这是与实际推断相抵触 的的“不合理不

23、合理”现象,则作出拒绝现象,则作出拒绝H H0 0的推断;的推断; 独立性检验一定能给出明确的结论独立性检验一定能给出明确的结论 A.A. B.B. C.C. D.D. A 2.2.在在2 22 2列联表中列联表中, ,两个比值两个比值_相差越大相差越大, ,两个两个 分类变量之间的关系越强分类变量之间的关系越强( ( ) ) acac A B abcdcdab acac C D adbcbdac .与.与 .与.与 A A 3.3.如果在犯错误的概率不超过如果在犯错误的概率不超过0.050.05的前提下认为事件的前提下认为事件A A 和和B B有关有关, ,那么具体算出的数据满足那么具体算出

24、的数据满足( ( ) ) A.KA.K2 23.841 B.K3.841 B.K2 26.635 D.KD.K2 26.6356.635 A A 4.4.下列变量中不属于分类变量的是下列变量中不属于分类变量的是( ( ) ) A.A.性别性别 B.B.吸烟吸烟 C.C.宗教信仰宗教信仰 D.D.国籍国籍 B B 5.5.有两个分类变量有两个分类变量X X与与Y Y的一组数据,由其列联表的一组数据,由其列联表 计算得计算得K K2 24.5234.523,则认为,则认为X X与与Y Y有关系是错误的有关系是错误的 可信度为可信度为( ( ) ) A.95% B.90% A.95% B.90% C

25、.5% D.10%C.5% D.10% C 6.6.在对人们的休闲方式的一次调查中,共调查了在对人们的休闲方式的一次调查中,共调查了 124124人,其中女性人,其中女性7070人,男性人,男性5454人,女性中有人,女性中有4343人人 主要的休闲方式是看电视,另外主要的休闲方式是看电视,另外2727人主要的休闲方式人主要的休闲方式 是运动;男性中有是运动;男性中有2121人主要的休闲方式是看电视,人主要的休闲方式是看电视, 另外另外3333人主要的休闲方式是运动人主要的休闲方式是运动 (1)(1)根据以上数据建立一个根据以上数据建立一个2 22 2的列联表的列联表. . (2)(2)判断休

26、闲方式与性别是否有关系判断休闲方式与性别是否有关系 解:解:(1)2(1)22 2 列联表如下:列联表如下: 性别性别 看电视看电视 运动运动 总计总计 女女 4343 2727 7070 男男 2121 3333 5454 总计总计 6464 6060 124124 休闲方式休闲方式 (2)假设假设“休闲方式与性别无关休闲方式与性别无关” 计算计算 K2124 43332721 2 70546460 6.201. 因为因为 K25.024,所以有理由认为假设,所以有理由认为假设“休闲方式与性休闲方式与性 别无关别无关”是不合理的 故是不合理的 故在犯在犯错误的概率错误的概率不超过不超过 0.025 的前的前 提下,提下,认为性别与休闲方式有关系认为性别与休闲方式有关系 分类变量之间关系 条形图 柱形图 列联表 独立性检验 背景分析 有一个颠扑不破的真理,那就是当我们不能有一个颠扑不破的真理,那就是当我们不能 确定什么是真的时,我们就应该去探求什么是最确定什么是真的时,我们就应该去探求什么是最 可能的。可能的。 笛卡儿笛卡儿

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 人教A版 >
版权提示 | 免责声明

1,本文(高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 情境互动课型.ppt)为本站会员(金钥匙文档)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|