高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 精讲优练课型.ppt

上传人(卖家):金钥匙文档 文档编号:429161 上传时间:2020-04-03 格式:PPT 页数:56 大小:1.16MB
下载 相关 举报
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 精讲优练课型.ppt_第1页
第1页 / 共56页
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 精讲优练课型.ppt_第2页
第2页 / 共56页
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 精讲优练课型.ppt_第3页
第3页 / 共56页
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 精讲优练课型.ppt_第4页
第4页 / 共56页
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 精讲优练课型.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

1、1.2 独立性检验的基本思想及其初步应用 【自主预习自主预习】 1.1.分类变量和列联表分类变量和列联表 (1)(1)分类变量分类变量 变量的不同“值”表示个体所属的变量的不同“值”表示个体所属的_,像这样,像这样 的变量称为分类变量的变量称为分类变量. . 不同类别不同类别 (2)(2)列联表列联表 定义:列出的两个分类变量的定义:列出的两个分类变量的_称为列联表称为列联表. . 2 22 2列联表:列联表: 一般地,假设有两个分类变量一般地,假设有两个分类变量X X和和Y Y,它们的取值分别,它们的取值分别 为为xx1 1,x x2 2 和和yy1 1,y y2 2 ,其样本频数列联表,其

2、样本频数列联表( (称为称为2 22 2 列联表列联表) )为为 频数表频数表 y y1 1 y y2 2 总计总计 x x1 1 a a b b a+ba+b x x2 2 c c d d c+dc+d 总计总计 a+ca+c b+db+d a+b+c+da+b+c+d 2.2.等高条形图等高条形图 (1)(1)等高条形图和表格相比,更能直观地反映出两个分等高条形图和表格相比,更能直观地反映出两个分 类变量间是否类变量间是否_,常用等高条形图展示列联表,常用等高条形图展示列联表 数据的数据的_._. (2)(2)如果直接观察等高条形图发现如果直接观察等高条形图发现_和和_相相 差很大,就判断

3、两个分类变量之间有关系差很大,就判断两个分类变量之间有关系. . 相互影响相互影响 频率特征频率特征 a ab c cd 3.3.独立性检验独立性检验 定定 义义 利用随机变量利用随机变量K K2 2来判断“两个分类变量有关系”来判断“两个分类变量有关系” 的方法称为独立性检验的方法称为独立性检验 公公 式式 2 2 n(adbc) Kn_ ab cd ac bd ,其中 ()()()() a+b+c+da+b+c+d 具具 体体 步步 骤骤 确定确定 ,根据实际问题的需要确定容许推断,根据实际问题的需要确定容许推断 “两个分类变量有关系”犯错误概率的上界“两个分类变量有关系”犯错误概率的上界

4、 , 然后查表确定然后查表确定_._. 计算计算K K2 2,利用公式计算随机变量,利用公式计算随机变量K K2 2的的_._. 下结论,如果下结论,如果_,就推断“,就推断“X X与与Y Y有关系”,有关系”, 这种推断这种推断_不超过不超过 ;否则,就认;否则,就认 为在犯错误的概率不超过为在犯错误的概率不超过 的前提下不能推断的前提下不能推断 “X X与与Y Y有关系”,或者在样本数据中有关系”,或者在样本数据中_ _支持结论“支持结论“X X与与Y Y有关系”有关系” 临界值临界值k k0 0 观测值观测值k k kkkk0 0 犯错误的概率犯错误的概率 没有发现没有发现 足够证据足够

5、证据 【即时小测即时小测】 1.1.下列变量中不属于分类变量的是下列变量中不属于分类变量的是( ( ) ) A.A.性别性别 B.B.吸烟吸烟 C.C.宗教信仰宗教信仰 D.D.职业职业 【解析解析】选选B.“B.“吸烟吸烟”不是分类变量不是分类变量.“.“是否吸烟是否吸烟”才才 是分类变量是分类变量. . 2.2.下面是下面是2 22 2列联表列联表. . y y1 1 y y2 2 总计总计 x x1 1 3333 2121 5454 x x2 2 a a 1313 4646 总计总计 b b 3434 则表中则表中a a,b b处的值应为处的值应为( ( ) ) A.33A.33,666

6、6 B.25B.25,5050 C.32C.32,6767 D.43D.43,5656 【解析解析】选选A.A.由由2 22 2列联表知列联表知a+13=46a+13=46,所以,所以a=33a=33, 又又b=a+33b=a+33,所以,所以b=33+33=66.b=33+33=66. 3.3.如果在犯错误的概率不超过如果在犯错误的概率不超过0.050.05的前提下认为事件的前提下认为事件A A 和和B B有关,那么具体算出的数据满足有关,那么具体算出的数据满足( ( ) ) A.KA.K2 23.8413.841 B.KB.K2 26.635 D.KD.K2 23.841. 【知识探究知识

7、探究】 探究点探究点1 1 2 22 2列联表列联表 1.21.22 2列联表中研究的变量是什么变量?列联表中研究的变量是什么变量? 提示:提示:分类变量分类变量. . 2.22.22 2列联表中列联表中xx1 1,x x2 2 ,yy1 1,y y2 2 的意义是什么?的意义是什么? 提示:提示:xx1 1,x x2 2 ,yy1 1,y y2 2 表示分类变量表示分类变量x x,y y的取值的取值. . 【归纳总结归纳总结】 1.1.对“分类变量”的三点说明对“分类变量”的三点说明 (1)(1)这里的“变量”和“值”都应作为“广义”的变量这里的“变量”和“值”都应作为“广义”的变量 和值进

8、行理解和值进行理解. .例如,对于性别变量,其取值为男和女例如,对于性别变量,其取值为男和女 两种两种. .这里的变量指的是性别,同样这里的“值”指的这里的变量指的是性别,同样这里的“值”指的 是“男”和“女”是“男”和“女”. .因此,这里所说的“变量”和“值”因此,这里所说的“变量”和“值” 不一定取的是具体的数值不一定取的是具体的数值. . (2)(2)分类变量是大量存在的分类变量是大量存在的. .例如,是否吸烟变量有吸例如,是否吸烟变量有吸 烟与不吸烟两种类别,而国籍变量则有多种类别烟与不吸烟两种类别,而国籍变量则有多种类别. . (3)(3)注意区分分类变量与定量变量的不同注意区分分

9、类变量与定量变量的不同. .如身高、体如身高、体 重、考试成绩等就是定量变量,它们的取值一定是实重、考试成绩等就是定量变量,它们的取值一定是实 数,并且取值大小有特定的含义数,并且取值大小有特定的含义. . 2.22.22 2列联表列联表 (1)2(1)22 2列联表用于研究两类变量之间是否相互独立,列联表用于研究两类变量之间是否相互独立, 它适用于分析两类变量之间的关系,是对两类变量进它适用于分析两类变量之间的关系,是对两类变量进 行独立性检验的基础行独立性检验的基础. . (2)(2)表中表中|ad|ad- -bc|bc|越小,两个变量之间的关系越弱;越小,两个变量之间的关系越弱; |ad

10、|ad- -bc|bc|越大,两个变量之间的关系越强越大,两个变量之间的关系越强. . 特别提醒:判断两个分类变量相关关系强弱也可通过特别提醒:判断两个分类变量相关关系强弱也可通过 比较比较 与与 之间的差的大小来判断,差越大,之间的差的大小来判断,差越大, 相关关系越强相关关系越强. . a ab c cd 探究点探究点2 2 K K2 2统计量统计量 1.K1.K2 26.6356.635是指在犯错误的概率不超过多少的前提下是指在犯错误的概率不超过多少的前提下 认为两个分类变量有关系?认为两个分类变量有关系? 提示:提示:0.010.0.010. 2.2.当当K K2 23.8413.84

11、1时,认为“时,认为“X X与与Y Y有关系”而犯错误的概有关系”而犯错误的概 率有多大?率有多大? 提示:提示:不超过不超过0.05.0.05. 【归纳总结归纳总结】 独立性检验的关注点独立性检验的关注点 (1)(1)使用使用K K2 2统计量作独立性检验时,统计量作独立性检验时,2 22 2列联表中的数列联表中的数 据据a a,b b,c c,d d都要大于都要大于5.5. (2)(2)独立性检验类似于数学中的反证法,要确认“两个独立性检验类似于数学中的反证法,要确认“两个 变量有关系”这一结论成立的可信度,首先假设结论变量有关系”这一结论成立的可信度,首先假设结论 不成立,在假设下,我们

12、构造的统计量不成立,在假设下,我们构造的统计量K K2 2应该很小应该很小. .如如 果由观测数据计算得到的果由观测数据计算得到的K K2 2值很大,则在一定程度上值很大,则在一定程度上 说明假设不合理,再根据不合理的程度与临界值的关说明假设不合理,再根据不合理的程度与临界值的关 系作出判断系作出判断. . 类型一类型一 等高条形图与等高条形图与2 22 2列联表列联表 【典例典例】1.1.下列关于等高条形图的叙述正确的是下列关于等高条形图的叙述正确的是( ( ) ) A.A.从等高条形图中可以精确地判断两个分类变量是否从等高条形图中可以精确地判断两个分类变量是否 有关系有关系 B.B.从等高

13、条形图中可以看出两个变量频数的相对大小从等高条形图中可以看出两个变量频数的相对大小 C.C.从等高条形图中可以粗略地看出两个分类变量是否从等高条形图中可以粗略地看出两个分类变量是否 有关系有关系 D.D.以上说法都不对以上说法都不对 2.2.在在2 22 2列联表中,两个比值列联表中,两个比值_相差越大,两相差越大,两 个分类变量之间的关系越强个分类变量之间的关系越强.(.( ) ) acac A B abcdcdab acac C D adbcbdac .与.与 .与.与 3.3.为了解铅中毒病人与尿棕色素为阳性是否有关系,为了解铅中毒病人与尿棕色素为阳性是否有关系, 分别对病人组和对照组的

14、尿液作尿棕色素定性检查,分别对病人组和对照组的尿液作尿棕色素定性检查, 结果如下:结果如下: 组别组别 阳性数阳性数 阴性数阴性数 总计总计 铅中毒病人铅中毒病人 2929 7 7 3636 对照组对照组 9 9 2828 3737 总计总计 3838 3535 7373 试画出列联表的等高条形图,分析铅中毒病人和对照试画出列联表的等高条形图,分析铅中毒病人和对照 组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色 素为阳性是否有关系?素为阳性是否有关系? 【解题探究解题探究】 1.1.典例典例1 1中利用等高条形图可以比较两个变量的什么大中利用等高条

15、形图可以比较两个变量的什么大 小关系?小关系? 提示:提示:利用等高条形图可以比较两个变量频率的大小利用等高条形图可以比较两个变量频率的大小 关系关系. . 2.2.典例典例2 2中,研究两个分类变量的关系,应着重研究中,研究两个分类变量的关系,应着重研究 哪些量?哪些量? 提示:提示:应着重研究应着重研究 与与 或者或者 与与 . . 3.3.典例典例3 3中要画出等高条形图应先计算哪些量?中要画出等高条形图应先计算哪些量? 提示:提示:铅中毒病人和对照组样本中尿棕色素为阳性铅中毒病人和对照组样本中尿棕色素为阳性 的频率的频率. . a ab c cd b ab d cd 【解析解析】1.1

16、.选选C.C.在等高条形图中仅能粗略判断两个分在等高条形图中仅能粗略判断两个分 类变量的关系,故类变量的关系,故A A错错. .在等高条形图中仅能找出频在等高条形图中仅能找出频 率,无法找出频数,故率,无法找出频数,故B B错错. . 2.2.选选A. A. 与与 相差越大,说明相差越大,说明adad与与bcbc相差越相差越 大,两个分类变量之间的关系越强大,两个分类变量之间的关系越强. . a ab c cd 3.3.等高条形图如图所示:等高条形图如图所示: 其中两个浅色条的高分别代表铅中毒病人和对照组样其中两个浅色条的高分别代表铅中毒病人和对照组样 本中尿棕色素为阳性的频率本中尿棕色素为阳

17、性的频率. . 由图可以直观地看出铅中毒病人与对照组相比,尿棕由图可以直观地看出铅中毒病人与对照组相比,尿棕 色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕 色素为阳性有关系色素为阳性有关系. . 【方法技巧方法技巧】 1.1.判断两个分类变量是否有关系的方法判断两个分类变量是否有关系的方法 (1)(1)利用数形结合思想,借助等高条形图来判断两个分利用数形结合思想,借助等高条形图来判断两个分 类变量是否相关是判断变量相关的常见方法类变量是否相关是判断变量相关的常见方法. . (2)(2)在等高条形图中,在等高条形图中, 与与 相差越大,两个分类相差

18、越大,两个分类 变量有关系的可能性就越大变量有关系的可能性就越大. . a ab c cd 2.2.利用等高条形图判断两个分类变量是否相关的步骤利用等高条形图判断两个分类变量是否相关的步骤 【变式训练变式训练】从发生交通事故的司机中抽取从发生交通事故的司机中抽取20002000名司名司 机作随机样本,根据他们血液中是否含有酒精以及他机作随机样本,根据他们血液中是否含有酒精以及他 们是否对事故负有责任将数据整理如下:们是否对事故负有责任将数据整理如下: 有责任有责任 无责任无责任 总计总计 有酒精有酒精 650650 150150 800800 无酒精无酒精 700700 500500 1 20

19、01 200 总计总计 1 3501 350 650650 2 0002 000 试分析血液中含有酒精与对事故负有责任是否有关系试分析血液中含有酒精与对事故负有责任是否有关系. . 【解析解析】作等高条形图如下,作等高条形图如下, 图中阴影部分表示有酒精负责图中阴影部分表示有酒精负责 任与无酒精负责任的比例,从任与无酒精负责任的比例,从 图中可以看出,两者差距较大,图中可以看出,两者差距较大, 由此我们可以在某种程度上认由此我们可以在某种程度上认 为“血液中含有酒精与对事故负有责任”有关系为“血液中含有酒精与对事故负有责任”有关系. . 类型二类型二 K K2 2独立性检验独立性检验 【典例典

20、例】为了探究学生选报文、理科是否与对外语的为了探究学生选报文、理科是否与对外语的 兴趣有关,某同学调查了兴趣有关,某同学调查了361361名高二在校学生,调查结名高二在校学生,调查结 果如下:理科对外语有兴趣的有果如下:理科对外语有兴趣的有138138人,无兴趣的有人,无兴趣的有9898 人,文科对外语有兴趣的有人,文科对外语有兴趣的有7373人,无兴趣的有人,无兴趣的有5252人人. .能能 否在犯错误的概率不超过否在犯错误的概率不超过0.10.1的前提下,认为“学生选的前提下,认为“学生选 报文、理科与对外语的兴趣有关”?报文、理科与对外语的兴趣有关”? 【解题探究解题探究】本例中“犯错误

21、的概率不超过本例中“犯错误的概率不超过0.1”0.1”对应对应 的的K K2 2值应满足什么?值应满足什么? 提示:提示:“犯错误的概率不超过犯错误的概率不超过0.1”0.1”对应的对应的K K2 2值应满足值应满足 K K2 22.706.2.706. 【解析解析】根据题目所给的数据得到如下列联表:根据题目所给的数据得到如下列联表: 理科理科 文科文科 总计总计 有兴趣有兴趣 138138 7373 211211 无兴趣无兴趣 9898 5252 150150 总计总计 236236 125125 361361 根据列联表中数据由公式计算得根据列联表中数据由公式计算得 k= 1.871k=

22、1.8711010- -4 4. . 因为因为1.8711.8711010- -4 42.706, 所以,在犯错误的概率不超过所以,在犯错误的概率不超过0.10.1的前提下,可以认的前提下,可以认 为为“学生选报文、理科与对外语的兴趣有关学生选报文、理科与对外语的兴趣有关”. . 2 361 (100 32 136 93) 193 168 236 125 2.2.在上述探究中能否在犯错误的概率不超过在上述探究中能否在犯错误的概率不超过0.0010.001的前的前 提下,认为“学生选报文、理科与对外语的兴趣有提下,认为“学生选报文、理科与对外语的兴趣有 关”?关”? 【解析解析】由上述探究可知由

23、上述探究可知k=33.69010.828k=33.69010.828,故在犯错,故在犯错 误的概率不超过误的概率不超过0.0010.001的前提下,可以认为的前提下,可以认为“学生选报学生选报 文、理科与对外语的兴趣有关文、理科与对外语的兴趣有关”. . 【方法技巧方法技巧】反证法与独立性检验的关系反证法与独立性检验的关系 反证法反证法 独立性检验独立性检验 要证明结论要证明结论A A 要确认“两个分类变量有关系”要确认“两个分类变量有关系” 在在A A不成立的前不成立的前 提下进行推理提下进行推理 假设该结论不成立,即假设结论假设该结论不成立,即假设结论 “两个分类变量没有关系”成立,“两个

24、分类变量没有关系”成立, 在该假设下计算在该假设下计算K K2 2 推出矛盾意味着推出矛盾意味着 结论结论A A成立成立 由观测数据计算得到的由观测数据计算得到的K K2 2的观测值的观测值 k k很大,则在一定可信程度上说明很大,则在一定可信程度上说明 假设不合理假设不合理 反证法反证法 独立性检验独立性检验 没有找到矛盾,没有找到矛盾, 不能对不能对A A下任何下任何 结论,即反证法结论,即反证法 不成立不成立 根据随机变量根据随机变量K K2 2的含义,可以通过的含义,可以通过 概率概率P(KP(K2 2kk0 0) )的大小来评价该假设的大小来评价该假设 不合理的程度有多大,从而得出不

25、合理的程度有多大,从而得出 “两个分类变量有关系”这一结论“两个分类变量有关系”这一结论 成立的可信程度有多大成立的可信程度有多大 易错警示:当易错警示:当K K2 2的观测值的观测值kkkk0 0时,是指“在犯错误的时,是指“在犯错误的 概率不超过概率不超过 的前提下推出“的前提下推出“X X与与Y Y有关系”,而不是有关系”,而不是 “X X与与Y Y有关系的概率为有关系的概率为 ”.”. 【补偿训练补偿训练】某学校对学生的课外活动进行调查,结某学校对学生的课外活动进行调查,结 果如表:果如表: 体育体育 文娱文娱 总计总计 男生男生 2121 2323 4444 女生女生 6 6 292

26、9 3535 总计总计 2727 5252 7979 试用你所学过的知识进行分析,能否在犯错误的概率试用你所学过的知识进行分析,能否在犯错误的概率 不超过不超过0.0050.005的前提下,认为学生喜欢课外活动的类型的前提下,认为学生喜欢课外活动的类型 与性别有关?与性别有关? 【解析解析】由表中数据可知由表中数据可知K K2 2的观测值的观测值 因为因为P(KP(K2 27.879)0.0057.879)0.005且且8.1067.879.8.1067.879. 所以在犯错误的概率不超过所以在犯错误的概率不超过0.0050.005的前提下,可以认为的前提下,可以认为 学生喜欢课外活动的类型与

27、性别有关系学生喜欢课外活动的类型与性别有关系. . 2 2 n adbc k ab cdacbd 79 (21 29 23 6) 8.106. 44 35 27 52 自我纠错自我纠错 判断两个分类变量的相关程度判断两个分类变量的相关程度 【典例典例】在某项研究吸烟与患肺癌的关系的调查中,在某项研究吸烟与患肺癌的关系的调查中, 共调查了共调查了1000010000人,经计算得人,经计算得K K2 2的观测值的观测值k=62.98k=62.98,根,根 据这一数据分析,在犯错误的概率超过据这一数据分析,在犯错误的概率超过_的前的前 提下认为“吸烟与患肺癌没有关系”提下认为“吸烟与患肺癌没有关系”

28、.(P(K.(P(K2 210.828)10.828) 0.001).0.001). 【失误案例失误案例】 分析解题过程,找出错误之处,并写出正确答案分析解题过程,找出错误之处,并写出正确答案. . 提示:提示:错误的根本原因是审题错误,由题意可知,我错误的根本原因是审题错误,由题意可知,我 们认为们认为“吸烟与患肺癌有关系吸烟与患肺癌有关系”,这种判断出错的可,这种判断出错的可 能性是能性是0.001.0.001.因此,我们认为因此,我们认为“吸烟与患肺癌没有关吸烟与患肺癌没有关 系系”,这种判断出错的可能性是,这种判断出错的可能性是0.999.0.999.正确解答过程正确解答过程 如下:如下: 【解析解析】由由P(KP(K2 210.828)0.00110.828)0.001知在犯错误的概率知在犯错误的概率 不超过不超过0.0010.001的前提下认为“吸烟与患肺癌有关系”的前提下认为“吸烟与患肺癌有关系”. . 因此在犯错误的概率超过因此在犯错误的概率超过0.9990.999的前提下认为“吸烟与的前提下认为“吸烟与 患肺癌没有关系”患肺癌没有关系”. . 答案:答案:0.9990.999

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 人教A版 >
版权提示 | 免责声明

1,本文(高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 精讲优练课型.ppt)为本站会员(金钥匙文档)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|