1、3.2 独立性检验的基本思想及其初步应用 1 / 7 课题:课题:32 独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用 长沙市第一中学长沙市第一中学 李谦李谦 教材:普通高中课程标准试验教科书数学 选修 2-33.2(人民教育出版社 A 版) 一、教学内容解析一、教学内容解析 1本节课是高中数学(选修 2-3)第三章统计案例的第二节独立性检验的基本思想及 初步应用的第二课时,是在学习了相互独立事件概率、掌握了分类变量的概念,学会了用列 联表和等高条形图直观判断两个分类变量是否有关系之后进行教学的 这节课的学习任务包 括的知识类型主要有: 事实性知识:数据统计分析、22 列联表
2、、独立性检验基本原理; 程序性知识:独立性检验的操作步骤; 元认知知识:独立性检验的基本思想及其初步应用 2独立性检验的基本思想及初步应用是高中数学教材的新增内容,也是一种重要的假 设检验方法 本节内容将反证法与独立性检验的思想有机融合, 将假设检验的思想应用到实 际生活中去 3独立性检验在选修 2-3 的第三章和选修 1-2 的第一章中都有设置,分别供理科选修 和文科选修的学生学习,两部分的区别主要是在构造随机变量 K2的过程中理科学生可以利 用相互独立事件概率的乘法原理进行理解, 而文科的学生没有学习相互独立事件概率这一内 容不过对于独立性检验思想的形成过程,教材的设计均还原了数学的本质,
3、是对“观察发 现、 抽象概括、 感性到理性” 等数学认知规律的提炼与总结, 能让学生充分体会数学的发生、 发展 二、教学目标设置二、教学目标设置 1知识与技能 结合生活实例对分类变量进行简单的数据处理,运用 22 列联表、等高条形图直观判 断两个分类变量是否有关系,了解独立性检验的基本思想、方法及初步应用 2过程与方法 让学生通过数据统计、 分析和计算过程, 从具体实例中学会用样本来估计总体的统计思 想通过主动探究、自主学习、小组合作交流,从具体实例“学科选择与性别是否相关”中 抽象、概括、总结出独立性检验的基本原理和基本步骤,同时让学生充分体会知识的发现过 3.2 独立性检验的基本思想及其初
4、步应用 2 / 7 程 3情感、态度与价值观 通过本节课的学习, 初步培养学生从生活中发现数学问题、 解决数学问题的能力及抽象 概括、数学建模、数据分析等数学素养通过学生分析问题、解决问题的学习过程,激发学 习兴趣,培养学生勇于探索的科学精神,从而实现自我的价值 三、学生学情分析三、学生学情分析 我校是湖南省著名的示范性中学,学生学习基础较好从课前的自学反馈中,了解到学 生具备以下 3 个学情: 1学生已经学习了相互独立事件的概率乘法,也有了一定的数据分析能力和利用样本 估计总体的统计学思想; 2学生能够初步了解分类变量的概念,以及能将数据整理为 22 列联表的形式、能够 利用 Excel 软
5、件得出等高条形图; 3 独立性检验的统计思想对学生来说比较难理解, 因此在教学过程中将采用自主探究、 小组讨论等环节引导学生类比反正法体会假设检验的思想,加深理解 四、教学策略分析四、教学策略分析 1有效开发、合理利用教材资源从学生关心的新高考选课的实例入手,引导学生统 计数据、 分析数据, 通过合作探究和动手操作中得出独立性检验的基本原理及初步应用等新 知识 2在学生已经学习了相互独立事件的概率、分类变量的概念、22 列联表以及等高条 形图, 通过循序渐进的教学环节和环环相扣的问题探究, 引导学生逐步发现新知, 感悟新知, 从而突破教学难点,使学生深刻领会独立性检验的含义 3适当整合媒体资源
6、,利用多媒体呈现实例与独立性检验的原理和过程、学生参与利 用 EXCEL 软件进行数据统计和分析,得出等高条形图,计算的观测值的过程这样既 2 K 充分展现了计算机的优势,也体现了学科知识间的融合 五、教学过程设计五、教学过程设计 (一)课前准备(一)课前准备 完成预习完成预习 1分组:4 人分为一个小组,确定 6 个小组长 2准备:教师准备本校高一学生模拟选科(即从物理、化学、生物、政治、历史、地 理 6 门学科中选择 3 门)的原始数据;准备 6 台笔记本电脑 3.2 独立性检验的基本思想及其初步应用 3 / 7 3预习 : 课前预习教材第 91 页至 96 页,让学生初步了解独立性检验的
7、原理以及 Excel 的操作方法 (二)复习回顾(二)复习回顾 引出课题引出课题 为了迎接 2018 年的新高考改革,我校对新高一学生选修物理、化学、生物、政治、历 史和地理 6 门课程情况进行调查,共调查了 921 个学生,教师展示原始数据表格 你觉得哪门学科的选择最可能与性别有关? 小组合作 : 完成物理课程选择与性别列联表,并绘制“物理课程选择与性别”等高条形 图 学生活动 : 先让学生小组之间合作完成下面表格中数据统计,教师巡视指导,并与学生 交流统计数据的方法, 用 Excel 软件演示等高条形图 由学生展示统计结果 女生 男生 总计 选修物理课程 193 340 533 没有选修物
8、理课程 244 154 398 总计 437 494 921 物理课程选择与性别列联表 等高条形图 问题问题 1 由物理课程选择与性别的列联表和等高条形图能否得出高中生选修物理课程与 性别有关? 分析:从上面 22 列联表,可以计算男生中有 340/494688%的人选修物理课程,女 3.2 独立性检验的基本思想及其初步应用 4 / 7 生中,有 193/437442%的人选修物理课程由此可以看出,男生选修物理课程的比例与 女生选修物理课程的比例有比较大的差异,故“高中生选修物理课程与性别有关” ;由等高 条形图也可以观察得出相同的结论 【设计意图】课堂开始阶段,引导学生回顾上节课关于分类变量
9、、列联表和等高条形图 的知识,让学生掌握用定性的方法来初步判断两个分类变量是否有关系 问题问题 2 上述判断是否可靠呢?你有多大的把握认为 “高中生选修物理课程与性别有 关”? 引导学生独立思考,然后再相互交流这两种方法都仅能粗略地判断“高中生选修物理 课程与性别有关” ,却不能给出认为“高中生选修物理课程与性别有关”的可靠程度 【设计意图】通过复习回顾,使学生进一步掌握如何根据列联表、等高条形图来判断两 个分类变量是否有关系,并了解两种方法的局限性充分认识独立性检验的必要性,创设悬 念,激发斗志,让学生跃跃欲试 (三)问题驱动(三)问题驱动 概念形成概念形成 为了找到一个精确又便于统一评判的
10、检验方法,我们先把具体问题一般化 把表格中的数字用字母代替,得到两个分类变量的 22 列联表: 女生 男生 总计 选修物理课程 a b ab 未选修物理课程 c d cd 总计 ac bd n 问题问题 3 3 如何利用列联表中的数据定量地刻画“两个分类变量有关系”的可靠程度呢? 学生合作讨论从正面分析,很难得出“有关系”时数据应该满足的条件,此时教师及时 引导学生回顾相互独立事件概率计算模型,类比反证法思想,提出假设: H0:高中生选修物理课程与性别无关 如果“高中生选修物理课程与性别无关” ,就可以认为“选修物理课程”与“性别”是 两个独立的事件,下面我们就从独立事件的概率进行分析 设 A
11、 表示事件“女生” ,B 表示事件“选修物理课程” ,AB 表示“是女生选修物理课程” , 问题问题 4 若“选修物理课程与性别无关” , A、B 事件的概率应该满足什么条件? 用样本频率估计概率,计算 P(AB)与 P(A),P(B),由于样本的随机性,提出当 P(AB)与 P(A)P(B)越接近,A 与 B 独立的可能性就越大,即“选修物理课程与性别有关”的可能性就 3.2 独立性检验的基本思想及其初步应用 5 / 7 越小 【设计意图】 通过对实例的分析和层层设问, 为引入和理解独立性检验的基本思想做好 铺垫 在列联表中,a 恰好为事件 AB 发生的频数 ; a+b 和 a+c 恰好分别
12、为事件 A 和事件 B 发 生的频数.因为频率近似于概率, 所以在 H0成立的条件下应该有, 其中 n abaca nnn abcd,即(a+b+c+d)a(a+b)(a+c), ad-bc0. 因此| ad-bc |越小,说明选修物理课程与性别的关系越弱,| ad-bc |越大,说明选修物理 课程与性别的关系越强 对绝对值我们通常类比方差的处理方法是将它平方, 但是对于不同的样本, 列联表中的 每一个数值都可能不一样, 为了使不同容量的样本有统一的评判标准, 统计学家构造了一个 随机变量,其中 nabcd 为样本容量 2 2 () ()()()() n adbc K ab ac bd cd
13、由于不同样本中 K2的观测值不同,我们统一将实际问题中 K2的观测值用 k 表示 同时得出,在 H0成立的情况下,有如下结果: P(K2k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 教师适当解释临界值表中相应数据的意义,并举例说明:以临界值 k0为 6.635 为例, 在 H0成立的情况下,统计学家研究发现,K2的观测值大于 6.635 的概率非常小,近似为 0.01,是一个小概率事件,在一次试验中
14、,小概率事件发生了,有理由断定假设 H0不成立 下面让学生计算实例中的 K2的观察值 由表中数据计算得到 K2的观察值 k52.441 问题问题 5 能否在犯错误的概率不超过 0.010 的前提下认为选择物理课程与性别有关系? 学生分析得出,犯错的概率 0.010 所对应的临界值 k0为 6.635,K2的观察值 k52.441, 大于 6.635,所以可以在犯错误的概率不超过 0.010 的前提下认为“高中生选修物理课程与性 别有关” 以上利用随机变量 K2来判断“两个分类变量有关系”的方法称为独立性检验(test of independence) 问题问题 6请回顾独立性检验的过程,将反证
15、法的原理和独立性检验的原理进行对比完 成下面表格 学生合作讨论、归纳总结,然后小组间交换意见 3.2 独立性检验的基本思想及其初步应用 6 / 7 反证法原理 在假设 H0下,如果推出一个矛盾,就证明了 H0不成立. 独立性检验原理 在假设 H0下,若果出现一个与 H0相矛盾的小概率事件,就推断 H0不成立,且该推断犯错误的概率不超过这个小概率. 【设计意图】 通过类比, 引领学生在积极的思考、 探究中, 理解独立性检验的基本思想 整理独立性检验的做法: (1)判断之前,确定容许推断“两个分类变量有关系”犯错误概率的上界 ,及相应 临界值 k0 (2)由观测数据计算得到的 K2的 观测值 k
16、(3)如果 kk0,就认为假设“两个分类变量之间无关系”不成立,推断“两个分类变 量之间有关系” , 推断错误的概率不超过 , 否则就没有足够证据拒绝 “两个分类变量无关” 的原假设,即在犯错误的概率不超过 的前提下不能认为“两个分类变量有关系” 【设计意图】 通过回顾和整理独立性检验的过程, 进一步加深学生对独立性检验的理解, 学会独立性检验的初步应用. (四)运用新知,感悟提升(四)运用新知,感悟提升 请小组各选择一个学科, 统计该学科课程选择与性别的有关数据, 得出列联表和等高 条形图, 并判断能否在犯错误概率不超过0.05的前提下认为该学科的课程选择与性别有关? 完成统计分析报告 统计
17、分析报告统计分析报告 _年_月_日_组 研究课题 高中生选修_课程与性别的关系 女生 男生 合计 选择_课程 没有选择_课程 数据整理(画出列联表) 合计 等高条形图 计算K2的观测值 结论 小组合作完成 3.2 独立性检验的基本思想及其初步应用 7 / 7 K2的观测值 物理 化学 生物 政治 历史 地理 k 52.441 17.637 0.009 59.25 3.881 6.796 从我校高一学生 921 个来看,在犯错误概率不超过 0.05 的前提下可以认为,物理,化 学,政治,历史和地理学科的选择与性别有关,在犯错误概率不超过 0.05 的前提下不能认 为生物学科的选择与性别有关 值得
18、注意的是,尽管我们的结论已相对严谨,但是,这组数据调查来自我们学校,因 此所得结论只适合我校或与我们学校情况类似的学校的学生 【设计意图】 完成调查分析报告不单纯是对独立性检验思想的应用, 更是课堂内容的一 个延伸,通过学生自己统计数据,分析数据,参与整个独立性检验的全过程,可以开阔学生 的视野,对独立性检验思想有一个较全面科学的认识 (五)回顾总结(五)回顾总结 提炼要点提炼要点 这节课我们学习了哪些知识和方法? 【设计意图】 学生总结反思, 进一步强调独立性检验的原理和操作步骤, 培养学生提炼、 总结、概括的能力 六、课堂教学目标检测六、课堂教学目标检测 1阅读思考 阅读教科书第 91 页至 96 页,完成教科书第 97 页的两个思考题. 2巩固提升 教科书第 97 页,第 2 题. 【设计意图】 在作业的布置中, 注意将双基训练与能力发展相结合 设计阅读思考问题, 有意识地回归教材,加深对独立性检验原理和做法的理解 ; 设计练习题,使学生能够学以致 用,既巩固了基本知识,有效地检测课堂教学效果,同时又提升了学生运用知识分析问题和 解决问题的能力