1、-1- 3 3.2 2 独立性检验的基本思想及其初步 应用 -2- 3.2 独立性检验的基本 思想及其初步应用 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练习 课程目标课程目标 学习脉络学习脉络 1.能用等高条形图反映两个分类 变量之间是否有关系. 2.能够根据条件列出列联表并会 由公式求 r. 3.能知道独立性检验的基本思想 和方法. -3- 3.2 独立性检验的基本 思想及其初步应用 JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练
2、习 1.数据的表示方法 (1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类 变量. (2)用图表列出两个分类变量的频数表,称为列联表. (3)与表格相比,图形更能直观地反映出两个分类变量间是否相互影响, 常用等高条形图展示列联表数据的频率特征. -4- 3.2 独立性检验的基本 思想及其初步应用 JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练习 思考 1班级与成绩 2 2 列联表: 优秀 不优秀 总计 甲班 10 35 45 乙班 7 38 p 总计 m n q 表示数据 m,n,p,q 的值应分别
3、为( ) A.70,73,45,188 B.17,73,45,90 C.73,17,45,90 D.17,73,45,45 提示:B -5- 3.2 独立性检验的基本 思想及其初步应用 JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练习 2.独立性检验 (1)利用随机变量 K2来判断“两个分类变量有关系”的方法称为两个分 类变量的独立性检验. (2)一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2y1,y2, 其样本频数列联表如下: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+
4、c b+d a+b+c+d 公式 K2= (-)2 (+)(+)(+)(+),其中 n=a+b+c+d 为样本容量. -6- 3.2 独立性检验的基本 思想及其初步应用 JICHU ZHISHI 基础知识 首 页 ZHONGDIAN NANDIAN 重点难点 SUITANG LIANXI 随堂练习 思考 2如何理解独立性检验的思想? 提示:独立性检验的基本思想类似于反证法.要判断“两个分类变量有 关系”,首先假设结论不成立,即 H0:“两个分类变量没有关系”成立,在该假 设下构造的随机变量K2,应该很小.如果由观测数据计算得到的K2的观测值 k很大,则断言H0不成立,即认为“两个分类变量有关系
5、”;如果观测值k很小, 则说明在样本数据中没有发现足够证据拒绝 H0. -7- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究一 利用图形与分类变量间的关系作出分析 (1)利用列联表直接计算 + 和 +,如果两者相差很大,就判断两个分 类变量之间有关系. (2)在等高条形图中展示列联表数据的频率特征,比较图中两个深色条 的高可以发现两者频率不一样而得出结论,这种直观判断的不足之处在于 不能给出推断“两个分类变量有关系”犯错误的概率. -8-
6、 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 【典型例题 1】 某学校对高三学生作了一项调查发现:在平时的模拟 考试中,性格内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学 生 594 人中有 213 人在考前心情紧张,作出等高条形图,利用图形判断考前 心情紧张与性格类别是否有关系. -9- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识
7、SUITANG LIANXI 随堂练习 探究一 探究二 探究三 解:作列联表如下: 性格内向 性格外向 总计 考前心情紧张 332 213 545 考前心情不紧张 94 381 475 总计 426 594 1 020 ad-bc=332381-21394=106 470. ad-bc 比较大,说明考前紧张与性格类型有关. -10- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比 例,从
8、图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧 张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关. -11- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 规律总结估算频率两图中深色条的高依据 差距大小结论 -12- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究二 独
9、立性检验与应用 进行独立性检验时,首先要根据题意列出两个分类变量的列联表,然后 代入公式计算随机变量 K2的观测值 k,再对照相应的临界值给出结论,以决 定两个变量有关,还是在犯错误概率不超过多少的前提下有关系. -13- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 【典型例题 2】 为调查某地区老年人是否需要志愿者提供帮助,用简 单随机抽样方法从该地区调查了 500 位老年人,结果如下: 男 女 需要 40 30 不需要 160 270 (
10、1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否在犯错误的概率不超过 0.01 的前提下认为该地区的老年人需 要志愿者提供帮助与性别有关? -14- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 附: P(K2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 K2= (-)2 (+)(+)(+)(+) 思路分析:(1)求出老年人需要帮助的共有多少人,再求比值. (2)利用公式计算出 K2,
11、再进行判断. -15- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区 老年人中,需要帮助的老年人的比例的估计值为 70 500=14%. (2)由列联表中数据,得 K2观测值为 k=500(40270-30160) 2 20030070430 9.967. 由于 9.9676.635,所以在犯错误的概率不超过 0.01 的前提下认为该地 区的老年人需要志愿者提供帮助与性别有
12、关. -16- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 规律总结在判断两个分类变量关系的可靠性时一般利用 随机变量 K2来确定,把计算出的 K2的值与相关的临界值作比较,确定出两 个变量有关系的把握程度. -17- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 探究三 易错辨析 易错点 对
13、概念理解不当致误. 【典型例题 3】 若两个分类变量 x 和 y 的列联表为: y1 y2 x1 5 15 x2 40 10 则 x 与 y 之间有关系的概率约为 . 错解:计算 K2的观测值得 k18.822,查表知 P(K210.828)0.001. 答案:0.001 -18- 3.2 独立性检验的基本 思想及其初步应用 ZHONGDIAN NANDIAN 重点难点 首 页 JICHU ZHISHI 基础知识 SUITANG LIANXI 随堂练习 探究一 探究二 探究三 错因分析:没有理解好独立性检验的基本思想. 正解:k= (5+15+40+10)(510-4015)2 (5+15)(
14、40+10)(5+40)(15+10) 18.822.查表知 P(K210.828)0.001, 则 x 与 y 之间有关系的概率约为 1-0.001=0.999. 答案:0.999 -19- 3.2 独立性检验的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列 联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由 K2= (-)2 (+)(+)(+)(+)
15、算得,K 2=110(4030-2020)2 60506050 7.8. 附表: P(K2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 -20- 3.2 独立性检验的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 参照附表,得到的正确结论是( ) A.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” C.有 99%以上的把握认为“爱好该项运
16、动与性别有关” D.有 99%以上的把握认为“爱好该项运动与性别无关” 解析: K27.86.635. 有 99%以上的把握认为“爱好该项运动与性别有 关”,即犯错误的概率不超过 1%. 答案:C -21- 3.2 独立性检验的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 2.观察下列各图,其中两个分类变量之间关系最强的是( ) 解析:在四幅图中,D 图中两个深色条的高相差最明显,说明两个分类变量之 间关系最强. 答案:D -22- 3.2 独立性检验的基本 思想及其初步
17、应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽 取了 100 名电视观众,相关的数据如下表所示: 文艺节目 新闻节目 总计 20 至 40 岁 40 18 58 大于 40 岁 15 27 42 总计 55 45 100 由表中数据直观分析,收看新闻节目的观众是否与年龄有关: (填“是” 或“否”). 解析:因为在 20 至 40 岁的 58 名观众中有 18 名观众收看新闻节目,而大于 40 岁的 42 名观众中有 27
18、名观众收看新闻节目,即 + = 18 58 , + = 27 42,两者 相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的. 答案:是 -23- 3.2 独立性检验的基本 思想及其初步应用 SUITANG LIANXI 随堂练习 首 页 JICHU ZHISHI 基础知识 ZHONGDIAN NANDIAN 重点难点 1 2 3 4 4.下表是一次针对高三文科学生的调查所得的数据,能否在犯错误的概率 不超过 0.025 的前提下认为文科学生总成绩不好与数学成绩不好有关系 呢? 总成绩好 总成绩不好 总计 数学成绩好 478 12 490 数学成绩不好 399 24 423 总计 877 36 913 解:依题意,计算随机变量 K2的观测值为 k=913(47824-39912) 2 49042387736 6.2335.024, 因此,在犯错误的概率不超过 0.025的前提下认为文科学生总成绩不好 与数学成绩不好有关系.