1、 32 独立性检验的基本思想独立性检验的基本思想 及其初步应用及其初步应用 1通过对典型案例的探究,了解独立性检 验(只要求22列联表)的基本思想、方法及 初步应用 2通过对数据的收集、整理和分析,增强 学生的社会实践能力,培养学生分析问题、 解决问题的能力 1.图片对齐 在我们插入PPT图片或是输入文字的时候,为了整齐都需要将插入的文本框对齐 ,但是又不想一个一个的进行操作,这时按住Ctrl键将需要进行对齐的文本选中 ,点击开始排列对齐垂直居中即可; 2.巧用格式刷 在制作PPT的时候为了保证PPT风格的统一,很多任通常会使用复制粘贴来确保 每一页PPT格式相同,这样对于少页数来说可以进行操
2、作,但是碎玉多页面的话 就有点麻烦了,其实我们可以巧用格式刷:首先,在开始菜单栏下方有一个格式 刷,点击格式刷,很快就能看到效果; 3.去除所有动画效果 很多人在制作PPT的时候都是直接在模板库里下载模板进行使用的,但是下载的 模板大多数都是有幻灯片的,这样在演讲的时候很不方便,怎样将其进行去除呢 ?单击幻灯片放映选择设置幻灯片放映,放映类型选择演讲者放映;换片方式 选择手动即可; 4.PPT快键 PPT逼格提升技巧逼格提升技巧 本节重点、难点:独立性检验的思想方法 与初步应用 1两分类变量之间关联关系的定性分析 (1)分类变量:取不同的“值”表示个体所 属不同类别的变量称为分类变量 说明:对
3、分类变量的正确理解:这里的 “变量”和“值”都应作为广义的变量和 值进行理解如:对于性别变量,其取值 为男、女两种,所以这里的“变量”指的 是“性别”,这里的“值”指的是“男” 和“女”故这里所说的“变量”和“值” 不一定是具体的数值 分类变量是大量存在的,如吸烟变量有 吸烟与不吸烟两种类别,而国籍变量则有 多种类别 (2)频率分析:通过对样本中每个分类变量 的不同类别的事件发生的频率大小比较来 分析分类变量之间是否有关联 (3)图形分析:利用三维柱形图及二维条形 图来分析分类变量之间是否具有关联分析, 图形的形象直观更能说明相关数据的总体 状况 一般地,假设有两个分类变量X和Y,它们 的可能
4、取值分别为x1,x2和y1,y2,其 样本频率列联表(即22列联表)如下表: y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abc d 在三维柱形图中,主对角线上两个柱形高 度的乘积ad与副对角线上的两个柱形高度 的乘积bc相差越大,说明X与Y有关的可能 性越大,当ad与bc的差趋近于零时,X与Y 几乎没有关系,可以说X与Y是相互独立 的 在二维条形图中,可以估计满足条件 Xx1的个体中 具有 Yy1的个体所占的比例 a ab,也可以估计满足条件 Xx2的个体中具有 Yy1的个体所占的比例 c cd, 两个比 例的值相差越大,X 与 Y 有关的可能性就越大 2独立
5、性检验 (1)定义:利用随机变量 K2 (其中nabc d)来确定是否能以一定把握认为“两个 分类变量有关系”的方法称为两个分类变 量的独立性检验独立性检验的基本思想 类似于反证法,要确认“两个分类变量有 关系”这一结论成立的可信程度,首先假 设该结论不成立,即假设结论“两个分类 变量没有关系”成立,在该假设下随机变 量K2应该很小 如果由观测数据计算得到的K2的观测值k 很大,则在一定可信程度上说明假设不合 理根据随机变量K2的含义,可以通过概 率P(K2k0)的大小来评价该假设不合理的 程度有多大,从而得出“两个分类变量有 关系”这一结论成立的可信程度有多大 (2)如何用K2的值判断X与Y
6、之间是否有关? 首先列22列联表,当得到的观测数据a, b,c,d都不小于5时,由22列联表求出 K2的观测值k.若k10.828,则我们有99.9% 的把握认为X与Y有关,这种判断结果出错 的可能性约为0.1%;若k6.635,则我们有 99%的把握认为X与Y有关,这种判断结果 出错的可能性约为1%;若k2.706,则我 们有90%的把握认为X与Y有关,这种判断 结果出错的可能性约为10%;若k2.706, 则没有充分的证据显示X与Y有关,但也不 能认为X与Y无关 3独立性检验的基本方法 一般地,假设有两个分类变量X和Y,它们 的可能取值分别为x1,x2和y1,y2,其 样本频数列联表(称为
7、22列联表)为: 若要推断的结论为:H1:“X与Y有关系”, 可以按如下步骤判断结论H1成立的可能性: y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abc d (1)通过三维柱形图和二维条形图,可以粗 略地判断两个分类变量是否有关系,但是 这种判断无法精确地给出所得结论的可靠 程度在三维柱形图中,主对角线上两 个柱形高度的乘积ad与副对角线上的两个 柱形高度的乘积bc相差越大,H1成立的可 能性就越大 在二维条形图中,可以估计满足条件 Xx1的个体 中具有 Yy1的个体所占的比例 a ab,也可以估计满足条 件 Xx2的个体中具有 Yy1的个体所占的比例 c c
8、d, 两个 比例的值相差越大,H1成立的可能性就越大 (2)可以利用独立性检验来考察两个分类变量是否有 关系, 并且能较为准确地给出这种判断的可靠程度, 具体 做 法 是 : 根 据 观 测 数 据 计 算 由 公 式K2 n(adbc)2 (ab)(cd)(ac)(bd)(其中 nabcd)给出的随 机变量 K2的观测值 k, k 的值越大, 说明“X 与 Y 有关系” 成立的可能性越大 可以利用以下数据来确定“X 与 Y 有 关系”的可信程度: 如果k10.828,就有99.9%的把握认为 “X与Y有关系”;如果k7.879,就有 99.5%的把握认为“X与Y有关系”;如 果k6.635,
9、就有99%的把握认为“X与Y有 关系”;如果k5.024,就有97.5%的把 握认为“X与Y有关系”;如果k3.841, 就有95%的把握认为“X与Y有关系”; 如果k2.706,就有90%的把握认为“X与Y 有关系”;如果k10.828 又P(K210.828)0.001, 故在犯错误概率不超过0.001的前提下认为 对“男女同龄退休”这一问题的看法与性 别有关 点评 可以利用独立性检验来判断两个分 类变量是否有关系,具体做法是: 例2 为了解铅中毒病人是否有尿棕色素 增加现象,分别对病人组和对照组的尿液 作尿棕色素定性检查,结果如下,问铅中 毒病人和对照组的尿棕色素阳性数有无差 别? 组别
10、 阳性 数 阴性 数 合 计 铅中毒 病人 29 7 36 对照组 9 28 37 合计 38 35 73 解析 由上述列联表可知,在铅中毒病人 中尿棕色素为阳性的占80.56%,而对照组 仅占24.32%.说明他们之间有较大差别 根据列联表作出三维柱形图(如图1),二维 条形图(如图2),频率分布条形图(如图3所 示),由上述三图可知,铅中毒病人中与对 照组相比较,尿棕色素为阳性差异明显, 因此铅中毒病人与尿棕色素为阳性存在关 联关系 点评 由两个分类变量之间频率大小差 异可说明这两个变量之间是有关联关系 的而利用三维柱形图、二维条形图、频 率分布条形图都能形象直观地反映它们之 间差异的关系
11、,进而推断它们之间是否具 有关联关系其中作三维柱形图时应注意 恰当的视角,使每个柱体都能看到而频 率分布条形图由于是等高的,因此它与二 维条形图相比较更能直观地反映它们之间 的差异的大小,特别是当样本容量差异明 显时更是如此 一、选择题 1调查男女学生购买食品时是否看出厂 日期与性别有无关系时,最有说服力的是 ( ) A期望 B方差 C正态分布 D独立性检验 答案 D 210名学生在一次数学考试中的成绩如 下表: 要研究这10名学生成绩的平均情况,则最 能说明问题的是 ( ) A概率 B期望 C方差 D独立性检验 答案 B 分 数 100 115 120 125 人 数 2 4 3 1 3下面
12、是一个22列联表 则表中a、b处的值分别为 ( ) A94、96 B52、50 C52、59 D54、52 答案 C y1 y2 合计 x1 a 21 73 x2 7 20 27 合计 b 41 100 二、填空题 4用K2统计量进行独立性检验时,使用的 表称为_,要求表中的四个数 据_ 答案 22列联表 均大于5 5若两个分类变量x和y的列联表为: 则x与y之间有关系的概率约为_ 答案 99% y1 y2 x1 6 15 x2 40 10 三、解答题 6为调查学生对国家大事关心与否是否与 性别有关,在学生中进行随机抽样调查, 结果如下表,根据统计数据作出合适的判 断分析. 关心 不关心 合计 男生 182 18 200 女生 176 24 200 合计 358 42 400 解析 假设 H0:学生对国家大事关心与否与性别无 关,则由公式及数据得 k 400(1822418176)2 35842200200 0.9577,因为 k0.95772.706,所以不能拒绝 H0,因此 我们没有充分理由说学生是否关心国家大事与性别有关 点评 根据随机变量K2的值判断两分类 变量是否有关的步骤:第一,假设两分类 变量无关,第二,由数据及公式计算K2的 观测值k,第三,将k的值与临界值比较得 出结论
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。