1、1.2 独立性检验的 基本思想及其初步应用 教学目标教学目标 1理解独立性检验的基本思想 2、会从列联表、柱形图、条形图直观判断吸 烟与患肺癌有关。 3、了解随机变量K2的含义。 理解独立性检验的基本思想及实施步骤。理解独立性检验的基本思想及实施步骤。 教学重点教学重点:理解独立性检验的基本思想。独 立性检验的步骤。 教学难点教学难点;1、理解独立性检验的基本思想; 2、了解随机变量K 的含义;独立性检验的步 骤。 看到这个课题,你能想到什么? 案案 例例:某医疗机构为了了解呼吸道疾病与吸:某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调查了烟是否有关,进行了一次抽样调查
2、,共调查了 515515个成年人,其中吸烟者个成年人,其中吸烟者220220人,不吸烟者人,不吸烟者 295295人。人。 调查结果调查结果:吸烟的:吸烟的220220人中有人中有3737人患呼吸道疾人患呼吸道疾 病,病,183183人未患呼吸道疾病;不吸烟的人未患呼吸道疾病;不吸烟的295295人中人中 有有2121人患病,人患病,274274人未患病。人未患病。 根据这些数据,能否断定:患呼吸道疾 病与吸烟有关? 数据整理 患病患病 未患病未患病 合计合计 吸烟吸烟 不吸烟不吸烟 合计合计 37 21 58 183 274 457 220 295 515 问题:判断的标准是什么? 吸烟与不
3、吸烟,患病的可能性的大小是否有差异? 频率估计概率 患 病 未患病 合 计(n) 吸 烟 16.82% 83.18% 100%(220) 不吸烟 7.12% 92.88% 100%(295) 通过图形直观判断通过图形直观判断 不患病不患病 比例比例 患病患病 比例比例 解决问题:直观方法 吸烟的患病率 不吸烟的患病率 37/220 16.82% 21/295 7.12% 根据统计分析的思想,用频率估计概率 可知,吸烟者与不吸烟者患病的可能性 存在差异。 你能有多大把握认为“患病与吸烟有关”呢? 有一个颠扑不破的真理,那就是当 我们不能确定什么是真的时,我们就 应该去探求什么是最可能的。 笛卡儿
4、 能否用数量来刻画“有关”程度能否用数量来刻画“有关”程度 不吸烟但患病的人数约为 n 不吸烟也不患病的人数约为 n 怎样估计实际观测值与理论估计值的误差? 采用如下的量(称为K2 统计量)来刻画这个差异: + + + 化简得 = K2 K 2统计量 K2 11.8634 解决问题的思路 思路:反证法思想 (1)假设:H0:患病与吸烟无关 即 P(A)P(B)= P(AB) (2)在 H0成立的条件下进行推理 (3)如果实际观测值与由(2)推出的值 相差不大,则可以认为这些差异是由随机 误差造成的,假设H0不能被否定;否则, 假设H0不能被接受 反证法原理与假设检验原理 反证法原理: 在一个已
5、知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。 假设检验原理: 在一个已知假设 下,如果推出一 个小概率事件发 生,则推断这个 假设不成立的可 能性很大。 一般地,对于两个研究对象一般地,对于两个研究对象和和,有两类有两类 取值,即类取值,即类A A和和B B(如吸烟与不吸烟);(如吸烟与不吸烟);也有两类也有两类 取值,即类取值,即类1 1和和2 2(如患病与不患病)。于是得到(如患病与不患病)。于是得到 下列联表所示的抽样数据:下列联表所示的抽样数据: 类类1 1 类类2 2 总计总计 类类A A a a b b a+ba+b 类类B B c c d d c+dc+d 总计总
6、计 a+ca+c b+db+d a+b+c+da+b+c+d 要推断要推断“和和有关系有关系”,可按下面的步骤进行:,可按下面的步骤进行: (1 1)提出假设)提出假设H H0 0 :和和没有关系;没有关系; (3 3)查对临界值,作出判断。)查对临界值,作出判断。 (2 2)根据)根据2 2 2 2列联表与公式计算列联表与公式计算 的值;的值; 2 K 由于抽样的随机性,由样本得到的推断由于抽样的随机性,由样本得到的推断 有可能正确,也有可能错误。利用有可能正确,也有可能错误。利用 进行独进行独 立性检验,可以对推断的正确性的概率作出立性检验,可以对推断的正确性的概率作出 估计,样本量估计,
7、样本量n n越大,估计越准确。越大,估计越准确。 2 K 0.5 0.4 0.25 0.15 0.1 0.05 0.025 0.01 0.005 0.001 ko 0.4 55 0.7 08 1.32 3 2.07 2 2.7 06 3.84 1 5.024 6.63 5 7.879 10.82 8 2 0 (Kk )P 卡方临界值表:卡方临界值表: 则有则有99.9%99.9%的把握认为“的把握认为“与与有关系”;有关系”; (1)1)若观测值若观测值K K2 210.828.10.828. (3)3)若观测值若观测值K K2 22.7062.706, (4)4)若观测值若观测值K K2 2
8、2.7062.706, (2)2)若观测值若观测值K K2 26.6356.635, 则有则有99%99%的把握认为“的把握认为“与与有关系”;有关系”; 则有则有90%90%的把握认为“的把握认为“与与有关系”;有关系”; 则没有充分的证据显示“则没有充分的证据显示“与与有关有关 系”,但也不能作出结论“系”,但也不能作出结论“H H0 0成立”,成立”, 即即与与没有关系。没有关系。 题型一 有关“相关的检验” 【例1】 某校对学生课外活动进行调查,结果整理成 下表: 试用你所学过的知识进行分析,能否在犯错误的概 率不超过0.005的前提下,认为“喜欢体育还是文娱 与性别有关系”? 体育
9、文娱 总计 男生 21 23 44 女生 6 29 35 总计 27 52 79 思路探索 可用数据计算 K2,再确定其中的具体关系 解 判断方法如下: 假设 H0“喜欢体育还是喜欢文娱与性别没有关系”,若 H0成立, 则 K2应该很小 a21,b23,c6,d29,n79, k nadbc2 abcdacbd 7921292362 212362921623298.106. 例2:为研究不同的给药方式(口服与注射)和 药的效果(有效和无效)是否有关,进行了相 应的抽样调查,调查的结果列在下表中,根据 所选择的193个病人的数据,能否作出药的效果 与给药方式有关的结论? 有效有效 无效无效 合计合计 口服口服 58 40 98 注射注射 64 31 95 合计合计 122 71 193 解:提出假设 H0:药的效果与给药方式无关系。 根据列联表中的数据可以求出: 2 2 193 (58 31 40 64) K1.38962.706 122 71 98 95 当H0成立时, 的概率大于10%, 这个概率比较大,所以根据目前的调查数 据,不能否定假设H0,即不能作出药的效 果与给药方式有关的结论。 2 K1.3896
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。