1、3.2独立性检验的基本思想及其初独立性检验的基本思想及其初步应用(三)步应用(三)不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟7775427817吸烟吸烟2099492148总计总计98749199651、列联表2、三维柱形图不患肺癌患肺癌吸烟不吸烟从三维柱形图能清从三维柱形图能清晰看出各个频数的晰看出各个频数的相对大小。相对大小。两个分类变量是否相关的表示及其独立性检验的方法和步骤两个分类变量是否相关的表示及其独立性检验的方法和步骤(以以吸烟和患肺癌为例)吸烟和患肺癌为例)复习回顾复习回顾3、二维条形图不患肺癌患肺癌吸烟不吸烟0800070006000500040003000200010
2、00从二维条形图能看从二维条形图能看出,吸烟者中患肺出,吸烟者中患肺癌的比例高于不患癌的比例高于不患肺癌的比例。肺癌的比例。复习回顾复习回顾不吸烟吸烟00.10.20.30.40.50.60.70.80.91不吸烟不吸烟吸烟吸烟患肺癌比例不患肺癌比例4、等高条形图等高条形图更清晰地表达了两种情况下患肺癌的比例。复习回顾复习回顾随机变量随机变量-卡方统计量卡方统计量22(),()()()()n adbcKabcdacbdnabcd其 中为 样 本 容 量。5、独立性检验独立性检验0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.323
3、2.0722.7063.8415.0246.6357.87910.8280k0)k2P(K临界值表临界值表210.828K26.635K22.706K22.706K0.1%0.1%把握认为把握认为A A与与B B无关无关1%1%把握认为把握认为A A与与B B无关无关99.9%99.9%把握认把握认A A与与B B有关有关99%99%把握认为把握认为A A与与B B有关有关90%90%把握认为把握认为A A与与B B有关有关10%10%把握认为把握认为A A与与B B无关无关没有充分的依据显示没有充分的依据显示A A与与B B有关但也不能显示有关但也不能显示A A与与B B无关无关复习回顾复习
4、回顾第一步:第一步:H0:吸烟吸烟和和患病患病之间没之间没有关系有关系 患病患病不患病不患病总计总计吸烟吸烟aba+b不吸烟不吸烟cdc+d总计总计a+cb+da+b+c+d第二步:列出第二步:列出22列联表列联表 6 6、独立性检验的步骤独立性检验的步骤第三步:计算第三步:计算第四步:查对临界值表,作出判断。第四步:查对临界值表,作出判断。22()()()()()na db cKacbdabcdP(k kk0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.8791
5、0.828复习回顾复习回顾反证法原理与假设检验原理 反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。复习回顾复习回顾例例1 在某医院,因为患心脏病而住院的在某医院,因为患心脏病而住院的665名男性病人中,有名男性病人中,有214人人秃顶;而另外秃顶;而另外772名不是因为患心脏病而住院的男性病人中有名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么
6、范围内有效?否有关系?你所得的结论在什么范围内有效?解:解:根据题目所给数据得到如下列联表:根据题目所给数据得到如下列联表:患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437新知应用新知应用秃头不秃头 相应的三维柱形图如图所示,比较来说,底面副对角线上两相应的三维柱形图如图所示,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为个柱体高度的乘积要大一些,因此可以在某种程度上认为“秃顶与患心脏病有关秃顶与患心脏病有关”。新知应用新知应用 根据列联表根据列联表1-13中的数据,得到中的数据,得
7、到221437(214597175451)16.3736.635.3891048665772K所以有所以有99%的把握认为的把握认为“秃顶患心脏病有关秃顶患心脏病有关”。患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437新知应用新知应用设设H H0 0:假设秃顶与患心脏病没有关系。:假设秃顶与患心脏病没有关系。2(6.635)0.01,P K例例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取某城市的某校高中生中随机抽取300名学生
8、,得到如下联表:名学生,得到如下联表:喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男37378585122122女女3535143143178178总计总计7272228228300300由表中数据计算由表中数据计算K2的观测值的观测值k 4.514。能够以。能够以95%的把握认为高的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出结论的依据。结论的依据。P(kk0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7
9、063.8415.0246.6357.87910.828新知应用新知应用()()acadbcabcdab cd()()()()()abcd ab cdac bd 上式右边乘以得常数因子分别用分别用a,b,c,d表示样本中喜欢数学课的男生人数、不喜欢数学课的男表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数。生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数。222()(),()()()()()()()()n adbcn adbcKabcdacbdabcdacbd解:解:可以有可以有95%以上的把握认为以上的把握认为“性别与喜欢数学课程之间有
10、关系性别与喜欢数学课程之间有关系”。ccd 如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例 与女生中喜欢数学课的比例与女生中喜欢数学课的比例 ,应该相差很多,即,应该相差很多,即aad新知应用新知应用因此,因此,K2 越大越大,“性别与喜欢数学课程之间有关系性别与喜欢数学课程之间有关系”成立的可能成立的可能性就越大。性就越大。另一方面,在假设另一方面,在假设“性别与喜欢数学课程之间有关系性别与喜欢数学课程之间有关系”的前的前提下,事件提下,事件 的概率为的概率为23.841K2(3.841)0.05,P K 因此事件因此事件A是
11、一个小概率事件。而由样本数据计算得是一个小概率事件。而由样本数据计算得K2的观的观测值测值k=4.514,即小概率事件即小概率事件A发生。因此应该断定发生。因此应该断定“性别与喜欢性别与喜欢数学课程之间有关系数学课程之间有关系”成立,并且这种判断结果出错的可能性成立,并且这种判断结果出错的可能性约为约为5%。所以,约有。所以,约有95%的把握认为的把握认为“性别与喜欢数学课程之性别与喜欢数学课程之间有关系间有关系”。新知应用新知应用P(kk0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.841
12、5.0246.6357.87910.828有效有效无效无效合计合计口服口服584098注射注射643195合计合计12271193例例3:为研究不同的给药方式(口服与注射)和药的效果(有效为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的表中,根据所选择的193个病人的数据,能否作出药的效果和个病人的数据,能否作出药的效果和给药方式有关的结论?给药方式有关的结论?新知应用新知应用P(kk0)0.500.400.250.150.100.050.0250.0100.0050
13、.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828有效有效无效无效合计合计口服口服584098注射注射643195合计合计12271193解:设解:设H H0 0:药的效果与给药方式没有关系。:药的效果与给药方式没有关系。221 9 35 83 16 44 01.3 8 9 62.7 0 21 2 27 19 89 5K 因当因当H0成立时,成立时,K21.323的概率大于的概率大于15%,故不能否定假设,故不能否定假设H0,即不能作出药的效果与,即不能作出药的效果与给药方式有关的结论。给药方式有关的结论。例例3:为研究不同的给药
14、方式(口服与注射)和药的效果(有效与无效)为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的的193个病人的数据,能否作出药的效果和给药方式有关的结论?个病人的数据,能否作出药的效果和给药方式有关的结论?新知应用新知应用P(kk0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828 练习练习1 1:气管炎是一种常见的呼吸
15、道疾病,医药研究人员对两种气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,有效有效无效无效合计合计复方江剪刀草复方江剪刀草18461245胆黄片胆黄片919100合计合计27570345问:它们的疗效有无差异?问:它们的疗效有无差异?练习巩固练习巩固 因当因当H0成立时,成立时,P(K210.828)=0.001,故有,故有99.9%的把握认为,的把握认为,两种药物的疗效有差异。两种药物的疗效有差异。22345 184 961 9111.098.275 70 245 100K 有效有效无
16、效无效合计合计复方江剪刀草复方江剪刀草18461245胆黄片胆黄片919100合计合计27570345解:解:设设H H0 0:两种中草药的治疗效果没有差异。:两种中草药的治疗效果没有差异。练习巩固练习巩固练习练习2、某校高三年级在一次全年级的大型考试中,数学成绩优、某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,表所示,物理物理化学化学总分总分数学优秀数学优秀228225267数学非优秀数学非优秀14315699注:该年级此次考试中,数学成绩优秀的有注:该年级此次考试中,数学成
17、绩优秀的有360人,非优秀人,非优秀的有的有880人。人。则数学成绩优秀与物理、化学、总分也优秀则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?哪个关系较大?练习巩固练习巩固物理优秀物理优秀物理非优秀物理非优秀合计合计数学优秀数学优秀数学非优秀数学非优秀合计合计2281323601437378803718691240代入公式可得代入公式可得 22 7 0.1 1 4 3.K列出数学与物理优秀的列出数学与物理优秀的2x22x2列联表如下列联表如下物理物理化学化学总分总分数学优秀数学优秀228225267数学非优秀数学非优秀14315699解:(解:(1)因为该年级此次考试中,数学成绩优秀的有
18、因为该年级此次考试中,数学成绩优秀的有360人,非优秀的人,非优秀的有有880人,结合条件中所给的下表人,结合条件中所给的下表练习巩固练习巩固列出数学与化学优秀的列出数学与化学优秀的2x22x2列联表如下列联表如下物理物理化学化学总分总分数学优秀数学优秀228225267数学非优秀数学非优秀14315699(2)因为该年级此次考试中,数学成绩优秀的有因为该年级此次考试中,数学成绩优秀的有360人,非优秀的有人,非优秀的有880人,结合条件中所给的下表人,结合条件中所给的下表化学优秀化学优秀化学非优秀化学非优秀合计合计数学优秀数学优秀数学非优秀数学非优秀合计合计22513536015688038
19、18591240代入公式可得代入公式可得2240.6112.K724练习巩固练习巩固列出数学与总分优秀的列出数学与总分优秀的2x2列联表如下列联表如下物理物理化学化学总分总分数学优秀数学优秀228225267数学非优秀数学非优秀14315699(3)因为该年级此次考试中,数学成绩优秀的有因为该年级此次考试中,数学成绩优秀的有360人,非优秀的有人,非优秀的有880人,结合条件中所给的下表人,结合条件中所给的下表代入公式可得代入公式可得总分优秀总分优秀总分非优秀总分非优秀合计合计数学优秀数学优秀数学非优秀数学非优秀合计合计2673609978188036687412402486.1225.K93练习巩固练习巩固因此,数学成绩的优秀对总分影响最大。因此,数学成绩的优秀对总分影响最大。1 1、能够通过三维柱形图与二维条形图估计能够通过三维柱形图与二维条形图估计 两个分类变量之间是否有关系两个分类变量之间是否有关系2、利用、利用K2能判断两个分类变量之间是否有能判断两个分类变量之间是否有 关系关系3、理解独立性检验的思想并能进行独立性、理解独立性检验的思想并能进行独立性 检验检验课堂小结课堂小结