1、3.1 独立性检验独立性检验 课件(苏教版选修课件(苏教版选修2-3)课堂互动讲练课堂互动讲练知能优化训练知能优化训练31课前自主学案课前自主学案学习目标学习目标学习目标学习目标1.了解了解22列联表的意义列联表的意义2了解随机变量了解随机变量2的意义的意义3通过典型案例分析了解独立性检验的基本思通过典型案例分析了解独立性检验的基本思想和方法想和方法课前自主学案课前自主学案简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样0知新益能知新益能类类1类类2合计合计类类Aabab类类Bcdcd合计合计acbdnabcd2.独立性检验独立性检验(1)定义定义:我们用随机变量我们用随机变量 2来确
2、定在多大程度上来确定在多大程度上可以认为可以认为“两个分类变量有关系两个分类变量有关系”的方法称为两的方法称为两个分类变量的独立性检验个分类变量的独立性检验(2)公式公式:2n adbc 2 ab cd ac bd (3)步骤步骤:提出假设提出假设 H0:_;根据根据 22 列联表及列联表及 2公式公式,计算计算的的_值值;与与没有关系没有关系2查对临界值,作出判断查对临界值,作出判断其中临界值如表所示:其中临界值如表所示:表示在表示在H0成立的情况下,事件成立的情况下,事件“_”发生发生的概率的概率P(2x0)0.500.400.250.150.100.050.0250.0100.0050.
3、001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.8282x03变量独立性的判断变量独立性的判断(1)如果如果_,那么有,那么有99.9%的把握认为的把握认为“与与”有关系;有关系;(2)如果如果_,那么有,那么有99%的把握认为的把握认为“与与”有关系;有关系;(3)如果如果_,那么有,那么有90%的把握认为的把握认为“与与”有关系;有关系;(4)如果如果_,那么就认为没有充分的证,那么就认为没有充分的证据显示据显示“与与”有关系,但也不能作出结论有关系,但也不能作出结论“H0成成立立”,即,即与与没有关系没有关系210.82826.6
4、3522.70622.706问题探究问题探究1如何理解由如何理解由2作出的判断?作出的判断?提示:提示:利用利用2进行独立性检验,可以对推断的正进行独立性检验,可以对推断的正确性的概率作出估计,确性的概率作出估计,n越大,这个估计越准越大,这个估计越准确确2在判断两变量相关时,若在判断两变量相关时,若256.632,则,则P(26.635)0.01和和P(210.828)0.001.哪种说法是正确的?哪种说法是正确的?提示:提示:两种说法均正确两种说法均正确P(26.635)0.01的含义是:在犯错误的概率不的含义是:在犯错误的概率不超过超过0.01的前提下,认为两变量相关的前提下,认为两变量
5、相关P(210.828)0.001的含义是:在犯错误的概率的含义是:在犯错误的概率不超过不超过0.001的前提下,认为两变量相关的前提下,认为两变量相关课堂互动讲练课堂互动讲练两个不独立事件的独立性检验两个不独立事件的独立性检验独立性检验的基本步骤:独立性检验的基本步骤:(1)找出相关数据,作出找出相关数据,作出列联表;列联表;(2)求随机变量求随机变量2的观测值;的观测值;(3)比较临界比较临界值的大小,然后得出事件有关的可信程度值的大小,然后得出事件有关的可信程度 调查某医院某段时间内婴儿出生的时间调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表,试问能有多与性别的关系,得
6、到下面的数据表,试问能有多大把握认为婴儿的性别与出生时间有关系?大把握认为婴儿的性别与出生时间有关系?出生时间出生时间性别性别晚上晚上白天白天合计合计男婴男婴243155女婴女婴82634合计合计325789【名师点评名师点评】研究两个变量是否独立的问题,研究两个变量是否独立的问题,其思路都是通过列联表的数据,计算统计量其思路都是通过列联表的数据,计算统计量2,再和临界值对比得出认为它们有关系的把握程度,再和临界值对比得出认为它们有关系的把握程度,从而判断它们的独立性从而判断它们的独立性变式训练变式训练1在国家未实施西部开发战略前,一在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机
7、抽取新闻单位在应届大学毕业生中随机抽取1000人人问卷,只有问卷,只有80人志愿加入西部建设而国家实人志愿加入西部建设而国家实施西部开发战略后,随机抽取施西部开发战略后,随机抽取1200名应届大学名应届大学毕业生问卷,有毕业生问卷,有400人志愿加入国家西部建人志愿加入国家西部建设问实施西部开发战略是否对应届大学毕业设问实施西部开发战略是否对应届大学毕业生的选择产生了影响?生的选择产生了影响?解:解:数据整理如下:数据整理如下:志愿者志愿者非志愿者非志愿者合计合计开发战略公布前开发战略公布前809201000开发战略公布后开发战略公布后4008001200合计合计48017202200两个独立
8、事件的独立性检验两个独立事件的独立性检验 (本题满分本题满分14分分)研究人员选取研究人员选取170名青年男女名青年男女大学生的样本,对他们进行一种心理测验,发现有大学生的样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:名女生对该心理测验中的最后一个题目的反应是:作肯定的作肯定的18名,否定的名,否定的42名;名;110名男生在相同的名男生在相同的题目上作肯定的有题目上作肯定的有22名,否定的有名,否定的有88名问:性别名问:性别与态度之间是否存在某种关系?用独立性检验的方与态度之间是否存在某种关系?用独立性检验的方法进行判断法进行判断【思路点拨】【思路点拨
9、】解答本题可先列出表格,然后计算解答本题可先列出表格,然后计算2,再与临界值比较,判断两个变量是否相互独,再与临界值比较,判断两个变量是否相互独立立【规范解答规范解答】根据题目所给数据列出下列表格:根据题目所给数据列出下列表格:态度态度性别性别肯定肯定否定否定合计合计男生男生2288110女生女生184260合计合计40130170【名师点评】【名师点评】要熟练应用要熟练应用2公式,以免因公公式,以免因公式不熟而导致结果错误式不熟而导致结果错误变式训练变式训练2某教育机构为了研究人具有大学专某教育机构为了研究人具有大学专科以上学历科以上学历(包括大学专科包括大学专科)和对待教育改革态度和对待教
10、育改革态度的关系,随机抽取了的关系,随机抽取了392名成年人进行调查,所名成年人进行调查,所得数据如下表所示:得数据如下表所示:对于教育机构的研究项目,根据上述数据能得出对于教育机构的研究项目,根据上述数据能得出什么结论?什么结论?积极支持教育改积极支持教育改革革不太赞成教育改不太赞成教育改革革合计合计大学专科以上学大学专科以上学历历(包括大学专包括大学专科科)39157196大学专科以下学大学专科以下学历历29167196合计合计68324392独立性检验的应用独立性检验的应用解决有关独立性检验的问题时,若题目中没有给解决有关独立性检验的问题时,若题目中没有给出出22列联表,需先根据题意画出
11、列联表,需先根据题意画出22列联表,注列联表,注意表中两个变量的放置位置,列表后可根据表中意表中两个变量的放置位置,列表后可根据表中数据计算数据计算2的值,然后比较的值,然后比较2值与临界值的大小值与临界值的大小来给出来给出“两个变量两个变量”的相关性的判断的相关性的判断 为研究学生对国家大事的关心与否与性别为研究学生对国家大事的关心与否与性别是否有关,在学生中随机抽样调查,结果如下:是否有关,在学生中随机抽样调查,结果如下:(1)根据统计数据作出合适的判断分析;根据统计数据作出合适的判断分析;(2)扩大样本容量,将表中每个数据扩大为原来的扩大样本容量,将表中每个数据扩大为原来的10倍,然后作
12、出判断分析;倍,然后作出判断分析;关心关心不关心不关心合计合计男生男生18218200女生女生17624200合计合计35842400(3)从某中学随机抽取从某中学随机抽取450名学生,其中男、女生名学生,其中男、女生数量之比为数量之比为5 4,通过问卷调查发现男生关心国,通过问卷调查发现男生关心国家大事的百分率为家大事的百分率为94%,而女生关心国家大事的,而女生关心国家大事的百分率为百分率为85%,请根据这些数据,判断该中学的,请根据这些数据,判断该中学的学生是否关心国家大事与性别的关系学生是否关心国家大事与性别的关系【思路点拨】【思路点拨】分别计算出三种情况下的分别计算出三种情况下的2统
13、计统计量的值,进行独立性检验,作出判断量的值,进行独立性检验,作出判断(3)依题意男、女生人数分别是依题意男、女生人数分别是250人和人和200人,男生人,男生中关心国家大事的人数为中关心国家大事的人数为235人,女生中关心国家大人,女生中关心国家大事的人数为事的人数为170人;人;列出列出22列联表如下:列联表如下:关心国家大事关心国家大事不关心国家大事不关心国家大事合计合计男生男生23515250女生女生17030200合计合计40545450【名师点评名师点评】我们通过分析题意可求得我们通过分析题意可求得2的值,的值,根据根据2的值可以判断两个量是否有关系,并且能的值可以判断两个量是否有
14、关系,并且能较精确地给出这种判断的可靠程度三个不同的较精确地给出这种判断的可靠程度三个不同的样本样本(包括样本量的不同包括样本量的不同)可能导致不同的结论或可能导致不同的结论或者影响判断正确者影响判断正确(不正确不正确)的程度的程度变式训练变式训练3网络对现代人的生活影响较大,尤其网络对现代人的生活影响较大,尤其对青少年,为了解网络对中学生学习成绩的影响,对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有人调查,发现其中经常上网的有200人,这人,这200人中有人中有80人期末考试
15、不及格,而另外人期末考试不及格,而另外800人中人中有有120人不及格,问:中学生经常上网是否影响学人不及格,问:中学生经常上网是否影响学习,为什么?习,为什么?解:解:根据题意列出根据题意列出22列联表:列联表:经常上网经常上网不经常上网不经常上网合计合计不及格不及格80120200及格及格120680800合计合计20080010001画列联表时要把两个分类变量分别作为第一行画列联表时要把两个分类变量分别作为第一行和第一列,把数据填在相应的交叉点上,最右面一和第一列,把数据填在相应的交叉点上,最右面一列为对行的合计,最下面一行为对列的合计列为对行的合计,最下面一行为对列的合计2对卡方公式要
16、从结构上结合列联表记忆,分母对卡方公式要从结构上结合列联表记忆,分母分别是四个合计的积,分子是列联表主对角线之积分别是四个合计的积,分子是列联表主对角线之积与副对角线之积的差的平方再乘样本容量注意:与副对角线之积的差的平方再乘样本容量注意:一是不要漏乘了样本容量,二是用公式时要细心计一是不要漏乘了样本容量,二是用公式时要细心计算,防止出错算,防止出错3用卡方检验只能推定两类分类变量有多大程用卡方检验只能推定两类分类变量有多大程度的相关关系,而不能推定两个分类变量无关,度的相关关系,而不能推定两个分类变量无关,所以当卡方的值小于所以当卡方的值小于2.706时,也不能对两个变时,也不能对两个变量下量下“无关无关”的结论的结论