1、第三章3.2独立性检验的基本思想及其初步应用学习目标1.了解独立性检验的基本思想、方法及其简单应用.2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤.1 预习导学 挑战自我,点点落实2 课堂讲义 重点难点,个个击破3 当堂检测 当堂训练,体验成功知识链接1.举例说明什么是分类变量?答变量的不同“值”表示个体所属的不同类别的变量称为分类变量,分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等.2.什么是列联表?怎样从列联表判断两个分类变量有无关系?答一般地,假设两个分类变量X和Y,它
2、们的值域分别为x1,x2和y1,y2,列出两个变量的频数表,称为列联表(如下图)y1y2总计x1ababx2cdcd总计acbdabcd|adbc|越小,说明两个分类变量x,y之间的关系越弱;|adbc|越大,说明两个分类变量x,y之间的关系越强.预习导引1.分类变量和列联表(1)分类变量:变量的不同“值”表示个体所属的 ,像这样的变量称为分类变量.(2)列联表定义:列出的两个分类变量的 称为列联表.不同类别频数表22列联表一般地,假设两个分类变量X和Y,它们的取值分别为和 ,其样本频数列联表(也称为22列联表)为下表.y1y2总计x1ababx2cdcd总计acbdabcdx1,x2y1,y
3、22.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否 ,常用等高条形图展示列联表数据的 .(2)观察等高条形图发现 和 相差很大,就判断两个分类变量之间 .相互影响频率特征有关系3.独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(3)独立性检验的具体做法根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定 k0.利用公式计算随机变量K2的 k.如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在 不超过的前提下不能推断“X与Y有关系”,或者在样本数据中 支持结论“X与Y有关系”.
4、临界值观测值kk0犯错误的概率没有发现足够证据要点一有关“相关的检验”例1某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?体育文娱总计男生212344女生62935总计275279解判断方法如下:假设H0“喜欢体育还是喜欢文娱与性别没有关系”,若H0成立,则K2应该很小.a21,b23,c6,d29,n79,且P(K27.879)0.005即我们得到的K2的观测值k8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超
5、过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.跟踪演练1为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,能在犯错误的概率不超过0.001的前提下认为人的性别与患色盲有关系吗?解由题意列出22列联表:患色盲未患色盲总计男性39441480女性6514520总计459551 000由公式得K2的观测值因为P(K210.828)0.001,且28.22510.828,所以在犯错误的概率不超过0.001的前提下认为患色盲与人的性别有关系,男性患色盲的概率要比女性大得多.要点二有关“无关的检验”例2为了探
6、究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关?解列出22列联表理文总计有兴趣13873211无兴趣9852150总计236125361代入公式得K2的观测值1.8711042.706,可以认为学生选报文、理科与对外语的兴趣无关.规律方法运用独立性检验的方法:(1)列出22列联表,根据公式计算K2的观测值k.(2)比较k与k0的大小作出结论.跟踪演练2在一次恶劣天气的飞行航程中调查男女乘客在飞机上晕机的情况如下表所示
7、,根据此资料是否能在犯错误的概率不超过0.05的前提下认为在恶劣天气飞行中男人比女人更容易晕机?晕机不晕机总计男人243155女人82634总计325789解根据列联表中的数据,可得K2的观测值为P(K23.841)0.05,且3.6893.841时,我们()A.在犯错误的概率不超过0.05的前提下可认为X与Y有关B.在犯错误的概率不超过0.05的前提下可认为X与Y无关C.在犯错误的概率不超过0.01的前提下可认为X与Y有关D.没有充分理由说明事件X与Y有关系A4.根据下表计算:不看电视看电视男3785女35143K2的观测值k_(保留3位小数).答案4.514课堂小结1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.