1、1.1 独立性检验独立性检验l小概率事件的发生?小概率事件的发生?高中生恋爱对学习成绩有影响吗?高中流行这样一句话“文科就怕数学不好,理科就怕英语不好.”试问:文科学生总成绩不好与数学成绩不好有关系吗?学生的性别与认为作业量大有关吗?高中生吸烟对学习成绩有影响吗?吸烟与患慢性气管炎有关吗?你能说说下面两个变量之间有关系吗?2022-10-6两事件独立的概念:一般地,对于两个事件A,B,如果有P(AB)=P(A)P(B),就称事件A与B相互独立.举例:1.分别掷两枚均匀的硬币,A=硬币甲出现正面B=硬币乙出现正面,则事件A与B的关系?2.掷一颗质地均匀的骰子一次,A=掷出偶数点 B=掷出3的倍数
2、点,则A与B,那么A与B的关系呢?一般情况下,如果事件A与B相互独立,那么A与B,A与B,A与B也是相互独立的.2022-10-6某医疗机构为了了解患慢性支气管炎与吸烟是某医疗机构为了了解患慢性支气管炎与吸烟是否有关,进行了否有关,进行了一次抽样一次抽样调查调查共调查了共调查了339339名名5050岁以上的人岁以上的人,调查结果如下表调查结果如下表为了研究这个问题,将上述数据用下表来表示为了研究这个问题,将上述数据用下表来表示(22列联表列联表)患病患病未患病未患病合计合计吸烟吸烟43162205不吸烟不吸烟13121134合计合计562833392022-10-6患病患病未患病未患病合计合
3、计吸烟吸烟43162205不吸烟不吸烟13121134合计合计56283339在不吸烟者中患病的比例为在不吸烟者中患病的比例为 ;在吸烟者中患病的比例为在吸烟者中患病的比例为 _;你认为你认为50岁以上的人吸烟与患慢性支气管炎有关系吗?岁以上的人吸烟与患慢性支气管炎有关系吗?9.7%21%2022-10-6患病患病未患未患病病合计合计吸吸烟烟402060不不吸吸烟烟203050合合计计6050110患病患病未患未患病病合计合计吸吸烟烟153247不不吸吸烟烟102535合合计计255782在不吸烟者中患病的比例为在不吸烟者中患病的比例为 ;在吸烟者中患病的比例为在吸烟者中患病的比例为 _;吸烟
4、群体和不吸烟群体患病的可能性存在差异吸烟群体和不吸烟群体患病的可能性存在差异40%66.7%28.6%31.9%为了使不同样本容量的数据有统一的评判标准,并且能为了使不同样本容量的数据有统一的评判标准,并且能够知道自己有多大把握做出判断,我们构造了一个随机够知道自己有多大把握做出判断,我们构造了一个随机变量变量1.不同的样本,数据不同,比例不同,数据所体现的差异性不同,怎样针对不同样本数据设置统一的评判标准?2.针对不同的样本数据,可能做出不同的判断,那么你有多大的把握认为自己的判断是正确的?22022-10-6我们先假设我们先假设 H H0 0 :患病与吸烟没有关系患病与吸烟没有关系为了得到
5、一般性结论将表中为了得到一般性结论将表中“观测值观测值”用字母表示,用字母表示,则得下列则得下列2 22 2列联表:列联表:患病(患病(B)未患病()合计合计吸烟吸烟An11n12n1+不吸烟不吸烟n21n22n2+合计合计n+1幻灯片幻灯片 10n+2nBA2022-10-6若事件A与B没有关系,即A与B相互独立这时应该有P(AB)=P(A)P(B)成立.也就有下面三个式子成立:()()()P ABP A P B()()()P ABP A P B()()()P ABP A P B根据概率的统计定义,上面提到的众多事件的概率都可以用相应的频率来估计.P(AB)的估计为的估计为11nnP(A)的
6、估计为的估计为 ,1nnP(B)的估计为的估计为 1nn于是于是 与与 应该很接近,应该很接近,11nn11nnnn21111(),nnnnnn或者说或者说比较小比较小.2022-10-6 21212(),nnnnnn22121()nnnnnn22222()nnnnnn应该比较小应该比较小.同理由()()()P ABP A P B得()()()P ABP A P B得()()()P ABP A P B得2022-10-62111111()nnnnnnnnnn2121212()nnnnnnnnnn2212121()nnnnnnnnnn2222222()nnnnnnnnnn也应该比较小也应该比较小
7、.卡方卡方2统计统计量量公式公式:21122122121212n n nn nn nn n2(3.841)0.05P2(6.635)0.01P23.841认为事件A与事件B是无关的.22339(43 121 162 13)7.469205 134 56 2832022-10-6例例3:对对196个接受心脏搭桥手术的病人和个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行个接受血管清障手术的病人进行3年跟年跟踪研究,调查他们是否又发作过心脏病,踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:调查结果如下表所示:又发作过心脏又发作过心脏病病未发作过心未发作过心脏病脏病合计合计心脏
8、搭桥手术心脏搭桥手术39157196血管清障手术血管清障手术29167196合计合计68324392 试根据上述数据比较两种手术对病人又发试根据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。作心脏病的影响有没有差别。2022-10-6解:这是一个解:这是一个22列联表的独立性检验问列联表的独立性检验问题,由公式题,由公式 22392(39 16729 157)1.78068 324 196 196因为因为1.7806.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病。B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有
9、99%的可能性患肺病。C.若从统计数据中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使推断出现错误。D.以上三种说法都不对。C2022-10-6喜欢数学课程不喜欢数学课程合计男104128232女95173268合计199301500为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取500名学生,得到如下列联表:单位:人能够有95的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?2022-10-62022-10-6(1)认识22列联表;(2)知道独立性检验的基本思想;(3)根据独立性检验的操作步骤,能对简单的22列联表中的两种状态进行独立性检验。作业:确定一个你感兴趣的问题,自己设计抽样方案,讨论作业:确定一个你感兴趣的问题,自己设计抽样方案,讨论调查的两个变量之间是否有关系调查的两个变量之间是否有关系2022-10-6