1、普通高中课程标准实验教科书普通高中课程标准实验教科书数学选修数学选修2-3(北京师范大学出版社(北京师范大学出版社)说起真人秀节目中的王牌节目,那么说起真人秀节目中的王牌节目,那么奔跑吧奔跑吧绝对是最受欢绝对是最受欢迎的节目之一。为了解男女生的态度迎的节目之一。为了解男女生的态度进行了进行了调查调查,共调查了,共调查了我校我校高二年级高二年级921921个学生,个学生,你觉得喜欢该节目与性别有关吗?你觉得喜欢该节目与性别有关吗?喜欢不喜欢男生154340女生234193问题一:如何问题一:如何通过通过表中的统计数据表中的统计数据判断判断喜欢该节目与喜欢该节目与性别性别是否有关联?是否有关联?为
2、了讨论方便,我们引入以下记号:为了讨论方便,我们引入以下记号:变量变量A A:A A1 1=男生,男生,A A2 2=女生;女生;变量变量B B:B B1 1=喜欢,喜欢,B B2 2=不喜欢不喜欢.根据上表,我们可以计算出喜欢与不喜欢的总人数,男生和女生根据上表,我们可以计算出喜欢与不喜欢的总人数,男生和女生的总人数,得到下表:的总人数,得到下表:喜欢(B(B1 1)不喜欢(B(B2 2)总计男生(A(A1 1)154340533女生(A(A2 2)234193388总计494427921 我们假设喜欢该节目与性别是我们假设喜欢该节目与性别是独立独立的,即性别的,即性别不影响不影响是否喜是否
3、喜欢该节目欢该节目.根据直观经验,我们把男生中喜欢该节目的人所占根据直观经验,我们把男生中喜欢该节目的人所占百分比,与女生中喜欢该节目的人所占百分比作比较百分比,与女生中喜欢该节目的人所占百分比作比较.也就意也就意味着,无论喜欢与否味着,无论喜欢与否,喜欢的人所占百分比应是基本一样的喜欢的人所占百分比应是基本一样的.喜欢(A(A1 1)不喜欢(A(A2 2)总计男生(B(B1 1)154340533女生(B(B2 2)234193388总计494427921通过计算得出:男生中喜欢该节目的人所占的百分比,与通过计算得出:男生中喜欢该节目的人所占的百分比,与女生中喜欢该节目的人所占百分比女生中喜
4、欢该节目的人所占百分比不等不等,且相差较大,且相差较大.由此由此我们可以推断,开始的我们可以推断,开始的假设是不成立假设是不成立的的.也就是说,也就是说,喜欢该喜欢该节目与性别是有关系节目与性别是有关系的的.由女生中喜欢该节目的人所占的百由女生中喜欢该节目的人所占的百分比比较多,我们认为性别会影响对该节目的喜欢分比比较多,我们认为性别会影响对该节目的喜欢.问题二问题二:你认为根据上述方法作出的判断可靠你认为根据上述方法作出的判断可靠吗?把握性有多大?吗?把握性有多大?喜欢(B(B1 1)不喜欢(B(B2 2)总计男生(A(A1 1)女生(A(A2 2)总计1得出:喜欢该节目与性别有关得出:喜欢
5、该节目与性别有关男生中喜欢该节目的人频率是:1672.09211545787.05364.05364.05787.01672.0显然 问题三问题三:假设喜欢该节目和性别为男生没假设喜欢该节目和性别为男生没有关系,即有关系,即 A A1 1与与B B1 1相互独立,根据表中的数据相互独立,根据表中的数据(用字母代替)你能得到什么结论?(用字母代替)你能得到什么结论?喜欢(A(A1 1)不喜欢(A(A2 2)总计男生(B(B1 1)a ab ba+ba+b女生(B(B2 2)c cd dc+dc+d总计a+ca+cb+db+dn=n=a+b+c+da+b+c+d分析:分析:假设喜欢该节目假设喜欢该
6、节目与性别为男生没有关系与性别为男生没有关系,即即A A1 1与与B B1 1相互独立,相互独立,则则:P(A1B1)=P(A1)P(B1)与越接近,与1独立的可能性就越大,即“喜欢该节目与性别”的可能性就越小.P(A1B1)P(A1)P(B1)A1B假设成立的条件下应该有 ,其中nabcd 即(a+b+c+d)a(a+b)(a+c),ad-bc0.因此|ad-bc|越小,说明喜欢该节目与性别的关系越弱,|ad-bc|越大,说明喜欢该节目与性别的关系越强.问题四问题四:如果如果A A1 1与与B B1 1相互独立相互独立,那么那么A A1 1与与B B2 2、A A2 2与与B B1 1、A
7、A2 2与与B B2 2什么关系?你还能得到什么结什么关系?你还能得到什么结论?论?喜欢(A(A1 1)不喜欢(A(A2 2)总计男生(B(B1 1)a ab ba+ba+b女生(B(B2 2)c cd dc+dc+d总计a+ca+cb+db+dn=n=a+b+c+da+b+c+d 若若A1与与B1相互独立,则相互独立,则A1与与B2、A2与与B1、A2与与B2均相互独立,那么有:均相互独立,那么有:-0aac abnnn;-0cac cdnnn;-0b bdabnnn;-0dbd cdnnn;喜欢(A(A1 1)不喜欢(A(A2 2)总计男生(B(B1 1)a ab ba+ba+b女生(B(
8、B2 2)c cd dc+dc+d总计a+ca+cb+db+dn=n=a+b+c+da+b+c+d统计学家皮尔逊采用如下的量(称为统计学家皮尔逊采用如下的量(称为2 2 统计量)来刻画这个差异统计量)来刻画这个差异:22()=+aab acnnnnab acnn2)+bab bdnnnab bdnn(+2()+ccd acnnncd acnn2()dcd bdnnncd bdnn化简得化简得=22()()()()()n adbcab ac cd bd 问题五问题五:根据卡方的表达式,请你说说卡方的大小根据卡方的表达式,请你说说卡方的大小和两个变量之间关联程度的强弱有何关系?和两个变量之间关联程
9、度的强弱有何关系?卡方越小,二者的关系越弱,独立性就越强;卡方越小,二者的关系越弱,独立性就越强;反之卡方越大,二者的关系越强,独立性就越弱。反之卡方越大,二者的关系越强,独立性就越弱。临界值表临界值表10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()Pk表的第二行显示的是卡方的临界值,第一行表的第二行显示的是卡方的临界值,第一行显示的是:假设两个变量没有关系,卡方大显示的是:假设两个变量没有关系,卡方大于这个临界值的概率于这个临界值的概率001.
10、0)828.10(2P例如:解释:统计学研究发现:解释:统计学研究发现:假设假设A A与与B B相互独立相互独立,则出现,则出现 的概率只有千分之一,这是一个小概率事件,的概率只有千分之一,这是一个小概率事件,几乎不可能发生几乎不可能发生.如果根据某次统计数据出现了如果根据某次统计数据出现了 一个几一个几乎不可能发生的小概率事件发生了,说明乎不可能发生的小概率事件发生了,说明A A与与B B相互独立相互独立这一假设成立的可能性非常小这一假设成立的可能性非常小只有只有0.0.1 1%,即就是说,即就是说我们有我们有1-1-0.0.1 1%=99.99.9 9%的把握判定的把握判定A A与与B B
11、有关联有关联.当然我们做当然我们做出出A A与与B B有关联这样的判断也会出错,但出错的概率不超有关联这样的判断也会出错,但出错的概率不超过过0.0.1 1%.我们把这种检验方法称为假设检验法。我们把这种检验方法称为假设检验法。828.102828.102 临界值表临界值表1%1%把握认为把握认为A A与与B B无关无关5%5%把握认为把握认为A A与与B B无关无关99%99%把握认把握认A A与与B B有关有关95%95%把握认为把握认为A A与与B B有关有关90%90%把握认为把握认为A A与与B B有关有关10%10%把握认为把握认为A A与与B B无关无关没有充分的依据显示没有充分
12、的依据显示A A与与B B有关,但也不能显示有关,但也不能显示A A与与B B无关无关84132.70622.22.70663562.10.837.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()Pk请同学们计算出喜欢该节目与性别是否有关的请同学们计算出喜欢该节目与性别是否有关的2 2乘乘2 2列联表中的卡方统计量列联表中的卡方统计量喜欢(A(A1 1)不喜欢(A(A2 2)总计男生(B(B1 1)154340533女生(B(B2 2)234193388总计49
13、442792110.837.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()Pk441.522结论:我们有结论:我们有99.9%99.9%的把握认为喜欢该节目与性别有的把握认为喜欢该节目与性别有关联,即关联,即在犯错误的概率不超过0.001的前提下认为喜欢该节目与性别有关.问题六:在喜欢该节目和性别的例子中,请根据卡方问题六:在喜欢该节目和性别的例子中,请根据卡方的值,并结合临界值表,说说你得到了什么结论的值,并结合临界值表,说说你得到了什么结论和启发?和启发?
14、独立性检验的具体做法“两个分类变量有关系”,推断错误的概率不超过假设 H0:两个分类变量无关确定容许推断“两个分类变量有关系”犯错误的上界,查表确定临界值k0由观测数据计算得到的X2的观测值k k k0k k0犯错误的概率不超过的前提下不能认为“两个分类变量有关系”H0:不成立没有足够证据拒绝H0练一练:练一练:为了了解高中生是否喜欢参加体育锻为了了解高中生是否喜欢参加体育锻炼和性别之间的关系,调查了炼和性别之间的关系,调查了500500名高中生的名高中生的情况,调差结果如下情况,调差结果如下(单位:人单位:人)喜欢参加体育锻炼喜欢参加体育锻炼 不不喜欢参加体育锻炼喜欢参加体育锻炼男男1971
15、974848女女135135120120 10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()Pk试问:高中生是否喜欢参加体育锻炼和性别之间有关系吗?试问:高中生是否喜欢参加体育锻炼和性别之间有关系吗?课堂活动:课堂活动:人常说:数理不分家,意思是物理和数学之间有人常说:数理不分家,意思是物理和数学之间有很多交叉知识。很多交叉知识。请同学们根据班上同学的实际情况,按下列四个请同学们根据班上同学的实际情况,按下列四个项目(数学成绩好物理成绩也好,数学成
16、绩好但物理成项目(数学成绩好物理成绩也好,数学成绩好但物理成绩不好、数学成绩不好但物理成绩好、数学成绩不好物绩不好、数学成绩不好但物理成绩好、数学成绩不好物理成绩也不好)调查相应人数,并制成理成绩也不好)调查相应人数,并制成2 2乘乘2 2列联表,利列联表,利用卡方独立检验法分析有多大把握认为数学成绩好与物用卡方独立检验法分析有多大把握认为数学成绩好与物理成绩好之间有关联。理成绩好之间有关联。算一算:算一算:请同学们根据统计数据,计算出统计请同学们根据统计数据,计算出统计量卡方的值,并回答你有多大把握认为数学成量卡方的值,并回答你有多大把握认为数学成绩和物理成绩之间有关联。绩和物理成绩之间有关
17、联。10.837.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()Pk2 22 2n n(a ad d-b bc c)=(a a+b b)(c c+d d)(a a+c c)(b b+d d)问题七:这组数据采集于我们班这个小范围内,为了使得结论更客问题七:这组数据采集于我们班这个小范围内,为了使得结论更客观、更可靠,我们应该做何改进?观、更可靠,我们应该做何改进?小结:小结:1 1、基本知识与方法:、基本知识与方法:2 22 2n n(a ad d-b bc
18、c)=(a a+b b)(c c+d d)(a a+c c)(b b+d d)10.837.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()Pk 反证法:反证法:(1 1)假设:原命题不成立)假设:原命题不成立 (2 2)推出一个矛盾,)推出一个矛盾,(3 3)证明了这个假设不成立)证明了这个假设不成立 (原命题成立)(原命题成立)对立的两个命题的真假相反对立的两个命题的真假相反 假设检验:假设检验:(1 1)假设(如)假设(如A A与与B B相互独立)相互独立
19、)(2 2)推出一个小概率事件发生)推出一个小概率事件发生 (3 3)推断假设成立的可能性很)推断假设成立的可能性很 小其对立结论成立可能性很大小其对立结论成立可能性很大 对立的两个结论可能性大小相反对立的两个结论可能性大小相反对立与统一的辩证思想对立与统一的辩证思想 2 2、独立性检验基本思想及原理:假设检验原理、独立性检验基本思想及原理:假设检验原理练习1、某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:一、课堂提问及练习.专业性别专业性别非统计专业非统计专业统计专业统计专业男男13131010女女7 72020为了判断主修统计专业是否与性别有关系,根据表中数
20、据得到,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为_841.3,844.422因为5%练习2、通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表;参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”A课后作业:选择生活中的一个大家比较关心的问题(如男选择生活中的一个大家比较关心的问题(如男女同学对数学课的喜欢程度),利用独立性检验女同学对数学课的喜欢程度),利用独立性检验进行分析,并写出一份简明的分析报告进行分析,并写出一份简明的分析报告.巩固提升夯实基础习题习题3-2:1,2,3,4,5