1、必备知识必备知识逐逐点夯实点夯实第四节列联表与独立性检验第四节列联表与独立性检验第十章统计与成对数据的统计分析第十章统计与成对数据的统计分析核心考点核心考点分类突破分类突破【课标解读】【课程标准】1.通过实例,理解22列联表的统计意义.2.通过实例,了解22列联表独立性检验及其应用.【核心素养】数学抽象、数据分析、数学运算.【命题说明】考向考法高考命题常以现实生活为载体,考查分类变量与列联表、独立性检验;独立性检验是高考热点,常以解答题的形式出现.预测 估计2025年高考仍会在独立检验上出题.必备知识必备知识逐点夯实逐点夯实知识梳理归纳1.分类变量为了表述方便,我们经常会使用一种特殊的随机变量
2、,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.2.列联表与独立性检验(1)22列联表22列联表给出了成对分类变量数据的_.交叉分类频数定义一对分类变量X和Y,我们整理数据如表所示:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d像这种形式的数据统计表称为22列联表.是否独立基础诊断自测类型辨析改编易错题号12,341.(思考辨析)(正确的打“”,错误的打“”)(1)22列联表中的数据是两个分类变量的频数.()提示:(1)由22列联表可知,表中的数据是两个分类变量的频数,所以(1)正确.(2)事件A和B的独立性检验无关,即
3、两个事件互不影响.()提示:(2)由独立性检验可知:事件A和B的独立性检验无关,说明事件A和B关联性不大,不一定互不影响,所以(2)错误.(3)2的大小是判断事件A和B是否相关的统计量.()(4)在22列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.()提示:(4)在22列联表中,若|ad-bc|越小,说明卡方值越小,即两个分类变量之间关系不强,所以(4)错误.2.(选修第三册P134练习4改编)某课外兴趣小组通过随机调查,利用22列联表和2统计量研究数学成绩优秀是否与性别有关.计算得2=6.748,经查阅临界值表知P(26.635)=0.010,则下列判断正确的是()A.每1
4、00个数学成绩优秀的人中就会有1名是女生B.若某人数学成绩优秀,那么他为男生的概率是0.010C.有99%的把握认为“数学成绩优秀与性别无关”D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”【解析】选D.因为2=6.7486.635,所以有99%的把握认为“数学成绩优秀与性别有关”,即在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”.所以ABC错误.3.(选修第三册P133例4改编)在研究吸烟是否对患肺癌有影响的案例中,通过对列联表的数据进行处理,计算得到随机变量256.632.在犯错误的概率不超过0.001的前提下,下面说法正确的是()A.因为随机变量210.
5、828=x0.001,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不超过0.001B.因为随机变量210.828,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不低于0.001C.因为随机变量210.828,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不超过0.001D.因为随机变量210.828,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不低于0.001【解析】选A.由题意知,通过对列联表的数据进行处理,计算得到随机变量256.63210.828=x0.001,所以在犯错误的概率不超过0.001的前提下,认为“吸烟与患肺癌有关系”.4.(不理解独立性检验方
6、法)已知P(26.635)=0.01,P(210.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到2=7.235,则根据小概率值=的2独立性检验,分析喜欢该项体育运动与性别有关.【解析】因为6.6357.23510.828,所以根据小概率值=0.01的2独立性检验,分析喜欢该项体育运动与性别有关.0.01核心考点核心考点分类突破分类突破考点一分类变量与列联表例1(1)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高堆积条形图,最能体现该药物对预防禽流感有效果的图形是()(2)如
7、表是22列联表,则表中a,b的值分别为()项目y1y2合计x1a835x2113445合计b4280A.27,38B.28,38C.27,37D.28,37【解析】选A.a=35-8=27,b=a+11=27+11=38.对点训练1.(2023莆田模拟)为考察A,B两种药物对预防某疾病的效果,进行动物试验,分别得到如下等高堆积条形图,根据图中信息,在下列各项中,说法最佳的一项是()A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果【解析】选B.根据题干中两个等高堆积条形图知,药物A试验显示
8、不服药与服药时患病差异较药物B试验显示明显大,所以药物A的预防效果优于药物B的预防效果.2.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,得到了如下的22列联表:性别打篮球合计喜爱不喜爱男生 6 女生10 合计 48性别打篮球合计喜爱不喜爱男生22628女生101020合计321648考点二列联表与独立性检验例2(2022全国甲卷改编)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:公司准点情况准点班次数 未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙
9、两城之间的长途客车准点的概率;考点二列联表与独立性检验例2(2022全国甲卷改编)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:公司准点情况准点班次数 未准点班次数A24020B210300.1000.0500.010 x2.7063.8416.635【解析】(2)列联表公司准点情况合计准点班次数 未准点班次数A24020260B21030240合计45050500对点训练为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“9
10、0后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:(单位:人)年龄段认知情况合计知晓不知晓A组(90后与00后)7525100B组(70后与80后)4555100合计12080200对点训练为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:(单位:人)年龄段认知情况合计知晓不知晓A组(90后与00后)7525
11、100B组(70后与80后)4555100合计12080200(2)能否依据小概率值=0.001的独立性检验,分析对“绿色消费”意义的认知情况与年龄有关?考点三独立性检验的综合应用例3(2023福州模拟)甲、乙两所学校高三年级分别有1 000人,1 100人,为了了解两所学校全体高三年级学生数学测试情况,采用分层随机抽样方法从两个学校一共抽取了105名学生的数学成绩,并作出了如下的频数分布统计表,规定考试成绩在120,150内为优秀.分组70,80)80,90)90,100)100,110)甲校频数1298乙校频数2310151分组110,120)120,130)130,140)140,150
12、甲校频数1010 x3乙校频数15y31(1)计算x,y的值;考点三独立性检验的综合应用例3(2023福州模拟)甲、乙两所学校高三年级分别有1 000人,1 100人,为了了解两所学校全体高三年级学生数学测试情况,采用分层随机抽样方法从两个学校一共抽取了105名学生的数学成绩,并作出了如下的频数分布统计表,规定考试成绩在120,150内为优秀.(2)由以上统计数据填写下面22列联表,依据小概率值=0.025的独立性检验,能否认为两个学校的数学成绩有差异?(注:x0.025=5.024)数学成绩学校合计甲校乙校优秀 非优秀 合计 分组70,80)80,90)90,100)100,110)甲校频数
13、1298乙校频数2310151分组110,120)120,130)130,140)140,150甲校频数1010 x3乙校频数15y31数学成绩学校合计甲校乙校优秀201030非优秀304575合计5055105解题技法独立性检验解题策略(1)分清分类变量是什么;(2)计算2时注意运算顺序、运算技巧的应用;(3)注意与其他统计知识的交汇运用.对点训练第五代移动通信技术简称5G或5G技术,是最新一代蜂窝移动通信技术,也是继4G系统之后的延伸.为了了解市民对A,B运营商的5G通信服务的评价,分别从A,B运营商的用户中随机抽取100名用户对其进行测评,已知测评得分在70分以上的为优秀,测评结果如下:
14、A运营商的100名用户的测评得分得分 40,50(50,60(60,70频率0.180.230.3得分(70,80(80,90(90,100频率0.240.030.02B运营商的100名用户的测评得分(1)根据频率分布直方图,分别求出B运营商的100名用户的测评得分的中位数和均值(同一组中的数据以该组区间的中点值为代表);【解析】(1)由题中频率分布直方图可知B运营商测评得分在区间40,70的频率为(0.008+0.016+0.026)10=0.5,故B运营商测评得分的中位数为70;由题中频率分布直方图可知B运营商测评得分的均值为450.08+550.16+650.26+750.3+850.1
15、6+950.04=69.2.(2)填写下面列联表,依据小概率值=0.01的独立性检验,推断测评得分优秀是否与运营商有关.(x0.01=6.635)运营商测评得分合计优秀非优秀A B 合计 【解析】(2)零假设H0:测评得分优秀与运营商无关.由题中频率分布表可知A运营商测评得分优秀的有100(0.24+0.03+0.02)=29(个),非优秀的有100(0.18+0.23+0.3)=71(个),由题中频率分布直方图可知B运营商测评得分优秀的有(0.03+0.016+0.004)10100=50(个),非优秀的有(0.008+0.016+0.026)10100=50(个),则可得列联表如下:运营商测评得分合计优秀非优秀A2971100B5050100合计79121200谢谢观赏!谢谢观赏!