1、专题七 概率与统计第 3讲 统计与统计案例主 干 知 识 梳 理热 点 分 类 突 破真 题 与 押 题1.该部分常考内容:样本数字特征的计算、各种统该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题处命题,也会出现解答题,都
2、属于中、低档题考情解读主干知识梳理1.随机抽样随机抽样(1)简单随机抽样特点是从总体中逐个抽取简单随机抽样特点是从总体中逐个抽取.适用范围:总适用范围:总体中的个体较少体中的个体较少.(2)系统抽样特点是将总体均分成几部分,按事先确定的系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取规则在各部分中抽取.适用范围:总体中的个体数较多适用范围:总体中的个体数较多.(3)分层抽样特点是将总体分成几层,分层进行抽取分层抽样特点是将总体分成几层,分层进行抽取.适用适用范围:总体由差异明显的几部分组成范围:总体由差异明显的几部分组成.2.常用的统计图表常用的统计图表(1)频率分布直方图频率
3、分布直方图各小长方形的面积之和等于各小长方形的面积之和等于1;(2)茎叶图茎叶图在样本数据较少时,用茎叶图表示数据的效果较好在样本数据较少时,用茎叶图表示数据的效果较好.3.用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数众数、中位数、平均数数字特数字特征征样本数样本数据据频率分布直方频率分布直方图图众数众数出现次出现次数最多数最多的数据的数据取最高的小长取最高的小长方形底边中点方形底边中点的横坐标的横坐标中位数中位数将数据按大小依将数据按大小依次排列,处在最次排列,处在最中间位置的一个中间位置的一个数据数据(或最中间两或最中间两个数据的平均数个数
4、据的平均数)把频率分布直方把频率分布直方图划分左右两个图划分左右两个面积相等的分界面积相等的分界线与线与x轴交点的横轴交点的横坐标坐标平均数平均数样本数据的算术样本数据的算术平均数平均数每个小矩形的面每个小矩形的面积乘以小矩形底积乘以小矩形底边中点的横坐标边中点的横坐标之和之和4.变量的相关性与最小二乘法变量的相关性与最小二乘法(1)相关关系的概念、正相关和负相关、相关系数相关关系的概念、正相关和负相关、相关系数.5.独立性检验独立性检验对于取值分别是对于取值分别是x1,x2和和y1,y2的分类变量的分类变量X和和Y,其样本频数列联表是其样本频数列联表是y1y2总计总计x1ababx2cdcd
5、总总计计ac bdn 热点一 抽样方法 热点二 用样本估计总体 热点三 统计案例热点分类突破例1(1)(2013陕西陕西)某单位有某单位有840名职工,现采用名职工,现采用系统抽样方法抽取系统抽样方法抽取42人做问卷调查,将人做问卷调查,将840人按人按1,2,840随机编号,则抽取的随机编号,则抽取的42人中,编号落人中,编号落入区间入区间481,720的人数为的人数为()A.11 B.12 C.13 D.14热点一 抽样方法思维启迪 系统抽样时需要抽取几个个体,样本就分成几组,且抽系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;取号码的间隔相同;解析由由 20,即每,即每
6、20人抽取人抽取1人,人,所以抽取编号落入区间所以抽取编号落入区间481,720的人数为的人数为 12.答案B(2)某学校共有师生某学校共有师生3 200人,现用分层抽样的方法,从所人,现用分层抽样的方法,从所有师生中抽取一个容量为有师生中抽取一个容量为160的样本,已知从学生中抽取的样本,已知从学生中抽取的人数为的人数为150,那么该学校的教师人数是,那么该学校的教师人数是_.思维启迪 分层抽样最重要的是各层的比例分层抽样最重要的是各层的比例.解析本题属于分层抽样,设该学校的教师人数为本题属于分层抽样,设该学校的教师人数为x,200(1)随机抽样各种方法中,每个个体被抽到的概率随机抽样各种方
7、法中,每个个体被抽到的概率都是相等的;都是相等的;(2)系统抽样又称系统抽样又称“等距等距”抽样,被抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例抽取的比例都等于样本容量在总体容量中的比例.思维升华变式训练1(1)某校高一、高二、高三分别有学生人数为某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取,现采用系统抽样方法,抽取49人做问人做问卷调查,将高一、高二、高三学生依次随机按卷调查,将高一、高二、高三学生依次随机按1,2,3,1 470编号,若第编号,若第1组有简单随机
8、抽样方法组有简单随机抽样方法抽取的号码为抽取的号码为23,则高二应抽取的学生人数为,则高二应抽取的学生人数为()A.15 B.16 C.17 D.18解析由系统抽样方法,知按编号依次每由系统抽样方法,知按编号依次每30个编号作个编号作为一组,共分为一组,共分49组,组,高二学生的编号为高二学生的编号为496到到988,在第,在第17组到第组到第33组内,组内,第第17组抽取的编号为组抽取的编号为163023503,为高二学生,为高二学生,第第33组抽取的编号为组抽取的编号为323023983,为高二学生,为高二学生,故共抽取高二学生人数为故共抽取高二学生人数为331617,故选,故选C.答案C
9、(2)(2014广东广东)已知某地区中小学生人数和近视情况分别已知某地区中小学生人数和近视情况分别如图如图和图和图所示所示.为了解该地区中小学生的近视形成原为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取因,用分层抽样的方法抽取2%的学生进行调查,则样本的学生进行调查,则样本容量和抽取的高中生近视人数分别为容量和抽取的高中生近视人数分别为()A.2 0 0,2 0B.100,20C.200,10D.100,10解析该地区中、小学生总人数为该地区中、小学生总人数为3 5002 0004 50010 000,则样本容量为则样本容量为10 0002%200,其中抽取的高中生近视人数为其中抽取
10、的高中生近视人数为2 0002%50%20,故选,故选A.答案A例2(1)(2014山东山东)为了研究某药品的疗效,选取若干为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据名志愿者进行临床试验,所有志愿者的舒张压数据(单单位:位:kPa)的分组区间为的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为,将其按从左到右的顺序分别编号为第一组,第二组,第一组,第二组,第五组,如图是根据试验数据,第五组,如图是根据试验数据制成的频率分布直方图制成的频率分布直方图.已知第一组与第二组共有已知第一组与第二组共有20人,人
11、,热点二 用样本估计总体第三组中没有疗效的有第三组中没有疗效的有6人,则第三组中有疗效的人人,则第三组中有疗效的人数为数为()思维启迪 根据第一组与第二组根据第一组与第二组的人数和对应频率估计的人数和对应频率估计样本总数,然后利用第样本总数,然后利用第三组的频率和无疗效人三组的频率和无疗效人数计算;数计算;A.6 B.8 C.12 D.18所以第三组人数为所以第三组人数为500.3618,有疗效的人数为有疗效的人数为18612.答案C(2)PM2.5是指大气中直径小于或等于是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早粒物,如图
12、是根据某地某日早7点至点至晚晚8点甲、乙两个点甲、乙两个PM2.5监测点统计的监测点统计的数据数据(单位:毫克单位:毫克/每立方米每立方米)列出的茎列出的茎叶图,则甲、乙两地浓度的方差较小的是叶图,则甲、乙两地浓度的方差较小的是()A.甲甲 B.乙乙C.甲乙相等甲乙相等 D.无法确定无法确定思维启迪 直接根据公式计算方差直接根据公式计算方差.解析 (0.0420.0530.0590.0610.0620.0660.0710.0730.0730.0840.0860.097)120.068 9,(0.0410.0420.0430.0460.0590.0620.0 6 9 0.0 7 9 0.0 8
13、7 0.0 9 2 0.0 9 4 0.096)120.067 5,s2 (0.0420.068 9)2(0.0530.068 9)2(0.0970.068 9)20.000 212.s2 (0.0410.067 5)2(0.0420.067 5)2(0.0960.067 5)20.000 429.所以甲、乙两地浓度的方差较小的是甲地所以甲、乙两地浓度的方差较小的是甲地.答案A(1)反映样本数据分布的主要方式:频率分布表、反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图频率分布直方图、茎叶图.关于频率分布直方图关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其要明确每个小
14、矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征分布直方图估计总体的概率分布和总体的特征思维升华数,具体问题中要能够根据公式求解数据的均数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等值、众数和中位数、方差等.(2)由样本数据估计总体时,样本方差越小,数由样本数据估计总体时,样本方差越小,数据越稳定,波动越小据越稳定,波动越小.思维升华变式训练2(1)某商场在庆元宵促销活动中,对某商场在庆元宵促销活动
15、中,对元宵节元宵节9时至时至14时的销售额进行统时的销售额进行统计,其频率分布直方图如图所示,计,其频率分布直方图如图所示,已知已知9时至时至10时的销售额为时的销售额为2.5万万元,则元,则11时至时至12时的销售额为时的销售额为_万元万元.解析由频率分布直方图可知:由频率分布直方图可知:所以所以x10.10(2)(2014陕西陕西)设样本数据设样本数据x1,x2,x10的均值和方的均值和方差分别为差分别为1和和4,若,若yixia(a为非零常数,为非零常数,i1,2,10),则,则y1,y2,y10的均值和方差分别为的均值和方差分别为()A.1a,4 B.1a,4aC.1,4 D.1,4a
16、所以所以y1,y2,y10的均值为的均值为1a,方差不变仍为,方差不变仍为4.故选故选A.A例3(1)以下是某年以下是某年2月某地区搜集到的新房屋的销售月某地区搜集到的新房屋的销售价格价格y和房屋的面积和房屋的面积x的数据的数据.热点三 统计案例房屋面积房屋面积x/m2115110 80 135105销售价格销售价格y/万元万元24.821.618.429.222思维启迪 回 归 直 线回 归 直 线过 样 本 点 中过 样 本 点 中心心();答案31.244 2(2)(2014江西江西)某人研究中学生的性别与成绩、视力、某人研究中学生的性别与成绩、视力、智商、阅读量这智商、阅读量这4个变量
17、的关系,随机抽查个变量的关系,随机抽查52名中学生,名中学生,得到统计数据如表得到统计数据如表1至表至表4,则与性别有关联的可能性,则与性别有关联的可能性最大的变量是最大的变量是()成成绩绩性别性别不及不及格格及格及格总计总计男男61420女女102232总计总计163652表表1表表2 视视力力性别性别好好差差总计总计男男41620女女122032总计总计163652表表3 智智商商性别性别偏高偏高正常正常总计总计男男81220女女82432总计总计163652表表4 阅阅读量读量性别性别丰富丰富不丰富不丰富总计总计男男14620女女23032总计总计163652A.成绩成绩 B.视力视力
18、C.智商智商 D.阅读量阅读量思维启迪 根据列根据列联表,计联表,计算算K2的值的值解析A中,中,a6,b14,c10,d22,ab20,cd32,ac16,bd36,n52,B中,中,a4,b16,c12,d20,ab20,cd32,ac16,bd36,n52,C中,中,a8,b12,c8,d24,ab20,cd32,ac16,bd36,n52,D中,中,a14,b6,c2,d30,ab20,cd32,ac16,bd36,n52,与性别有关联的可能性最大的变量是阅读量与性别有关联的可能性最大的变量是阅读量.答案D(1)线性回归方程求解的关键在于准确求出样本线性回归方程求解的关键在于准确求出样
19、本点中心点中心.回归系数的求解可直接把相应数据代入回归系数的求解可直接把相应数据代入公式中求解,回归常数的确定则需要利用中心公式中求解,回归常数的确定则需要利用中心点在回归直线上建立方程求解;点在回归直线上建立方程求解;(2)独立性检验独立性检验问题,要确定问题,要确定22列联表中的对应数据,然后列联表中的对应数据,然后代入代入K2(2)计算公式求其值,根据计算公式求其值,根据K2(2)取值范取值范围求解即可围求解即可.思维升华变式训练3(1)已知已知x、y取值如下表:取值如下表:x014568y 1.31.85.6 6.1 7.49.3A.1.30 B.1.45 C.1.65 D.1.80答
20、案B(2)某研究机构为了研究人的脚的大小与身高之间的关系,某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测了随机抽测了20人,若人,若“身高大于身高大于175厘米厘米”的为的为“高高个个”,“身高小于等于身高小于等于175厘米厘米”的为的为“非高个非高个”,“脚长大于脚长大于42码码”的为的为“大脚大脚”,“脚长小于等于脚长小于等于42码码”的为的为“非大脚非大脚”.得以下得以下22列联表:列联表:高个高个非高非高个个总计总计大脚大脚527非大脚非大脚11213总计总计61420则在犯错误的概率不超过则在犯错误的概率不超过_的前提下认为人的的前提下认为人的脚的大小与身高之间有关系脚的大
21、小与身高之间有关系.(附:附:)而而K26.635的概率约为的概率约为0.01,所以在犯错误的概率不超,所以在犯错误的概率不超过过0.01的前提下认为人的脚的大小与身高之间有关系的前提下认为人的脚的大小与身高之间有关系.0.011.随机抽样的方法有三种,其中简单随机抽样适用随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体于总体中的个体数量不多的情况,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样具有明显的层次时使用分层抽样.系统抽样最重要系统抽样最重要的特征是的特征是“等距
22、等距”,分层抽样,最重要的是各层的,分层抽样,最重要的是各层的“比例比例”.”.本讲规律总结2.用样本估计总体用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为应的频率,各小长方形的面积的和为1.(2)众数、中位数及平均数的异同:众数、中位数及众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是平均数都是描述一组数据集中趋势的量,平均数是最重要的量最重要的量.(3)当总体的个体数较少时,可直接分析总体取值的频当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布
23、;当总体容量很大时,通常率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计从总体中抽取一个样本,分析它的频率分布,以此估计总体分布总体分布.4.独立性检验独立性检验(1)作出作出22列联表列联表.(2)计算随机变量计算随机变量K2(2)的值的值.(3)查查临界值,检验作答临界值,检验作答.真题感悟 押题精练真题与押题12真题感悟1.(2014江苏江苏)为了了解一片经济为了了解一片经济林的生长情况,随机抽测了其中林的生长情况,随机抽测了其中60株树木的底部周长株树木的底部周长(单位:单位:cm),所得数据均在区间所得数据均在区间80,130上,其上,
24、其频率分布直方图如图所示,则在抽测的频率分布直方图如图所示,则在抽测的60株树木中,株树木中,有有_株树木的底部周长小于株树木的底部周长小于100 cm.12真题感悟解析底部周长在底部周长在80,90)的频率为的频率为0.015100.15,底部周长在底部周长在90,100)的频率为的频率为0.025100.25,样本容量为样本容量为60,所以树木的底部周长小于,所以树木的底部周长小于100 cm的的株数为株数为(0.150.25)6024.答案24真题感悟21真题感悟21解析因为变量因为变量x和和y正相关,则回归直线的斜率为正相关,则回归直线的斜率为正,故可以排除选项正,故可以排除选项C和和
25、D.因为样本点的中心在回归直线上,把点因为样本点的中心在回归直线上,把点(3,3.5)的坐的坐标分别代入选项标分别代入选项A和和B中的线性回归方程进行检验,中的线性回归方程进行检验,可以排除可以排除B,故选,故选A.答案A1.某地区对某路段公路上行驶的汽某地区对某路段公路上行驶的汽车速度实施监控,从中抽取车速度实施监控,从中抽取50辆汽辆汽车进行测速分析,得到如图所示的车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速的频率分布直方图,根据该图,时速在时速在70 km/h以下的汽车有以下的汽车有_辆辆.解析时速在时速在70 km/h以下的汽车所占的频率为以下的汽车所占的频率为0
26、.01100.03100.4,共有,共有0.45020(辆辆).20押题精练12342.某教育出版社在高三期末考试结束后,从某市参某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取与考试的考生中选取600名学生对在此期间购买教名学生对在此期间购买教辅资料的情况进行调研,得到如下数据:辅资料的情况进行调研,得到如下数据:购买购买图书图书情况情况只买只买试题试题类类只买只买讲解讲解类类试题类和试题类和讲解类都讲解类都买买人数人数240200160押题精练1234若该教育出版社计划用分层抽样的方法从这若该教育出版社计划用分层抽样的方法从这600人人中随机抽取中随机抽取60人进行座谈,则只买
27、试题类的学生应人进行座谈,则只买试题类的学生应抽取的人数为抽取的人数为_.解析只买试题类的学生应抽取的人数为只买试题类的学生应抽取的人数为60 24.24押题精练12343.下表提供了某厂节能减排技术改造后在生产下表提供了某厂节能减排技术改造后在生产A产产品过程中记录的产量品过程中记录的产量x(吨吨)与相应的生产能耗与相应的生产能耗y(吨吨)的几组对应数据:的几组对应数据:x3456y2.5t44.5押题精练1234根据上表提供的数据,求出根据上表提供的数据,求出y关于关于x的线性回归方程的线性回归方程为为 0.7x0.35,那么表中,那么表中t的值为的值为_.3押题精练12344.春节期间,
28、春节期间,“厉行节约,反对浪费厉行节约,反对浪费”之风悄然吹之风悄然吹开,某市通过随机询问开,某市通过随机询问100名性别不同的居民是否名性别不同的居民是否能做到能做到“光盘光盘”行动,得到如下的列联表:行动,得到如下的列联表:做不到做不到“光光盘盘”能做到能做到“光光盘盘”男男4510女女3015押题精练1234附:附:P(K2k0)0.10 0.05 0.025k02.7063.8415.024押题精练1234参照附表,得到的正确结论是参照附表,得到的正确结论是()A.在犯错误的概率不超过在犯错误的概率不超过1%的前提下,认为的前提下,认为“该市该市居民能否做到居民能否做到光盘光盘与性别有关与性别有关”B.在犯错误的概率不超过在犯错误的概率不超过1%的前提下,认为的前提下,认为“该市该市居民能否做到居民能否做到光盘光盘与性别无关与性别无关”押题精练1234C.有有90%以上的把握认为以上的把握认为“该市居民能否做到该市居民能否做到光光盘盘与性别有关与性别有关”D.有有90%以上的把握认为以上的把握认为“该市居民能否做到该市居民能否做到光光盘盘与性别无关与性别无关”押题精练1234解析由公式可计算由公式可计算K2的观测值的观测值k所以有所以有90%以上的把握认为以上的把握认为“该市民能否做到该市民能否做到光光盘盘与性别有关与性别有关”,故选,故选C.答案C押题精练1234