1、-1-第第2课时课时统计统计自主预习专题整合知识网络要点梳理思考辨析自主预习专题整合知识网络要点梳理思考辨析1.三种抽样方法的共同特点若样本容量为n,总体的个体数为N,用三种方法抽样时,每一个个体被抽到的可能性等于 ,即抽样过程中每个个体被抽到的可能性相等,体现了三种抽样方法的客观性和公平性.2.三种抽样方法的使用原则(1)当总体容量较小,样本容量也较小时,采用抽签法.(2)当总体容量较大,样本容量较小时,采用随机数表法.(3)当总体容量较大,样本容量也较大时,采用系统抽样法.(4)当总体由差异明显的几部分组成时,常用分层抽样.自主预习专题整合知识网络要点梳理思考辨析3.数据的数字特征样本的数
2、字特征可分为两大类,一类是反映样本数据的集中趋势的,包括样本平均数、中位数、众数;一类是反映样本数据的波动大小的,包括样本方差和标准差,通常我们用样本的数字特征来估计总体的数字特征.在实际应用中,平均数常被理解为平均水平,标准差常被理解为稳定性,常常将二者结合起来解决问题.4.相关关系(1)分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归直线方程.把样本数据表示的点在直角坐标系中作出,构成的图叫 散点图,从而我们可以分析出两个变量是否存在相关关系.(2)如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性
3、相关关系,这条直线叫做回归直线,直线方程叫做回归直线方程.自主预习专题整合知识网络要点梳理思考辨析自主预习专题整合知识网络要点梳理思考辨析判断下列说法是否正确,正确的在后面的括号内画“”,错误的画“”.(1)在抽签法中,先抽的人抽中的可能性大.()(2)用系统抽样从1 002名学生中抽取20名作为样本,需要剔除2人,这样对被剔除者不公平.()(3)在分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(4)平均数、众数与中位数都可以描述数据的集中趋势.()(5)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()(6)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者
4、准确、后者直观.()答案:(1)(2)(3)(4)(5)(6)自主预习专题整合知识网络要点梳理思考辨析(7)只有两个变量有相关关系,所得的回归模型才有预测价值.()(8)通过回归直线方程 可以估计和观测变量的取值和变化趋势.()(9)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(10)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()答案:(7)(8)(9)(10)专题整合自主预习专题归纳高考体验专题一采用适当的方法进行抽样【例1】某班的60名同学已编号1,2,3,60,为了解该班同学的作业完成情况,老师收取了号码能被5整除的12名同学的作业本,这里运用的抽样方法
5、是.解析:这是考查抽样方法的常见题型,即判断给出的问题采用何种抽样方法,应抓住每种抽样方法的特点进行判断.答案:系统抽样专题整合自主预习专题归纳高考体验【例2】某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取名学生.解析:由分层抽样方法可得,从一年级本科生中抽取的学生人数为答案:60专题整合自主预习专题归纳高考体验专题整合自主预习专题归纳高考体验4.三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;
6、当总体容量较大,样本容量较小时,可采用随机数表法;当总体容量较大,样本容量也较大时,可采用系统抽样法;当总体中个体差异较显著时,可采用分层抽样.专题整合自主预习专题归纳高考体验变式训练变式训练1下列抽样方式是简单随机抽样的是()A.某工厂从老年、中年、青年职工中按253的比例选取职工代表B.从装有20个完全相同的小球的袋子中有放回地抽取4个小球C.福利彩票用摇奖机摇奖D.规定凡买到明信片最后的几位号码是“6637”的人获三等奖解析:简单随机抽样要求总体个数有限,从总体中逐个进行不放回抽样,每个个体有相同的可能性被抽到.根据简单随机抽样的上述特点可知,只有选项C符合.答案:C专题整合自主预习专题
7、归纳高考体验变式训练变式训练2某客运公司为了了解客车的耗油情况,现采用系统抽样的方法按110的比例抽取一个样本进行检测,将所有200辆客车依次编号为1,2,200,则从中抽取的4辆客车的编号可能是()A.3,23,63,102B.31,61,87,127C.103,133,153,193D.57,68,98,108解析:由于抽样比为 ,所以共抽取 200=20(辆)汽车.将200辆汽车均分成20段,每段10辆,从第一段(编号为110)中抽取一个号码l,则所抽取的号码为l,10+l,20+l,190+l,故所有抽取的号码的个位数字相同.答案:C专题整合自主预习专题归纳高考体验专题二用样本估计总体
8、【例3】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56B.46,45,53C.47,45,56D.45,47,53解析:由茎叶图可知中位数为46,众数为45,极差为68-12=56.故选A.答案:A专题整合自主预习专题归纳高考体验【例4】在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日到31日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图),已知从左到右各长方形的高的比为234641,第三组的频数为12,请回答下列问题:(1)本次活动共有多少件作品参加评比?
9、(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?专题整合自主预习专题归纳高考体验专题整合自主预习专题归纳高考体验反思感悟因为总体容量很大或因为检测过程具有一定的破坏性,所以不直接去研究总体,而是通过从总体中抽取一个样本,用样本的频率分布估计总体的分布,用样本的数字特征去估计总体的数字特征.(1)频率分布直方图是从各个小组数据在样本容量中所占比例大小的角度,表示数据分布的规律.图中各小长方形的面积等于相应各组的频率,它直观反映了数据在各个小组的频率的大小.(2)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们
10、所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.专题整合自主预习专题归纳高考体验变式训练变式训练3若样本数据x1,x2,x10的标准差为8,则数据2x1-1,2x2-1,2x10-1的标准差为()A.8B.15C.16 D.32解析:设样本数据x1,x2,x10的标准差为s,则s=8,即方差s2=64,而数据2x1-1,2x2-1,2x10-1的方差为22s2=2264,所以其标准差为答案:C专题整合自主预习专题归纳高考体验变式训练变式训练4下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):(1)列出样本的频率分
11、布表(频率保留两位小数).(2)画出频率分布直方图.(3)估计身高低于134 cm的人数占总人数的百分比.专题整合自主预习专题归纳高考体验解解:(1)列出样本频率分布表:专题整合自主预习专题归纳高考体验(2)画出频率分布直方图,如图所示.专题整合自主预习专题归纳高考体验专题三回归直线方程的应用【例5】一台机器由于使用时间较长,生产的零件有一些缺损.按不同转速生产出来的零件有缺损的统计数据如下表所示:(1)作出散点图;(2)如果y与x线性相关,求出回归直线方程;(保留两位小数)(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围内?(保留整数)专题
12、整合自主预习专题归纳高考体验专题整合自主预习专题归纳高考体验反思感悟在解决实际问题时,通常先作出散点图,判定两个变量的关系是否具有线性相关关系.若具有线性相关关系,则利用计算公式解出相应的回归直线方程,这样就可以利用回归直线方程对事情作出决策.专题整合自主预习专题归纳高考体验变式训练变式训练5(2017山东济宁高三模拟)某企业对自己的某种产品的销售价格(单位:元)与月销售量(单位:万件)进行调查,其中最近五个月的统计数据如下表所示:专题整合自主预习专题归纳高考体验答案:10 专题整合自主预习专题归纳高考体验专题四统计图形表的应用【例6】一个高中研究性学习小组对本地区2014年至2016年快餐公
13、司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和盒饭年销售量平均数条形图(如图所示).根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭万盒.专题整合自主预习专题归纳高考体验解析:由题图可知,该地区三年共销售盒饭301+452+901.5=255(万盒),则每年平均销售 (万盒).答案:85专题整合自主预习专题归纳高考体验【例7】随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如下:(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班同学身高的样本方差.思路分析:茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它较好地保留了
14、原始数据,所以它可以帮助我们分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征,例如众数、中位数、平均数等.专题整合自主预习专题归纳高考体验解解:(1)由题中茎叶图可知:甲班同学身高的中位数为169 cm,乙班同学身高的中位数为171.5 cm;两班同学的身高都集中在160180 cm之间,但乙班更多同学的身高集中于170180 cm之间.因此乙班同学的平均身高高于甲班.专题整合自主预习专题归纳高考体验反思感悟用样本估计总体时用到的图表主要有:频率分布表、频率分布直方图、频率分布折线图、茎叶图、扇形图等.构建起这几种图表中统计数据间的关系是解决此类问题的关键,因此在分析每种图表时
15、,不但要抓住其自身所具有的显著的信息,还要挖掘出其内在的数据特点.专题整合自主预习专题归纳高考体验变式训练变式训练6甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示:(1)填写下表:专题整合自主预习专题归纳高考体验(2)请从四个不同的角度对这次测试进行分析:从平均数和方差结合分析偏离程度;从平均数和中位数结合分析谁的成绩好些;从平均数和命中9环以上的次数相结合看谁的成绩好些;从折线图上两人射击命中环数及走势分析谁更有潜力.专题整合自主预习专题归纳高考体验专题整合自主预习专题归纳高考体验(2)甲、乙的平均数相同,均为7,但 ,说明甲偏离平均数的程度小,而乙偏离平均数的程度大
16、.甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.专题整合自主预习专题归纳高考体验考点一随机抽样1.(2015北京,文4)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()A.90B.100C.180D.300 专题整合自主预习专题归纳高考体验答案:C 专题整合自主预习专题归纳高考体验2.(2015陕西,
17、文2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123 C.137D.167解析:由性别比例图知,该校女教师的人数为11070%+150(1-60%)=77+60=137.答案:C专题整合自主预习专题归纳高考体验3.(2015福建,文13)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.解析:设男生抽x人.女生有400人,男生有500人,故抽取男生的人数为25.答案:25专题整合自主预习专题归纳高考体验4.(2017江苏,3)某工厂生产甲、
18、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案:18 专题整合自主预习专题归纳高考体验5.(2015湖北,文14)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示.(1)直方图中的a=;(2)在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为.解析:(1)由频率分布直方图,得(1.5+2.5+a+2.0+0.8+0.2)0.1=1,解得a=3;(2)
19、消费金额在0.5,0.9的购物者的人数为10 000(1-1.50.1-2.50.1)=10 0000.6=6 000.答案:(1)3(2)6 000专题整合自主预习专题归纳高考体验考点二用样本估计总体6.(2017全国1,文2)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,xn的平均数B.x1,x2,xn的标准差C.x1,x2,xn的最大值D.x1,x2,xn的中位数解析:标准差和方差可刻画样本数据的稳定程度,故选B.答案:B专题整合自主预习专题归纳高考体验7.
20、(2017全国3,理3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析:由题图可知2014年8月到9月的月接待游客量在减少,故A错误.答案:A专题整合自主预习专题归纳高考体验8.(2015山东,文6)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单
21、位:)制成如图所示的茎叶图.考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.B.C.D.专题整合自主预习专题归纳高考体验答案:B 专题整合自主预习专题归纳高考体验9.(2014江苏,4)从1,2,3,6这4个数中一次随机地取2个数,则所取2个数的乘积为6的概率是.解析:从1,2,3,6这4个数中随机地取2个数,不同的取法为1,2,1,3,1,6,2,3,
22、2,6,3,6共6个基本事件,其中乘积为6的有1,6,2,3两个基本事件,因此所求事件的概率为专题整合自主预习专题归纳高考体验10.(2016北京,文17)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.专题整合自主预习专题归纳高考体验解
23、:(1)由用水量的频率分布直方图知,该市居民该月用水量在区间0.5,1,(1,1.5,(1.5,2,(2,2.5,(2.5,3内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为40.1+60.15+80.2+100.25+120.15+170.05+220.05+270.05=10.5(元).专题整合自主预习专题归纳高考体验11.(2016四川,文16)我国是世界上严
24、重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.专题整合自主预习专题归纳高考体验解解:(1)由频率分布直方图,可知:月均用水量在0,0.5)的频率为0.080.5=0.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5)等组的频率分别为0.08,0
25、.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5a+0.5a,解得a=0.30.(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 0000.12=36 000.专题整合自主预习专题归纳高考体验(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.730.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.480.5,所以2x19
26、时,y=3 800+500(x-19)=500 x-5 700.所以y与x的函数解析式为(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.专题整合自主预习专题归纳高考体验专题整合自主预习专题归纳高考体验13.(2015广东,文17)某城市100户居民的月平均用电量(单位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240),240,260)
27、,260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?专题整合自主预习专题归纳高考体验解:(1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)20=1,得x=0.007 5,所以直方图中x的值是0.007 5.因为(0.002+0.009 5+0.011)20=0.450.5,所以月平均用电量的中位数在220,240)内,设中位数为a,由(0.002+0.009 5+0.011)20+0.012 5(a-220)=0.5,得a=224,所以月平均用电量的中位数是224.
28、专题整合自主预习专题归纳高考体验(3)月平均用电量在220,240)的用户有0.012 520100=25(户),月平均用电量在240,260)的用户有0.007 520100=15(户),月平均用电量在260,280)的用户有0.00520100=10(户),月平均用电量在280,300的用户有0.002 520100=5(户),专题整合自主预习专题归纳高考体验考点三变量间的相关关系14.(2015全国2,文3)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧
29、化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关解析:由柱形图知,2006年以来我国二氧化硫年排放量呈减少趋势,故其排放量与年份负相关.答案:D专题整合自主预习专题归纳高考体验15.(2015湖北,文4)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y负相关,x与z负相关B.x与y正相关,x与z正相关C.x与y正相关,x与z负相关D.x与y负相关,x与z正相关解析:由y=-0.1x+1知y与x负相关,又因为y与z正相关,故z与x负相关.答案:A专题整合自主预习专题归纳高考体验16.(2
30、015福建,理4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:A.11.4万元B.11.8万元C.12.0万元D.12.2万元答案:B 专题整合自主预习专题归纳高考体验17.(2016全国3,文18)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.专题整合自主预习专题归纳高考体验专题整合自主预习专题归纳高考体验专题整合自主预习专题归纳高考体验专题整合自主预习专题归纳高考体验18.(2015全国1,文19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.专题整合自主预习专题归纳高考体验