1、本章整合第二章 统计专题一专题二专题三专题四专题五专题一三种抽样方法的比较简单随机抽样、系统抽样、分层抽样的比较如下表:专题一专题二专题三专题四专题五研究统计问题的基本思想方法就是从总体中抽取样本,用样本估计总体,因此选择适当的抽样方法抽取具有代表性的样本对整个统计问题起着至关重要的作用.高考中主要考查三种抽样方法的比较和辨析以及应用.专题一专题二专题三专题四专题五应用1已知某校的初中学生人数、高中学生人数、教师人数之比为20152,现在用分层抽样的方法从所有师生中抽取一个容量为N的样本进行调查,若应从高中学生中抽取60人,则N=.答案:148 专题一专题二专题三专题四专题五应用2某高级中学有
2、学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270;使用系统抽样时,将学生统一随机编号为1,2,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,2
3、19,246,270.关于上述样本的下列结论中,正确的是()A.都不能为系统抽样B.都不能为分层抽样C.都可能为系统抽样D.都可能为分层抽样专题一专题二专题三专题四专题五提示:分层抽样时,在各层所抽取的样本个数与该层个体数的比值等于抽样比;系统抽样抽取的号码按从小到大排列后,每一个号码与前一个号码的差都等于分段间隔.号码,在号码段109,110,189中抽取3个号码,在号码段190,191,270中抽取3个号码,符合,所以可能是分层抽样,不符合,所以不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是“等距”的,符合,不符合,所以都可能为系统抽样,都不能为系统抽样.答案:D专题一专题二专题三
4、专题四专题五专题二用样本的频率分布估计总体分布通常利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的情况,使我们能够看到在频率分布表中看不清楚的数据模式,这样根据样本的频率分布,我们就可以大致估计出总体的分布.专题一专题二专题三专题四专题五应用某路段检查站监控录像显示,在某段时间内有2 000辆车通过该站.现随机抽取其中的200辆进行车速分析,分析结果表示为如图所示的频率分布直方图.则图中a=,估计在这段时间内通过该站的汽车中速度不小于90 km/h的有辆.专题一专题二专题三专
5、题四专题五解析:在频率分布直方图中,(0.04+0.025+a+0.01+0.005)10=1,解得a=0.02,由题图可估计,速度不小于90 km/h的汽车通过的频率为(0.025+0.005)10=0.3,则估计在这段时间内通过该站的汽车中速度不小于90 km/h的汽车的辆数为0.32 000=600.答案:0.02600专题一专题二专题三专题四专题五专题一专题二专题三专题四专题五应用1对某种花卉的开放花期追踪调查,调查情况如下:则这种花卉的平均花期约为天.解析:由题中表格可知,花期在1113天的花卉个数为20,估计花期在1113天的花卉的总花期天数为1220=240;花期在1416天的花
6、卉个数为40,估计花期在1416天的花卉的总花期天数为1540=600;花期在1719天的花卉个数为30,估计花期在1719天的花卉的总花期天数为1830=540;花期在2022天的花卉个数为10,估计花期在2022天的花卉的总花期天数为2110=210.综上所述,此种花卉的总花期数为240+600+540+210=1 590,这种花卉的答案:16 专题一专题二专题三专题四专题五应用2某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的8次测试成绩记录如下:甲:9582888193798478乙:8392809590808575试比较哪个工人的成绩较好.提示:成绩较好要从两方面来分析,一
7、是平均成绩比较高,二是成绩波动比较小.专题一专题二专题三专题四专题五甲的成绩较稳定.综上可知,甲的成绩较好.专题一专题二专题三专题四专题五专题四频率分布直方图和茎叶图与数字特征的综合应用(1)利用频率分布直方图估计数字特征.众数是最高的矩形的底边的中点.中位数左右两侧直方图的面积相等.平均数等于每个小矩形的面积乘小矩形底边中点的横坐标的和.中间小矩形最高,两侧小矩形较矮,说明方差、标准差较小,这组数据比较集中;反之,中间小矩形较矮,两侧小矩形较高,说明方差、标准差较大,这组数据比较分散.说明:利用直方图求出的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中
8、位数和平均数.专题一专题二专题三专题四专题五(2)利用茎叶图求数字特征.利用茎叶图求数字特征一般有两种方法:方法一,根据茎叶图读出所有数据,并根据定义,求出平均数、众数、中位数、方差、标准差的大小;方法二,粗略估计:每个叶上出现次数最多的数字,其对应的数据是众数;每个叶上的数字按由小到大排列,位于“中间”的数字,其对应的数据是中位数;“叶”越集中,说明数据越集中,方差、标准差越小;“叶”越分散,说明数据越分散,方差、标准差越大.专题一专题二专题三专题四专题五应用1某班甲、乙两名学生进入高三以来5次数学考试成绩的茎叶图如图所示,甲、乙两人5次数学考试成绩的中位数分别为、;平均数分别为、.解析:甲
9、同学5次数学考试成绩分别是76,83,84,87,90,乙同学5次数学考试成绩分别是79,80,82,88,91,可知甲、乙两人5次数学考试成绩的中位数分别为84,82,甲同学成绩的平均数答案:84828484 专题一专题二专题三专题四专题五应用2某校开设了丰富多彩的课外活动课程,甲、乙两班各随机抽取了5名学生课外活动课程的学分,用茎叶图表示(如图).s1,s2分别表示甲、乙两班各随机抽取的5名学生学分的标准差,则s1s2(填“”“专题一专题二专题三专题四专题五应用3从高三年级抽出50名学生参加数学竞赛,由成绩得到如图所示的频率分布直方图.由于一些数据丢失,试利用频率分布直方图估计:(1)这5
10、0名学生成绩的众数与中位数;(2)这50名学生的平均成绩.专题一专题二专题三专题四专题五则这50名学生成绩的众数估计是75分.频率分布直方图中,从左到右前3个和前4个矩形的面积和分别是(0.004+0.006+0.02)10=0.30.5,设中位数是m,则70m0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.480.5,所以2x2.5.由0.50(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.1234566(2016北京高考)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按
11、10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.123456解:(1)由用水量的频率分布直方图知,该市居民该月用水量在区间0.5,1,(1,1.5,(1.5,2,(2,2.5,(2.5,3内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为40.1+60.15+80.2+100.25+120.15+170.05+220.05+270.05=10.5(元).
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。