1、第九章统计知识点和典型例题1简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:抽签法和随机数法例1在由编号为00,01,02,39的40个个体组成的总体中,利用如下的随机数表从第1行第11列开始横向依次选取5个个体组成样本,则选取的第5个个体编号为( )7816 6572 0802 6314 07023204 9243 4935 8200 36232976 3413 2481 4241 2424A14B02C32D04例2下列抽样方法不
2、是简单随机抽样的是( )A从50个零件中逐个抽取5个做质量检验B从50个零件中有放回地抽取5个做质量检验C从实数集中随机抽取10个分析奇偶性D运动员从8个跑道中随机选取一个跑道例3总体由编号为01,02,39,40的40个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )50 44 66 44 21 66 46 58 05 62 61 65 54 35 02 42 35 48 96 32 14 52 41 52 4822 66 22 15 86 26 63 75 41 99 58 42 36
3、72 24 58 37 52 18 51 03 37 18 39 11A23B21C35D242系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本(1)编号:先将总体的N个个体编号;(2)分段:确定分段间隔k,对编号分段,当(n是样本容量)是整数时,取k;(3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(lk);(4)获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(lk),再加k得到第3个个体编号(l2k),依次进行下去,直到获取整个样本例4为某校高一班54名同学随机编号为,现用系统抽样抽取一个容量为9的样本,将同学按编号分为九个小组若从第三组抽取
4、的同学编号为16,则从第八组抽取的同学编号为( )A36B39C46D49例5要从96个接种了新冠疫苗的人中抽取16人检查体内的抗体情况,将这96人随机编为1到96号,再用系统抽样法抽出16个号.把抽出的号从小到大排列,已知第1,3,13个号成等比数列,则抽出的最大号为( )A92B93C95D963分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样4分层抽样的步骤(1)分层:将总体按某种特征分成若干部分
5、;(2)确定比例:计算各层的个体数与总体的个体数的比;(3)确定各层应抽取的样本容量;(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本例6某校高中三个年级人数饼图如图所示,按年级用分层抽样的方法抽取一个样本,已知样本中高一年级学生有8人,则样本容量为( )A24B30C32D35例7高一年级1500名同学参加数学期中考试,规定:成绩不低于90分的为及格,成绩不低于120分的为优秀.经统计有1200名同学的数学成绩不低于90分,其中有500名同学的数学成绩不低于120分,从这1500名同学中按分层抽样的方法抽取15名同学的试卷分析答题情况,则从恰好及格
6、(不到优秀)的试卷中抽取的样本数与从不及格的试卷中抽取的样本数之差是( )A1B4C7D9例8在中国共产党建党100周年之际,某外国语学校组织了“党史知识竞赛”活动,已知该外国语学校共有高中生2700名,用分层抽样的方法从该校高中学生中抽取一个容量为45的样本参加活动,其中高三年级抽取了14人,高二年级抽取了15人,则该校高一年级学生人数为( )A1680B1020C960D7205.中位数、众数、平均数众数:一组数据中出现次bai数最多的那个数据,叫做这组数据的众数中位数-把n个数据按大小顺序排列,处于最中间位置的一个数据(或)叫做这组数据的中位数(median).中位数则仅与数据排列位置有
7、关,当一组数据从小到大排列后,最中间的数据为中位数(偶数个数据的最中间两个的平均数)。平均数:所有数据的和除以数据个数例9某校举行校园歌手大赛,6位评委对某选手的评分分别为9.2,9.5,8.8,9.9,8.9,9.5,设该选手得分的平均数为x,中位数为y,众数为z,则( )ABCD例1016位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断能否进入决赛,其他15位同学成绩的下列数据中,能使他得出结论的是( )A平均数B极差C中位数D众数例11某学校抽取100位老师的年龄,得到如下数据年龄(单位:岁)323438404243454648频数24202
8、02610864则估计这100位老师的样本的平均年龄为( )A42岁B41岁C41.1岁D40.1岁6.百分位数:,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列。如,处于p%位置的值称第p百分位数。计算步下面的步骤来说明如何计算第p百分位数。第1步:以递增顺序排列原始数据(即从小到大排列)。第2步:计算指数i=np%第3步:l)若 i 不是整数,将 i 向上取整。大于i的毗邻整数即为第p百分位数的位置。2) 若i是整数,则第p百分位数是第i项与第(i+l)项数据的平均值。除了以上方法,再介绍另外
9、一种方法,这种方法是SPSS所用方法,也是SAS所用方法之一。第一步:将n个变量值从小到大排列,X(j)表示此数列中第j个数。第二步:计算指数,设(n+1)P%=j+g,j为整数部分,g为小数部分。第三步:1)当g=0时:P百分位数=X(j);2)当g0时:P百分位数=g*X(j+1)+(1-g)*X(j)=X(j)+g*X(j+1)-X(j)。例12已知甲乙两组数据(已按从小到大的顺序排列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的30百分位数80百分位数分别相等,则等于( )ABCD例13高一年级共有1000名学生参加物理测试,若所有学
10、生成绩(单位:分)的第80百分位数是75,则物理成绩大于或等于75分的学生数至少有( )A200B220C240D2607茎叶图的优点用茎叶图表示数据有两个突出的优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示14甲乙两名学生,六次数学测验成绩(百分制如图所示)甲同学成绩的中位数大于乙同学成绩的中位数;甲同学的平均分比乙同学高;甲同学成绩的极差是18;甲同学成绩方差小于乙同学成绩的方差上面说法正确的是( )ABCD例15甲乙两位体育特长生在平时训练中,5次的成绩如下面茎叶图所示,则下列说法正确的是( )A甲同学
11、成绩的极差是17B乙同学的平均成绩较高C乙同学成绩的中位数是85D甲同学成绩的方差较小8频率分布直方图(1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征(2)作频率分布直方图的步骤求极差(即一组数据中最大值与最小值的差)决定组距与组数将数据分组列频率分布表画频率分布直方图(3)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示各小长方形的面积总和等于1.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增
12、加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线例16某农场对一批果实进行称重后得到如图所示的频率分布直方图,从图中看,这一批果实重量(单位:g)的中位数是( )A382.5gB390gC397.5gD402.5g例17某校对该校800名高一年级学生的体重进行调查,他们的体重都处在A,B,C,D四个区间内,根据调查结果得到如下统计图,则下列说法正确的是( )A该校高一年级有300名男生B该校高一年级学生体重在C区间的人数最多C该校高一年级学生体重在C区间的男生人数为175D该校高一年级学生体重在D区间的人数最少例18统计某学校名学生的课外阅读时间,得
13、到如下的频率分布直方图,则这名学生课外阅读时间的中位数约为(保留一位小数)( )ABCD9样本方差与标准差设样本的元素为x1,x2,xn,样本的平均数为,(1)样本方差:s2(x1)2(x2)2(xn)2(2)样本标准差:s 例19已知一组数据,的平均值为3,方差为1,则,的平均值和方差分别为( )A10,4B10,9C9,4D7,4例20已知五个数据3,4,x,6,7的平均数是x,则该样本标准差为( )A1BCD210.综合题例21某大学工商管理专业共有1000名大学生,其中男生有520名为了解该专业大学生的身高情况,李明按男生,女生进行分层,通过分层随机抽样的方法,得到男生,女生的平均身高
14、分别为,假设李明在各层中按比例分配样本(1)如果总样本量为200,那么李明在男生,女生中分别抽取了多少名?(2)请估计这1000名大学生的平均身高(结果精确到0.01)例22某校3000名学生参加了一次校规测验,为了分析这次校规测验的成绩,从中随机抽取了240名学生的成绩绘制成如下的统计表,并已知.分组频数平均分1848364852727590(1)求,的值;(2)估计该校这次校规测验分数不低于60分的人数;(3)估计这次校规测验成绩的平均分.例23某校高一年级共有800名学生参加了数学检测,现随机抽取部分学生的数学成绩并分组如下,得到的频率分布直方图,如图所示(1)求图中实数a的值;(2)试
15、根据以上数据,估计该校高一年级学生的数学检测成绩不低于120分的人数例24某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和(1)求,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否
16、则不认为有显著提高)例25某中学现有学生人,为了解学生数学学习情况,对学生进行了数学测频率试,得分分布在之间,按,分组,得到的频率分布直方图如图所示,且已知.(1)求,的值;(2)估计该中学数学测试的平均分(同组数据以这组数据的中间值作代表);(3)估计该中学数学分数在的人数.参考答案1D【分析】根据题意,结合随机数表抽样的方法,即可求解.【详解】根据随机数表法抽样的方法,根据题意选取规则可得选取的5个样本编号为:02,14,07,32,04,所以选取的第5个个体编号为04.故选:D.2C【分析】一般地,设一个总体含有N个个体,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到
17、的概率相等,则这样的抽样方法叫做简单随机抽样,据此定义逐项判断即可【详解】A是,因为逐个抽取是不放回简单随机抽样.B是有放回简单随机抽样.C不是,因为实数集是无限集.D是无放回简单随机抽样.故选:C.3B【分析】从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,于是将两个数字构成的编号依次写出,然后读取出在01,02,39,40编号内编号(重复的算一次),依次选取5个不重复的即可得到.【详解】解随机数表第1行的第6列和第7列数字为6,4所以从这两个数字开始,由左向右依次选取两个数字如下64,42,16,60,65,80,56,26,16,55,43,50,24,23,54,89
18、,63,21,45,其中落在编号01,02,39,40内的有:16,26,24,23,21,故第5个编号为21.故选B4C【分析】利用系统抽样的抽取特征即可得出结果.【详解】由题每组有6人,第三组抽取的同学编号为16,说明每:组抽取的是第4个,第八组应抽取的是46号故选:C5B【分析】设出第1组抽取的编号为,然后得个抽取的编号,根据题意得到,解之可得第1组的编号,进而可以求出最大组的编号.【详解】设第1个抽取的编号为,则第个抽取的编号为,所以第3个编号为,第13个编号为,又因为第1,3,13个号成等比数列,则,解得,则最大编号为,故选:B.6C【分析】根据分层抽样特征,列方程求解即可.【详解】
19、由分层抽样的方法可设样本中有高中三个年级学生人数为x人,则,解得:故选:C7B【分析】由分层抽样的比例求解.【详解】由题知,不及格的同学有300人,恰好及格的同学有700人,优秀的同学有500人,从中抽取15人的试卷,抽取比例为1100,所以恰好及格的试卷抽取7份,不及格的试卷抽取3份,.故选:B8C【分析】先得到从该校高一年级抽取的学生人数为人,根据分层抽样的方法列出方程,即可求解.【详解】设该校高一年级学生人数为人,由题意,从该校高一年级抽取的学生人数为人,可得,解得人,即从该校高一年级学生的人数为人.故选:C.9A【分析】根据平均数,中位数,众数的概念,分别求出,即可求出结果.【详解】由
20、题意可得,则故选:A.10C【分析】根据题意,结合数据的中位数的概念进行分析,即可求解.【详解】判断是不是能进入决赛,只要判断是不是前8名,所以只要知道其他15位同学的成绩中是不是有8位高于他,也就是把其他15位同学的成绩排列后看第8位的成绩即可,其成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,这个第8位的成绩就是这15位同学成绩的中位数.故选:C.11C【分析】利用求平均数的公式求解即可.【详解】 (岁),即这100位老师的样本的平均年龄约为41.1岁.故选:C.12A【分析】根据百分位数的定义并结合已知条件求出的值,由此可得的值.【详解】因为6=1.8,6=4.8,所以30百分
21、位数为第二个数,即n=28,80百分位数为第五个数即m=48,所以=.故选:A13A【分析】根据题意,第80百分位数是75,那么得到小于75分的学生占总数最多为80%,最多有800人,即是说大于或等于75分的学生数至少有200人.【详解】由100080%=800,所以小于75分的学生最多有800人,所以大于或等于75分的学生至少有200人故选:A14A【分析】由茎叶图数据,求出甲同学的极差,甲、乙同学成绩的中位数,平均数,估计方差,从而解决问题【详解】解:根据茎叶图数据知,甲同学成绩的中位数是81,乙同学成绩的中位数是87.5,甲的中位数小于乙的中位数;甲同学的平均分是,乙同学的平均分是,乙的
22、平均分高;甲同学的极差为;甲同学成绩数据比较集中,方差小,乙同学成绩数据比较分散,方差大正确的说法是故选:A15B【分析】根据极差、均值、中位数、方差的概念,结合茎叶图,应用均值、方差公式求均值、方差,即可判断各项的正误.【详解】A:由图知:甲同学的极差为,错误;B:甲同学平均成绩为,乙同学平均成绩为,所以乙同学的平均成绩较高,正确;C:由图知:乙同学成绩的中位数是86,错误;D:甲,乙,所以乙同学的方差较小,错误.故选:B.16B【分析】通过计算频率,前2组的频率和恰好为,从而可得中位数为390g【详解】由图知组距为80,所以组对应的频率为;组对应的频率为,所以中位数为390g.故选:B17
23、C【分析】分别根据条形图和扇形图求得女生和男生的体重在A、B、C、D区间的人数,逐一判断可得选项.【详解】由题意可得该校高一年级有名女生,则有名男生,则男生体重在A,B,C,D区间内的人数分别为75,150,175,100,从而该校高一年级学生体重在A,B,C,D区间的人数分别为135,270,255,140,故A,B,D错误,C正确故选:C.18B【分析】设出中位数,按照中位数左右面积都为0.5的原则解出答案.【详解】设中位数为,由,可得,由,解得.故选:.19B【分析】利用平均值与方差的线性运算法则计算即可.【详解】平均值为,方差为.故选:B.【点睛】设,则, .20B【分析】先求出的值,
24、然后利用标准差公式求解即可【详解】解:因为五个数据3,4,x,6,7的平均数是x,所以,解得,所以标准差为,故选:B21(1)男生104名,女生96名;(2).【分析】(1)由分层抽样的定义求解即可;(2)用男生的平均身高乘以所占比例,再加女生的平均身高乘以所占比例即可得答案【详解】解:(1)男生被抽取了名,女生被抽取了名(2)这1000名大学生的平均身高的估计值为22(1);(2)人;(3)分.【分析】(1)由已知条件和表中的数据可得从而可求出,的值;(2)利用表中的数据求出样本中校规测验分数不低于60分的频率,然后用频率乘以总人数可得结果;(3)利用平均数的定义直接求解即可【详解】解:(1
25、)由题意得解得(2)样本中校规测验分数不低于60分的频率为,所以估计该校这次校规测验分数不低于60分的人数为.(3)样本的平均分为,所以估计这次校规测验成绩的平均分为分.23(1);(2)【分析】(1)因为图中所有小矩形的面积之和等于1,即可得到方程,解得即可;(2)根据频率分布直方图,求出成绩不低于的频率,即可求出成绩不低于120分的人数【详解】解:(1)因为图中所有小矩形的面积之和等于1,所以,解得(2)根据频率分布直方图,成绩不低于的频率为由于该校高一年级共有学生800名,利用样本估计总体的思想,可估计该校高一年级数学检测成绩不低于的人数为.24(1);(2)新设备生产产品的该项指标的均
26、值较旧设备有显著提高.【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.(2)根据题目所给判断依据,结合(1)的结论进行判断.【详解】(1),.(2)依题意,所以新设备生产产品的该项指标的均值较旧设备有显著提高.25(1);(2);(3).【分析】(1)由频率分布直方图联立方程,求出答案;(2)由频率分布直方图,直接求平均分;(3)分别求出该中学数学分数在和的频率和人数进一步求出答案.【详解】(1)由频率分布直方图可得,解得.(2)由频率分布直方图可得,估计该中学数学测试的平均分为.(3)因为该中学数学分数在的频率是,所以估计该中学数学分数在的人数是;同理,因为该中学数学分数在的频率是,所以估计该中学数学分数在的人数是.所以估计该中学数学分数在的人数为.