1、20版新教材人教B高中数学必修二51.1.用样本估计总体用样本估计总体(1)(1)前提前提样本的容量恰当样本的容量恰当,抽样方法合理抽样方法合理.(2)(2)必要性必要性在容许一定误差存在的前提下在容许一定误差存在的前提下,可以用样本估计总体可以用样本估计总体,这样能节省人力和物力这样能节省人力和物力.有时候总体的数字特征不可能获得有时候总体的数字特征不可能获得,只能用样本估计只能用样本估计总体总体.(3)(3)误差误差估计一般是估计一般是有误差有误差的的.但是但是,大数定律可以保证大数定律可以保证,当样本当样本的容量越来越大时的容量越来越大时,估计的误差很小的可能性将越来越估计的误差很小的可
2、能性将越来越大大.【思考思考】用样本估计总体出现误差的原因有哪些用样本估计总体出现误差的原因有哪些?提示提示:样本抽取的随机性样本抽取的随机性;样本抽取的方法不合适样本抽取的方法不合适,导致导致代表性差代表性差;样本容量偏少等样本容量偏少等.2.2.用样本的数字特征来估计总体的数字特征用样本的数字特征来估计总体的数字特征(1)(1)一般来说一般来说,在估计总体的数字特征时在估计总体的数字特征时,只需直接算出只需直接算出样本对应的数字特征即可样本对应的数字特征即可.(2)(2)样本是用分层抽样得到的样本是用分层抽样得到的,由每一层的数字特征估由每一层的数字特征估计总体的数字特征计总体的数字特征.
3、以分两层抽样的情况为例以分两层抽样的情况为例.3.3.用样本的分布来估计总体的分布用样本的分布来估计总体的分布如果总体在每一个分组的频率记为如果总体在每一个分组的频率记为1 1,2 2,n n,样样本在每一组对应的频率记为本在每一组对应的频率记为p p1 1,p,p2 2,p,pn n,一般来说一般来说,不等于零不等于零.当样本的容量越来越大时当样本的容量越来越大时,上上式很小的可能性将越来越大式很小的可能性将越来越大.n2iii 11(p)n【素养小测素养小测】1.1.思维辨析思维辨析(对的打对的打“”“”,错的打错的打“”)”)(1)(1)样本的数字特征有随机性样本的数字特征有随机性.()
4、(2)(2)只要样本抽取合理只要样本抽取合理,样本平均数与总体平均数相等样本平均数与总体平均数相等.()(3)(3)一般地一般地,样本容量越大样本容量越大,用样本去估计总体就越准确用样本去估计总体就越准确.()提示提示:(1).(1).在抽样过程中在抽样过程中,抽取的样本是具有随机性抽取的样本是具有随机性的的,因此样本的数字特征也有随机性因此样本的数字特征也有随机性.(2)(2).一般地一般地,样本平均数与总体的平均数的大小关系样本平均数与总体的平均数的大小关系是不确定的是不确定的.(3).(3).大数定律保证大数定律保证,样本容量越大样本容量越大,用样本去估计总用样本去估计总体就越准确体就越
5、准确.2.2.已知样本已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,11,12,9,10,11,10,那么频率为那么频率为0.20.2的范围是的范围是()A.5.5A.5.57.5 7.5 B.7.5B.7.59.59.5C.9.5C.9.511.511.5D.11.5D.11.513.513.5【解析解析】选选D.D.共共2020个数据个数据,频率为频率为0.2,0.2,在此范围内的数在此范围内的数据有据有4 4个个,只有在只有在11.511.513.513
6、.5范围内有范围内有4 4个数据个数据:13,12,:13,12,12,12.12,12.3.3.如图所示是容量为如图所示是容量为100100的样本的频率分布直方图的样本的频率分布直方图,则由图中的数据可知则由图中的数据可知,样本落在样本落在15,2015,20内的频数内的频数为为()A.20A.20 B.30 B.30 C.40 C.40 D.50D.50【解析解析】选选B.B.样本数据落在样本数据落在15,2015,20内的频数为内的频数为1001001-51-5(0.04+0.1)=30.(0.04+0.1)=30.4.4.为了解某校教师使用多媒体进行教学的情况为了解某校教师使用多媒体进
7、行教学的情况,采用简采用简单随机抽样的方法单随机抽样的方法,从该校从该校200200名教师中抽取名教师中抽取2020名名,调查调查了他们上学期使用多媒体进行教学的次数了他们上学期使用多媒体进行教学的次数,结果用茎叶结果用茎叶图表示如图图表示如图:据此可估计该校上学期据此可估计该校上学期200200名教师中名教师中,使用多媒体进行使用多媒体进行教学次数在教学次数在15,25)15,25)内的人数为内的人数为_._.【解析解析】在抽取的在抽取的2020名教师中名教师中,在在15,25)15,25)内的人数为内的人数为6,6,据此可估计该校上学期据此可估计该校上学期200200名教师中名教师中,使用
8、多媒体进行使用多媒体进行教学的次数在教学的次数在15,25)15,25)内的人数为内的人数为60.60.答案答案:6060类型一用样本的数字特征估计总体的数字特征类型一用样本的数字特征估计总体的数字特征【典例典例】1.1.对某商店一个月内每天的顾客人数进行了统对某商店一个月内每天的顾客人数进行了统计计,得到样本的茎叶图得到样本的茎叶图(如图所示如图所示),),则可估计该商店每天则可估计该商店每天的顾客人数的中位数、众数、极差分别是的顾客人数的中位数、众数、极差分别是()A.46,45,56A.46,45,56 B.46,45,53 B.46,45,53C.47,45,56C.47,45,56
9、D.45,47,53 D.45,47,532.2.下表是某超市下表是某超市5 5月份一周的利润情况记录月份一周的利润情况记录:根据上表你估计该超市今年五月份的总利润是根据上表你估计该超市今年五月份的总利润是()A.6.51A.6.51万元万元 B.6.4B.6.4万元万元C.1.47C.1.47万元万元 D.5.88D.5.88万元万元3.3.为比较甲、乙两地某月为比较甲、乙两地某月1414时的气温情况时的气温情况,随机选取该随机选取该月中的月中的5 5天天,将这将这5 5天中天中1414时的气温数据时的气温数据(单位单位:):)制成制成如图所示的茎叶图如图所示的茎叶图.考虑以下结论考虑以下结
10、论:甲地该月甲地该月1414时的平均气温低于乙地该月时的平均气温低于乙地该月1414时的平均时的平均气温气温;甲地该月甲地该月1414时的平均气温高于乙地该月时的平均气温高于乙地该月1414时的平均时的平均气温气温;甲地该月甲地该月1414时的气温的标准差小于乙地该月时的气温的标准差小于乙地该月1414时的时的气温的标准差气温的标准差;甲地该月甲地该月1414时的气温的标准差大于乙地该月时的气温的标准差大于乙地该月1414时的时的气温的标准差气温的标准差.其中根据茎叶图能得到的正确的统计结论的编号其中根据茎叶图能得到的正确的统计结论的编号为为()A.A.B.B.C.C.D.D.【思维思维引引】
11、1.1.弄清茎叶图中数据的个数和从小到大弄清茎叶图中数据的个数和从小到大的排列顺序的排列顺序,确定中位数、众数、极差确定中位数、众数、极差.2.2.先计算一天的平均利润的估计值先计算一天的平均利润的估计值,再估算五月份的总再估算五月份的总利润利润;3.3.根据相关公式求平均数和标准差根据相关公式求平均数和标准差,进行判断进行判断;也可根也可根据茎叶图中数据的分布规律直接判断数据的波动大小据茎叶图中数据的分布规律直接判断数据的波动大小.【解析解析】1.1.选选A.A.由题意知各数为由题意知各数为12,15,20,22,23,23,12,15,20,22,23,23,31,32,34,34,38,
12、39,45,45,45,47,47,48,48,49,50,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,50,51,51,54,57,59,61,67,68,中位数是中位数是46,46,众数是众数是45,45,最大数为最大数为68,68,最小数为最小数为12,12,极差为极差为68-12=56.68-12=56.2.2.选选A.A.从表中一周的利润可得一天的平均利润为从表中一周的利润可得一天的平均利润为 =0.21.=0.21.又五月份共有又五月份共有3131天天,所以五月份的总利润约是所以五月
13、份的总利润约是0.210.2131=6.51(31=6.51(万元万元).).0.20 0.170.230.210.230.180.25x73.3.选选B.B.方法一方法一:因为因为 所以所以 又又 所以所以s s甲甲ss乙乙.故可判断结论正确故可判断结论正确.2628293131x295甲,282930 3132x305乙 ,xx甲乙,229 10 44184 10 14ss2555甲乙 ,方法二方法二:甲地该月甲地该月1414时的气温数据分布在时的气温数据分布在2626和和3131之之间间,且数据波动较大且数据波动较大,而乙地该月而乙地该月1414时的气温数据分布时的气温数据分布在在282
14、8和和3232之间之间,且数据波动较小且数据波动较小,可以判断结论可以判断结论正确正确.【内化内化悟悟】用样本的数字特征来描述总体的数字特征时用样本的数字特征来描述总体的数字特征时,通常从哪通常从哪两个方面分析两个方面分析?提示提示:(1)(1)分析数据的集中趋势或取值的平均水平分析数据的集中趋势或取值的平均水平,如平如平均数、众数、中位数、百分位数均数、众数、中位数、百分位数;(2)(2)分析数据的离散程度或围绕平均数波动的大小分析数据的离散程度或围绕平均数波动的大小,如如极差、方差和标准差极差、方差和标准差.标准差、方差越大标准差、方差越大,数据离散程数据离散程度越大度越大,越不稳定越不稳
15、定;标准差、方差越小标准差、方差越小,数据的离散程度数据的离散程度越小越小,越稳定越稳定.【类题类题通通】1.1.用样本的数字特征估计总体的数字特征的可行性用样本的数字特征估计总体的数字特征的可行性(1)(1)如果抽样的方法比较合理如果抽样的方法比较合理,那么样本可以反映总体那么样本可以反映总体的信息的信息,但从样本得到的信息会有偏差但从样本得到的信息会有偏差,这些偏差是由这些偏差是由样本的随机性引起的样本的随机性引起的.(2)(2)虽然样本的数字特征并不是总体真正的数字特征虽然样本的数字特征并不是总体真正的数字特征,而是总体的一个估计而是总体的一个估计,但这种估计是合理的但这种估计是合理的,
16、特别是当特别是当样本容量很大时样本容量很大时,样本的数字特征稳定于总体的数字特样本的数字特征稳定于总体的数字特征征.2.2.样本数字特征所反映的样本的特征样本数字特征所反映的样本的特征一般地一般地,平均数反映的是样本个体的平均水平平均数反映的是样本个体的平均水平,众数和众数和中位数则反映样本中个体的中位数则反映样本中个体的“重心重心”,而标准差则反映而标准差则反映了样本的波动程度、离散程度了样本的波动程度、离散程度,即均衡性、稳定性、差即均衡性、稳定性、差异性等异性等.因此因此,我们可以根据问题的需要选择用样本的我们可以根据问题的需要选择用样本的不同数字特征来分析问题不同数字特征来分析问题.【
17、习练习练破破】(2019(2019中山高一检测中山高一检测)若八个学生参加合唱比赛的得若八个学生参加合唱比赛的得分分别为分分别为87,88,90,91,92,93,93,94,87,88,90,91,92,93,93,94,则这组数据的方则这组数据的方差是差是_._.【解析解析】(87+88+90+91+92+93+93+94)=91,(87+88+90+91+92+93+93+94)=91,s s2 2=(87-91)=(87-91)2 2+(88-91)+(88-91)2 2+(90-91)+(90-91)2 2+(91-91)+(91-91)2 2+(92-+(92-91)91)2 2+
18、(93-91)+(93-91)2 2+(93-91)+(93-91)2 2+(94-91)+(94-91)2 2=5.5.=5.5.答案答案:5.55.51x818【加练加练固固】林管部门在每年林管部门在每年3 3月月1212日植树节前日植树节前,为保证树苗的质量为保证树苗的质量,都会对树苗进行检测都会对树苗进行检测,现从甲乙两种树苗中抽测了现从甲乙两种树苗中抽测了1010株株树苗的高度树苗的高度,其茎叶图如图其茎叶图如图,下列描述正确的是下列描述正确的是()A.A.甲种树苗的平均高度大于乙种树苗的平均高度甲种树苗的平均高度大于乙种树苗的平均高度,且甲且甲种树苗比乙种树苗长得整齐种树苗比乙种树
19、苗长得整齐.B.B.甲种树苗的平均高度大于乙种树苗的平均高度甲种树苗的平均高度大于乙种树苗的平均高度,但乙但乙种树苗比甲种树苗长得整齐种树苗比甲种树苗长得整齐.C.C.乙种树苗的平均高度大于甲种树苗的平均高度乙种树苗的平均高度大于甲种树苗的平均高度,且乙且乙种树苗比甲种树苗长得整齐种树苗比甲种树苗长得整齐.D.D.乙种树苗的平均高度大于甲种树苗的平均高度乙种树苗的平均高度大于甲种树苗的平均高度,但甲但甲种树苗比乙种树苗长得整齐种树苗比乙种树苗长得整齐.【解析解析】选选D.D.由茎叶图中的数据由茎叶图中的数据,我们可得甲、乙两种我们可得甲、乙两种树苗抽取的样本高度分别为树苗抽取的样本高度分别为:
20、甲甲:19,20,21,23,25,29,31,32,33,37:19,20,21,23,25,29,31,32,33,37乙乙:10,10,14,26,27,30,44,46,46,47:10,10,14,26,27,30,44,46,46,47由已知易得由已知易得:=(19+20+21+23+25+29+31+32+33+37)=(19+20+21+23+25+29+31+32+33+37)10=27,10=27,x甲 =(10+10+14+26+27+30+44+46+46+47)=(10+10+14+26+27+30+44+46+46+47)10=30,10=30,故乙种树苗的平均高度
21、大于甲种树苗的平均高度故乙种树苗的平均高度大于甲种树苗的平均高度,甲种甲种树苗比乙种树苗长得整齐树苗比乙种树苗长得整齐.x乙22ss甲乙类型二用样本的分布估计总体的分布类型二用样本的分布估计总体的分布【典例典例】1.1.如图是一容量为如图是一容量为100100的样本的的样本的重量的频率分布直方图重量的频率分布直方图,则由图可估计样则由图可估计样本的众数与中位数分别为本的众数与中位数分别为()A.13,12A.13,12B.12.5,12B.12.5,12C.12.5,11C.12.5,11 D.12,11D.12,112.(20192.(2019全国卷全国卷)某行业主管部门为了解本行业中某行业
22、主管部门为了解本行业中小企业的生产情况小企业的生产情况,随机调查了随机调查了100100个企业个企业,得到这些企得到这些企业第一季度相对于前一年第一季度产值增长率业第一季度相对于前一年第一季度产值增长率y y的频数的频数分布表分布表.世纪金榜导学号世纪金榜导学号(1)(1)分别估计这类企业中产值增长率不低于分别估计这类企业中产值增长率不低于40%40%的企业的企业比例、产值负增长的企业比例比例、产值负增长的企业比例.(2)(2)求这类企业产值增长率的平均数与标准差的估计值求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表同一组中的数据用该组区间的中点值为代表)
23、.().(精确精确到到0.01)0.01)附附:8.602.8.602.74【思维思维引引】1.1.众数是最高的矩形的底边的中点众数是最高的矩形的底边的中点,中位中位数左边和右边的直方图的面积相等数左边和右边的直方图的面积相等,都是都是0.5.0.5.2.(1)2.(1)用样本中用样本中 内的比例估计产内的比例估计产值增长率不低于值增长率不低于40%40%的企业比例的企业比例,内的比例估计内的比例估计产值负增长的企业比例产值负增长的企业比例;(2)(2)根据公式求平均数根据公式求平均数.0.40,0.60)0.60,0.80)和 0.20,0)【解析解析】1.1.选选B.B.观察频率分布直方图
24、可知众数为观察频率分布直方图可知众数为 =12.5,=12.5,设中位数为设中位数为x,x,则则0.060.065+5+0.1=0.5,0.1=0.5,解得解得x=12x=122.(1)2.(1)根据产值增长率频数分布表得根据产值增长率频数分布表得,所调查的所调查的100100个企个企业中产值增长率不低于业中产值增长率不低于40%40%的企业频率为的企业频率为 =0.21.=0.21.产值负增长的企业频率为产值负增长的企业频率为 =0.02.=0.02.10 152147100(x10)2100用样本频率分布估计总体分布得这类企业中产值增长用样本频率分布估计总体分布得这类企业中产值增长率不低于
25、率不低于40%40%的企业比例为的企业比例为21%,21%,产值负增长的企业比例产值负增长的企业比例为为2%.2%.(2)(-0.10(2)(-0.102+0.102+0.1024+0.3024+0.3053+0.5053+0.5014+0.7014+0.707)=0.30,7)=0.30,s s2 2=(-0.40)=(-0.40)2 22+(-0.20)2+(-0.20)2 2 24+024+02 253+0.2053+0.202 214+0.4014+0.402 277=0.029 6,=0.029 6,所以所以s=0.02s=0.02 0.17,0.17,1y10052iii 111n
26、(yy)1001000.029 674所以所以,这类企业产值增长率的平均数与标准差的估计值这类企业产值增长率的平均数与标准差的估计值分别为分别为30%,17%.30%,17%.【素养素养探探】在与用样本的分布估计总体的分布的问题中在与用样本的分布估计总体的分布的问题中,经常利用经常利用核心素养中的数据分析核心素养中的数据分析,通过研究样本的频数、频率分通过研究样本的频数、频率分布布,估计总体的频数、频率分布估计总体的频数、频率分布,培养学生用样本估计培养学生用样本估计总体的统计思想总体的统计思想.在本例在本例1 1的条件下的条件下,求平均重量求平均重量.【解析解析】平均重量为平均重量为7.57
27、.55 50.06+12.50.06+12.55 50.1+17.50.1+17.5 =12.=12.(1 5 0.065 0.1)【类题类题通通】1.1.总体的分布分两种情况总体的分布分两种情况(1)(1)当总体中的个体取值很少时当总体中的个体取值很少时,用茎叶图估计总体的用茎叶图估计总体的分布分布;(2)(2)当总体中的个体取值较多时当总体中的个体取值较多时,将样本数据恰当分组将样本数据恰当分组,用各组的频率分布描述总体的分布用各组的频率分布描述总体的分布,方法是用频率分布方法是用频率分布表或频率分布直方图表或频率分布直方图.2.2.利用频率分布直方图求数字特征利用频率分布直方图求数字特征
28、(1)(1)在频率分布直方图中在频率分布直方图中,众数是最高的矩形的底边的众数是最高的矩形的底边的中点中点.(2)(2)在频率分布直方图中在频率分布直方图中,中位数左边和右边的直方图中位数左边和右边的直方图的面积相等的面积相等.(3)(3)平均数等于频率分布直方图中每个小矩形的面积乘平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和以小矩形底边中点的横坐标之和.【习练习练破破】已知某人工养殖观赏鱼池塘中养殖着大量的红鲫鱼与已知某人工养殖观赏鱼池塘中养殖着大量的红鲫鱼与中国金鱼中国金鱼.为了估计池塘中这两种鱼的数量为了估计池塘中这两种鱼的数量,养殖人员养殖人员从水库中捕出了
29、红鲫鱼与中国金鱼各从水库中捕出了红鲫鱼与中国金鱼各1 0001 000条条,给每条给每条鱼作上不影响其存活的记号鱼作上不影响其存活的记号,然后放回池塘然后放回池塘,经过一定经过一定时间时间,再每次从池塘中随机捕出再每次从池塘中随机捕出1 0001 000条鱼条鱼,分类记录下分类记录下其中有记号的鱼的数目其中有记号的鱼的数目,随即将它们放回池塘中随即将它们放回池塘中.这样这样的记录作了的记录作了1010次次,将记录获取的数据作成如下所示的茎将记录获取的数据作成如下所示的茎叶图叶图.根据茎叶图计算有记号的红鲫鱼与中国金鱼数目的平根据茎叶图计算有记号的红鲫鱼与中国金鱼数目的平均数均数,并估计池塘中的
30、红鲫鱼与中国金鱼的数量并估计池塘中的红鲫鱼与中国金鱼的数量.【解析解析】由茎叶图可求出由茎叶图可求出1010次记录下的有记号的红鲫次记录下的有记号的红鲫鱼与中国金鱼数目的平均数均为鱼与中国金鱼数目的平均数均为20,20,故认为池塘中的红故认为池塘中的红鲫鱼与中国金鱼的数目相同鲫鱼与中国金鱼的数目相同,设池塘中两种鱼的总数是设池塘中两种鱼的总数是x,x,则有则有 即即x=50 000,x=50 000,所以所以,可可估计池塘中的红鲫鱼与中国金鱼的数量均为估计池塘中的红鲫鱼与中国金鱼的数量均为25 00025 000条条.402 0001 000 x,2 000 1 00040【加练加练固固】1.
31、1.党的十八大以来党的十八大以来,脱贫攻坚取得显著成绩脱贫攻坚取得显著成绩.2013.2013年至年至20162016年年4 4年间年间,累计脱贫累计脱贫5 5645 564万人万人,2017,2017年各地根据实年各地根据实际进行创新际进行创新,精准、高效地完成了脱贫任务精准、高效地完成了脱贫任务.某地区对某地区对当地当地3 0003 000户家庭的户家庭的20172017年所得年收入情况调查统计年所得年收入情况调查统计,年收入的频率分布直方图如图所示年收入的频率分布直方图如图所示,数据数据(单位单位:千元千元)的分组依次为的分组依次为20,40),40,60),60,80),80,100,
32、20,40),40,60),60,80),80,100,则则年收入不超过年收入不超过6 6万的家庭大约为万的家庭大约为()A.900A.900户户B.600B.600户户C.300C.300户户D.150D.150户户【解析解析】选选A.A.由频率分布直方图得由频率分布直方图得:年收入不超过年收入不超过6 6万万的家庭所占频率为的家庭所占频率为:(0.005+0.010):(0.005+0.010)20=0.3,20=0.3,所以年收所以年收入不超过入不超过6 6万的家庭大约为万的家庭大约为0.30.33 000=900(3 000=900(户户).).2.2.为了了解高一年级学生的体能情况为
33、了了解高一年级学生的体能情况,某校抽取部分学某校抽取部分学生进行一分钟跳绳次数测试生进行一分钟跳绳次数测试,将所得数据整理后将所得数据整理后,画出画出频率分布直方图频率分布直方图(如图所示如图所示),),图中从左到右各小长方形图中从左到右各小长方形的面积之比为的面积之比为24171593,24171593,第二小组的频数为第二小组的频数为12.12.(1)(1)第二小组的频率是多少第二小组的频率是多少?样本容量是多少样本容量是多少?(2)(2)若次数在若次数在110110以上以上(含含110110次次)为达标为达标,则该校全体高则该校全体高一年级学生的达标率是多少一年级学生的达标率是多少?【解析解析】(1)(1)频率分布直方图是以面积的形式反映了频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的数据落在各小组内的频率大小的,因此第二小组的频因此第二小组的频率为率为 =0.08.=0.08.又因为第二小组的频率又因为第二小组的频率=,=,所以样本容所以样本容量量=150.=150.424 17 1593第二小组的频数样本容量120.08第二小组的频数第二小组的频率(2)(2)由直方图可估计该校高一年级学生的达标率为由直方图可估计该校高一年级学生的达标率为 100%=88%.100%=88%.17 159324 17 1593