1、第四节用样本估计总体,总纲目录,教材研读,1.作频率分布直方图的步骤,考点突破,2.频率分布折线图和总体密度曲线,3.茎叶图的优点,考点二茎叶图,考点一频率分布直方图,4.样本的数字特征,考点三样本的数字特征,1.作频率分布直方图的步骤(1)求极差(一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.,教材研读,2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:一般地,随着样本容量的增加,作频率分布直方图时所分组数增加,组距减小,相应的频率分布
2、折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.,3.茎叶图的优点茎叶图的优点是可以?保留原始数据,而且可以?随时记录.,4.样本的数字特征(1)众数、中位数、平均数,.(ii)方差:标准差的平方s2.s2=?(x1-?)2+(x2-?)2+(xn-?)2.,(2)标准差、方差(i)标准差:表示样本数据到平均数的一种平均距离.一般用s表示,s=,与平均数有关的结论(1)若给定一组数据x1,x2,xn的平均数为?,则ax1,ax2,axn的平均数为a .(2)若给定一组数据x1,x2,xn的平均数为?,则ax1+b,ax2+b,axn+b的平均数为a?+b.(3)若M个数
3、的平均数是X,N个数的平均数是Y,则这(M+N)个数的平均数是?;若两组数据x1,x2,xn和y1,y2,yn的平均数分别是?和?,则x1+y1,x2+y2,xn+yn的平均数是?+?.,与方差有关的结论(1)若给定一组数据x1,x2,xn,其方差为s2,则ax1,ax2,axn的方差为a2s2.(2)若给定一组数据x1,x2,xn,其方差为s2,则ax1+b,ax2+b,axn+b的方差为a2s2,特别地,当a=1时,有x1+b,x2+b,xn+b的方差为s2,这说明将一组数据的每一个数据都加上一个相同的常数,方差是不变的,即不影响数据的波动性.,1.某中学初中部共有110名教师,高中部共有
4、150名教师,其性别比例如图所示,则该校女教师的人数为?()?A.93B.123C.137D.167,答案C初中部女教师人数为11070%=77,高中部女教师人数为150(1-60%)=60,所以该校女教师的人数为77+60=137.故选C.,C,2.10名工人某天生产同一种零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有?()A.abcB.bcaC.cabD.cba,答案Da=?=14.7,因为这组数据中,17出现的次数最多,故c=17.这些数据由小到大排列依次是10,12,14,14,15,15,16,17,17,
5、17,因此b=15,所以cba.,D,3.(2017北京海淀二模)北京市2016年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是 ()?A.第一季度B.第二季度,C.第三季度D.第四季度,答案B方差越小数据越稳定,由题图知,第二季度的三个月波动最小.,B,4.(2016北京东城二模)下图是一组数据的频率分布直方图,估计该组数据的中位数是?()?A.10B.12C.13D.16,C,答案C由题图可设该组数据的中位数为10+x,由题意,得0.045+x0.1=0.5,解得x=3,故估计该组数据的中位数是13.,5.(2015北京通州一模)某同学7
6、次考试的分数的茎叶图如图所示,这名同学7次考试的分数的平均数是86,那么m=.,3,考点突破,(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.,解析本题考查频率分布直方图,古典概型,分层抽样方法.考查运算求解能力.(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400
7、名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)10=0.9,分数在区间40,50)内的人数为100-1000.9-5=5.所以总体中分数在区间40,50)内的人数估计为400?=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)10100=60,所以样本中分数不小于70的男生人数为60?=30.,所以样本中的男生人数为302=60,女生人数为100-60=40,男生和女生人数的比例为6040=32.所以根据分层抽样原理,总体中男生和女生人数的比例估计为32.,1-1(20
8、17北京朝阳二模)从某中学随机选取了40名男生,将他们的身高作为样本进行统计,得到如图所示的频率分布直方图.观察图中数据,完成下列问题.(1)求a的值及样本中男生身高在185,195(单位:cm)的人数;(2)假设同一组中的每个数据可用该组区间的中点值代替,试估计该校全体男生的平均身高;(3)在样本中,从身高在145,155)和185,195(单位:cm)内的男生中任选两人,求这两人的身高都不低于185 cm的概率.,解析(1)根据题意,得(0.005+a+0.020+0.025+0.040)10=1,解得a=0.010.所以样本中男生身高在185,195(单位:cm)内的人数为400.011
9、0=4.(2)?=1500.05+1600.2+1700.4+1800.25+1900.1=7.5+32+68+45+19=171.5(cm).所以,估计该校全体男生的平均身高为171.5 cm.(3)在样本中,男生身高在145,155)内的人数为400.00510=2,记这两人分别为A,B.由(1)可知,男生身高在185,195内的人数为4,记这四人分别为a,b,c,d.所以,身高在145,155)和185,195内的男生共6人.从这6人中任意选取2人,有ab,ac,ad,aA,aB,bc,bd,bA,bB,cd,cA,cB,dA,dB,AB,共15种情况.记“所选两人的身高都不低于185
10、cm”为事件M,事件M包括ab,ac,ad,bc,bd,cd,共6种情况.所以P(M)=?=?.,典例2(1)(2016北京丰台一模)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用茎叶图表示,如图,则甲、乙两名运动员得分的中位数分别为?(),考点二茎叶图,A.20、18B.13、19C.19、13D.18、20,(2)(2017北京东城二模)如图所示茎叶图记录了甲,乙两班各六名同学一周的课外阅读时间(单位:小时),已知甲班数据的平均数为13,乙班数据的中位数为17,那么x的位置应填,y的位置应填.,解析(1)由茎叶图知甲的分数分别为6,8,9,15,17,19,23,
11、24,26,32,41,共11个数据,中位数是最中间的数19;乙的分数分别为5,7,8,11,11,13,20,22,30,31,40,共11个数据,中位数是最中间的数13.故选C.(2)由甲班数据的平均数为?=13,解得x=3,由乙班数据的中位数为?=17,得y=8.,答案(1)C(2)3;8,规律总结(1)绘制茎叶图时需注意:“叶”的每个位置上只有一个数字,而“茎”的每个位置上的数的位数一般不需要统一;重复出现的数据要重复记录,不能遗漏.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪块茎,数据分布是否均匀
12、等.,2-1(2018北京海淀高三期末)下面的茎叶图记录的是甲、乙两个班级各5个同学在一次数学测试中的选择题的成绩(单位:分,每道题5分,共8道题):?已知两组数据的平均数相等,则x,y的值分别为?()A.0,0B.0,5C.5,0D.5,5,B,答案B由两组数据平均数相等,可得?=?,化简可得y=x+5,且x10,y10,根据选项可知y=5,x=0,故选B.,典例3(2017北京丰台一模)某校学生营养餐由A和B两家配餐公司配送.学校为了解学生对这两家配餐公司的满意度,采用问卷的形式,随机抽取了40名学生对两家公司分别评分.根据收集的80份问卷的评分,得到A公司满意度评分的频率分布直方图和B公
13、司满意度评分的频数分布表:,考点三样本的数字特征,(1)根据A公司的频率分布直方图,估计该公司满意度评分的中位数;(2)从满意度高于90分的问卷中随机抽取两份,求这两份问卷都是给A公司评分的概率;(3)请从统计角度,对A、B两家公司作出评价.,解析(1)设A公司调查的40份问卷的中位数为x分,则有0.01510+0.02510+0.03(x-70)=0.5.解得x73.3.估计该公司满意度得分的中位数为73.3分.(2)满意度高于90分的问卷共有6份,其中4份评价A公司,设为a1,a2,a3,a4,2份评价B公司,设为b1,b2.从这6份问卷中随机抽取2份,所有可能的结果为(a1,a2),(a1,a3),(a1,a4),(a1,b1),(a1,b2),(a2,a3),(a2,a4),(a2,b1),(a2,b2),(a3,a4),(a3,b1),(a3,b2),(a4,b1),(a4,b2),(b1,b2),共15种.其中2份问卷都评价A公司的有以下6种情况:(a1,a2),(a1,a3),(a1,a4),(a2,a3),(a2,a4),(a3,a4).,设两份问卷均是评价A公司为事件C,则P(C)=?=?.(3)由所给两个公司的调查满意度得分知,A公司得分的中位数低