1、4.1样本的数字特征 4.2分层随机抽样的均值与方差 4.3百分位数 激趣诱思知识点拨 应届毕业生王刚想找一份年薪8万元的工作.有一位招聘员告诉 王刚:“我们公司50名员工中,最高年收入达到了100万元,他们平均 年收入是10万元,加盟我们公司吧.” 根据以上信息,能否判断王刚可以成为此公司的一名高收入者? 如果招聘员继续告诉王刚:“员工年收入的变化范围是从7万元到 100万元.”这个信息是否可以促使王刚做出决定? 激趣诱思知识点拨 一、样本的数字特征 1.众数、中位数、平均数 众数、中位数、平均数刻画了一组数据的. (1)众数 一组数据中,出现次数最多的数据就是众数.若有两个或几个数据 出现
2、的次数相等且都最多,则这些数都是这组数据的众数;若一组 数据中,每个数据出现的次数都一样,则这组数据没有众数. (2)中位数 一般地,将一组数据按从小到大的顺序排列后,“中间”的那个数据为 这组数据的中位数. 提示:当数据有奇数个时,位于最中间位置的数就是中位数;当数据 有偶数个时,位于最中间的两个数的平均数就是中位数. 集中趋势 激趣诱思知识点拨 (3)平均数 一组数据的平均值,数据x1,x2,xn的平均数为 名师点析众数、中位数、平均数的比较 激趣诱思知识点拨 2.极差、方差、标准差 极差、方差、标准差刻画了一组数据的. (1)极差:把一组数据中. (2)方差:设一组数据为x1,x2,x3
3、,xn,其平均数为 ,则方差s2= ,其单位是原始观测数据单位的,方差刻画的是数据偏 离平均数的离散程度. 离散程度 最大值与最小值的差 平方 激趣诱思知识点拨 (3)标准差 定义:它是方差的正的平方根, = ,其单位与原 始测量单位. 计算方法:先求出方差s2,再求方差的算术平方根,即得标准差 相同 激趣诱思知识点拨 名师点析计算方差、标准差的步骤 计算样本数据x1,x2,xn的标准差的算法如下: 第一步:算出样本数据的平均数 ; 第二步:算出每个样本数据与样本平均数的差xi- (i=1,2,n); 第三步:算出第二步中xi- (i=1,2,n)的平方; 第四步:算出第三步中n个平方数的平均
4、数,即为样本方差; 第五步:算出第四步中平均数的算术平方根,即为样本标准差. 激趣诱思知识点拨 微练习1 已知一组数据10,30,50,50,60,70,80.其中平均数、中位数和众数的 大小关系是() A.平均数中位数众数 B.平均数中位数众数 C.中位数众数平均数 D.众数=中位数=平均数 答案:D 解析:由所给数据可得平均数为50,中位数为50,众数为50,因此众数 =中位数=平均数. 激趣诱思知识点拨 微拓展1 怎样由频率分布直方图估计样本的众数、中位数、平均数. 提示:(1)在频率分布直方图中,众数是最高的小长方形的中点.(2)在 样本中,有50%的个体小于或等于中位数,也有50%的
5、个体大于或等 于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图 的面积应相等.平均数的估计值等于频率分布直方图中每个小矩形 的面积乘以小矩形的底边中点的横坐标之和. 激趣诱思知识点拨 微练习2 从一堆苹果中任取5个,称得它们的质量如下(单位:克): 125124121123127 则该样本的标准差s=(克)(用数字作答). 答案: 2 激趣诱思知识点拨 微拓展2 平均数与方差有哪些性质? 激趣诱思知识点拨 二、分层随机抽样的均值与方差 1.分层随机抽样的平均数 (1)定义:一般地,将样本a1,a2,am和样本b1,b2,bn合并成一个新样 本,则这个新样本的平均数为 激趣诱思知识点
6、拨 激趣诱思知识点拨 微练习 甲、乙两人进行射击比赛,甲射击6次,成绩分别为10,9,8,7,8,6;乙射 击4次,成绩分别为9,8,7,10.则甲、乙两人共射击10次的平均成绩和 方差分别是多少? 激趣诱思知识点拨 三、百分位数 p分位数:一般地,当总体是连续变量时,给定一个百分数p(0,1),总 体的p分位数有这样的特点:总体数据中任意一个小于或等于它的 可能性是p. 名师点析直观地说,一组数p%分位数指的是,将这组数按照从小到 大的顺序排列后,处于p%位置的数. 激趣诱思知识点拨 微练习 求数据11,17,19,21,22,24,24,30,30,32中的60%分位数. 探究一探究二探究
7、三素养形成当堂检测 平均数、众数、中位数的求法平均数、众数、中位数的求法 例1在一次中学生田径运动会上,参加男子跳高的17名运动员的成 绩如表所示. 分别求这些运动员成绩的众数、中位数与平均数.(结果精确到0.01) 探究一探究二探究三素养形成当堂检测 解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众 数是1.75.题目中表里的17个数据可看成是按从小到大的顺序排列 的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数 是1.70.这组数据的平均数是 探究一探究二探究三素养形成当堂检测 反思感悟中位数、众数、平均数的应用要点 中位数、众数反映了一组数据的“中等
8、水平”“多数水平”,平均数反 映了数据的平均水平,我们需根据实际需要选择使用. (1)求中位数的关键是将数据排序,一般按照从小到大的顺序排列. 中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影 响.中位数可能在所给数据中,也可能不在所给数据中.当一组数据 中的个别数据变动较大时,可用中位数描述数据的集中趋势. (2)确定众数的关键是统计各数据出现的频数,频数最大的数据就是 众数.当一组数据中有不少数据多次重复出现时,众数往往更能反 映数据的集中趋势. (3)平均数与每一个样本数据都有关,受个别极端数据(比其他数据 大很多或小很多的数据)的影响较大,因此若在数据中存在少量极 端数据,平
9、均数对总体估计的可靠性较差,这时往往用众数或中位 数去估计总体.有时也采用剔除最大值与最小值后所得的平均数去 估计总体. 探究一探究二探究三素养形成当堂检测 变式训练1(1)16位参加百米赛跑半决赛同学的成绩各不相同,按成 绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断能否进 入决赛,则其他15位同学成绩的下列数据中,能使他得出结论的是( ) A.平均数B.极差C.中位数D.方差 (2)已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中 位数是5,那么该组数据的众数是,平均数是. 探究一探究二探究三素养形成当堂检测 答案: (1) C (2)65 解析: (1)判断
10、能否进入决赛,只要判断是不是前8位,所以只要知道 其他15位同学的成绩中是不是有8位高于他,也就是把其他15位同 学的成绩排列后看第8位的成绩即可,小刘的成绩高于这个成绩就 能进入决赛,低于这个成绩就不能进入决赛,这个第8位的成绩就是 这15位同学成绩的中位数. 探究一探究二探究三素养形成当堂检测 方差和标准差的计算及应用方差和标准差的计算及应用 例2甲、乙两台机床同时加工直径为100 cm的零件,为检验质量,各 从中抽取6件测量,数据为: 甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100. (1)分别计算两组数据的平均数及方差; (2)根据计算
11、结果判断哪台机床加工零件的质量更稳定. 探究一探究二探究三素养形成当堂检测 探究一探究二探究三素养形成当堂检测 反思感悟标准差(方差)的两个作用 (1)标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据 的离散程度越小. (2)在实际应用中,常常把平均数与标准差结合起来进行决策.在平 均值相等的情况下,比较方差或标准差以确定稳定性. 探究一探究二探究三素养形成当堂检测 变式训练2(1)在某项体育比赛中,七位裁判为一选手打出的分数 为:90,89,90,95,93,94,93,去掉一个最高分和一个最低分后,剩下数据 的平均值和方差分别为() A.92,2B.92,2.8 C.93,
12、2D.93,2.8 (2)已知样本9,10,11,x,y的平均数是10,标准差是 ,则xy= . 探究一探究二探究三素养形成当堂检测 答案: (1) B (2)96 解析:去掉最高分95和最低分89后, x2+y2-20(x+y)=-192, (x+y)2-2xy-20(x+y)=-192,xy=96.故填96. 探究一探究二探究三素养形成当堂检测 求百分位数求百分位数 例3给出下列一组数据:18,19,20,20,21,22,23,31,31,35,求出45%分位 数. 解:因为数据个数为10,而且1045%=4.5,因此该组数据的45%分位 数为x5=21. 探究一探究二探究三素养形成当堂
13、检测 反思感悟p(p(0,1)分位数的确定方法 设一组数据按照从小到大排列后为x1,x2,xn,计算i=np%的值,如 果i不是整数,设i0为大于i的最小整数,取 为p分位数;如果i是整数, 取 为p分位数. 探究一探究二探究三素养形成当堂检测 延伸探究求出本例中80%的分位数. 探究一探究二探究三素养形成当堂检测 样本的数字特征的意义及综合应用样本的数字特征的意义及综合应用 典例 (1)据了解,某公司的33名职工月工资(单位:元)如下. 该公司职工月工资的平均数为(结果精确到1),中位数为 ,在这两个统计量中,更能反映这个公司员工的工资水 平. 探究一探究二探究三素养形成当堂检测 (2)某高
14、中从参加学业水平测试的学生中抽出80名学生,其数学成绩 (均为整数)的频率分布直方图如图所示. 则这次数学测试的众数是,中位数是(结果精确到 0.1). 探究一探究二探究三素养形成当堂检测 解析:(1)把工资数据由小到大排列,得到中位数为4 000元. 5 333(元). 所以中位数更能反映该公司员工的工资水平,平均数受少数人工资 额的影响较大,不能反映这个公司员工的工资水平. 设中位数为x,前三个矩形面积之和为0.4,第四个矩形面积为0.3,因 此中位数位于第四个矩形内,由0.1=0.03(x-70),得x73.3. 答案:(1)5 3334 000中位数(2)7573.3 探究一探究二探究
15、三素养形成当堂检测 方法点睛1.因为平均数与每一个样本数据有关,所以任何一个样本 数据的改变都会引起平均数的改变,这是众数、中位数不具有的性 质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映 出更多的关于全体样本数据的信息.但平均数受数据的极端值的影 响较大,使平均数在估计总体时可靠性降低. 2.利用频率分布直方图估计数字特征: (1)众数的估计值是最高的矩形的底边的中点; (2)中位数的估计值左右两侧直方图的面积相等; (3)平均数的估计值等于每个小矩形的面积乘以小矩形底边中点的 横坐标之和. 探究一探究二探究三素养形成当堂检测 答案:C 解析:依题意可得 探究一探究二探究三素养
16、形成当堂检测 2.若甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均 成绩和标准差如下表: 则参加奥运会的最佳人选应为() A.甲B.乙 C.丙D.丁 答案:C 解析:从平均数来看,乙、丙的平均值最大,从标准差来看,丙的标准 差最小,因此,应选择丙参加比赛. 探究一探究二探究三素养形成当堂检测 3.已知一组数据x1,x2,xn的方差是a,则另一组数据x1-2,x2-2,xn-2 的方差是. 答案:a 解析:将一组数据同时加上或减去一个数,所得新数据的方差与原 数据的方差相等. 探究一探究二探究三素养形成当堂检测 4.某车间20名工人年龄数据如下表: (1)求这20名工人年龄的众数与极差; (2)求这20名工人年龄的方差s2. 探究一探究二探究三素养形成当堂检测 解:(1)这20名工人年龄的众数为30;这20名工人年龄的极差为 40-19=21. (2)这20名工人年龄的平均数为 (19+283+293+305+314+323+40)20=30; 所以这20名工人年龄的方差为