1、2.2.2 用样本的数字特征估计 总体的数字特征 1.1.能从样本数据中提取基本的数字特征(如平均数、众数、中能从样本数据中提取基本的数字特征(如平均数、众数、中位数),并进行合理的解释位数),并进行合理的解释. .2.2.正确理解样本数据标准差的意义和作用,学会计算数据的标正确理解样本数据标准差的意义和作用,学会计算数据的标准差准差. .3.3.会用样本的基本数字特征估计总体的基本数字特征会用样本的基本数字特征估计总体的基本数字特征. . 1.1.本课重点是用样本平均数和标准差估计总体的平均数与标准本课重点是用样本平均数和标准差估计总体的平均数与标准差差. .2.2.本课难点是能应用相关知识
2、解决简单的实际问题本课难点是能应用相关知识解决简单的实际问题. . 1.1.众数、中位数、平均数的概念众数、中位数、平均数的概念(1 1)众数:一组数据中)众数:一组数据中_的数的数. .(2 2)中位数:一组数据按大小顺序排列后,处于)中位数:一组数据按大小顺序排列后,处于_位置的位置的数数. .如果个数是偶数,则取如果个数是偶数,则取_两个的平均数两个的平均数. .(3 3)平均数:一组数据的)平均数:一组数据的_除以数据个数所得到的数除以数据个数所得到的数. .2.2.标准差与方差的概念标准差与方差的概念标准差是样本数据到平均数的一种标准差是样本数据到平均数的一种_,一般用,一般用s s
3、表示,表示,即样本数据即样本数据x x1 1,x,x2 2, ,x,xn n的标准差的标准差 出现次数最多出现次数最多中间中间中间中间和和平均距离平均距离S=_,S=_,方差方差S S2 2=_.=_.22212n1xxxxxxn()()() 22212n1xxxxxxn()()() 1.1.在某项体育比赛中,七位裁判为一选手打出的分数如下:在某项体育比赛中,七位裁判为一选手打出的分数如下:90 90 89 90 95 93 94 9389 90 95 93 94 93计算平均分时,一般要去掉一个最高分和计算平均分时,一般要去掉一个最高分和一个最低分,其目的是什么?一个最低分,其目的是什么?提
4、示:提示:消除极端值的影响消除极端值的影响. .2.2.对数字特征的理解中,下列说法正确的是对数字特征的理解中,下列说法正确的是_._.数据数据5,4,4,3,5,25,4,4,3,5,2的众数为的众数为4 4;数据数据2,3,4,52,3,4,5的标准差是数据的标准差是数据4,6,8,104,6,8,10的标准差的一半;的标准差的一半;方差与标准差具有相同的单位;方差与标准差具有相同的单位; 如果一组数中每个数减去同一个非零常数,则这组数的平均如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变数改变,方差不变. .【解析】【解析】中的众数应为中的众数应为4 4和和5;5;正
5、确;正确;不正确;不正确;正确,正确,平均数也应减去该常数,方差不变平均数也应减去该常数,方差不变. .答案:答案:3.3.若若M M个数的平均数是个数的平均数是X,NX,N个数的平均数是个数的平均数是Y Y,则,则M+NM+N个数的平均个数的平均数是数是_._.【解析】【解析】M M个数的和为个数的和为MXMX,N N个数的和为个数的和为NYNY,则,则M+NM+N个数的和为个数的和为MX+NYMX+NY,所以其平均数为,所以其平均数为答案:答案:MXNY.MNMXNYMN4.4.已知五个数据已知五个数据3,5,7,4,63,5,7,4,6,则该样本的标准差为,则该样本的标准差为_._.【解
6、析】【解析】答案:答案:1x357465,5()221s35655 ()() 1404 1 12.5 ()21.1.众数、中位数、平均数的特点众数、中位数、平均数的特点(1 1)众数:)众数:众数容易计算众数容易计算; ;众数只能表示样本数据中的很众数只能表示样本数据中的很少一部分信息少一部分信息; ;众数可以反映一组数据的多数水平众数可以反映一组数据的多数水平. .(2 2)中位数:)中位数:中位数易计算中位数易计算, ,能较好地表现数据信息能较好地表现数据信息; ;中中位数不受少数极端数据的影响;位数不受少数极端数据的影响;中位数通常用来描述分类变中位数通常用来描述分类变量的中心位置量的中
7、心位置. .(3 3)平均数:平均数代表了数据更多的信息,但受样本中每)平均数:平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大个数据的影响,越极端的数据对平均数的影响也越大. . 2.2.对方差与标准差概念的理解对方差与标准差概念的理解(1 1)标准差、方差描述了一组数据围绕平均数波动的大小)标准差、方差描述了一组数据围绕平均数波动的大小. .标标准差、方差越大准差、方差越大, ,数据的离散程度越大数据的离散程度越大; ;标准差、方差越小标准差、方差越小, ,数数据的离散程度越小据的离散程度越小. .(2 2)标准差、方差的取值范围)标准差、方差的取值范
8、围: :0,+0,+). .标准差标准差、方差为方差为0 0时时, ,样本各数据全相等样本各数据全相等, ,表明数据没有波动幅表明数据没有波动幅度度, ,数据没有离散性数据没有离散性. . (3 3)因为方差与原始数据的单位不同)因为方差与原始数据的单位不同, ,且平方后可能夸大了偏且平方后可能夸大了偏差的程度差的程度, ,所以虽然方差与标准差在刻画样本数据的分散程度所以虽然方差与标准差在刻画样本数据的分散程度上是一样的上是一样的, ,但在解决实际问题时但在解决实际问题时, ,一般多采用标准差一般多采用标准差. . 众数、中位数、平均数的计算众数、中位数、平均数的计算【技法点拨】【技法点拨】利
9、用样本数字特征进行决策时的两个关注点利用样本数字特征进行决策时的两个关注点(1 1)平均数与每一个数据都有关,可以反映更多的总体信息,)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征法客观反映总体特征. . (2 2)当平均数大于中位数时,说明数据中存在许多较大的极)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值端值
10、;反之,说明数据中存在许多较小的极端值. . 【典例训练】【典例训练】1.101.10名工人某天生产同一零件,生产的件数是名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,14,10,15,17,17,16,14,1215,17,17,16,14,12,设其平均数为,设其平均数为a a,中位数为,中位数为b b,众数为,众数为c c,则有(,则有( )(A A)abc abc (B B)bcabca(C C)cab cab (D D)cbacba2.2.某房间中某房间中1010个人的平均身高为个人的平均身高为1.741.74米,身高为米,身高为1.851.85米的第米的第
11、1111个人进入房间后,这个人进入房间后,这1111个人的平均身高是个人的平均身高是_. . 3.3.下面是某快餐店所有工作人员一周的收入表:下面是某快餐店所有工作人员一周的收入表: (1 1)计算所有人员的周平均收入;)计算所有人员的周平均收入;(2 2)这个平均收入能反映打工人员的周收入的一般水平吗?)这个平均收入能反映打工人员的周收入的一般水平吗?为什么?为什么?(3 3)去掉老板的收入后,再计算平均收入,这能代表打工人)去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的水平吗?员的周收入的水平吗? 【解析】【解析】1.1.选选D.D.平均数平均数中位数中位数b=15,b=15
12、,众数众数c=17.cba.c=17.cba.2.2.原来的原来的1010个人的身高之和为个人的身高之和为17.417.4米,所以,这米,所以,这1111个人的平个人的平均身高为均身高为 即这即这1111个人的平均身高为个人的平均身高为1.751.75米米. .答案:答案:1.751.75米米3.3.(1 1)周平均收入)周平均收入=750=750(元)(元). . 1a15 1714 10 15 17171610(14 1214.7.)17.4 1.851.7511,11x3 0004503504003203204107()(2 2)这个平均收入不能反映打工人员的周收入水平,可以看)这个平均
13、收入不能反映打工人员的周收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员工人员. .(3 3)去掉老板的收入后的周平均收入)去掉老板的收入后的周平均收入 (450+350+400+450+350+400+320+320+410320+320+410)=375=375(元)(元). .这能代表打工人员的周收入水平这能代表打工人员的周收入水平. . 21x6【思考】【思考】在题在题3 3中,为什么(中,为什么(
14、3 3)中去掉老板的收入后,再计算)中去掉老板的收入后,再计算平均收入,能代表打工人员的周收入的水平?平均收入,能代表打工人员的周收入的水平?提示:提示:因为老板收入是个特殊数据,对平均值产生很大的影响,因为老板收入是个特殊数据,对平均值产生很大的影响,因此从统计分析的某一角度进行分析时,应剔除因此从统计分析的某一角度进行分析时,应剔除. . 【变式训练】【变式训练】(20122012黄冈模拟)如图是某赛季甲、乙两名篮黄冈模拟)如图是某赛季甲、乙两名篮球运动员每场比赛得分茎叶图,则在这几场比赛得分中甲的中球运动员每场比赛得分茎叶图,则在这几场比赛得分中甲的中位数与乙的众数之和是(位数与乙的众数
15、之和是( ) (A A)50 50 (B B)41 41 (C C)51 51 (D D)61.561.5【解析】【解析】选选C.C.甲的中位数是甲的中位数是 =27=27,乙的众数是,乙的众数是2424,所以,所以甲的中位数与乙的众数之和是甲的中位数与乙的众数之和是51.51. 26282 标准差(方差)的计算及应用标准差(方差)的计算及应用【技法点拨】【技法点拨】1.1.计算标准差的五个步骤计算标准差的五个步骤(1 1)算出样本数据的平均数)算出样本数据的平均数 . .(2 2)算出每个样本数据与样本数据平均数的差:)算出每个样本数据与样本数据平均数的差:(3 3)算出()算出(2 2)中
16、的)中的x xi i- - (i=1,2,3i=1,2,3,,n,n)平方)平方. .(4 4)算出()算出(3 3)中)中n n个平方数的平均数,即为样本方差个平方数的平均数,即为样本方差. . ixx i1,2,3,n .(,)xx(5 5)算出()算出(4 4)中方差的算术平方根,即为样本标准差)中方差的算术平方根,即为样本标准差. .2.2.标准差(方差)的两个作用标准差(方差)的两个作用(1 1)标准差(方差)较大,数据的离散程度较大;标准差)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小(方差)较小,数据的离散程度较小. .(2 2)在实际应用中,常
17、常把平均数与标准差结合起来进行决)在实际应用中,常常把平均数与标准差结合起来进行决策策. .在平均值相等的情况下,比较方差或标准差以确定稳定性在平均值相等的情况下,比较方差或标准差以确定稳定性. . 【典例训练】【典例训练】1.1.在发生某公共卫生事件期间,有专业机构认为该事件在一段在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为时间没有发生在规模群体感染的标志为“连续连续1010天,每天新增天,每天新增疑似病例不超过疑似病例不超过7 7人人”. .根据过去根据过去1010天甲、乙、丙、丁四地新增天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是(疑
18、似病例数据,一定符合该标志的是( )(A A)甲地:总体均值为)甲地:总体均值为3 3,中位数为,中位数为4 4(B B)乙地:总体均值为)乙地:总体均值为1 1,总体方差大于,总体方差大于0 0(C C)丙地:中位数为)丙地:中位数为2 2,众数为,众数为3 3(D D)丁地:总体均值为)丁地:总体均值为2 2,总体方差为,总体方差为3 3 2.2.(20122012菏泽高一检测)从甲、乙两名学生中选拔一人参加菏泽高一检测)从甲、乙两名学生中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击各射击1010次,命中的环
19、数如下:次,命中的环数如下: (1 1)计算甲、乙两人射击命中环数的平均数与方差)计算甲、乙两人射击命中环数的平均数与方差. .(2 2)比较两人成绩,决定应该选哪一人参赛)比较两人成绩,决定应该选哪一人参赛. . 【解析】【解析】1.1.选选D.D.根据信息可知,连续根据信息可知,连续1010天内,每天的新增疑似天内,每天的新增疑似病例不能有超过病例不能有超过7 7的数,选项的数,选项A A中,中位数为中,中位数为4 4,可能存在大于,可能存在大于7 7的数;同理,在选项的数;同理,在选项C C中也有可能;选项中也有可能;选项B B中的总体方差大于中的总体方差大于0 0,叙述不明确,如果数目
20、太大,也有可能存在大于叙述不明确,如果数目太大,也有可能存在大于7 7的数;选项的数;选项D D中,根据方差公式,如果有大于中,根据方差公式,如果有大于7 7的数存在,那么方差不会为的数存在,那么方差不会为3 3,故答案选故答案选D. D. 2.2.(1 1)(2 2)应该选派乙参赛应该选派乙参赛. . 1x7868659 1074710 甲() ,1x9578768677710 乙() ,222221s778767876710甲()()()()()22222579710777471.73()()()()() ,222221s975777877710乙()()()()()22222678767
21、77771.10.()()()()() xx ,ss甲乙甲乙,【想一想】【想一想】在实际决策中,是否一定采用方差小的一种方案?在实际决策中,是否一定采用方差小的一种方案?提示:提示:当平均数差异较大时,不必考虑方差;在体育比赛中,当平均数差异较大时,不必考虑方差;在体育比赛中,若两人平均水平都比对手稍差,则应选派方差大的,以期超水若两人平均水平都比对手稍差,则应选派方差大的,以期超水平发挥平发挥. . 【变式训练】【变式训练】(20122012东北三校联考)甲、乙两位同学在高三东北三校联考)甲、乙两位同学在高三的的5 5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平次月考中数学成绩统计如茎
22、叶图所示,若甲、乙两人的平均成绩分别是均成绩分别是x x甲甲,x x乙乙,则下列叙述正确的是(,则下列叙述正确的是( ) (A A)x x甲甲xx乙乙;乙比甲成绩稳定;乙比甲成绩稳定(B B)x x甲甲xx乙乙;甲比乙成绩稳定;甲比乙成绩稳定(C C)x x甲甲xx乙乙;乙比甲成绩稳定;乙比甲成绩稳定(D D)x x甲甲xss1 1ss2 2 (B B)s s2 2ss1 1ss3 3(C C)s s1 1ss2 2ss3 3 (D D)s s3 3ss2 2ss1 1【解题指导】【解题指导】 【解析】【解析】选选D.D.所给图是成绩分布图所给图是成绩分布图,平均分是,平均分是7575分,在图
23、分,在图1 1中,中,集中在集中在7575分附近的数据最多,图分附近的数据最多,图3 3中中从从5050分到分到100100分均匀分布,分均匀分布,所有成绩不集中在任何一个数据附近所有成绩不集中在任何一个数据附近,图,图2 2介于两者之间介于两者之间. .由由标准差的意义可得标准差的意义可得s s3 3s s2 2s s1 1,故选,故选D.D.【阅卷人点拨】【阅卷人点拨】通过阅卷后分析,对解答本题的常见错误及解通过阅卷后分析,对解答本题的常见错误及解题启示总结如下:(注:此处的题启示总结如下:(注:此处的见解析过程)见解析过程) 【即时训练】【即时训练】(福建师大附中高一检测)甲、乙两位运动
24、员(福建师大附中高一检测)甲、乙两位运动员5 5场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分别为别为 则下列判断正确的是(则下列判断正确的是( )(A A) 甲比乙成绩稳定甲比乙成绩稳定(B B) 乙比甲成绩稳定乙比甲成绩稳定(C C) 甲比乙成绩稳定甲比乙成绩稳定(D D) 乙比甲成绩稳定乙比甲成绩稳定 x ,x甲乙,xx甲乙;xx甲乙;xx甲乙;xx甲乙;【解析】【解析】选选D.D.甲的平均得分甲的平均得分方差方差 乙的平均得分乙的平均得分方差方差 乙比甲成绩稳定乙比甲成绩稳定. . 16 17283034x25.5甲2222
25、1s162517252825305甲()()()(2225342552.)() 1528262833x26.5乙222221s15262826262628265乙()()()()21783326xx5甲乙() ,1.1.某同学使用计算器求某同学使用计算器求3030个数据的平均数时,错将其中一个个数据的平均数时,错将其中一个数据数据105105输入为输入为1515,那么由此求出的平均数与实际平均数的,那么由此求出的平均数与实际平均数的差是(差是( )(A A)3.5 3.5 (B B)-3 -3 (C C)3 3 (D D)-0.5-0.5【解析】【解析】选选B.B.错将数据错将数据105105
26、输入为输入为1515,则平均数少,则平均数少即与实际平均数的差是即与实际平均数的差是-3. -3. 105 153,302.2.一位同学种了甲、乙两种树苗各一位同学种了甲、乙两种树苗各1 1株,分别观察了株,分别观察了9 9次、次、1010次次后,得到树苗高度的数据的茎叶图如图(单位:厘米),则甲、后,得到树苗高度的数据的茎叶图如图(单位:厘米),则甲、乙两种树苗高度的数据的中位数之和是(乙两种树苗高度的数据的中位数之和是( )(A A)44 44 (B B)54 54 (C C)50 50 (D D)5252【解析】【解析】选选D.D.根据茎叶图可得,甲树苗根据茎叶图可得,甲树苗9 9次得到
27、的树苗高度分次得到的树苗高度分别为别为19,20,21,23,24,31,32,33,3719,20,21,23,24,31,32,33,37;乙树苗;乙树苗1010次得到的树苗高次得到的树苗高度分别为度分别为10,10,14,24,26,30,44,46,46,4710,10,14,24,26,30,44,46,46,47,则甲树苗高度的,则甲树苗高度的中位数为中位数为2424,乙树苗高度的中位数为,乙树苗高度的中位数为 因此因此2424282852.52.26 30282 ,3.3.某射手在一次训练中五次射击的成绩分别为某射手在一次训练中五次射击的成绩分别为9.4,9.4,9.4,9.4,
28、9.4,9.4,9.6,9.79.6,9.7,则该射手五次射击的成绩的方差是(,则该射手五次射击的成绩的方差是( )(A A)0.127 0.127 (B B)0.016 0.016 (C C)0.08 0.08 (D D)0.216 0.216 【解析】【解析】选选1B.x9.49.49.49.69.79.5,5()22221s9.49.59.49.59.49.55()()()229.69.59.79.50.016.()() 4.4.若某校高一年级若某校高一年级8 8个班参加合唱比赛的得分如茎叶图所示,个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是则这组数据的中位数和平
29、均数分别是_. _. 【解析】【解析】数据从小到大排列后可得其中位数为数据从小到大排列后可得其中位数为 平均数为平均数为答案:答案:91.5,91.591.5,91.591 9291.5,287899091 9293949691.5.85.5.下面是某校学生日睡眠时间的抽样频率分布表(单位:下面是某校学生日睡眠时间的抽样频率分布表(单位:h h),),试估计该学生的日平均睡眠时间试估计该学生的日平均睡眠时间. . 【解析】【解析】方法一:总睡眠时间约为方法一:总睡眠时间约为6.256.255+6.755+6.7517+7.2517+7.2533+7.7533+7.7537+8.2537+8.256+8.756+8.752=2=739739(h h). .故平均睡眠时间约为故平均睡眠时间约为7.39 h.7.39 h.方法二:求每组中值与对应频率之积的和方法二:求每组中值与对应频率之积的和6.256.250.05+6.750.05+6.750.17+7.250.17+7.250.33+7.750.33+7.750.37+8.250.37+8.250.060.06+8.75+8.750.02=7.390.02=7.39(h h). .答答: :估计该校学生的日平均睡眠时间约为估计该校学生的日平均睡眠时间约为7.39 h.7.39 h.