222用样本数字特征分布估计总体数字特征课件.ppt

上传人(卖家):晟晟文业 文档编号:4300665 上传时间:2022-11-27 格式:PPT 页数:29 大小:2.55MB
下载 相关 举报
222用样本数字特征分布估计总体数字特征课件.ppt_第1页
第1页 / 共29页
222用样本数字特征分布估计总体数字特征课件.ppt_第2页
第2页 / 共29页
222用样本数字特征分布估计总体数字特征课件.ppt_第3页
第3页 / 共29页
222用样本数字特征分布估计总体数字特征课件.ppt_第4页
第4页 / 共29页
222用样本数字特征分布估计总体数字特征课件.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、用样本的数字特征估计用样本的数字特征估计总体的数字特征总体的数字特征 在一次射击比赛中在一次射击比赛中,甲、乙两名运动员各射击甲、乙两名运动员各射击10次,命中环数如下次,命中环数如下甲运动员甲运动员7,8,6,8,6,5,8,10,7,4;乙运动员乙运动员9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?的更稳定些吗?问题问题为了从整体上更好地把握总体的规律,我们要通为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。过样本的数据对总体的数字特征进行研究。用样本的数字特征估计总体的

2、数字特征。用样本的数字特征估计总体的数字特征。1、众数众数 在一组数据中,在一组数据中,出现次数最多出现次数最多的数据的数据叫做这一组数据的众数叫做这一组数据的众数.2、中位数中位数 将一组数据按大小依次排列,将一组数据按大小依次排列,把把处在最中间位置的一个数据处在最中间位置的一个数据(或两个数据(或两个数据的平均数)叫做这组数据的中位数的平均数)叫做这组数据的中位数.3、平均数平均数 (1)x=(x1+x2+xn)/n (2)x=x1f1+x2f2+xkfk 甲在一次射击比赛中的得分如下甲在一次射击比赛中的得分如下:(单位单位:环环).7,8,6,8,6,5,9,10,7,5,则他则他命中

3、的平均数是命中的平均数是_,中位数是中位数是 众数是众数是_ 2.某次数学试卷得分抽样中得到某次数学试卷得分抽样中得到:90分分的有的有3个人个人,80分的有分的有10人人,70分的有分的有5人人,60分的有分的有2人人,则这次抽样的平均分为则这次抽样的平均分为_.7.177分分 练习练习75,6,7,8众数众数:若有两个或两个以上的数据出若有两个或两个以上的数据出现的次数一样,则这些数据都叫众数;若一现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没组数据中每个数据出现的次数一样多,则没有众数。有众数。中位数中位数:唯一确定的。不受极端值的影唯一确定的。不受极端值的

4、影响,仅利用了数据中排在中间数据的信息。响,仅利用了数据中排在中间数据的信息。当样本数据质量比较差,即存在一些错误信当样本数据质量比较差,即存在一些错误信息时,应该用抗极端性很强的中位数表示数息时,应该用抗极端性很强的中位数表示数据的中心值。据的中心值。平均数平均数:任何一个样本数据的改变都任何一个样本数据的改变都会引起平均数的改变。会引起平均数的改变。月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10如何从频率分布直方图中估计众数?如图:如何从频率分布直方图中估计众数?如图:2.25 众数在样本数据的频率分布直方图中,众

5、数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。就是最高矩形的中点的横坐标。思考:思考:频率分布直方图中估计的众数与原始频率分布直方图中估计的众数与原始数据中的众数数据中的众数2.32.3不同,为什么?不同,为什么?在频率分布直方图,我们只能直观地看出在频率分布直方图,我们只能直观地看出数据的大概分布情况,从直方图本身得不出数据的大概分布情况,从直方图本身得不出原始的数据内容,直方图已经损失一些样本原始的数据内容,直方图已经损失一些样本信息。信息。讨论:讨论:众数估计总体情况有什么优缺点?众数估计总体情况有什么优缺点?能够体现样本数据的最大集中点,但它能够体现样本数据的最大集中点,

6、但它对其它数据信息的忽视使得无法客观地反映对其它数据信息的忽视使得无法客观地反映总体特征。总体特征。如何从频率分布直方图中估计中位数?如何从频率分布直方图中估计中位数?0.020.040.060.140.250.220.150.080.04月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10前四个小矩形的面积前四个小矩形的面积和和=0.492.02后四个小矩形的后四个小矩形的面积和面积和=0.26分析:分析:在样本数据中,有在样本数据中,有50%50%的个体小于或等于中位数,也有的个体小于或等于中位数,也有50%50%的个体

7、大的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。的面积应该相等。总结:总结:在频率分布直方图中,把频率分布直方图划分左右两在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与个面积相等的分界线与x轴交点的横坐标称为中位数。轴交点的横坐标称为中位数。注注:图中的数据是小矩形的面积即频率图中的数据是小矩形的面积即频率上图中,设中位数为上图中,设中位数为x,则,则 02.25.05.0)2(22.015.008.004.0 xx思考:思考:2.022.02这个中位数的估计值,与

8、样本数据的中这个中位数的估计值,与样本数据的中位数位数2.02.0不同,为什么?不同,为什么?从频率分布直方图本身得不出原始的数据内容,从频率分布直方图本身得不出原始的数据内容,频率分布直方图已经损失一些样本信息。频率分布直方图已经损失一些样本信息。思考:思考:中位数不受少数极端值的影响,这在某些情中位数不受少数极端值的影响,这在某些情 况下是一个优点,但它对极端值的不敏感有时也会成况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?为缺点,你能举例说明吗?考察考察100位居民的月均用水量表中的数据,如果把位居民的月均用水量表中的数据,如果把最后一个数据错写成最后一个数据错写

9、成22,并不会对样本中位数产生影,并不会对样本中位数产生影响也就是说对极端数据不敏感的方法能够有效地预防响也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中人为操作的失误经错误数据的影响,而在实际应用中人为操作的失误经常造成错误数据。常造成错误数据。对极端值不敏感有利的例子对极端值不敏感有利的例子:某人具有初级计算机专业技术水平,某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很选择工作的参考指标就会

10、冒这样的风险:很可能所选择公司的初级计算机专业技术水平可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的人员的收入很低,其原因是中位数对极小的数据不敏感。数据不敏感。这里更好的方法是同时用平均这里更好的方法是同时用平均数和中位数来作为参考指标,选择平均数较数和中位数来作为参考指标,选择平均数较大且中位数较大的公司就业。大且中位数较大的公司就业。对极端值不敏感有弊的例子:对极端值不敏感有弊的例子:如何从频率分布直方图中估计平均数如何从频率分布直方图中估计平均数?注注:图中的数据是小矩形的面积即频率图中的数据是小矩形的面积即频率0.020.040.060.140.250.

11、220.150.080.04月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10.0.250.751.251.752.25.2.753.253.754.25 平均数等于频率分布直方图中每个小矩形平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。的面积乘以小矩形底边中点的横坐标之和。2.02 应该采用应该采用平均数平均数来表示每一个国家项目的平来表示每一个国家项目的平均金额,因为它能反映所有项目的信息均金额,因为它能反映所有项目的信息.但但平均数平均数会受到极端数据会受到极端数据2200万元的影响,所以

12、大多数项万元的影响,所以大多数项目投资金额都和平均数相差比较大目投资金额都和平均数相差比较大.练习练习课本课本P74 练练习习三种数字特征的优缺点三种数字特征的优缺点特征数特征数优优 点点缺缺 点点众数众数体现了样本数据的最大体现了样本数据的最大集中点集中点无法客观反映总体无法客观反映总体特征特征中位数中位数不受少数极端值的影响不受少数极端值的影响 不受少数极端值的不受少数极端值的影响有时也是缺点影响有时也是缺点平均数平均数与每一个数据有关,更与每一个数据有关,更能反映全体的信息能反映全体的信息.受少数极端值的影受少数极端值的影响较大,使其在估响较大,使其在估计总体时的可靠性计总体时的可靠性降

13、低降低.探究探究一个企业中,一个企业中,有职工的人数很多,他有职工的人数很多,他们的月收入是两千左右,然后有少数人员是们的月收入是两千左右,然后有少数人员是经理以上层次的人,他们的月收入是三万左经理以上层次的人,他们的月收入是三万左右。如果是你老板,去招聘时,回答有关工右。如果是你老板,去招聘时,回答有关工资待遇方面的问题,你更愿意用哪个数字特资待遇方面的问题,你更愿意用哪个数字特征来回答这个问题呢?如果你是应聘者,你征来回答这个问题呢?如果你是应聘者,你更愿意希望老板是用哪个特征数字来回答?更愿意希望老板是用哪个特征数字来回答?平均数向我们提供了样本数据的重要信平均数向我们提供了样本数据的重

14、要信息,但是,有时它也会影响我们,使我们对息,但是,有时它也会影响我们,使我们对总体作出片面判断。总体作出片面判断。平均数反映数据的集中平均数反映数据的集中趋势趋势,但是,只有平均数还难以概况样本数,但是,只有平均数还难以概况样本数据的实际状态。当样本的平均数相等或相差据的实际状态。当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计无几时,就要用样本数据的离散程度来估计总体的数字特征。这时,我们引进了一个概总体的数字特征。这时,我们引进了一个概念:念:标准差!标准差!标准差标准差 有两位射击运动员在一次射击测试中各射有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下靶十

15、次,每次命中的环数如下:如果你是教练,你应当如何对这次射击情况作出如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选评价?如果这是一次选拔性考核,你应当如何作出选择?择?标准差标准差 标准差标准差是样本数据到平均数的一种平均距是样本数据到平均数的一种平均距离离.它用来描述样本数据的离散程度它用来描述样本数据的离散程度.在实际应在实际应用中,标准差常被理解为稳定性用中,标准差常被理解为稳定性.1、平均距离、平均距离标准差标准差 标准差是样本数据到平均数的一种平均距离标准差是样本数据到平均数的一种平均距离.它它用来描述样本数据的离散程度用来描述样本数据的离散程

16、度.在实际应用中,标准在实际应用中,标准差常被理解为稳定性差常被理解为稳定性.规律:标准差越大,规律:标准差越大,大则大则a越大,数据的越大,数据的离散程度越大;反离散程度越大;反之,数据的离散程之,数据的离散程度越小度越小.计算标准差的算法:计算标准差的算法:1、算出样本数据的平均数2、算出每个样本数据与样本平均数的差3、算出 ,这n个数的平均数,即为样本方差4、算出方差的算术平均值,即为样本标准差s。2sx0+,x22222123nn222222i123ni=11s=x-x-x-x-n11=x-=xxxx-nxnnxxxxx注意:注意:1、标准差、方差的取值范围:、标准差、方差的取值范围:

17、当标准差,方差为当标准差,方差为0时,样本各数据全相等,表时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性。明数据没有波动幅度,数据没有离散性。2、因为方差与原始数据的单位不同,且平方后可、因为方差与原始数据的单位不同,且平方后可能增大了偏差的程度,所以虽然方差与标准差在能增大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般采用标准差。实际问题时,一般采用标准差。2s例例1:画出下列四组样本数据的直方图,说画出下列四组样本数据的直方图,说明它们的异同点明它们的异同点.(1)(2)(3)(4)例例2

18、:甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm的一种零件的一种零件.为了对两人的生产质量进行评比,从他们生产的零件为了对两人的生产质量进行评比,从他们生产的零件中各抽出中各抽出20件,量得其内径尺寸如下(单位:件,量得其内径尺寸如下(单位:mm)甲甲乙乙从生产的零件内径的尺寸来看,谁生产的质量较高?从生产的零件内径的尺寸来看,谁生产的质量较高?X甲甲25.401X乙乙25.406s甲甲0.037S乙乙0.068从样本平均数看,甲生产的零件内径比从样本平均数看,甲生产的零件内径比乙更接近内径标准,但是差异很小;乙更接近内径标准,但是差异很小;从样本标准差看,由于从样本标准差看,由于

19、s甲甲S乙,因乙,因此甲生产的零件内径比乙的稳定程度高很此甲生产的零件内径比乙的稳定程度高很多。于是,可以作出判断,甲生产的零件多。于是,可以作出判断,甲生产的零件的质量比乙的高一些。的质量比乙的高一些。X甲甲25.401 X乙乙25.406s甲甲0.037 S乙乙0.068拓展拓展1、若 的平均数是 ,则 平均数为2、数据 与数据 的方差相等。3、若 的方差为 ,则 的方差为 。4、若 的方差为 ,则 的方差为123nxxxx,x12nmx+amx+amx+a,m x+a123nxxxx,12nx+ax+ax+a,123nxxxx,2s12naxaxax,123nxxxx,2s22asix-

20、x i=1,2 n,1 1、对划艇运动员甲乙二人在相同的条件下进行了、对划艇运动员甲乙二人在相同的条件下进行了6 6次测试,次测试,测得他们最大速度的数据如下:测得他们最大速度的数据如下:甲:甲:27,38,30,37,35,3127,38,30,37,35,31;乙:乙:33,29,38,34,28,3633,29,38,34,28,36根据以上数据,试判断他们谁更优秀。根据以上数据,试判断他们谁更优秀。2 2、若数据、若数据的平均数为的平均数为,方差,方差为为,则,则的平均数和方差分别为:(的平均数和方差分别为:()123nxxxx,12 n2 x+3 2 x+3 2 x+3,22 x+3

21、4 s 和2x=3 3s1 5.7甲甲,2x=33s12.7乙乙,乙比甲更稳乙比甲更稳定,所以乙定,所以乙比甲更优秀比甲更优秀 练习练习课本课本P79 练练习习解解:依题意计算可得依题意计算可得x1=900 x2=900 s123.8 s2 42.6 甲乙两种水稻甲乙两种水稻6年平均产量的平均数相同年平均产量的平均数相同,但甲的标准差比乙的小但甲的标准差比乙的小,所以甲的生产比较稳所以甲的生产比较稳定定.解解:(1)平均重量约为平均重量约为496.86 g,标准差约为标准差约为6.55(2)重量位于重量位于(x-s,x+s)之间有之间有14袋白糖袋白糖,所占所占百分比为百分比为66.67%.1.用样本的数字特征估计总体的数字特征分两类:用样本的数字特征估计总体的数字特征分两类:a.用样本平均数估计总体平均数。用样本平均数估计总体平均数。b.用样本标准差估计总体标准差。样本容量越大,用样本标准差估计总体标准差。样本容量越大,估计就越精确。估计就越精确。2.平均数对数据有平均数对数据有“取齐取齐”的作用,代表一组数据的作用,代表一组数据的平均水平。的平均水平。3.标准差描述一组数据围绕平均数波动的大小,反标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。映了一组数据变化的幅度。小结小结

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(222用样本数字特征分布估计总体数字特征课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|