第三章数值描述度量.ppt

上传人(卖家):hyngb9260 文档编号:5790957 上传时间:2023-05-09 格式:PPT 页数:89 大小:1.77MB
下载 相关 举报
第三章数值描述度量.ppt_第1页
第1页 / 共89页
第三章数值描述度量.ppt_第2页
第2页 / 共89页
第三章数值描述度量.ppt_第3页
第3页 / 共89页
第三章数值描述度量.ppt_第4页
第4页 / 共89页
第三章数值描述度量.ppt_第5页
第5页 / 共89页
点击查看更多>>
资源描述

1、Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-1Chapter 3数值描述度量Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-2n描述数值数据的集中趋势、变异程度和分布形状的特性n计算总体的描述性总结度量n构建和解释盒须图n描述协方差和相关系数学习目标Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-3集中趋势是指所有的数据观测值组在

2、一个典型或者中心值周围的范围。变异度是观测值与一个中心值散布或分散的量。分布形状是观测值从最小值到最大值分布的模式。数据特征的测度数据特征的测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-63.1 集中趋势的度量n算术平均数n简称均值是最常见的集中趋势的度量。n对一组样本容量是 n的数据:样本容量nXXXnXXn21n1ii数据观测值第i个数据读作:x-barBusiness Statistics:A First Course,5e 2009 Pren

3、tice-Hall,Inc.Chap 3-7 最常见的集中趋势的测度指标均值=标志值总量/总体总量受极端值(离群点)的影响(continued)0 1 2 3 4 5 6 7 8 9 10Mean=3 0 1 2 3 4 5 6 7 8 9 10Mean=4351555432145205104321按销售量分组按销售量分组组中值(组中值(Mi)频数(频数(fi)Mi fi 1401501501601601701701801801901902002002102102202202302302401451551651751851952052152252354916272017108455801395

4、2640472537003315205017209001175合计合计12022200蔬菜蔬菜名称名称批发价格批发价格(元元)Mi成交额成交额(元元)Mi fi甲甲乙乙丙丙1.200.500.8018000125006400合计合计36900蔬菜蔬菜名称名称批发价格批发价格(元元)Mi成交额成交额(元元)Mi fi成交量成交量(公斤公斤)fi甲甲乙乙丙丙1.200.500.801800012500640015000250008000合计合计3690048000Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-

5、17中位数n按从最小到最大排序以后处于正中间的数据值。n不受极端值的影响0 1 2 3 4 5 6 7 8 9 10Median=3 0 1 2 3 4 5 6 7 8 9 10Median=3Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-24如何选择合适的测度指标:当没有极端值的时候,一般使用均值。当存在极端值的时候,经常使用中位数。Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-25小结:集中趋势集中趋势算术平均值

6、算术平均值中位数中位数众数众数nXXnii1Middle value in the ordered arrayMost frequently observed valueBusiness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-26相同的中心值相同的中心值,不同的方差不同的方差3、2变异度测度n变异度度量数据集中的观测值的离散程度或散布程度。变异度变异度标准差标准差变异度系数变异度系数全距全距方差方差Business Statistics:A First Course,5e 2009 Prentice-Hall,In

7、c.Chap 3-27全距最简单的测度值最大值与最小值之差Range=Xlargest Xsmallest0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Range=13-1=12Example:Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-28没有考虑数据的分布易受极端值的影响7 8 9 10 11 12Range=12-7=57 8 9 10 11 12Range=12-7=51,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,51,1

8、,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120Range=5-1=4Range=120-1=119计算公式未分组数据组距式分组数据例三:按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)14015015016016017017018018019019020020021021022022023023024014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计合计1202040例五:计算公式例六:企业编号

9、企业编号产品销售额(万元)产品销售额(万元)x1销售利润(万元)销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0课堂练习1n男生的平均体重是60千克,标准差是5千克;n女生的平均体重是50千克,标准差是5千克;n是男生的体重差异程度大还是女生的体重差异程度大?课堂练习2n对对10名成年人和名成年人和10名幼儿的身高进行抽样调查,结果如下:名幼儿的身高进行抽样调查,结果如下:n计算各组的均值、方差、标准差?计算各组的均值、方差、标准差?n比较分析哪一组的身高差异大?比较分析哪一组的身高差异大?成年

10、组166169172177180170172174168173幼儿组68696870717372737475Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-44nAverage(approximately)of squared deviations of values from the meannSample variance:Measures of Variation:The Variance1-n)X(XSn1i2i2Where =arithmetic meann=sample sizeXi=ith v

11、alue of the variable XXBusiness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-45Measures of Variation:The Standard DeviationnMost commonly used measure of variationnShows variation about the meannIs the square root of the variancenHas the same units as the original datanSample standard

12、deviation:1-n)X(XSn1i2iBusiness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-46Measures of Variation:The Standard DeviationSteps for Computing Standard Deviation1.Compute the difference between each value and the mean.2.Square each difference.3.Add the squared differences.4.Divide this

13、 total by n-1 to get the sample variance.5.Take the square root of the sample variance to get the sample standard deviation.Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-47Measures of Variation:Sample Standard Deviation:Calculation ExampleSample Data (Xi):10 12 14 15 17 18 18 2

14、4 n=8 Mean=X=164.309571301816)(2416)(1416)(1216)(101n)X(24)X(14)X(12)X(10S22222222A measure of the“average”scatter around the meanBusiness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-48Mean=15.5 S=3.338 11 12 13 14 15 16 17 18 19 20 2111 12 13 14 15 16 17 18 19 20 21Data BData AMean=1

15、5.5 S=0.92611 12 13 14 15 16 17 18 19 20 21Mean=15.5 S=4.570Data CBusiness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-49标准差较小标准差较大Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-50小结:数据越分散,全距、方差、标准差越大。数据越集中,全距、方差、标准差越小。如果所有的数据都是相同的(没有变异),所有的测度指标都是零。非负Business Stat

16、istics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-51Measures of Variation:The Coefficient of VariationnMeasures relative variationnAlways in percentage(%)nShows variation relative to meannCan be used to compare the variability of two or more sets of data measured in different units 100%XSCVBusi

17、ness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-52Measures of Variation:Comparing Coefficients of VariationnStock A:nAverage price last year=$50nStandard deviation=$5nStock B:nAverage price last year=$100nStandard deviation=$5Both stocks have the same standard deviation,but stock B i

18、s less variable relative to its price10%100%$50$5100%XSCVA5%100%$100$5100%XSCVB5.一般,如果Z值小于-3或者大于3被认为是异常值。6.Z的绝对值越大,数据离均值的距离越远。Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-54 X 代表变量值 X 是样本均值 S 是样本标准差SXXZBusiness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-55假设SAT

19、 分数的均值是490,标准差是 100.计算考试成绩620的Z值.3.1100130100490620SXXZ620比均值大1.3倍标准差,不能被考成是离群点。家庭编号家庭编号人均月收入(元)人均月收入(元)标准化值标准化值 z 123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-59分布形状n测度数据是怎么分布的。n形态的测度:n

20、对称或者偏态均值均值=中位数中位数 均值均值 中位数中位数 中位数中位数 Xlargest MedianMedian XsmallestXlargest MedianMedian XsmallestXlargest Q3Q1 XsmallestXlargest Q3Q1 XsmallestQ3 MedianMedian Q1Q3 MedianMedian Q1 0 X 和 Y 同向变动,cov(X,Y)0 X 和Y 反向变动,cov(X,Y)=0 X 和Y 不相关。n协方差的缺点:n协方差可以有任何值,不能决定关系的相对强度。Business Statistics:A First Course

21、,5e 2009 Prentice-Hall,Inc.Chap 3-85相关系数(Coefficient of Correlation)n衡量两个数值变量之间线性关系的相对程度。n样本相关系数:式中:YXSSY),(Xcovr 1n)X(XSn1i2iX1n)Y)(YX(XY),(Xcovn1iii1n)Y(YSn1i2iYBusiness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.n总体相关系数用表示.n样本相关系数用r表示.n 或者r 都具有下面的特征:n没有计量单位n1 到 1之间n越接近 1,表示具有越强的线性负相关n越接近

22、 1,表示具有越强的线性正相关n越接近 0,表示具有越弱的线性相关Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-87散点图YXYXYXYXr=-1r=-.6r=+.3r=+1YXr=0Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-883.6描述性数值度量:缺陷和道德问题n数据分析是客观的n应该选择重要的描述数据的指标n数据解释是主观的n 应该用公平、客观、中立的方式Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.Chap 3-89本章总结:n集中趋势测度n均值、中位数、众数n离中趋势测度n全距、内距、方差、标准差、相关系数、Z分数n分布形态n对称、偏态n用5值概括数据n 箱线图n协方差与相关系数

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 待归类文档
版权提示 | 免责声明

1,本文(第三章数值描述度量.ppt)为本站会员(hyngb9260)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|