大学精品课件:数据特征的描述 完成.ppt

上传人(卖家):罗嗣辉 文档编号:5263968 上传时间:2023-03-02 格式:PPT 页数:58 大小:17.50MB
下载 相关 举报
大学精品课件:数据特征的描述 完成.ppt_第1页
第1页 / 共58页
大学精品课件:数据特征的描述 完成.ppt_第2页
第2页 / 共58页
大学精品课件:数据特征的描述 完成.ppt_第3页
第3页 / 共58页
大学精品课件:数据特征的描述 完成.ppt_第4页
第4页 / 共58页
大学精品课件:数据特征的描述 完成.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

1、概率统计概率统计 李芳凤李芳凤email:哪名运动员的发挥更稳定?在奥运会女子10米气手枪比赛中,每个运动员首先进行每组10枪共4组的预赛,然后根据预赛总成绩确定进入决赛的8名运动员。决赛时8名运动员再进行10枪射击,再将预赛成绩加上决赛成绩确定最后的名次。哪名运动员的发挥更稳定?在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表:哪名运动员的发挥更稳定?最后的比赛结果是,中国运动员郭文珺凭借决赛的稳定发挥,以总成绩492.3环夺得金牌,预赛排在第1名的俄罗斯运动员纳塔利娅帕杰林娜以总成绩498.1环获得银牌,预赛排

2、在第4名的格鲁吉亚运动员妮诺萨卢克瓦泽以总成绩487.4环的成绩获得铜牌,而预赛排在第3名的蒙古运动员卓格巴德拉赫蒙赫珠勒仅以479.6环的成绩名列第8名.哪名运动员的发挥更稳定?由此可见,在射击比赛中,运动员能否取得好的成绩,发挥的稳定性至关重要。那么,怎样评价一名运动员的发挥是否稳定呢?通过本章内容的学习就能很容易回答这样的问题.学习目标n1.集中趋势各测度值的计算方法集中趋势各测度值的计算方法n2.集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合n3.离散程度各测度值的计算方法离散程度各测度值的计算方法n4.离散程度各测度值的特点及应用场合离散程度各测度值的特点及应用场合

3、5.偏态与峰态的测度方法偏态与峰态的测度方法6.用用Excel计算描述统计量并进行分析计算描述统计量并进行分析数据分布特征数据分布特征集中趋势集中趋势离散程度离散程度分布形状分布形状集中趋势(central tendency)平均数(mean)1也称为均值2集中趋势的最常用测度值3一组数据的均衡点所在4体现了数据的必然性特征5易受极端值的影响6有简单平均数和加权平均数之分7根据总体数据计算的,称为平均数,记为;8根据样本数据计算的,称为样本平均数,记为x简单平均数(Simple mean)加权平均数(Weighted mean)某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按

4、销售量分组组中值组中值(Mi)频数频数(fi)Mi fi 140150150160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 5801395264047253700331520501720 9001175合计合计12022200加权平均数(权数对均值的影响)【例例】甲乙两组各有10名学生,他们的考试成绩及其分布数据如下n 甲组:甲组:考试成绩(考试成绩(x):0 20 100n 人数分布(人数分布(f):):1 1 8n 乙组:乙组:考试成绩

5、(考试成绩(x):0 20 100n 人数分布(人数分布(f):):8 1 1几何平均数(geometric mean)1.n 个变量值乘积的 n 次方根2.适用于对比率数据的平均比率数据的平均3.主要用于计算平均增长率4.计算公式为几何平均数(例题分析)【例例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率.几何平均数(例题分析)中位数(median)1.排序后处于中间位置上的值排序后处于中间位置上的值min1eniiMx中位数(位置和数值的确定)顺序数据的中位数(例题分析)甲城市家

6、庭对住房状况评价的频甲城市家庭对住房状况评价的频数分布数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满非常不满意意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300数值型数据的中位数(9个数据的算例)n【例例】9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9数值型数据的中位数(10

7、个数据的算例)n【例例】:10个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9 10 严重偏斜严重偏斜中位数更合适中位数更合适众数(mode)1.一组数据中出现次数最多的变量值(M0)2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数众数(不惟一性)原始数据:10 5 9 12 6 8无众数无众数分类数据的众数(例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频频数数比例比例百分百分比比(%)果汁果汁 矿泉水矿泉水 绿茶

8、绿茶 其他其他 碳酸饮料碳酸饮料61011 8 150.120.200.220.160.301220221630合计合计501100顺序数据的众数(例题分析)甲城市家庭对住房状况评价的频甲城市家庭对住房状况评价的频数分布数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0众数、中位数和平均数的关系众数、中位数、平均数的特点和应用1.众数q不受极端值影响q具有不惟一性q数据分布偏斜程度较大偏斜程度较大且有明显峰值有明显峰值时应用2.

9、中位数q不受极端值影响q数据分布偏斜程度较大偏斜程度较大时应用3.平均数q易受极端值影响q数学性质优良q数据对称分布对称分布或接近对称分布时应用怎样评价水平代表值?假定有两个地区每人的平均收入数据,其中甲地区的平均收入为5000元,乙地区的平均收入为3000元。你如何评价两个地区的收入状况?如果平均收入的多少代表了该地区的生活水平,你能否认为甲地区的平均生活水平就高于乙地区呢?要回答这些问题,首先需要搞清楚这里的平均收入是否能代表大多数人的收入水平。如果甲地区有少数几个富翁,而大多数人的收入都很低,虽然平均收入很高,但多数人生活水平仍然很低。相反,乙地区多数人的收入水平都在3000元左右,虽然

10、平均收入看上去不如甲地区,但多数人的生活水平却比甲地区高,原因是甲地区的收入差距大于乙地区.怎样评价水平代表值?离散程度的度量离中趋势极差(range)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布方差和标准差(variance and standard deviation)1.数据离散程度的最常用测度值2.反映了各变量值与均值的平均差异3.根据总体数据计算的,称为总体方差(标准差),记为2();4.根据样本数据计算的,称为样本方差(标准差),记为s2(s)样本方差和标准差(sample variance and standard deviat

11、ion)n未分组数据自由度(degree of freedom)1.自由度是指数据个数与附加给独立的观测值的约束或限制的个数之差。2.从字面涵义来看,自由度是指一组数据中可以自由取值的个数。3.当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值。4.按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k。自由度(degree of freedom)1.样本有3个数值,即x1=2,x2=4,x3=9,则 x=5。当 x=5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取

12、值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值。2.为什么样本方差的自由度为什么是n-1呢?因为在计算离差平方和时,必须先求出样本均值x,而x则是附件给离差平方和的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个。自由度(degree of freedom)样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差s2去估计总体方差2时,它是2的无偏估计量。无偏估计量。样本标准差(例题分析)某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组 组中值组中值(Mi)频数频数(fi)140150

13、150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合计合计120554002)(xMiiifxM2)(样本标准差(例题分析)总体方差和标准差(Population variance and Standard deviation)未分组数据变异系数(coefficient of variation)1.标准差与其相应的均值之比

14、2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为又称为离散系数变异系数(例题分析)某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)x1销售利润销售利润(万元万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0离散系数(例题分析)哪名运动员的发挥更稳定?在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员

15、的预赛成绩和最后10枪的决赛成绩如下表:计算运动员决赛时计算运动员决赛时10枪的枪的平均值,标准差平均值,标准差和离散系数和离散系数8名运动员射击成绩的误差图(例题分析)【Graphs】【Error Bar】【Simple】【Data in Chart Are】【Summaries of separate variables】变变量选入量选入【Error Bars】【Bars Represent】【Standard deviations】【Multiplier】框内输入所需的标准差倍数框内输入所需的标准差倍数【OK】数据分布特征和描述统计量数据分布特征数据分布特征集中趋势集中趋势离散程度离散程

16、度分布形状分布形状Excel中的统计函数lMODE计算众数lMEDIAN计算中位数lQUARTILE计算四分位数lAVERAGE计算平均数lHARMEAN计算简单调和平均数lGEOMEAN计算几何平均数lAVEDEV计算平均差lSTDEV计算样本标准差lSTDEVP计算总体标准差lSKEW计算偏态系数lKURT计算峰态系数lTRIMMEAN计算切尾均值用Excel和SPSS计算描述统计量n Excel【工具工具】【数据分析数据分析】【描述描述统计统计】【确定确定】【输入区域输入区域】【输出选输出选项项】【汇总统计汇总统计】【确定确定】用Excel和SPSS计算描述统计量nSPSS【Analyz

17、e】【Descriptive statistics】【Descriptives】【variables】(选入变量)【Options】(选择需要的描述统计量)【Continue】【OK】n(注:使用【Analyze】【Descriptive s t a t i s t i c s】【E x p l o r e】(或【Frequencies】)【Statistics】,选择相应的统计量亦可)用Excel和SPSS计算描述统计量用Excel和SPSS计算描述统计量Descriptive StatisticsDescriptive Statistics108.510.69.810.6154.37910

18、9.410.810.230.4373.191108.310.79.260.7074.500109.110.810.140.5461.298108.610.59.800.6498.422108.110.79.730.7334.538109.110.29.690.3573.128108.710.39.650.4625.21410纳塔利娅帕杰林娜郭文珺卓格巴德拉赫蒙赫珠勒妮诺萨卢克瓦泽维多利亚柴卡莱万多夫斯卡萨贡亚斯娜舍卡里奇米拉内万苏Valid N(listwise)NMinimumMaximumMeanStd.Deviation Variancen1 一项关于大学生体重状况的研究发现男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答:n是男生的体重差异大还是女生的体重差异大?为什么?n 女生,因为标准差一样,而均值男生小,所以,离散系数是女生的大,离散程度是女生的大。练习n2 对10名成年人和10名幼儿的身高进行抽样调查,结果如下:n要求:n如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?n 均值不相等,用离散系数衡量身高差异均值不相等,用离散系数衡量身高差异。成年组166 169 l72177 180170172174168173幼儿组68696870 7l7372737475n作业P18n9n

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(大学精品课件:数据特征的描述 完成.ppt)为本站会员(罗嗣辉)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|