1、2022-8-171第第4 4章章 统计数据分布特征的度量统计数据分布特征的度量统计学统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-172第第4 4章章 统计数据分布特征的度量统计数据分布特征的度量一、集中趋势的度量一、集中趋势的度量二、离散趋势的度量二、离散趋势的度量三、偏态和峰态的度量三、偏态和峰态的度量四、四、ExcelExcel在数据分布特征度量中的应用在数据分布特征度量中的应用统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-173本章学习目标本章学习目标1.1
2、.掌握反映数据集中趋势度量值掌握反映数据集中趋势度量值众数、中众数、中位数、四分位数、均值的概念及应用场合;位数、四分位数、均值的概念及应用场合;2.2.掌握反映数据离散趋势度量值掌握反映数据离散趋势度量值异众比率异众比率、四分位差、极差、平均差、方差、标准差及、四分位差、极差、平均差、方差、标准差及离散系数的概念及应用场合;离散系数的概念及应用场合;3.3.了解反映数据分布形态度量值了解反映数据分布形态度量值偏态系数偏态系数和峰态系数的测度方法;和峰态系数的测度方法;4.4.熟练运用熟练运用ExcelExcel进行描述统计量分析。进行描述统计量分析。统计学统计学统计学统计学统计学统计学STA
3、TISTICSSTATISTICSSTATISTICS2022-8-174众众 数数中位数中位数均均 值值离散系数离散系数方差和标准差方差和标准差四分位差四分位差异众比率异众比率四分位数四分位数统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-175一、集中趋势的度量一、集中趋势的度量(一)众数(一)众数(二)中位数与四分位数(二)中位数与四分位数(三)均值(三)均值(四)众数、中位数与均值的比较(四)众数、中位数与均值的比较统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-
4、1761.1.一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值3.3.从不同的角度考虑,反映集中趋势的测度值有多个从不同的角度考虑,反映集中趋势的测度值有多个 集中趋势集中趋势统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1771.出现次数最多的变量出现次数最多的变量值,用值,用m mo o表示表示 2.不受极端值的影响不受极端值的影响3.主要用于分类数据,也可用于顺序数据和主要用于分类数据,也可用于顺序数据和数值型
5、数据数值型数据4.一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数5.众数只有在数据较多时才有意义,当数据众数只有在数据较多时才有意义,当数据量较少时,不宜使用众数。量较少时,不宜使用众数。(一)众数(一)众数(mode)(mode)0m统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-178无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:3 5 7 5 5 5多于一个众数多于一个众数原始数据:25 28 28 36 42 42统计学统计学统计学统计学统计学统计学STATISTICSSTATI
6、STICSSTATISTICS2022-8-179这里的变量为“饮料品牌”,不同饮料的品牌就是变量值。在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即mo可口可乐1.1.根据未分组数据或单项分组确定众数根据未分组数据或单项分组确定众数序号ABCDE12345678910旭日升冰茶露露旭日升冰茶可口可乐百事可乐可口可乐汇源果汁可口可乐露露可口可乐可口可乐旭日升冰茶可口可乐百事可乐露露旭日升冰茶旭日升冰茶百事可乐可口可乐旭日升冰茶旭日升冰茶可口可乐可口可乐旭日升冰茶露露旭日升冰茶可口可乐露露百事可乐百事可乐汇源果汁露露百事可乐可口可乐
7、百事可乐汇源果汁可口可乐汇源果汁可口可乐汇源果汁露露可口可乐旭日升冰茶百事可乐露露汇源果汁可口可乐百事可乐露露旭日升冰茶统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1710这里的数据为这里的数据为顺序数据。变量为顺序数据。变量为“回答类别回答类别”甲城市中对住甲城市中对住房表示不满意的户房表示不满意的户数最多,为数最多,为108108户户,因此众数为,因此众数为“不不满意满意”这一类别,这一类别,即即 m mo o不满意不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)百分比 (%)非常不满意 不满意 一般 满意
8、 非常满意24108934530836311510合计300100.0统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1711产品数(件)工人人数(人)1718192028105合计25解:解:表中日加表中日加工产品数为变工产品数为变量,变量值量,变量值1919的工人人数最的工人人数最多,即出现次多,即出现次数最多,所以数最多,所以Mo19件件统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17122.2.根据组距分组数据确定众数根据组距分组数据确定众数 首先,要确定众数
9、所在的组,若为等距分组数据,首先,要确定众数所在的组,若为等距分组数据,次数最多的那个组就是众数所在组;若为异距分组数据,次数最多的那个组就是众数所在组;若为异距分组数据,需将其换算为次数密度(或标准组距次数),换算后次需将其换算为次数密度(或标准组距次数),换算后次数密度最多的一组才是众数所在组。数密度最多的一组才是众数所在组。然后,运用差值公式来计算众数的近似值。然后,运用差值公式来计算众数的近似值。下限公式:下限公式:dlm2110上限公式:上限公式:dum2120 表示众数所在组的下限表示众数所在组的下限 表示众数所在组的上限表示众数所在组的上限 表示众数所在组的频数与其下限的邻组频数
10、之差 表示众数所在组的频数与其上限的邻组频数之差 众数所在组的组众数所在组的组距距 统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1713 某地区利润额的频数分布某地区利润额的频数分布按利润额分组(万元)企业数(个)200-30019300-40030400-50042500-60018600以上11合计120【例】dlmo211(万元)33.433100241212400om统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1714解解:首先,确定众数所在组。本例为等距
11、分组数据首先,确定众数所在组。本例为等距分组数据,频数数值最大的组就是众数所在组。即企业数最多,频数数值最大的组就是众数所在组。即企业数最多的组的组“400-500”400-500”就是众数所在组。就是众数所在组。然后,运用众数的插值公式计算众数。然后,运用众数的插值公式计算众数。dlm2110(万元)33.433100)1842()3042(3042400(万元)33.433100)1842()3042(18425002120dum统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1715排序后处于中间位置上的值排序后处于中间位置上
12、的值m me e50%50%50%50%主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能用于分类数据用于分类数据 不受极端值的影响,不受极端值的影响,在总体标志值差异很大时,在总体标志值差异很大时,具有较强的代表性。具有较强的代表性。各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即(二)中位数与四分位数(二)中位数与四分位数1.中位数中位数统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1716 变量值变量值 3 3 4 4 5 5 5 5 6 6 9 9 1010
13、中位数中位数 5 5平均值平均值 6 6与中位数离差与中位数离差 -2 -1 0 0 1 4 5-2 -1 0 0 1 4 5与平均数离差与平均数离差 -3 -2 -1 -1-3 -2 -1 -1 0 3 4 0 3 4绝对绝对数值数值之和之和 1313 1414统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1717 首先,对数据进行排序,然后确首先,对数据进行排序,然后确定中位数的位置;定中位数的位置;最后,确定中位数的具体数值。最后,确定中位数的具体数值。原始数据:原始数据:分组数据分组数据统计学统计学统计学统计学统计学统计学
14、STATISTICSSTATISTICSSTATISTICS2022-8-1718(1 1)根据未分组数据确定中位数)根据未分组数据确定中位数为偶数为奇数nnmnnne xx2 1 x)12()2()21(统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1719【例【例】某汽车公司的营销部经理随机抽取某汽车公司的营销部经理随机抽取9 9个汽车销售个汽车销售门店了解门店了解5 5月份的汽车销售情况,获得的汽车销售额月份的汽车销售情况,获得的汽车销售额(单位:万元)数据分别为:(单位:万元)数据分别为:700700、400400、200
15、200、10001000、10001000、12001200、14001400、10001000、12001200。试计算这。试计算这9 9个汽车销个汽车销售门店销售额的中位数。售门店销售额的中位数。解:解:首先,对销售额(万元)数据进行排序,依次为:首先,对销售额(万元)数据进行排序,依次为:200200、400400、700700、10001000、10001000、10001000、12001200、12001200、14001400;然后,计算中位数位置:然后,计算中位数位置:521921n最后,找出第最后,找出第5 5个位置的变量值,即个位置的变量值,即(万元)1000)21(nex
16、m。统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1720【例】:10个家庭的人均月收入数据个家庭的人均月收入数据排 序:660 750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9 10 统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1721中位数的位置为 300/2150 从累计频数看,中位数在“一般”这一组别中。因此 me=一般一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累
17、计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300(2 2)根据单项分组数据确定中位数)根据单项分组数据确定中位数统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1722【例【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)工人人数(人)向上累计次数(人)10111213147010038015010070170550700800合计800 xf计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。em统计学统计学统计学统
18、计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1723(3 3)根据组距分组数据计算中位数)根据组距分组数据计算中位数第一步,根据中位数位置及累计次数确定中位数组;第一步,根据中位数位置及累计次数确定中位数组;第二步,用插补公式计算中位数的近似值。第二步,用插补公式计算中位数的近似值。dfcflmmme12下限公式:dfcfummme12上限公式:表示比中位数所在组下表示比中位数所在组下限小的各组累计次数限小的各组累计次数 表示比中位数所在组上表示比中位数所在组上限大的各组累计次数限大的各组累计次数 统计学统计学统计学统计学统计学统计学STATIST
19、ICSSTATISTICSSTATISTICS2022-8-1724某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)工人人数(人)向上累计次数(人)200以下200400400600600以上373283104250合计50计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。Xf统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1725排序后处于排序后处于25%25%和和75%75%位置上的值位置上的值不受极端值的影响不受极端值的影响主要用于顺序数据,也可用于数值型数据,主要用于顺序数据,也可用
20、于数值型数据,但不能用于分类数据但不能用于分类数据 计算方法与中位数的类似。计算方法与中位数的类似。qlqmequ25%25%25%25%2.四分位数四分位数统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1726原始数据:原始数据:分组数据:分组数据:四分位数位置的确定四分位数位置的确定统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1727【例】:9 9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2
21、000 1250 16301500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 1 2 3 4 5 6 4 5 6 7 8 9 9统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1728 ql位置=(300)/4=75 qu位置=(3300)/4 =225 从累计频数看,ql在“不满意”这一组别中,qu在“一般”这一组别中
22、。因此,ql=不满意,qu=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300【例】统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17291.集中趋势的最常用测度值集中趋势的最常用测度值2.一组数据的均衡点所在一组数据的均衡点所在,反映这组数据的一般水平反映这组数据的一般水平3.3.将各个数据之间的数量差异抽象掉将各个数据之间的数量差异抽象掉,体现数据的必体现数据的必然性特征然性特征4.易受极端值的影响易受极
23、端值的影响5.用于数值型数据,不能用于分类数据和顺序数据用于数值型数据,不能用于分类数据和顺序数据(三)均值(三)均值均值均值算术均值算术均值调和均值调和均值几何均值几何均值统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17301.1.算术均值算术均值(average)数据集中趋势最主要的测度值数据集中趋势最主要的测度值适用于数值型数据,不适用于用文字表示的分类数据和适用于数值型数据,不适用于用文字表示的分类数据和顺序数据顺序数据凡是总体各单位的标志值之和等于总体的标志总量时凡是总体各单位的标志值之和等于总体的标志总量时,均可使用
24、算术均值来反映总体的一般水平。,均可使用算术均值来反映总体的一般水平。算术均值通常用算术均值通常用“”“”表示,其基本计算公式为:表示,其基本计算公式为:x总体单位总量总体标志总量算术均值x统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1731设一组数据为:x1,x2,xn或各组的组中值为:x1,x2,xk 相应的频数为:f1,f2,fk简单算术均值简单算术均值加权算术均值加权算术均值统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1732平均每人日销售额平均每人日销售
25、额元558527905440750480600520nxx某售货小组某售货小组5 5个人,某天的销售额分别个人,某天的销售额分别为为520520元、元、600600元、元、480480元、元、750750元、元、440440元,则:元,则:【例【例】统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1733【例【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)工人人数(人)总日产量(件)1011121314701003801501007001100456019501400合计8009710计算该企业该日
26、全部工人的平均日产量。计算该企业该日全部工人的平均日产量。xfxf2022-8-1734已改至此!某电脑公司销售量数据分组表按销售量(台)分组组中值(x)频数(f)xf 14015015016016017017018018019019020020021021022022023023024014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计12022200【例【例】某电脑公司近某电脑公司近4个月的日销售量资料如下:个月的日销售量资料如下:本例为组距分组数据,取各组的组中值作为该
27、组的代表值用于计算;此时求得的算术均值只是其真值的近似值。统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1735fxfx成绩(分)人数(人)甲班乙班丙班603915010013950平均成绩(分)619980权数权数变量值变量值统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1736表现为次数、频数、单位数;即表现为次数、频数、单位数;即公式公式 中的中的fxfxf表现为频率、比重;即公式表现为频率、比重;即公式中的中的).(ffxfxfxff指在计算均值的过程中起着权
28、衡轻重作用指在计算均值的过程中起着权衡轻重作用的次数或频率,反映了各组的变量值对均的次数或频率,反映了各组的变量值对均值的影响程度值的影响程度权数权数绝对权数绝对权数相对权数相对权数若各组权数相同,则各组的次数或频率也就失去了权若各组权数相同,则各组的次数或频率也就失去了权衡轻重的作用,加权算术均值就转化为简单算术均值。衡轻重的作用,加权算术均值就转化为简单算术均值。统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1737变量值与其算术均值的离差之和等于零,即:变量值与其算术均值的离差之和等于零,即:变量值与其算术均值的离差平方和为
29、最小,变量值与其算术均值的离差平方和为最小,即:即:0)(0)(fxxxx或min)(min)(22fxxxx或算术均值的主要数学性质算术均值的主要数学性质统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17381x2x3x4x5x6x123456785x-1-1-2130)1(13)2(01)(xx16)1(13)2(01)(2222222xx离差的概念离差的概念统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1739均值的另一种表现形式,是变量值倒数的算术均均值的另一
30、种表现形式,是变量值倒数的算术均值的倒数。值的倒数。易受极端值的影响易受极端值的影响计算公式为计算公式为2.2.调和均值调和均值(harmonic mean)适用于未分组数据适用于已分组数据统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1740 相对数或平均数再求平均数一定要符合该相对数相对数或平均数再求平均数一定要符合该相对数或平均数本身的计算公式。或平均数本身的计算公式。例如:有例如:有A、B、C三个企业,三个企业,A企业计划产量为企业计划产量为156吨,计划完成百分比是吨,计划完成百分比是120%;B企业计划产量企业计划产量
31、为为200吨,计划完成百分比为吨,计划完成百分比为110%;C企业计划产企业计划产量为量为145吨,计划完成百分比为吨,计划完成百分比为90%。求三个企业。求三个企业平均计划完成百分比。平均计划完成百分比。相对数或平均数再求平均数统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1741 苹果苹果 单价单价 购买量购买量 总金额总金额 品种品种 (元)(元)(斤)(斤)(元)(元)红富士红富士 2 3 62 3 6青香蕉青香蕉 1.8 5 9 1.8 5 9 统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICS
32、STATISTICS2022-8-1742mxmfxffmx1己知 ,采用基本平均数公式fm、己知 ,采用加权算术平均数公式fx、己知 ,采用加权调和平均数公式mx、若比值若比值fmx 统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1743某季度某工业公司某季度某工业公司1818个工业企业产值计划完个工业企业产值计划完成情况如下(按计划完成程度分组成情况如下(按计划完成程度分组):):组别企业数(个)计划产值(万元)实际产值(万元)12342310380025001720044006802375180605060合计1824900
33、26175计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1744某日三种蔬菜的批发成交数据蔬菜名称批发价格(元)x成交额(元)m成交量(公斤)m/x甲乙丙1.200.500.801800012500640015000250008000合计3690048000某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1745n n 个变量值乘
34、积的个变量值乘积的 n n 次方根次方根适用于对比率数据的平均适用于对比率数据的平均,而且各比率的乘而且各比率的乘积要等于总比率积要等于总比率主要用于计算平均增长率、平均收益率等主要用于计算平均增长率、平均收益率等计算公式为计算公式为3.3.几何均值几何均值(geometric mean)ffkffgkxxxx.2121加权几何均值:统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1746【例【例】某流水生产线有前后衔接的五道工序。某日各工某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为序产品的合格率分别为9595、9
35、292、9090、8585、8080,求整个流水生产线产品的平均合格率。求整个流水生产线产品的平均合格率。设最初投产设最初投产100A100A个单位个单位 ,则,则第一道工序的合格品为第一道工序的合格品为100A100A0.950.95;第二道工序的合格品为(第二道工序的合格品为(100A100A0.950.95)0.920.92;第五道工序的合格品为第五道工序的合格品为(100A100A0.950.950.920.920.900.900.850.85)0.800.80;统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1747因该流
36、水线的最终合格品即为第五道工序的合因该流水线的最终合格品即为第五道工序的合格品,格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A100A0.950.950.920.920.900.900.850.850.800.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:80.085.090.092.095.0100A80.085.090.092.00.95100A总产品总合格品该流水线总的合格率等于各工序合格率的连乘该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何积,符合几何平均数的适用条件,故需采用几何平均法计算。平均法计算。统计学统计学
37、统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-174824.885349.080.085.090.092.095.055gx统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1749某金融机构以复利计息。近某金融机构以复利计息。近1212年来的年利率年来的年利率有有4 4年为年为3 3,2 2年为年为5 5,2 2年为年为8 8,3 3年为年为1010,1 1年年为为1515。求平均年利率。求平均年利率。设本金为设本金为V V,则至各年末的本利和应为:,则至各年末的本利和应为:第第1
38、 1年末的本利和为:年末的本利和为:31V3131V第第2 2年末的本利和为:年末的本利和为:1511018151313224V分析:分析:第第2 2年的年的计息基础计息基础第第1212年的年的计息基础计息基础统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1750 15.010.05130.01V15.010.05130.01V2424本金总的本利和则该笔本金则该笔本金1212年总的本利率为:年总的本利率为:即即1212年总本利率等于各年本利率的连乘积,符合几年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年
39、本利率应采用何平均数的适用条件,故计算平均年本利率应采用几何平均法。几何平均法。统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1751若上题中不是按复利而是按若上题中不是按复利而是按单利单利计息,计息,且各年的利率与上相同,求平均年利率。且各年的利率与上相同,求平均年利率。平均年利率85.6185.106185.1062154.215.0105.0103.011212424GGxx解:解:统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1752是否为比率或速度各个比率或
40、速度的连乘积是否等于总比率或总速度是否为其他比值ffgngxxxx几何平均法几何平均法fxfxnxx算术平均法算术平均法mxmfxffmx1均值计算公式的选用顺序均值计算公式的选用顺序统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1753左偏分布左偏分布均值均值 中位数中位数 众数众数对称分布对称分布 均值均值=中位数中位数=众数众数右偏分布右偏分布众数众数 中位数中位数均值均值3()oexMxM(四)众数、中位数与均值的比较(四)众数、中位数与均值的比较1.1.众数、中位数和均值的关系众数、中位数和均值的关系统计学统计学统计学统
41、计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1754众数众数不受极端值影响具有不惟一性数据多、且分布偏斜程度较大时应用中位数中位数不受极端值影响数据分布偏斜程度较大时应用主要适合作为顺序数据的集中趋势测度值。均值均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用2.2.众数、中位数和均值的特点与应用场合众数、中位数和均值的特点与应用场合统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1755数据类型数据类型分类数据分类数据 顺序数据顺序数据数值型数据数值型数据适适用用的的测测
42、度度值值众数众数中位数中位数均值均值四分位数四分位数调和平均数调和平均数众数众数几何平均数几何平均数中位数中位数四分位数四分位数众数众数数据类型与集中趋势测度值数据类型与集中趋势测度值统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1756集中趋势弱、集中趋势弱、离散趋势强离散趋势强集中趋势强、集中趋势强、离散趋势弱离散趋势弱cmx 164cmx164统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1757二、离散趋势的度量二、离散趋势的度量(一)异众比率(一)异众比率(
43、二)四分位差(二)四分位差(三)极差和平均差(三)极差和平均差(四)方差与标准差(四)方差与标准差(五)相对位置的度量(五)相对位置的度量(六)离散系数(六)离散系数2022-8-17581.数据分布的另一个重要特征数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值离中趋势离中趋势统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTI
44、CS2022-8-17591.1.对分类数据离散程度的测度对分类数据离散程度的测度2.2.非众数组的频数占总频数的比率非众数组的频数占总频数的比率3.3.计算公式为计算公式为4.4.用于衡量众数的代表性用于衡量众数的代表性异众比率异众比率(variation ratio)(variation ratio)统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1760解:解:在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“可口可乐”代表消费者购买饮料品牌的状况,其代表性不是很好不同品牌饮料的频数分布 饮料品牌
45、频数比例百分比(%)可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露15119690.300.220.180.120.183022181218合计501100统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17611.1.对顺序数据离散程度的测度对顺序数据离散程度的测度2.2.也称为内距或四分间距也称为内距或四分间距3.3.上四分位数与下四分位数之差上四分位数与下四分位数之差 qd=qu ql4.4.反映了中间反映了中间50%50%数据的离散程度数据的离散程度5.5.不受极端值的影响不受极端值的影响6.6.用于衡量中位数的代表性用于衡
46、量中位数的代表性四分位差四分位差(quartile deviation)(quartile deviation)统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1762解:解:设非常不满意为1,不满意为2,一般为3,满意为 4,非常满意为5。又已知 ql=不满意=2 qU =一般=3四分位差:q qd d=q qU U -q ql l =3 2 3 2 =1 1甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300统计
47、学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17631.1.一组数据的最大值与最小值之差一组数据的最大值与最小值之差2.2.离散程度的最简单测度值离散程度的最简单测度值3.3.易受极端值影响易受极端值影响4.4.未考虑数据的分布未考虑数据的分布R R =max(=max(x x)-min()-min(x x)5.5.计算公式为计算公式为极差极差(range)(range)统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17641.各变量值与其均值离差绝对值的平均数各变量值
48、与其均值离差绝对值的平均数2.能全面反映一组数据的离散程度能全面反映一组数据的离散程度3.数学性质较差,实际中应用较少数学性质较差,实际中应用较少4.计算公式为计算公式为平均差平均差(mean deviation)(mean deviation)统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1765【例【例】某售货小组某售货小组5 5个人,某天的销售额分别为个人,某天的销售额分别为14401440元、元、14801480元、元、15201520元、元、16001600元、元、17501750元,求该元,求该售货小组销售额的平均差。
49、售货小组销售额的平均差。元6.93546851558175015581440nxxmd 元解:155857790517501600152014801440nxx即该售货小组即该售货小组5 5个人销售额与平均数相比,平均相差个人销售额与平均数相比,平均相差93.693.6元元统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1766随机抽查4个月的销售量数据平均差计算表 按销售量分组组中值(x)频数(f)1401501501601601701701801801901902002002102102202202302302401451551
50、6517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计1202040即每一天的销售量与平均数相比,平均相差即每一天的销售量与平均数相比,平均相差1717台。台。统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1767 方差和标准差方差和标准差(variance and standard deviation)(variance and standard deviation)1.数据离散程度的最常用测度值数据离散程度的