1、统 计 学第四章 统计分布的数值特征分布的集中趋势第一节 分布的离中趋势第二节分布的偏度和峰度第三节第四章 统计分布的数值特征 学习目标学习目标1.掌握算术平均数的概念及种类;2.掌握调和平均数、几何平均数的计算方法和适用条件;3.掌握众数、中位数和四分位数的概念及确定方法;4.了解全距、四分位差的概念和确定方法;5.掌握标准差、离散系数的计算方法和适用条件;6.了解偏度和峰度的概念及测度。0101一、分布的集中趋势 集中趋势是对数据资料的集中状况和平均水平的综合测度。常用来表述数列集中趋势的测度有算术平均数、调和平均数(harmonic mean)、几何平均数、众数、中位数和分位数等。这些测
2、度在统计学中也称为平均指标或平均数,可以用来反映标志值的典型水平和标志值分布的中心位置或集中趋势。一、分布的集中趋势 一、算术平均数 算术平均数是统计中最基本的、应用最广泛的一种平均数。一般不特别说明时,所说的“平均数”就是指算术平均数。一、分布的集中趋势 算术平均数的类型算术平均数的类型1.根据掌握资料的不同,算术平均数可分别采用简单算术平均数和加权算术平均数两种方法进行计算。一、分布的集中趋势 (1)简单算术平均数。当掌握的资料是总体未经分组整理的资料时,应依据总体各个单位的具体资料来计算,即将总体各单位标志值简单加总除以总体单位数之和。其计算公式为一、分布的集中趋势 (2)加权算术平均数
3、。如果掌握的资料已经过分组,且编成变量数列,那么应采用加权算术平均数来计算平均数。加权算术平均数是用各组的标志值乘以相应的各组单位数,求出各组标志总量,并加总得到总体标志总量,再除以总体单位总量所得。其计算公式为一、分布的集中趋势 此外,从上述表达式中可以看出,加权算术平均数受两个因素的影响:一是各组的标志值,二是各组的单位数或频率。当各组的标志值不变时,其出现的次数f对于平均数的大小起着权衡轻重的作用,统计学称其为权数。当各组次数相等时,影响平均数的因素就只有一个,即各组的标志值,这时加权算术平均数就等于简单算术平均数。可见,简单算术平均数是加权算术平均数的特例。一、分布的集中趋势 【例4-
4、2】某商场售货员的人数及工资资料见表4-1,求该商场售货员的月平均工资。表表4 4-1 1 某商场售货员的人数及工资资料某商场售货员的人数及工资资料 一、分布的集中趋势 由上述计算可以看出,不仅受变量值x大小的影响,而且受各组单位数或频率f大小的影响。由于各组单位数或频率f对x的水平高低起着一种权衡轻重的作用,因而把f称为权数。显然,权数大的标志值对平均数的影响要大些,权数小的标志值对平均数的影响相应小些,所以算术平均数的最终计算结果一定倾向于次数多的标志值。在本例中,某商场售货员的月平均工资为1 267.2元,最接近50人对应的标志值,这个结果可作为检验平均数计算正确与否的重要参考依据。一、
5、分布的集中趋势 算术平均数的数学性质算术平均数的数学性质2.算术平均数在统计学中具有重要的地位。它是进行统计分析和统计推断的基础。首先,从统计思想上看,算术平均数是一组数据的重心所在,是数据误差相互抵消后的必然性结果。例如,对同一事物进行多次测量后的结果不一致,有可能是测量误差所致,也可能是其他因素的偶然影响所致,而利用算术平均数作为其代表值,则可以使误差相互抵消,反映出事物必然性的数量特征。其次,算术平均数具有下面一些重要的数学性质,这些数学性质不仅在实际工作中(如在相关性分析和方差分析及建立回归方程中)有着广泛的应用,而且也体现了算术平均数的统计思想。一、分布的集中趋势 (1)各变量值与其
6、算术平均数的离差之和等于零。(2)各变量值与其算术平均数的离差平方和为最小值。(3)如果对每个标志值加或减一个任意常数A,则平均数也加或减一个任意常数A,即两个独立的同性质变量代数和的平均数等于各变量平均数的代数和。(4)如果对每个标志值乘或除以一个任意常数A,则平均数也乘或除以任意常数A,即两个独立的同性质变量乘积(除商)的平均数等于各个变量平均数的乘积(除商)。一、分布的集中趋势 二、调和平均数 调和平均数又称倒数平均数,它是根据各标志值的倒数来计算的平均数,用 来表示。具体地说,调和平均数就是各标志值倒数的算术平均数的倒数,但计算结果并非是算术平均数的倒数。在统计实践中,直接使用调和平均
7、数的场合比较少,大多数情况下,都是把调和平均数看作算术平均数的变形形式来使用。调和平均数根据计算方法的不同,可以分为简单调和平均数和加权调和平均数两种。一、分布的集中趋势 简单调和平均数简单调和平均数1.当所掌握的资料未进行统计分组,且各个标志值所对应的总量都相同时,用简单调和平均数进行计算。其计算公式为 (4-6)式中,为调和平均数;xi为各标志值;n为总体单位数nx一、分布的集中趋势 加权调和平均数加权调和平均数2.前面曾提到,调和平均数是作为算术平均数(特别是加权算术平均数)的变形形式来应用的,所以应符合算术平均数的基本公式的要求,即分子应是总体的标志总量,分母应是总体的单位总量。在实际
8、的应用中,加权调和平均数比简单调和平均数的应用要广泛,而且通常是在缺少分母资料时才应用加权调和平均数。这时,式(4-7)中的m是一种特定的权数,即m=xf,m则是总体的标志总量。下面以某机械厂的有关资料来说明加权调和平均数的应用。一、分布的集中趋势 【例4-5】某机械厂工人按日产量分组(见表4-3),试计算该厂工人的平均日产量。表表4 4-3 3 某机械厂工人按日产量分组某机械厂工人按日产量分组 一、分布的集中趋势 解:当已知各组的日产零件数x和各组工人人数f时,可采用加权算术平均数来计算平均日产量;若已知的不是各组的工人人数,而是各组的日总产量m时,则可以利用加权调和平均数来计算该厂的平均日
9、产量,即该厂的平均日产量为一、分布的集中趋势 由上述对算术平均数及调和平均数的介绍可知,当计算平均指标时,若缺少分子资料,即缺少总体的标志总量,则适宜采用加权算术平均数计算;若缺少分母资料,即缺少总体的单位总量,则适宜采用加权调和平均数计算。一、分布的集中趋势 三、几何平均数 几何平均数是n个变量值连乘积的n次方根。它是几何级数(等比级数)的平均数,是计算平均比率和平均速度时比较适用的一种方法,符合人们的认识规律,通常用 来表示。Gx一、分布的集中趋势 简单几何平均数适用于资料未进行分组的情况。其计算公式为 (4-8)式中,为几何平均数;xi为变量值;n为变量值个数;为连乘符号。简单几何平均数
10、简单几何平均数1.Gx一、分布的集中趋势 【例4-6】某企业生产某种产品要经过三个连续的作业车间才能完成。若某月份第一车间粗加工产品的合格率为95,第二车间精加工产品的合格率为93,第三车间最后装配的合格率为90,则该产品的企业合格率(三个车间的平均合格率)为多少?解:由于该企业的生产是流水作业,即后续车间的生产加工是在前面车间合格制品的基础上进行的,也就是说,其制品的合格率是在前面车间的合格品的基础上计算得到的。所以,各车间合格率的总和不等于全厂的总合格率,但三个车间的合格率的连乘积却等于总合格率。因此,这是计算平均比率的问题,应采用几何平均数计算,则一、分布的集中趋势 加权几何平均数加权几
11、何平均数2.【例4-7】某投资银行某笔投资的年利率是按复利计算的,过去25年的年利率资料见表4-4,求这25年的平均年利率。表表4 4-4 4 某投资银行某笔投资过去某投资银行某笔投资过去2525年的年利率资料年的年利率资料一、分布的集中趋势 解:计算平均年利率时,必须先将各年的利率加上100,换算为各年的本利率,然后再应用几何平均数的方法。平均年本利率为 则这25年的平均年利率为8.48。一、分布的集中趋势 综上分析,几何平均数具有以下特点:(1)几何平均数主要适用于计算平均比率或平均速度,应用范围比较窄。(2)几何平均数同算术平均数、调和平均数相比,受极端值的影响比较小。(3)当变量数列中
12、的变量值为零或负数时,几何平均数将无法计算或失去意义。一、分布的集中趋势 众数是指总体中出现次数最多的那个标志值,用M0表示。众数是一种位置平均数,表示被研究社会经济现象中最普遍、最常见的标志值,以反映该现象的一般水平。例如,要掌握市场上某种蔬菜的一般价格水平,只需了解市场上最普遍的成交价格即可,而不必通过这种蔬菜的全部贸易量和贸易额的平均计算获得。假定市场上这种蔬菜使用最多的成交价格为每500克5.7元,则5.7元就可以代表这种蔬菜的一般价格水平。四、众数众数的概念众数的概念1.一、分布的集中趋势 众数的确定方法众数的确定方法2.(1)未分组数据及单项式变量数列众数的确定。当根据未分组数据或
13、单项式变量数列计算众数时,只需找出出现次数最多的变量值即可。(2)组距式变量数列众数的确定。对于组距式变量数列众数的确定,首先要将频数最多的变量值所在的组定为众数组,然后利用上限公式或下限公式来推算具体的众数值。一、分布的集中趋势【例4-10】某企业120名工人的工资资料见表4-6,试计算其众数。表表4 4-6 6 某企业某企业120120名工人的工资资料名工人的工资资料一、分布的集中趋势 解:经观察可知,变量值“26002700”这一组出现的频数最多,为40人,即众数组为变量数列的第三组,则利用式(4-11)或式(4-12)可得 由计算结果可知,众数为2640元。众数计算公式(以下限公式为例
14、)的意义为:众数等于众数组的下限加上众数组组距的一部分数量,这部分数量的大小取决于众数组前后组的次数多少。众数是按比例推算的近似值。一、分布的集中趋势 众数的特点众数的特点3.根据上面所述,众数具有以下特点:(1)众数属于位置平均数,不受极端值的影响。(2)当变量数列为均匀分布、U形分布、J形分布时,不存在众数。(3)缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不像数值平均数那样利用了全部数据信息。一、分布的集中趋势 中位数是一种按其在数列中的特殊位置而决定的平均数。将总体中各单位标志值按大小顺序排列,处在中点位置的标志值称为中位数,用Me来表示。它将全部标志值分成两部分,一半标志
15、值比它大,一半标志值比它小,而且比它大的标志值的个数和比它小的标志值的个数相等。中位数同众数一样,也属于位置平均数。五、中位数中位数的概念中位数的概念1.一、分布的集中趋势 中位数的确定方法中位数的确定方法2.(1)未分组资料中位数的确定。在资料未分组的情况下,先将变量值按从小到大的顺序排列,然后根据研究数列项数的奇偶,用相应的公式来确定中位数。一、分布的集中趋势 表表4 4-7 7 某工厂某班组某工厂某班组1111名工人生产产品零件数资料名工人生产产品零件数资料【例4-11】某工厂某班组11名工人生产产品零件数资料见表4-7,试求中位数。一、分布的集中趋势 解:中位数的位置=(n+1)/2=
16、(11+1)2=6,则中位数为第6号位置的零件数,即Me=x(6)=24件。若项数为偶数,在例4-11中加上1名工人,其生产零件为25件,则中位数应该为 与 这两个标志值的简单平均数,即一、分布的集中趋势 (2)分组变量数列中位数的确定。对于单变量值分组的情况,确定中位数时,首先要将变量数列的频数或频率进行累计;然后用公式f/2来计算中位数的项次,确定中位数组,找到中位数所在的位置;最后确定中位数。若中位数的项次用公式(f+1)/2来计算,则不太科学。这是因为,由分组资料确定中位数,一般要通过累计次数计算,而累计次数有两种表示方法:向上累计和向下累计。如果按照(f+1)/2确定中位数的位置,在
17、组距数列的情况下,根据向上累计次数和向下累计次数所计算的中位数不一致,而中位数只有一个。因而,确定中位数的位置,通常采用f/2,而不采用(f+1)/2。一、分布的集中趋势 表表4 4-9 9 某企业工人工资资料某企业工人工资资料【例4-13】表4-9为某企业工人工资资料,试计算其中位数。一、分布的集中趋势 确定中位数的方法如下:计算累计频数,见表4-9第3栏和第4栏。利用公式f/2确定中位数的项次,f/2=120/2=60。通过观察,找到中位数(以向上累计为例),从向上累计频数可知,从第41个工人到第80个工人都包含在了第三组中。由此可以判断,第60个工人也应在第三组里。利用公式求得中位数近似
18、值(以上限公式为例)。一、分布的集中趋势 中位数的特点中位数的特点3.(1)中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大值或极小值的影响,从而在一定程度上提高了中位数对分布数列的代表性。(2)有些离散型变量的单项式数列,当次数分布呈偏态时,中位数的代表性会受到影响。(3)缺乏敏感性。一、分布的集中趋势 由于算术平均数、众数和中位数的上述关系,一般认为,在比较明显的偏斜分布情况下,用中位数来说明次数分布的位置特征比较适中。因为众数忽略了偏斜一侧的大量数值,而算术平均数又过分强调了这些数值。均值对极端值的反应十分灵敏,而中位数对极端值的反应不灵敏。因此,常常
19、把中位数作为探索发现极端值的标准。把数据中的每一个数值和中位数相减,可以很容易发现极端值;而把每一个数值和均值相减却不容易发现极端值。算术平均数、众数和中位数的关系算术平均数、众数和中位数的关系4.一、分布的集中趋势 中位数是将统计分布从中间分成面积(数据个数)相等的两部分,与中位数相似的还有四分位数(quartile)、十分位数(decile)和百分位数(percentile)等。它们分别是用3个点、9个点和99个点将数据四等分、十等分和一百等分后各分位点上的值。这里只介绍四分位数的计算。六、四分位数一、分布的集中趋势 未分组资料四分位数的确定未分组资料四分位数的确定1.与中位数的计算方法类
20、似,根据未分组数据计算四分位数时,首先应对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。根据定义,四分位数的位置的确定方法是:Q1所在位置点=(n+1)/4,Q2所在位置点=2(n+1)/4=(n+1)/2,Q3所在位置点=3(n+1)/4。式中,Q1为下四分位数,Q3为上四分位数。一、分布的集中趋势 如果位置是整数,则四分位数就是该位置对应的值;如果是在0.5的位置上,则四分位数取该位置两侧值的平均数;如果是在0.25或0.75的位置上,则四分位数等于该位置的下侧值加上按比例分摊位置两侧数值的差值。一、分布的集中趋势 分组变量数列四分位数的确定分组变量数列四分位数的确
21、定2.确定单变量值分组数列的四分位数时,首先要将变量数列的频数或频率进行累计;然后用公式f/4和3f/4计算四分位数的项次,确定四分位数组,找到四分位数所在的位置;最后确定下四分位数和上四分位数。Q1所在位置点=f/4,Q2所在位置点=f/2,Q3所在位置点=3f/4。一、分布的集中趋势 表表4 4-10 10 某市某市20152015年职工家庭统计调查资料年职工家庭统计调查资料 【例4-15】某市2015年职工家庭统计调查资料见表4-10,试求其四分位数。一、分布的集中趋势 解:第1个四分位数所在位置点=f/4=10000/4=2500,则L1=2000。第3个四分位数所在位置点=3f/4=
22、310000/4=7500,则L3=5000。将有关数字代入式(4-15)和式(4-16),则得 Q2(中位数)=4337.21(元)一、分布的集中趋势 综上所述,通过四分位数可以将研究总体频数分配的集中状况反映得更加清晰。另外,将四分位数与算术平均数结合起来,还可以分析频数分布的偏度,所以四分位数也是描述频数分布集中趋势的一个重要指标。0202二、分布的离中趋势 数据的离散程度是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度,又称离中趋势。数据的离散程度越大,集中趋势的测度值对该组数据的代表性越差;反之,其代表性越好。常用的描述数据离散程度的测度值有全距、四分位差(quart
23、ile deviation)、方差(variance)、标准差(standard deviation)和离散系数等。二、分布的离中趋势 一、全距 全距也称为极差,它是表明总体单位标志数值变动范围的指标,是总体各单位全部变量值中两个极端值(最大值和最小值)之差,用R表示。其计算公式为 R=xmaxxmin (4-17)式中,R为全距;xmax为标志的最大值;xmin为标志的最小值。二、分布的离中趋势 用全距衡量总体分布的离散程度,计算方法简单,便于理解,能说明总体中各标志值变动的最大范围。但全距是根据总体中的两个极端标志值进行计算的,并不能反映所有标志值差异的大小和总体单位的分配情况,并且受极端
24、值的影响较大。二、分布的离中趋势 二、四分位差四分位差的概念四分位差的概念1.四分位数是通过三个点将全部数据四等分。如果用上四分位数减去下四分位数,可得内四分位间距或四分位间距。这个指标与一般极差的区别在于计算范围较窄,因而排除了部分极端值对变异指标的影响。但在运用指标进行分析时,人们一般习惯于取四分位间距的一半(四分位差,用QD表示)。二、分布的离中趋势 四分位差的计算四分位差的计算2.计算四分位差的步骤是:首先求出Q1、Q3所在的位置;然后根据位置确定其对应标志值,即Q1、Q3;最后取这两者差额的一半。二、分布的离中趋势 三、方差和标准差方差和标准差的概念方差和标准差的概念1.方差是总体各
25、单位标志值与其算术平均数的离差平方和的算术平均数,用2表示。标准差又称均方差,是总体各单位标志值与其平均数离差平方和的算术平均数的平方根,用表示。标准差是测定离散程度最常用、最重要的指标。二、分布的离中趋势 方差和标准差的计算方差和标准差的计算2.(1)方差的计算。(2)标准差的计算。二、分布的离中趋势 样本方差和样本标准差的计算样本方差和样本标准差的计算3.样本方差是样本各单位标志值与其算术平均数的离差平方和的算术平均数,用s2表示。样本标准差是样本各单位标志值与其平均数离差平方和的算术平均值的平方根,用s表示。二、分布的离中趋势(2)样本标准差的计算。(1)样本方差的计算。二、分布的离中趋
26、势 标准差的计算应用标准差的计算应用4.(1)未分组数据标准差的计算应用。【例4-18】某工厂某车间甲、乙两个组各有10名工人,每人日产某种零件数(单位:件)为 甲组:20,21,21,22,22,22,23,23,23,23 乙组:14,15,16,21,22,22,23,28,29,30 试计算两组工人的日产量的标准差。解:计算过程见表4-11。二、分布的离中趋势 表表4 4-11 11 甲、乙两组工人日产量的标准差计算甲、乙两组工人日产量的标准差计算 从计算结果可以看出,在甲、乙两组工人平均日产量相等的情况下,乙组的标准差大于甲组,因而乙组平均数的代表性更差一些。二、分布的离中趋势 (2
27、)已分组数据标准差的计算应用。由于方差的计算单位为平方单位,不易于直接比较,因而,标准差在经济统计中应用得更为广泛。以上计算的标准差是通过一系列的变量值与平均数计算后而得出的变异结果,它是针对变量(数量标志)现象而言的。如果是品质标志,它所表现的属性只分为两种情况。如性别这一品质标志只分为男、女两种属性;产品质量这一品质标志只分为合格和不合格两种属性;等等。通常,要研究的那个属性称为“是”,非研究的那个属性称为“非”。我们经常研究“是”属性所占的比重,即成数。二、分布的离中趋势 在统计实践中,有时需要计算成数的标准差,即是非标志的标准差。是非标志把总体分成两个部分:一部分具有某种标志,另一部分
28、不具有此种标志。这种用“是”或“非”来表示总体单位特征的标志,称为是非标志。计算是非标志的标准差时要把是非标志从质的差别转化为量的差别,一般把“是”的标志值用“1”代替,把“非”的标志值用“0”代替;总体单位数用N表示;具有所研究的标志的单位数用N1表示,成数用P表示,P=N1/N;不具有所研究的标志的单位数用N0表示,成数用Q表示,Q=N0/N。显然,N1+N0=N,P+Q=1。二、分布的离中趋势 表表4 4-13 13 某年级学生的资料某年级学生的资料【例4-20】某年级学生的资料见表4-13,求成数的标准差。二、分布的离中趋势 解:成数的平均数为 成数的标准差为 由具体数值可计算出 男生
29、成数的标准差为二、分布的离中趋势 四、离散系数 上面介绍的各离散程度测度值都是反映数据分散程度的绝对值。其数值的大小,一方面取决于原变量值本身水平的高低,即与变量的均值大小有关,变量值的绝对水平越高,离散程度的测度值越大;变量值的绝对水平越低,离散程度的测度值越小。另一方面,它们与原变量值的计量单位相同,但当采用不同计量单位计量变量值时,其离散程度的测度值将不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用标准差比较的。为了消除变量值平均水平高低和计量单位对离散程度测度值的影响,需要计算离散系数。二、分布的离中趋势 表表4 4-14 14 乙车间的生产情况乙车间的生产情
30、况 【例4-22】某企业有甲、乙两个车间,甲车间的平均产量为81件,标准差为9.9件,乙车间的生产情况见表4-14。试计算乙车间的平均产量,并比较甲、乙两个车间哪个车间的平均产量更具代表性。二、分布的离中趋势 解:(1)乙车间的平均产量为 乙车间平均产量的标准差为 由乙=9.16(件)从计算结果看,虽然甲,但是由于甲、乙两个车间的平均产量不等,故不能直接肯定说明甲车乙间产量的变动程度比乙车间大,应该通过计算标准差系数来加以判断。乙=9.16(件)二、分布的离中趋势 (2)甲车间的标准差系数为 乙车间的标准差系数为 因为V甲V乙,所以,甲车间的平均产量更具有代表性,即乙车间产量的变动程度更大。分
31、布的偏度和峰度0303三、分布的偏度和峰度 一、偏度偏度的概念偏度的概念1.偏度是指反映频数分布偏态方向和程度的指标。已知频数分布,若用图形表示,则可以看出有的是对称的,有的是非对称的(偏态)。偏度是对分布偏斜方向和程度的测试,与平均数和标准差一样,也是反映频数分布性质的一个重要指标。偏态通常分为两种:右偏(或正偏)和左偏(或负偏)。当分布中心对称时,算术平均数、中位数和众数是相等的;分布越偏,三者差距越大。三、分布的偏度和峰度 偏度的测定偏度的测定2.“偏度”一词由英国统计学家皮尔森(Pearson)于1895年提出,它是对数据分布对称性的测度。前面已经提到,利用众数、中位数和均值之间的关系
32、可以大体上判断数据分布是对称、左偏还是右偏。显然,判断偏度的方向并不困难,但要测度偏斜的程度则需要计算偏度系数SK。三、分布的偏度和峰度 表表4 4-15 15 某企业某企业120120名工人工资的偏度及峰度的计算名工人工资的偏度及峰度的计算 【例4-23】根据例4-10中某企业120名工人的工资资料,试计算该企业工人工资的偏度系数。解:计算过程见表4-15。三、分布的偏度和峰度 将计算结果代入式(4-31),得 由计算结果可以看出,偏度系数为正,但数值非常小,这说明该企业工人工资的分布为右偏分布,但偏斜程度非常小,接近正态分布。三、分布的偏度和峰度 一、峰度峰度的概念峰度的概念1.峰度是指频
33、数分布曲线与正态分布曲线相对平坦或尖峭的程度。它反映了频数分布的各个度量集中于平均数左右的相对程度,同偏度一样,峰度也是频数分布的一个重要特征。三、分布的偏度和峰度 峰度的类型峰度的类型2.峰度通常分为以下三种:(1)正态峰度。正态峰度又称标准峰度,是指次数分布各变量值在平均数左右均匀分布时形成的正态曲线的峰度。(2)尖顶峰度。尖顶峰度是指变量值的次数在众数周围分布比较集中,使次数分布曲线比正态分布曲线顶峰更为隆起尖峭。(3)平顶峰度。平顶峰度是指变量值的次数在众数周围分布较为分散,使次数分布曲线较正态分布曲线更为平缓。三、分布的偏度和峰度 峰度的度量峰度的度量3.当根据未分组数据计算峰度系数
34、K时,通常采用的公式为 (4-33)当根据已分组数据计算峰度系数K时,需要用离差四次方的平均数除以标准差的四次方,其计算公式为 (4-34)式中,s4为样本标准差的四次方。三、分布的偏度和峰度 三、利用SPSS软件进行描述性统计 【例4-25】已知某大型商场6月份的日销售额(单位:万元)为 236 238 240 249 252 257 258 261 268 265 267 268 269 268 272 273 274 268 278 280 268 284 291 292 295 297 301 303 310 322 试利用SPSS软件对这些数据进行描述性统计分析。解:(1)将日销售额
35、的数据录入SPSS软件中,将“日销售额”这一变量定义为数值型变量。(2)执行“分析”“描述统计”“描述”命令,打开“描述性”对话框,选中左侧列表框中的“日销售额”选项,将其选入“变量”列表框中,如图4-2所示。三、分布的偏度和峰度 图图4 4-2 “2 “描述性描述性”对话框对话框三、分布的偏度和峰度 峰度的度量峰度的度量3.(3)单击“选项”按钮弹出“描述:选项”对话框,如图4-3所示,选中所需的描述统计量,单击“继续”按钮,保存设置。图图4 4-3 “3 “描述:选择描述:选择”对话框对话框三、分布的偏度和峰度 图图4 4-4 4 描述统计量描述统计量 (4)在“描述性”对话框中单击“确定”按钮,即可得到描述统计结果,如图4-4所示。根据图4-4中显示的结果,可以计算出标准差系数为 V=(/)100%=(21.136 23/273.466 7)100%=7.729%感 谢 收 看!