1、上次课主要内容回顾上次课主要内容回顾1. 原始资料原始资料 2. 统计资料统计资料3. 资料整理的目的和过程资料整理的目的和过程4. 连续性资料和离散性资料连续性资料和离散性资料5. 连续性资料的频率分布(全距、组数、组距、连续性资料的频率分布(全距、组数、组距、组中值、组上限、组下限、频数、频率)组中值、组上限、组下限、频数、频率)6. 离散性资料的频率分布(类别、频数、频率)离散性资料的频率分布(类别、频数、频率)7. 统计表(简单表、复合表、与统计图的关系)统计表(简单表、复合表、与统计图的关系)8. 统计图(种类以及适合那类资料)统计图(种类以及适合那类资料) 在数理统计中,平均数是用
2、来反映在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有:心位置。常用的度量指标有: 1. 1. 算术平均数算术平均数 2. 2. 中位数(中位数(Md) 3. 3. 众数(众数(Mo) 4. 4. 几何平均数(几何平均数(G G) 5. 5. 调和平均数(调和平均数(H) X2.6 集中趋势的度量集中趋势的度量意义:意义: 作为一个资料的代表,指资料中各变数集中作为一个资料的代表,指资料中各变数集中较多的中心位置,用来与另一资料相比较。不同的较多的中心位置,用来与另一资料相比较。不同的平均数适合于不同的数据资料。平均数适
3、合于不同的数据资料。例如:例如:不同国家、地区、种族之间身高、体重等不同国家、地区、种族之间身高、体重等的的 比较;不同品种的家畜、家禽之间生产性能比较;不同品种的家畜、家禽之间生产性能 的比较的比较2.6 集中趋势的度量集中趋势的度量主要内容:主要内容:一、算术平均数一、算术平均数二、中位数、众数、几何平均数和调和平均数二、中位数、众数、几何平均数和调和平均数三、三、5 5 种平均数的关系和评价种平均数的关系和评价 2.6 集中趋势的度量集中趋势的度量2.6.1 2.6.1 算术平均数算术平均数一、定义一、定义 一组资料中,所有观测值的总和除以其个资料中,所有观测值的总和除以其个数所得到的商
4、,称为算术平均数,简称平均数数所得到的商,称为算术平均数,简称平均数或均数。或均数。最常用的一种集中趋势度量指标。最常用的一种集中趋势度量指标。 样本的平均数记为样本的平均数记为 总体平均数记为总体平均数记为 x2.6.1 2.6.1 算术平均数算术平均数xnnnxxixxx 211 :第:第i个观察值或变数个观察值或变数 n:观察值或变数的个数:观察值或变数的个数 :求和符号(:求和符号(sigma)xi计算公式:计算公式:一、直接法:一、直接法: 例例2.12.1:5 5头猪的体重分别为头猪的体重分别为7070、7272、8080、8383、 88kg88kg,问,问 5 5头猪的算术平均
5、数是多少?头猪的算术平均数是多少?)(6 .78888380727051kgx 从计算结果看从计算结果看5 5头猪都距头猪都距78.678.6(kgkg)不远,)不远,所以平均数是数量资料的代表值。所以平均数是数量资料的代表值。 上述计算方法称为上述计算方法称为直接法直接法,适用于样本小,适用于样本小,即资料内包含变数个数不多,一般在即资料内包含变数个数不多,一般在3030个变数以个变数以下未经分组的资料。下未经分组的资料。2.6.1 2.6.1 算术平均数算术平均数二、加权法二、加权法 1. 1. 分类资料:每个类别在某个指标上取相同的值。分类资料:每个类别在某个指标上取相同的值。 2. 2
6、. 计数资料和连续性资料:频率分布表计数资料和连续性资料:频率分布表 加权法,即计算时先将各个变数乘上它加权法,即计算时先将各个变数乘上它的权数,再经过总和,然后除以权数的总合,的权数,再经过总和,然后除以权数的总合,称为加权平均数。称为加权平均数。2.6.1 2.6.1 算术平均数算术平均数fxfiiix x xi i= =变数值变数值 f fi i= =变数值变数值x xi i出现的频数出现的频数计算公式:计算公式:2.6.1 2.6.1 算术平均数算术平均数例例2.22.2:一个有一个有10001000个个体的群体,等位基因个个体的群体,等位基因 A A 的的 频率为频率为0.60.6,
7、另一个,另一个400400个个体的群体,个个体的群体, 等位基因等位基因 A A 的频率为的频率为0.30.3,这两个群体的混,这两个群体的混 合在一起,整个混合群体的等位基因合在一起,整个混合群体的等位基因 A A 的的 频率为:频率为:5131. 040010004003 . 010006 . 02.6.1 2.6.1 算术平均数算术平均数例例2.32.3:200200头大白猪的仔猪的一月窝重的资料见表头大白猪的仔猪的一月窝重的资料见表2-12-1组别组别组中值组中值频数(频数(f f)fxfx8-8-16-16-24-24-32-32-40-40-48-48-56-56-64-64-72
8、-72-80-80-88-88-96-96-104-104-112-112-121220202828363644445252606068687676848492921001001081081161164 46 69 9101013131717262635352828212116168 84 43 348481201202522523603605725728848841560156023802380212821281764176414721472800800432432348348总合总合20020013120131202.6.1 2.6.1 算术平均数算术平均数)(6.65200131203.
9、643116.620412kgx2.6.1 2.6.1 算术平均数算术平均数fxfiiixx xi i= =组中值组中值f fi i= =组中值出现的频数组中值出现的频数例例2.3:表:表22和表和表25三、性质三、性质(一)离均差之和为零:(一)离均差之和为零: 一个样本观察值与平均数之差简称离一个样本观察值与平均数之差简称离均差。均差。(xi- )=(x1- )+(x2- )+(xn- )= x1+x2+xn-n= xi- n xi/n= 0 xxxxx2.6.1 2.6.1 算术平均数算术平均数例例2.22.2:5头猪的体重分别为头猪的体重分别为70、72、80、83、 88kg,5头猪
10、的算术平均数是头猪的算术平均数是78.6 kg。 (70-78.670-78.6)+ +(72-78.672-78.6)+ +(80-78.680-78.6)+ + (83-78.683-78.6)+ +(88-78.688-78.6) = =(-8.6-8.6)()(- 6.6- 6.6)+ 1.4+ 4.4+ 9.4+ 1.4+ 4.4+ 9.4 = 0 = 02.6.1 2.6.1 算术平均数算术平均数(二)离均差平方和最小:(二)离均差平方和最小:一个样本的各个观察值一个样本的各个观察值与平均数之差的平方和比各个观察值与任意其他数与平均数之差的平方和比各个观察值与任意其他数之差的平方和
11、小。即:之差的平方和小。即:Axxxii22所以:平均数是与各个观察值最接近的数值。所以:平均数是与各个观察值最接近的数值。所以:平均数代表这个样本的集中趋势。所以:平均数代表这个样本的集中趋势。2.6.1 2.6.1 算术平均数算术平均数定义:定义:n n个非负数的乘积开个非负数的乘积开n n次方的根称为几何平均次方的根称为几何平均 数,用数,用 G G 表示。表示。ninnXXXXG 21为了计算方便,各变数先取对数,再相加除以为了计算方便,各变数先取对数,再相加除以n n,即,即为为logGlogG,再求其反对数,即为,再求其反对数,即为G G值。值。nnXXXGGlglglglg)(l
12、glg21111 2.6.2 2.6.2 几何平均数几何平均数2.6.2 2.6.2 几何平均数几何平均数从公式可以知道:几何平均数就是首先将原数据转从公式可以知道:几何平均数就是首先将原数据转换为对数;然后求对数值的算数平均数;最后再取换为对数;然后求对数值的算数平均数;最后再取反对数还原。反对数还原。几何平均数用于以百分率、比例表示的数据资料,几何平均数用于以百分率、比例表示的数据资料,如增长率、利率、药物效价、抗体滴度等。如增长率、利率、药物效价、抗体滴度等。能够消弱数据中个别过分偏大值的影响。能够消弱数据中个别过分偏大值的影响。2.6.2 2.6.2 几何平均数几何平均数例例2.3:某
13、奶牛场在某奶牛场在1995年有年有100头奶牛,已知在头奶牛,已知在1996,1997和和1998年的奶牛头数分别为前一年的年的奶牛头数分别为前一年的2,3和和4.5倍,求其年平均增加率。倍,求其年平均增加率。 解:解:3275 . 43233G1998年的奶牛头数为:年的奶牛头数为: 100234.52700头头 或者或者100332700头头2.6.2 2.6.2 几何平均数几何平均数【例】【例】 某波尔山羊群某波尔山羊群19972000年各年度的存年各年度的存栏数见表,试求其年平均增长率。栏数见表,试求其年平均增长率。 2.6.2 2.6.2 几何平均数几何平均数)lglg(lg1lg2
14、11nxxxn2.6.2 2.6.2 几何平均数几何平均数加权法:分类资料或计数和连续性资料加权法:分类资料或计数和连续性资料总观测值个数个体的取值(组中值)组类第类(组)中的频数第类别数:.)(:3212121fffniXifkXXXGiinfkffk iiXfnGlg1lg1对数形式对数形式例例2.4P19定义:各观察值倒数的平均数的倒数定义:各观察值倒数的平均数的倒数 inXnxxxnH11111121适用于极端右偏态,例适用于极端右偏态,例33页页2.6.3 2.6.3 调和平均数调和平均数iiiXffH1简单调和简单调和平均数平均数加权调和加权调和平均数平均数从公式可以知道:调和几何
15、平均数就是首先将原数从公式可以知道:调和几何平均数就是首先将原数据转换为倒数;然后求倒数值的算数平均数;最后据转换为倒数;然后求倒数值的算数平均数;最后再取倒数还原。再取倒数还原。调和平均数主要用于速度类资料,或者数据中有个调和平均数主要用于速度类资料,或者数据中有个别极端大的值的情况。别极端大的值的情况。2.6.3 2.6.3 调和平均数调和平均数2.6.3 2.6.3 调和平均数调和平均数例例2.42.4:用某药物救治:用某药物救治1212只中毒的小鼠,它们的存活只中毒的小鼠,它们的存活天数记录如下:天数记录如下:8 8,8 8,8 8,1010,1010,7 7,1313,1010,9
16、9,1414,另外有两只未死亡,求平均存活天数。,另外有两只未死亡,求平均存活天数。解:未死亡的存活天数记为解:未死亡的存活天数记为,为极端右偏态,用,为极端右偏态,用算术平均数不合理。算术平均数不合理。14.11.12118181H定义:将定义:将n n个观察值从小到大依次排队,位于中个观察值从小到大依次排队,位于中间的那个观察值称为中位数。间的那个观察值称为中位数。 2.6.4 2.6.4 中位数(中位数(M Md d):观察值个数为偶数时,当为奇数时,当nXXMnXMnnndnd212221 适用于适用于偏态分布偏态分布的资料。的资料。例:例:2.5 现有一窝仔猪的出生重资料为:现有一窝
17、仔猪的出生重资料为:1.4,1.0,1.3,1.2,1.6kg,试求其中位数。,试求其中位数。解:首先将数据资料排序:解:首先将数据资料排序:1.0,1.2,1.3,1.4, 1.6;然后计算中位数:;然后计算中位数: (n+1)/2=(5+1)/2=3;Md=X3=1.3 如果增加一头仔猪,出生重为如果增加一头仔猪,出生重为1.8kg,计算中位数:,计算中位数: n/2=6/2=3 (n/2)+1=3+1=4; Md=(X3+X4)/2=(1.3+1.4)/2=1.352.6.4 2.6.4 中位数(中位数(M Md d)2.6.4 2.6.4 中位数(中位数(M Md d) 对于频数分布的
18、资料,公式如下:对于频数分布的资料,公式如下:)2(CnfiLMmmdd Lmd:中位数所在组的组下限;:中位数所在组的组下限; fm:中位数所在组的频数;:中位数所在组的频数; C:从第一组到中位数所在组的前:从第一组到中位数所在组的前一组的累积频数。一组的累积频数。 n:样本含量;:样本含量; i:组距;:组距; 例:表例:表262.6.4 2.6.4 中位数(中位数(M Md d)97.12)66100(35112)2(CnfiLMmmdd定义:在资料中某一个变数出现次数最多,就称定义:在资料中某一个变数出现次数最多,就称 之为众数。之为众数。1.1. 离散性资料:出现频数最多的数。离散
19、性资料:出现频数最多的数。2. 2. 连续性资料:频数分布表中,频数出现最多的连续性资料:频数分布表中,频数出现最多的 一组的组中值。一组的组中值。 !有的资料可出现多个众数,即多个数具有有的资料可出现多个众数,即多个数具有相同的最高频数;相同的最高频数;有的资料没有众数,即所有数出有的资料没有众数,即所有数出现的频数都相同。现的频数都相同。2.6.5 2.6.5 众数(众数(mode ,Mmode ,M0 0)2.6.6 2.6.6 各个集中趋势度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价一、各个集中趋势度量指标之间的关系一、各个集中趋势度量指标之间的关系 1.1.在完全对称
20、分布情况下,算数平均数、中位数在完全对称分布情况下,算数平均数、中位数 和众数三者相等。和众数三者相等。2.6.6 2.6.6 各个集中趋势度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价二、集中趋势指标的评价二、集中趋势指标的评价 应满足以下几个条件:应满足以下几个条件: 1.1.必须有严格的定义及算法,避免有主观成分存必须有严格的定义及算法,避免有主观成分存在其间;在其间; 2.2.计算过程中应利用全部观察值;计算过程中应利用全部观察值; 3.3.简单明了,容易领悟,容易计算;简单明了,容易领悟,容易计算; 4.4.受抽样变动影响不大,即抽样误差小。受抽样变动影响不大,即抽样误
21、差小。 5.5.适用于代数方法处理。适用于代数方法处理。 (1 1)算术平均数)算术平均数 能够满足以上所有的条件,适用于正态分布资能够满足以上所有的条件,适用于正态分布资料。料。 家畜的大多数数量性状都是正态分布,因此算家畜的大多数数量性状都是正态分布,因此算术平均数是最常用的,也是最重要的。术平均数是最常用的,也是最重要的。 但是当分布不对称时,呈偏态时,用算术平均但是当分布不对称时,呈偏态时,用算术平均数则难以表示资料的集中趋势。数则难以表示资料的集中趋势。2.6.6 2.6.6 各个集中趋势度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价2.6.6 2.6.6 各个集中趋势
22、度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价(2 2)中位数)中位数 能够满足第能够满足第 2 2、3 3条,适用于非参数检验,如条,适用于非参数检验,如卡方检验。卡方检验。(3 3)几何平均数和调和平均数)几何平均数和调和平均数 能够满足第能够满足第 1 1、2 2 、5 5条,适用于右偏态分布。条,适用于右偏态分布。(4 4)众数)众数 仅满足第仅满足第3 3条,日常生活常用,如鞋子、衣服尺条,日常生活常用,如鞋子、衣服尺码码 2.6.6 2.6.6 各个集中趋势度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价x2.6.6 2.6.6 各个集中趋势度量指标之间的
23、关系和评价各个集中趋势度量指标之间的关系和评价例:一家小企业例:一家小企业13个员工工资为:个员工工资为:13500,11500,11000,9000,8500,8000,6500,6000,3500,3500,3500,3500,3000元。元。如果低工资的员工抱怨工资低,老板可以用算术平均如果低工资的员工抱怨工资低,老板可以用算术平均数消除员工不满,我们平均有数消除员工不满,我们平均有7000元收入。元收入。如果慈善机构来募捐,他会搪塞说,我们多数人工资如果慈善机构来募捐,他会搪塞说,我们多数人工资才才3500元(众数)。元(众数)。在别的场合,他又可以用中位数在别的场合,他又可以用中位数
24、6500元。元。对于学过统计的人来说,不能盲目接受别人说的一个对于学过统计的人来说,不能盲目接受别人说的一个统计指标,而应对数据进行分析并作出科学的评价。统计指标,而应对数据进行分析并作出科学的评价。一、平均数的代表程度与样本的变异程度有关一、平均数的代表程度与样本的变异程度有关 一个样本内有很多的变数,用平均数作为样本一个样本内有很多的变数,用平均数作为样本的代表,其代表程度决定于样本内各个变数的变异的代表,其代表程度决定于样本内各个变数的变异程度。程度。1.1.如果各个变数相同或者变异程度比较小,则平均如果各个变数相同或者变异程度比较小,则平均数能够代表整个样本。数能够代表整个样本。2.2
25、.如果各个变数的变异程度比较大,则平均数的代如果各个变数的变异程度比较大,则平均数的代表性就小。表性就小。 因此,单靠平均数不能全面、正确地了解样因此,单靠平均数不能全面、正确地了解样本。也不能了解平均数作为样本的变异程度本。也不能了解平均数作为样本的变异程度 2.7 离散趋势的度量离散趋势的度量例,即使两个样本的平均数相同,但是样本内变数例,即使两个样本的平均数相同,但是样本内变数的变异程度不一定相同。的变异程度不一定相同。产仔数产仔数总总和和平均数平均数品种品种甲甲8 8,4 4,1616,1212,2222,1717,6 6,1414,6 6,5 51101101111品种品种乙乙141
26、4,8 8,1111,9 9,1111,1212,1010,1414,1313,8 811011011112.7 离散趋势的度量离散趋势的度量从以上统计结果可知:从以上统计结果可知:1.1.甲乙两品种的平均产仔数相同,都是甲乙两品种的平均产仔数相同,都是1111头,从平均数来头,从平均数来 看,两个品种没有差异。看,两个品种没有差异。2.2.进一步观察各个变数,两个样品的变异程度并不相同。进一步观察各个变数,两个样品的变异程度并不相同。 甲:最小为甲:最小为4 4,最大为,最大为2222;乙:最小为;乙:最小为8 8,最大为,最大为1414 甲的变异程度大于乙甲的变异程度大于乙 甲的平均数的代
27、表性小于乙的平均数甲的平均数的代表性小于乙的平均数 所以,应该测定其变异程度所以,应该测定其变异程度2.7 离散趋势的度量离散趋势的度量一一 全距全距( (范围或极差范围或极差) ) 定义:全部变数的最大值与最小值之差定义:全部变数的最大值与最小值之差 R= Max(x)-Min(x)R= Max(x)-Min(x) 全距可以反映变异程度的一部分,但是不能代表样全距可以反映变异程度的一部分,但是不能代表样本本内各变数之间的变异程度。内各变数之间的变异程度。 目前,被广泛使用的是以目前,被广泛使用的是以标准差标准差来度量变异程度来度量变异程度2.7 离散趋势的度量离散趋势的度量二、标准差的定义二
28、、标准差的定义 如果一个样本有如果一个样本有n个观察值个观察值x1,x2 xn,设其算术平均设其算术平均数为数为 ,则该样本的标准差为:,则该样本的标准差为:x12nxxsi从公式可以看出,标准差考虑了每个从公式可以看出,标准差考虑了每个变数与平均数的离差。变数与平均数的离差。每个变数与平均数与平均数相差愈小,每个变数与平均数与平均数相差愈小,样本变异程度愈小,反之,愈大。样本变异程度愈小,反之,愈大。因此,标准差是离散程度的度量因此,标准差是离散程度的度量2.7 离散趋势的度量离散趋势的度量三、标准差公式的来源三、标准差公式的来源1.离均差离均差=(x- )2.离均差之和离均差之和= (x-
29、 x- )=0=03.3.离均差平方和离均差平方和 SS= SS= (x- x- )2 2xxx虽然离均差可以衡量变异程度,但是离均差之和为0,所以不是理想的指标为了合理地计算平均差异,用平方和的办法来消除离均差的正负号,离均差平方相加,得到平方和(SS),但是由于不同样本的观察值个数不同,所以离均差平方和也不是理想指标2.7 离散趋势的度量离散趋势的度量4.4.样本均方和样本标准差样本均方和样本标准差122nxxs12nxxs将离均差平方和求平均数,称为样本均方,目的是消除观察值个数的影响样本均方开方,目的是使变异还原,即标准差。nx225.5.总体均方和总体标准差总体均方和总体标准差nx2
30、总体是未知的,用样本标准差估计和推断总体标准差2.7 离散趋势的度量离散趋势的度量四、四、自由度自由度:能够独立取值的观测值个数,:能够独立取值的观测值个数, 一般一般df = n-1df = n-1: 对于小样本,计算标准差的时候,样本含量为对于小样本,计算标准差的时候,样本含量为n,df=n-1,目的是纠正由于样本小而发生的取样误差影响。,目的是纠正由于样本小而发生的取样误差影响。 如果一个样本含有如果一个样本含有n个变数,从理论上讲,个变数,从理论上讲,n个变数都个变数都同样用以计算标准差,同样用以计算标准差,n个变数与平均数相减有个变数与平均数相减有n个离均个离均差。表面上虽有差。表面
31、上虽有n个比较,但实质上仅有个比较,但实质上仅有n-1个可以自由个可以自由变动,最后一个离均差受到变动,最后一个离均差受到离均差之和离均差之和这个条件的限制,这个条件的限制,所以不能自由。所以不能自由。 2.7 离散趋势的度量离散趋势的度量例如,例如, 有有5个变数,其个变数,其4个离均差为个离均差为-2、-1、1、2,则,则第第5个离均差必等于个离均差必等于0,如,如4个离均差为个离均差为-1、0、1、2时,则第时,则第5个离均差必等于个离均差必等于-2,这样才能使离均差,这样才能使离均差的总和等于的总和等于0。这。这5个离均差中,因受离均差之和等个离均差中,因受离均差之和等于于0的限制,所
32、以只有的限制,所以只有4个能自由变动。这时的自由个能自由变动。这时的自由度就是度就是n-1。自由度等于样本变数的总个数减去计算自由度等于样本变数的总个数减去计算过程中使用的条件数。过程中使用的条件数。2.7 离散趋势的度量离散趋势的度量在计算标准差时,条件就是一个,即在计算标准差时,条件就是一个,即0 xx所以,自由度为所以,自由度为n-1。 如计算样本某一个统计数应用如计算样本某一个统计数应用2个条件,其自由度则为个条件,其自由度则为n-2,如果应用如果应用k个条件,则自由度为个条件,则自由度为n-k。 小样本常用自由度来计算标准差或其他统计数,因为小小样本常用自由度来计算标准差或其他统计数
33、,因为小样本的全距较群体为小,若为大样本,当与群体较接近时,样本的全距较群体为小,若为大样本,当与群体较接近时,可以不用自由度,直接用可以不用自由度,直接用n即可。自由度的符号以即可。自由度的符号以“df”表示。表示。2.7 离散趋势的度量离散趋势的度量五、标准差的计算方法五、标准差的计算方法1.直接法直接法1)(2nxxS12)(2nxnx2.7 离散趋势的度量离散趋势的度量标准差的计算方法标准差的计算方法【例】【例】 计算计算10只辽宁绒山羊产绒量:只辽宁绒山羊产绒量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600,650(g)的标准差。)
34、的标准差。 此例此例n=10,经计算得:,经计算得:x=5400,x2=2955000,代入上式得:,代入上式得: 即即10只辽宁绒山羊产绒量的只辽宁绒山羊产绒量的 标准差标准差 为为65.828g。gnnxxS828.6511010/540029550001/)(222标准差的计算方法标准差的计算方法2.加权法加权法对于已制成次数分布表的大样本资料,可利用次数对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。计算公式为:分布表,采用加权法计算标准差。计算公式为:式中,式中,f为各组次数;为各组次数;x为各组的组中值。为各组的组中值。 1/)(1)(222nnfxfxf
35、xxfS 表表3-4 某纯系蛋鸡某纯系蛋鸡200枚蛋重资料次数分布枚蛋重资料次数分布 及标准差计算表及标准差计算表下一张下一张 主主 页页 退退 出出 上一张上一张 【例】【例】 利用某纯系蛋鸡利用某纯系蛋鸡200枚蛋重资料的次枚蛋重资料的次数分布表(见表数分布表(见表3-4)计算标准差。)计算标准差。 将表将表3-4中的中的f、fx、fx 2代入式得:代入式得: 即某纯系蛋鸡即某纯系蛋鸡200枚蛋重的标准差为枚蛋重的标准差为3.5524g。gfffxfxS5524. 31200200/1.1070511.5755071/)(222下一张下一张 主主 页页 退退 出出 上一张上一张 标准差的特
36、性标准差的特性 (一)标准差的大小,受资料中每个观测值的影响,(一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。如观测值间变异大,求得的标准差也大,反之则小。 (二)在计算标准差时,在各观测值加上或减去一(二)在计算标准差时,在各观测值加上或减去一个常数,其数值不变。个常数,其数值不变。 (三)当每个观测值乘以或除以一个常数(三)当每个观测值乘以或除以一个常数a,则所,则所得的标准差是原来标准差的得的标准差是原来标准差的a倍或倍或1/a倍。倍。 下一张下一张 主主 页页 退退 出出 上一张上一张 2.7.2 范围范围 又称全距,或极差,样本中最大值和最
37、小又称全距,或极差,样本中最大值和最小值的差,用值的差,用R表示表示: R=max(X)-min(X) 内百分位数范围内百分位数范围 以中位数为中心的上下两个百分位数之差。以中位数为中心的上下两个百分位数之差。 中四分位(内中四分位(内50%)范围:上下四分位数)范围:上下四分位数之差。之差。2.7 离散趋势的度量离散趋势的度量 2.7.3 平均绝对离差平均绝对离差 对以分对以分k组的资料,可用加权法计算(组的资料,可用加权法计算(fi为各组频为各组频数,数,Xi为各组组中值)为各组组中值) nXXMDnii12.7 离散趋势的度量离散趋势的度量niiiniifXXfMD11 2.7.4 变异
38、系数变异系数 变异系数是衡量资料中各观测值变异变异系数是衡量资料中各观测值变异 程度的另程度的另一个统计量一个统计量 。 标准差与平均数的比值称为标准差与平均数的比值称为 变异系数,记为变异系数,记为C.V.。 变异系数可以消除单位变异系数可以消除单位 和和 (或)平(或)平 均数不同均数不同对两个或多个资料变异程度比较的影响。对两个或多个资料变异程度比较的影响。 2.7 离散趋势的度量离散趋势的度量%100.xSVC2.7.4 2.7.4 变异系数变异系数例例1:比较两组资料:比较两组资料 1kg,2kg,3kg,4kg 与与1001kg,1002kg,1003kg,1004kg。问那组资料
39、变异程度。问那组资料变异程度大?大? 因为因为S1=S2,所以两组资料变异程度一样所以两组资料变异程度一样? 因为因为C.V.1=5.16%,C.V.2=0.13%,所以第一组,所以第一组资料变异程度大。资料变异程度大。;29.1,29.1;5 .1002,5 .22121kgSkgSkgXkgX2.7.4 变异系数变异系数 例例2:已知秦川黄牛的平均胸围:已知秦川黄牛的平均胸围182cm,标准差为标准差为6.19cm;其平均体重;其平均体重450.78kg,标准差,标准差38.96kg,问胸围与体重哪个变异程度大?问胸围与体重哪个变异程度大? S胸围胸围=6.19cm S体重体重=38.96
40、kg ? CV胸围胸围=3.797%CV体重体重=8.643% 所以体重变异程度大。所以体重变异程度大。课后习题课后习题 P26-4、5 R=284-175=109 i=109/10=10.9 近似取近似取10 第一组组中值第一组组中值 取资料中最小值取资料中最小值 175 第一组第一组 组限组限 : 170-180 其余各组依次递推其余各组依次递推100尾小黄鱼体长频数分布表尾小黄鱼体长频数分布表组别组别组中值组中值频数频数累积频数累积频数fxfxfxfx2 2170-170-1751754 44 4700700122500122500180-180-1851858 812121480148
41、0273800273800190-190-1951951111232321452145418275418275200-200-2052051212353524602460504300504300210-210-2152151616515134403440739600739600220-220-2252251111626224752475556875556875230-230-2352351010727223502350552250552250240-240-2452451010828224502450600250600250250-250-255255121294943060306078030
42、0780300260-260-2652652 29696530530140450140450270-270-2752753 39999825825226875226875280-290280-2902852851 11001002852858122581225合计合计100100100100222002220049967004996700算术平均数算术平均数fxfiiix22210022200 x中位数中位数375.219)3550(1610210)2(CnfiLMmmdd众数众数 众数众数=资料中频数最高一组资料中频数最高一组 组中值组中值 =215标准差标准差266.261100100/2
43、220049967001/)(1)(2222nnfxfxfxxfS方差方差899.6891/)(1)(2222nnfxfxfxxfMSS极差极差R=max(X)-min(X) =284-175 =109中四分位范围中四分位范围67.2012341001210200)%(LxxfxnfiLP上四分位数24372431001010240)%(LxxfxnfiLP下四分位数所以中四分位范围所以中四分位范围=243-201.67=41.33变异系数变异系数%83.11%100222266.26%100.xSVC课后习题课后习题 P26-6年度年度饲养种羊数(只)饲养种羊数(只)年增长率年增长率1995
44、1995240240199619963203200.3330.333199719973603600.1250.125199819984004000.1110.111199919994204200.0500.050200020004504500.0710.071年平均增长率年平均增长率11. 0957. 0lg071. 0lg125. 0lg333. 0lglglglglglg15112111 nnXXXG2010.4 相关试题相关试题 测定某蛋鸡配套系商品代的年产蛋量和群体测定某蛋鸡配套系商品代的年产蛋量和群体鸡白痢抗体水平,所得数据属于(鸡白痢抗体水平,所得数据属于( ) A.等级资料,数量
45、性状资料等级资料,数量性状资料 B.数量性状资料,连续性变量数量性状资料,连续性变量 C.等级资料,质量性状资料等级资料,质量性状资料 D.数量性状资料,质量性状资料数量性状资料,质量性状资料 D 统计量一般有两种,即平均数和变异数,除地统计量一般有两种,即平均数和变异数,除地位特征数外,常用的统计量是(位特征数外,常用的统计量是( )A.中位数,算术平均数,几何平均数,方差和标准差中位数,算术平均数,几何平均数,方差和标准差B.众数,算术平均数,几何平均数,方差和标准差众数,算术平均数,几何平均数,方差和标准差C.极差,算术平均数,几何平均数,方差和标准差极差,算术平均数,几何平均数,方差和
46、标准差D.算术平均数,几何平均数,方差和标准差算术平均数,几何平均数,方差和标准差 2010.4 相关试题相关试题D 几何平均数的计算其实是先将数据进行几何平均数的计算其实是先将数据进行( )转换,然后再计算算术平均数,)转换,然后再计算算术平均数,最后反转换即为几何平均数最后反转换即为几何平均数名词解释名词解释(3分分):离散型资料、统计量:离散型资料、统计量 离散型资料:指在一定范围内只取有限种可能值离散型资料:指在一定范围内只取有限种可能值的数据资料,如计数资料,分类资料。的数据资料,如计数资料,分类资料。 统计量:描述样本特征的量。如样本平均数,样统计量:描述样本特征的量。如样本平均数
47、,样本方差、标准差等。本方差、标准差等。2010.4 相关试题相关试题对对 数数2010.4 相关试题相关试题 符号释义(符号释义(2分),写出中文含义及计算公式分),写出中文含义及计算公式 1. df 2. s21.自由度;自由度;df=n-k,其中,其中n为样本含量,为样本含量,K为计算过为计算过程中使用条件数。程中使用条件数。2.样本方差;样本方差; 122nxxs 简答题(简答题(6分):描述样本集中趋势和离散趋势分):描述样本集中趋势和离散趋势的特征数有哪些?举例简要说明变异系数的用途。的特征数有哪些?举例简要说明变异系数的用途。 集中趋势:算术平均数,几何平均数,调和平均数,集中趋
48、势:算术平均数,几何平均数,调和平均数,中位数,众数。中位数,众数。 离散趋势:方差和标准差,范围,平均绝对离差,离散趋势:方差和标准差,范围,平均绝对离差,变异系数。变异系数。 变异系数用途:比较平均数数量级不同或单位不同变异系数用途:比较平均数数量级不同或单位不同时多组数据之间变异(离散)程度,如牛胸围时多组数据之间变异(离散)程度,如牛胸围cm与体重与体重kg两组资料,比较那组数据离散度大。两组资料,比较那组数据离散度大。2010.4 相关试题相关试题2010.4 相关试题相关试题计算题(计算题(10分)分)要求写出计算过程,否则只给结果分。要求写出计算过程,否则只给结果分。 某一资料由某一资料由1、3、5、7、9,总共,总共5个观测值构成,试个观测值构成,试计算将该组资料分别视为总体和样本时的总体平均数计算将该组资料分别视为总体和样本时的总体平均数 、总体方差总体方差2 、样本均数、样本方差、样本均数、样本方差s2、和变异系数、和变异系数C.V.。 相关数据:相关数据:32. 311,16. 310,83. 28,65. 272010.4 相关试题相关试题5211 nnnxxixxx59753151Nxi854222222Nx10440122nxxs%2 .63%100510%100.xSVC