1、离散趋势指标离散趋势指标(变异程度的统计描述)变异程度的统计描述)(Measures of Dispersion)要求:要求:掌握:掌握:标准差的含义及计算方法;标准差的含义及计算方法;变异系数的计算方法和应用。变异系数的计算方法和应用。熟悉:熟悉:其他描述离散趋势的常用指其他描述离散趋势的常用指标。标。B离散趋势离散趋势(dispersion tendency)指标指标三组同年龄、同性别儿童的体重(三组同年龄、同性别儿童的体重(kgkg)甲组甲组 26 28 30 32 34 26 28 30 32 34 乙组乙组 24 27 30 33 36 24 27 30 33 36 丙组丙组 26
2、29 30 31 34 26 29 30 31 34 x30 30 30 30 30 30 B标准差的意义标准差的意义 标准差是表示一组观察者离散程度或变标准差是表示一组观察者离散程度或变异程度的统计指标;异程度的统计指标;描述一个变量的所有观察值与均数的描述一个变量的所有观察值与均数的平均离散程度的指标。平均离散程度的指标。B 全距表示一群变量值的最大值与最小值全距表示一群变量值的最大值与最小值之差,反映个体差异的范围,用之差,反映个体差异的范围,用R R表示。全表示。全距大,说明变异度大;反之,说明变异度距大,说明变异度大;反之,说明变异度小。小。甲组甲组 26 28 30 32 3426
3、 28 30 32 34 乙组乙组 24 27 30 33 3624 27 30 33 36R=8R=8R=12R=12一、全距一、全距(range)(range)B1.不能全面反映资料的离散程度;不能全面反映资料的离散程度;2.不稳定,易受极端值的影响,抽样不稳定,易受极端值的影响,抽样 误差大。误差大。优点缺点1.表示变异范围,简单明了、容易使用,如表示变异范围,简单明了、容易使用,如用于说明传染病、食物中毒等的最短、最用于说明传染病、食物中毒等的最短、最长潜伏期等;长潜伏期等;2.各种分布类型的资料均可用。各种分布类型的资料均可用。全距全距(range)(range)B二、四分位数间距二
4、、四分位数间距(quartile interval)(quartile interval)四分位数间距是上四分位数四分位数间距是上四分位数(QQU U=P P7575)和和下四分位数下四分位数(QQL L=P P2525)之差,用之差,用QQ表示表示(QQU U-QQL L)。该数值越大,说明变异度越大;反。该数值越大,说明变异度越大;反之,说明变异度越小。之,说明变异度越小。B某地某地630630名正常女性血清甘油三脂含量名正常女性血清甘油三脂含量(mg/dl)(mg/dl)B L L:组段的下限;组段的下限;i iMM:组距;组距;f fx x:频数;频数;f fL L:P Px x所在组
5、段之前的累积频数。所在组段之前的累积频数。xxLxiffxnLP%)mmol/L(632.030.01692725.063040.025P)mmol/L(357.130.08145775.063030.175 P)/(725.0632.0357.1LmmolQQQLUB1.与中位数配套,用于偏态分布资料及分布的与中位数配套,用于偏态分布资料及分布的一端或两端无确切数值的资料;一端或两端无确切数值的资料;2.比全距稳定。比全距稳定。未考虑到每个观察值的变异度。未考虑到每个观察值的变异度。优点缺点 四分位数间距四分位数间距(quartile interval)B 三、平均差距指标三、平均差距指标(
6、一)平均偏差(一)平均偏差(Mean Difference(Mean Difference)甲班:甲班:乙班:乙班:特点特点:直观直观 ,易理解;但由于用了绝对值,不便于易理解;但由于用了绝对值,不便于数学处理,实际中很少使用。数学处理,实际中很少使用。nXX 平均偏差平均偏差)平均偏差15.52(cm806.1621866.1621456.1621622.32(cm)904.1621664.1621604.162164平均偏差B(二)离均差平方和(二)离均差平方和(Sum of SquareSum of Square,SSSS)为了克服平均偏差的缺点,可以不通过取绝对值,为了克服平均偏差的缺
7、点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平而是通过取平方来避免正负抵消,即使用离均差平方和,其计算公式为方和,其计算公式为 SS SS 通常作为一个中间统计量使用。通常作为一个中间统计量使用。nXXXXSS222)()(B(三)方差(三)方差(Variance)(Variance)方差是将离均差平方和再取平均,即方差是将离均差平方和再取平均,即 注意:对于样本资料,分母用的是注意:对于样本资料,分母用的是n n-1-1,称为自由度称为自由度(degree of freedom(degree of freedom,df)df)。方差的特点:便于数学上的处理,但由于有方差
8、的特点:便于数学上的处理,但由于有平方,度量衡发生变化,不便于实际应用。平方,度量衡发生变化,不便于实际应用。1)(22 nXXSB方差方差(variance(variance)1)()(2222nxxSNxii自由度自由度n限制条件的个数,用限制条件的个数,用表示。表示。(n1):当):当 选定时,选定时,n个变量值个变量值 中能自由变动的变量值的个数。中能自由变动的变量值的个数。xB(1)方差越大,资料的离散程度越方差越大,资料的离散程度越 大大(全面考虑了每个观察值全面考虑了每个观察值);(2)不受观察值个数的影响。不受观察值个数的影响。优点缺点 一些资料不适用于以平方表示。一些资料不适
9、用于以平方表示。方差方差(variance(variance)B 四、标准差四、标准差(Standard Deviation)将方差取平方根,还原成与原始观察值单位相将方差取平方根,还原成与原始观察值单位相同的变异量度即为标准差:同的变异量度即为标准差:例如对于例例如对于例3.13.1经计算有经计算有 甲患者:甲患者:同理乙患者同理乙患者:1)(1)(222 nnXXnXXS813 X1337132 X5n(mmHg)49.19155/8131337132 S(mmHg)88.2 SB例例 三组同年龄、同性别儿童的体重(三组同年龄、同性别儿童的体重(kgkg)甲组甲组 26 28 30 32
10、3426 28 30 32 34乙组乙组 24 27 30 33 3624 27 30 33 36丙组丙组 26 29 30 31 34 26 29 30 31 34 直接法直接法1)(1)(222nnxxnxxSiiiB加权法加权法1)(22iiiiiiffxfxfSB)(58.61130130)18600(26668242cmcmSB标准差应用标准差应用1.表示观察值分布的离散程度。均数相近、表示观察值分布的离散程度。均数相近、度量单位相同的条件下,度量单位相同的条件下,S越大,观察值越大,观察值的变异程度越大,均数的代表性越差。的变异程度越大,均数的代表性越差。2.结合均数计算结合均数计
11、算CV。3.结合均数描述正态分布资料的分布特征结合均数描述正态分布资料的分布特征和估计医学参考值范围和估计医学参考值范围4.结合样本含量计算标准误。结合样本含量计算标准误。B 五、变异系数五、变异系数(Coefficient of Variation)(Coefficient of Variation)主要用于对均数相差较大或单位不同的几组观察主要用于对均数相差较大或单位不同的几组观察值的变异程度进行比较。值的变异程度进行比较。例例3.3 3.3 测得某地成年人舒张压均数为测得某地成年人舒张压均数为77.5mmHg,77.5mmHg,标准差为标准差为10.7mmHg10.7mmHg;收缩压均数
12、为;收缩压均数为122.9mmHg,122.9mmHg,标准差为标准差为17.1mmHg17.1mmHg。试比较舒张压和收缩压的变。试比较舒张压和收缩压的变异程度。异程度。%100 XSCV%8.13%1005.777.10 舒舒张张压压CV%9.13%1009.1221.17 收收缩缩压压CVB变异系数变异系数 Coefficient of variation(CV)Coefficient of variation(CV)应用应用1.1.表示数据分布的相对离散程度表示数据分布的相对离散程度2.2.比较均数相差悬殊的两组或多组资料比较均数相差悬殊的两组或多组资料的离散程度的离散程度3.3.比较
13、度量衡单位不同的两组或多组比较度量衡单位不同的两组或多组资料的变异程度资料的变异程度%100XSCVB 某地某地2020岁男子岁男子160160人,身高均数为人,身高均数为166.06cm166.06cm,标准差为,标准差为4.95cm4.95cm;体重均数;体重均数为为53.72kg53.72kg,标准差为,标准差为4.96kg4.96kg。比较身高。比较身高与体重的变异程度。与体重的变异程度。2020岁男子体重的变异程度比身高的岁男子体重的变异程度比身高的变异程度大。变异程度大。%98.2%10006.16695.4CV身高%23.9%10072.5396.4CV体重B 某地不同年龄女童的
14、身高(某地不同年龄女童的身高(cmcm)资料如)资料如下表所示下表所示 。试比较不同年龄身高的变异程。试比较不同年龄身高的变异程度。度。某地不同年龄女童身高的变异程度某地不同年龄女童身高的变异程度年龄组年龄组 人数人数 均数均数 标准差标准差 CV(%)12月月 100 56.3 2.1 3.756月月 120 66.5 2.2 3.333.5岁岁 300 96.1 3.1 3.255.5岁岁 400 107.8 3.3 3.1B小结小结全距与四分位数间距:全距与四分位数间距:后者较稳定,但均不能后者较稳定,但均不能综合反映各观察值的变异程度。综合反映各观察值的变异程度。标准差标准差:最为常用
15、,对正态分布尤为重要:最为常用,对正态分布尤为重要变异系数变异系数:可用于多组资料间度量衡单位:可用于多组资料间度量衡单位不同或均数相差悬殊时作变异度的比较。不同或均数相差悬殊时作变异度的比较。以上指标都是数值越小,说明观察值以上指标都是数值越小,说明观察值的变异度越小,均数的代表性越好。的变异度越小,均数的代表性越好。平均指标和变异指标常配套使用平均指标和变异指标常配套使用 如如 正态分布:均数、标准差;正态分布:均数、标准差;偏态分布:中位数、四分位间距偏态分布:中位数、四分位间距B 练习:练习:某市某市19741974年为了解该地居民发汞的基础水平年为了解该地居民发汞的基础水平,为汞污染
16、的环境监测积累资料为汞污染的环境监测积累资料,调查了留住该市一调查了留住该市一年以上年以上,无明显肝、肾疾病,无汞作业接触史的居无明显肝、肾疾病,无汞作业接触史的居民民238238人的发汞含量人的发汞含量(mol/kg)如下如下:用何种指标说明本资料的集中位置和变异程用何种指标说明本资料的集中位置和变异程度较好?并计算之。度较好?并计算之。发发汞汞值值1.5 3.5 5.57.5 9.511.513.515.517.519.5人人数数2066604818166103B 某检验师测定了某检验师测定了1010名正常成年钢铁工人的血名正常成年钢铁工人的血红蛋白值红蛋白值(g/dl)(g/dl)和红细
17、胞数和红细胞数(万万/mm/mm3 3)如下如下,试比试比较这两个检测项目的结果哪个变异性大较这两个检测项目的结果哪个变异性大?血红蛋白血红蛋白(g/dL)13.0 13.6 14.0 14.5 14.6 14.7 15.2 15.5 15.8 16.0血细胞数血细胞数(万万/mm3)510 515 517 518 520 522 524 525 528 530BB小小 结结 1.1.描述一组观察值,除需要表示其平均水平外,描述一组观察值,除需要表示其平均水平外,还要说明它的离散或变异的情况。还要说明它的离散或变异的情况。2.2.衡量变异程度大小的指标有多种衡量变异程度大小的指标有多种:极差、四分位极差、四分位数间距、方差、标准差和变异系数。其中应用最多数间距、方差、标准差和变异系数。其中应用最多的是标准差和变异系数。的是标准差和变异系数。B作业:作业:1、标准差与全距、四分位数间距比较、标准差与全距、四分位数间距比较,有哪些优点?,有哪些优点?2、变异系数在什么情况下应用?它与、变异系数在什么情况下应用?它与标准差有什么区别和联系?标准差有什么区别和联系?B