1、周玲凤周玲凤 集中趋势和离散趋势描述 要了解资料的分布状况 频数分布图频数分布表与频数分布图频数分布表与频数分布图 频数分布表的编制频数分布表的编制 找全距找全距 R=最大值最大值-最小值最小值 定组距定组距 i=全距全距/组数组数 写组段写组段 第一组组段包括最小值第一组组段包括最小值 最后一组组段包括最大值最后一组组段包括最大值 划划 记记 各组段的观察单位数(频数)各组段的观察单位数(频数)反映资料的分布类型反映资料的分布类型简化计算简化计算 集中趋势:变量值集中分布的位置集中趋势:变量值集中分布的位置 离散趋势:离散趋势:变量值围绕集中位置变量值围绕集中位置的的 分布情况分布情况 对称
2、分布对称分布 偏态分布偏态分布 某某地区地区130名正常成年男子红细胞数名正常成年男子红细胞数(1012/L)的频数分布的频数分布 红细胞数红细胞数 划划 记记 频频 数数 3.70|2 3.90|44.10正正|94.30正正正正正正|164.50正正正正正正正正|224.70正正正正正正正正正正 254.90正正正正正正正正|215.10正正正正正正|175.30正正|95.50|45.705.90|1 合合 计计 130*对称分布(正态分布)对称分布(正态分布)偏态偏态分布分布 238名正常人发汞值名正常人发汞值(g/g)发发 汞汞 值值 频频 数数 累计频数累计频数 累计频率累计频率(
3、%)(1)(2)(3)(4)=(3)/238 0.3 20 20 8.4 0.7 6686 36.1 1.1 60 146 61.3 1.5 48 194 81.5 1.9 18 212 89.1 2.3 16 228 95.8 2.7 6 234 98.3 3.1 1 235 98.7 3.5 0 235 98.7 3.9 3 238 100.0某地某年恶性肿瘤死亡数某地某年恶性肿瘤死亡数年龄组年龄组(岁)岁)死亡人数死亡人数 累计频数累计频数 累计频率(累计频率(%)05 5 0.42 10 12 17 1.41 20 15 32 2.66 30 76 108 8.98 40 189 29
4、7 24.69 50 234 531 44.14 60 386 917 76.23 70 286 1203 100.00 均数均数常用平均数常用平均数 几何均数几何均数 中位数中位数 平均数常用于描述一组变量值的集中平均数常用于描述一组变量值的集中趋势,是反映同质资料的平均水平或集中趋势,是反映同质资料的平均水平或集中位置的特征值。位置的特征值。1.算术均数(均数)算术均数(均数)表示符号表示符号总体均数总体均数 ()样本均数样本均数 (x)应应 用用对称分布资料,尤其是正态分布资料对称分布资料,尤其是正态分布资料计算方法计算方法 x1+x2+xn x直接法直接法 x=n nf 1x1+f 2
5、x2+f kxk fx加权法加权法 x=f 1+f 2+f k n某某地区地区130名名12岁男孩身高岁男孩身高(cm)资料的频数分布资料的频数分布 组组 段段 划划 记记 频频 数数 125|1 129正正 5133正正正正|11137正正正正正正 正正正正正正 30141正正正正正正正正正正正正正正|37145正正正正正正正正正正|28149正正正正|12153正正 5157161|1 合合 计计130某某地区地区130名名12岁男孩身高岁男孩身高(cm)均数加权法计算均数加权法计算 组组 段段 频频 数数f 组中值组中值 X fX 1251 127 1271295 131 655133
6、11 135 1485137 30 139 4170141 37 143 5291145 28 147 4116149 12 151 1812153 5 155 775157161 1 159 159合合 计计130列表计算均数18 590计算方法计算方法 fx18590加权法加权法 x=143.00cm f 130 2.几何均数几何均数 表示符号表示符号:(G)应应 用用:变量值呈倍数关系,对数正态分布资料变量值呈倍数关系,对数正态分布资料 计算方法计算方法:直接法直接法 G=n x1 x2 xn lgx1+lgx2+lgxn lgx G=lg1 =lg1 n n f1lgx1+f2lgx2
7、+fklgxk f lgx 加权法加权法G=lg1 =lg1 n n 3.中位数中位数 表示符号表示符号:(M)偏态分布资料偏态分布资料 应应 用用变量值分布一端或两端无确定数值变量值分布一端或两端无确定数值分布不明资料分布不明资料 计算方法计算方法 直接用变量值计算直接用变量值计算M=X n+1 (n为奇数时为奇数时)2 1 或或M=X n +X n (n为偶数时为偶数时)2 2 2+1 i n 用频数表计算用频数表计算M=L+(fL )fx 2附:百分位数附:百分位数 描述变量值序列在某百分描述变量值序列在某百分位位置的水位位置的水 平平iPx=L+(n x%fL)fx 描述变量值的离散趋
8、势用变异指标描述变量值的离散趋势用变异指标 全距全距 常用变异指标常用变异指标 标准差标准差 变异系数变异系数 四分位数间距四分位数间距 1.全距全距 R=最大值最大值 最小值最小值 反映变量值的变异范围反映变量值的变异范围 各种类型资料都可应用,但只作各种类型资料都可应用,但只作 参考资料参考资料 2.方差方差 和和 标准差标准差 定义公式定义公式 (X)2 (X)2 2 =N N (X X)2 (X X)2 S2 =S=n 1 n 1 为总体标准差为总体标准差 s 为样本标准差为样本标准差应用公式应用公式 X2 (X)2/n直接法直接法S=n 1 f X2 (f X)2/n加权法加权法S=
9、n 1 标准差标准差用途:用途:1.表示同质变量值的离散程度表示同质变量值的离散程度 2.估计观察值的频数分布估计观察值的频数分布 3.用于确定医学参考值范围用于确定医学参考值范围 4.与均数结合,与均数结合,计算变异系数计算变异系数 5.与样本含量与样本含量(n)结合,计算标准误结合,计算标准误-用途:用途:1)比较多组单位不同资料的变异度比较多组单位不同资料的变异度 2)比较多组均数相差较大资料的变度比较多组均数相差较大资料的变度3.变异系数变异系数(CV)定义定义 CV=s/X100%4.四分位数间距四分位数间距 四分位数间距为特定的百分位数,可四分位数间距为特定的百分位数,可看作为中间看作为中间1/2变量值的全距变量值的全距 Q=Qu QL,Qu=P75(上四分位数)上四分位数)QL=P25(下四分位数)下四分位数)用途:用于表示偏态分布资料的变异用途:用于表示偏态分布资料的变异程度,常与中位数配合使用程度,常与中位数配合使用