2 统计描述201102.ppt

上传人(卖家):hwpkd79526 文档编号:5633899 上传时间:2023-04-28 格式:PPT 页数:81 大小:467KB
下载 相关 举报
2 统计描述201102.ppt_第1页
第1页 / 共81页
2 统计描述201102.ppt_第2页
第2页 / 共81页
2 统计描述201102.ppt_第3页
第3页 / 共81页
2 统计描述201102.ppt_第4页
第4页 / 共81页
2 统计描述201102.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

1、生物医学研究的统计方法 第2章施学忠公共卫生学院卫生统计学教研室生物医学研究的统计方法 第2章讲授内容一定量资料的统计描述二定性资料的统计描述生物医学研究的统计方法 第2章教学目的和要求了解频数分布表的编制方法及应用;掌握定量资料集中趋势和离散趋势常用的统计描述指标及应用;掌握率、频率的概念及应用。生物医学研究的统计方法 第2章一、频数表与频数分布图二、集中趋势的统计描述三、离散趋势的统计描述定量资料的统计描述生物医学研究的统计方法 第2章【例例1 1】某地2008年100名8岁男童身高资料(cm)表 3.1 某市 100 名 8 岁男童的身高(cm)130.1 128.9 128.7 129

2、.5 128.9 129.6 130.0 128.8 130.4 128.8 131.6 131.0 130.4 131.2 130.7 131.2 131.5 130.5 131.6 130.5 125.9 125.0 124.0 125.0 124.9 125.2 125.5 124.5 126.3 124.2 123.0 121.5 116.2 121.9 121.2 122.6 122.9 120.2 123.4 119.8 132.6 132.0 131.8 132.0 131.9 132.1 132.2 131.9 133.2 131.8 127.6 127.2 126.3 127

3、.2 127.0 127.3 127.5 126.7 127.6 126.6 128.5 128.2 127.8 128.2 128.2 128.4 128.4 128.1 128.6 128.0 135.3 134.5 133.5 134.6 134.2 135.1 135.2 133.8 135.5 133.8 142.7 139.6 132.7 140.8 139.6 140.9 135.9 139.3 143.3 133.2 137.8 136.5 135.7 136.8 136.3 137.6 137.8 135.9 138.3 135.8 生物医学研究的统计方法 第2章问题1:该1

4、00名8岁男童的平均身高是多少?问题2:最高身高是多少?最低身高是多少?身高的分布范围是多少?问题3:身高在132136cm占多大比例?问题4:如何用一个直观的统计图来描述身高的分布规律?分布是否对称?生物医学研究的统计方法 第2章【解析解析】此问题涉及如何对定量资料进行统计描述?问题1 集中趋势集中趋势 问题2 离散趋势离散趋势 问题3,4 频数分布表和频数分布图频数分布表和频数分布图生物医学研究的统计方法 第2章(一)频数表的概念:(一)频数表的概念:为频数分布表的简称,将各数值变量的值及其相应的频数列表即称为频数分布表。频率可用百分数或小数表示,频率的和为100%或1。一、连续变量频数表

5、与频数分布图一、连续变量频数表与频数分布图生物医学研究的统计方法 第2章(二)频数表的编制方法:(二)频数表的编制方法:1.1.求求MAXMAX、MINMIN、R R R=MAX-MIN R=143.3-116.2=27.1(cm)2.2.求求“组段组段”数,组段和组距数,组段和组距(1)“组段”数一般为10-15个;(2)组距一般为R/10取整;(3)第一组段要包括MIN,最末组段包括MAX,并同时写出上下限。本例本例 i=R/10=2.71i=R/10=2.71 3 33.3.列表划计列表划计146生物医学研究的统计方法 第2章 图3.1 某市100名8岁男童身高(cm)的频数分布身高(c

6、m)频数频数生物医学研究的统计方法 第2章(三)频数表的用途 1.揭示频数的分布特征揭示频数的分布特征 (1)集中趋势 central tendency (2)离散趋势 tendency of dispersion (3)当集中趋势与离散趋势结合起来时能全面反映频数的分布。l 对称分布:高峰位于中部,左右两侧的频数大体对称。正态分布为最常见的一种。l 偏态分布:正偏态分布儿童疾病年龄分布;负偏态分布老年疾病年龄分布。生物医学研究的统计方法 第2章对称分布对称分布偏态分布偏态分布正偏正偏负偏负偏频数分布高峰位于中部,左右两恻的频数大体对称。高峰偏于右侧,长尾向左侧延伸,则为负偏态负偏态。高峰偏于

7、左侧,长尾向右侧延伸,则为正偏态正偏态生物医学研究的统计方法 第2章2.便于发现某些特大或特小的可疑值。便于发现某些特大或特小的可疑值。3.当样本含量足够大时,以频率作为概率的估计当样本含量足够大时,以频率作为概率的估计值。值。4.作为陈述资料的形式。作为陈述资料的形式。生物医学研究的统计方法 第2章 二、集中趋势指标二、集中趋势指标v概念:概念:集中趋势是指一组定量资料集中位置的特征值,说明这种变量值大小的平均水平,常用平均数描述。包括算术均数、几何均数、中位数、百分位数等。生物医学研究的统计方法 第2章(一)均数(一)均数:1.1.概念:概念:均数是算术均数的简称,指n个性质相同的定量数据

8、之和除以n所得的结果。总体均数用希腊字母表示,样本均数用 表示。X生物医学研究的统计方法 第2章均数的计算均数的计算(1)直接法:适用于观察值的个数较少时。nXnXXXXXn.321生物医学研究的统计方法 第2章l例 某地10名18岁健康男大学生身高(cm)分别为168.7,178.4,170.0,170.4,172.1,167.6,172.4,170.7,177.3,169.7求平均身高。)(73.171107.169.4.1787.168cmnXX生物医学研究的统计方法 第2章(2)加权法:适用于样本例数较多时或者频数表资料。ffXfffXfXfXfXkkk.212211各组段的频数组中值

9、(下限+上限)/2生物医学研究的统计方法 第2章例2 计算例1中100名8岁男童的平均身高。表 3.3 某市 100 名 8 岁男童身高的均数计算(加权法)身高组段 频数fI 组中值 xi fixI fix i 2 116 1 117.5 117.5 13806.25 119 5 120.5 602.5 72601.25 122 8 123.5 988.0 122018.00 125 17 126.5 2150.5 272038.25 128 23 129.5 2978.5 385715.75 131 21 132.5 2782.5 368681.25 134 14 135.5 1897.0

10、257043.50 137 7 138.5 969.5 134275.75 140 3 141.5 424.5 60066.75 143-146 1 144.5 144.5 20880.25 合计 100 13055.0 1707127.00 55.13010013055ffxx生物医学研究的统计方法 第2章算术均数的应用场合:算术均数的应用场合:均数能反映全部观察值的平均数量水平,因而应用甚广。它适用于对称分布,特别是正态分布的定量资料。生物医学研究的统计方法 第2章(二)几何均数二)几何均数G 1.1.概念:概念:对n个性质相同的定量数据分别取对数变换后,按算术均数计算,然后再求其反对数所

11、得的结果,叫几何均数。生物医学研究的统计方法 第2章 2.2.计算计算 (1)直接法:适用于观察值个数较少时。nnXXXXG.,321)lg(lg)lg.lglg(lg1211nXnXXXGn方法:将n个观察值(X1,X2,X3,Xn)直接相乘再开n次方。公式:生物医学研究的统计方法 第2章l例3.2 设有5份血清样品,滴度分别为:1:1,1:10,1:100,1:1000,1:10000 求其平均滴度。生物医学研究的统计方法 第2章l G 或Glg-1(lg1+lg10+lg100+lg1000+lg10000)/5)lg-1(0+1+2+3+4)/5)lg-12 =100 即:平均滴度为1

12、:100。较好地代表了观察值的平均水平。1001000010001001015生物医学研究的统计方法 第2章(2)加权法 用于样本量较大的频数表资料。可用下式计算:Glg-1(f lgX/f)生物医学研究的统计方法 第2章几何均数的应用场合 几何均数适用于经对数转换后成对称分布的资料,或者说是等比资料,如抗体的滴度,血清效价等。生物医学研究的统计方法 第2章(三)中位数和(三)中位数和百分位数百分位数 1.1.概念:概念:(1)中位数(median):把一组变量值从小到大排列,位于中间位置的变量值叫中位数,用M表示。(2)百分位数(percentile):为一种位置指标,一个PX将总体或样本的

13、全部观察值分为两部分,理论上有X%的观察值比它小,(100-X)%的观察值比它大,P50分位数即是中位数。生物医学研究的统计方法 第2章2.2.计算方法:计算方法:(1)直接由原始数据计算中位数n为奇数时n为偶数时)21(nXM2/)12()2(nnXXM生物医学研究的统计方法 第2章生物医学研究的统计方法 第2章(2)用频数表计算中位数及百分位数步骤:)2/(LmxfnfiLP按所分组段,由小到大计算累计频数和累计频率根据公式计算中位数及其它百分位数生物医学研究的统计方法 第2章)%(LxxfnxfiLPPx 所在组段的组距Px 所在组段的下限Px 所在组段的频数 fL 为小于 L 的各组段

14、累计频数计算中位数时,X=50,即M=P50。生物医学研究的统计方法 第2章3.3.应用应用(1)中位数(median):可用于任何分布的资料集中趋势的统计描述,但更常用于偏态分布资料、分布的一端或两端无确定数值时集中趋势的描述。生物医学研究的统计方法 第2章(2)百分位数:A、用于描述数据某一百分位的位置,最常用的是P50,即中位数;也可用两个百分位数的结合来描述一组资料的分布特征。B、用于确定参考值范围:WBC95%参考值范围:P2.5P97.5过高过低均异常 肺活量95%参考值范围:P5 过低异常 尿铅95%参考值范围:P95 过高异常。生物医学研究的统计方法 第2章(四)众数(mode

15、):):是一组数据中出现频率最高的那个数;一组数据的众数可以是1个,也可能有多个。生物医学研究的统计方法 第2章中位数、算术均数和众数的关系 众数 中位数 算术均数众数 中位数 算术均数算术均数 中位数 众数 正偏态分布对称分布负偏态分布生物医学研究的统计方法 第2章三、离散趋势指标三、离散趋势指标生物医学研究的统计方法 第2章 (一一)、计算计算:R=极大值极小值意义意义:反映观察值变异度的大小。优点优点:简单明了缺点:缺点:1、R只考虑最大值和最小值之差,不能反映组内其它观察值的变异度;2、样本例数越多,抽到极大值和极小值的可能性越大,故样本例数悬殊时不易比较极差。3、即使样本例数不变,极

16、差的抽样误差亦较大,即不够稳定。生物医学研究的统计方法 第2章(二二)、计算计算:=P75-P25意义及特点意义及特点:类似值,但比其稳定,考虑了中间50%观察值的变异度。缺点:缺点:未考虑全部观察值的变异度。生物医学研究的统计方法 第2章表3.5 164 例沙门氏菌食物中毒病人的潜伏期(小时)潜伏期(小时)频数f 累计频数 累计频率(%)0 21 21 15.24 12 58 79 48.17 24 44 123 75.00 36 23 146 89.02 48 12 158 96.34 60 5 163 99.39 7284 1 164 100.00 例 有164例沙门氏菌食物中毒病人的潜

17、伏期(小时)见表3.5,求该潜伏期的四分位数间距。生物医学研究的统计方法 第2章P 25 L i/f25(n25%f L)12 12/58(16425%21)16.14(小时)P 75 L i/f 75(n75%f L)24 12/44(16475%79)36(小时)Q=P 75-P 25=36-16.14=19.86(小时)即该潜伏期的四分位数间距为19.86小时。生物医学研究的统计方法 第2章常用的变异指标常用的变异指标 (三三)、概念概念:1 总体方差:一组性质相同的定量数据中的每一个与其总体算术均数总体算术均数的差的平方和除以数据个数数据个数,所得的结果叫做总体方差。2 样本方差:一组

18、性质相同的定量数据中的每一个与其样本算术均数样本算术均数的差的平方和除以数据个数与数据个数与1 1的差值的差值,所得的结果叫做样本方差。生物医学研究的统计方法 第2章离均差平方和:离均差平方和:总体方差:总体方差:样本方差:样本方差:NX22)(1/)(1)(2222nnxxnXXs1/)(222nnfxfxs2)(X生物医学研究的统计方法 第2章 n-1为自由度(为自由度(degree of freedom),表示随表示随机变量能自由取值的个数。机变量能自由取值的个数。如有一四个(n=4)数据的样本,受到 的条件限制,在自由确定4、2、5三个数据后,第四个数据只能是9,否则 。因而这里的自由

19、度=n-1=4-1=3。推而广之,任何统计量的自由度=n-限制条件的个数。5X5XnXXXXlSSxx/)()(222离均差平方和常用SS或lxx表示意义及特点意义及特点:克服了值的不足,考虑了每个变量值的离散情况并消除了的影响。其单位是原度量单位的平方。例7-9 从表7-6中3组男孩体重资料分别求出方差。表7-6 三组同龄男孩体重(kg)分组 1 2 3 4 5 甲2628303234 乙2427303336 丙2629303134生物医学研究的统计方法 第2章生物医学研究的统计方法 第2章)(101551504540222kgs)(甲)(5.221551504590222kgs)(乙)(5

20、.81551504534222kgs)(丙甲组甲组生物医学研究的统计方法 第2章常用的变异指标常用的变异指标 (四四)、概念概念:方差的单位为原单位平方,:方差的单位为原单位平方,不便使用。为了应用的方便,对不便使用。为了应用的方便,对总体方差开平方总体方差开平方标准差。标准差。1)(1)(222nnxxnXXs1)(22nnfxfxs样本标准差样本标准差总体标准差总体标准差NX2)(生物医学研究的统计方法 第2章标准差的计算标准差的计算(1)直接法:用于样本量较小的资料 例3.6:现有一影像专业医生,测得10名患者的EA值分别为:0.47 0.60 0.86 0.96 1.01 1.13 1

21、.27 1.58 1.72 2.88。试计算其标准差。首先列表,求出X和X2(表3.6)。生物医学研究的统计方法 第2章表 3.6 10 名患者 EA 值的标准差计算 X X2 0.47 0.22 0.60 0.36 0.86 0.74 0.96 0.92 1.01 1.02 1.13 1.28 1.27 1.61 1.58 2.50 1.72 2.96 2.88 8.29 X12.48 X219.90 生物医学研究的统计方法 第2章l 将X和X2代入公式得:)(6832.0)110/()10/48.1290.19()1/(/)(222cmnnXXS生物医学研究的统计方法 第2章(2)加权法:

22、用于样本量较大的频数表资料。例3.7 以表3.3的资料为例,计算其标准差。表 3.3 某市 100 名 8 岁男童身高的均数计算(加权法)身高组段 频数fI 组中值 xi fixI fix i 2 116 1 117.5 117.5 13806.25 119 5 120.5 602.5 72601.25 122 8 123.5 988.0 122018.00 125 17 126.5 2150.5 272038.25 128 23 129.5 2978.5 385715.75 131 21 132.5 2782.5 368681.25 134 14 135.5 1897.0 257043.50

23、 137 7 138.5 969.5 134275.75 140 3 141.5 424.5 60066.75 143-146 1 144.5 144.5 20880.25 合计 100 13055.0 1707127.00 生物医学研究的统计方法 第2章)(315.51100100/1305517071271)(222cmnnfxfxs生物医学研究的统计方法 第2章 标准差的应用:标准差的应用:(1)表示变量分布的离散程度;(2)概略估计正态分布资料的频数分布;(3)结合样本含量,计算标准误;(4)结合均数,计算变异系数。常用的变异指标常用的变异指标(五五)、)概念:概念:又叫变异度或离散系

24、数,是同一组资料的标准差与均数之比。生物医学研究的统计方法 第2章计算:计算:%100 xsCV生物医学研究的统计方法 第2章应用应用:CV为相对数,无单位,主要用于比较度量衡单位不同或均数相差悬殊的资料的变异度。其数值越小,说明观察值的变异度越小,均数的代表性越好。生物医学研究的统计方法 第2章l例7-11 某地7岁男孩身高的均数为123.10cm,标准差为4.71 cm;体重的均数为22.29kg,标准差为2.26kg。试比较身高、体重何者变异度大。身高体重 由此可见,7岁男孩体重的变异度大于身高的变异度或者说身高比体重稳定。%83.3%10010.12371.4CV%14.10%1002

25、9.2226.2CV生物医学研究的统计方法 第2章 总总 结结 上述变异指标中,标准差是反映观察值离散趋势的最佳指标,而极差则是最简明指标。服从一定分布的资料,其标准差和极差之间存在着一定的数量化关系。集中趋势集中趋势 离散趋势离散趋势 应用场合算术均数算术均数 方差、标准差方差、标准差 适用于对称分布,特别是正态分布几何均数几何均数 正偏态分布资料或对数正态分布资料 中位数中位数 极差及极差及及百分位数及百分位数 四分位数间距四分位数间距 变异系数变异系数 适用于任何分布资料,特别是偏态 分布、分布不明、分布末端无确定 值适用于均数相差悬殊或度量衡单位不同的资料生物医学研究的统计方法 第2章

26、 分类资料的统计描述分类资料的统计描述生物医学研究的统计方法 第2章 前面已讲过,统计中的变量有两种类型,即:定量变量和分类变量。定量变量其变量值是定量的,表现为数值的大小;而分类变量是定性的,对其观察结果的统计处理,应先按分析要求,分类汇总观察单位数,即绝对数,再进一步计算其相对数。生物医学研究的统计方法 第2章 【案例3.1】某年甲乙两地发生麻疹流行,甲地发病人数为人,乙地发病人数为人,甲地发病人数比乙地多人,能否据此认为甲地麻疹发病比乙地严重呢?生物医学研究的统计方法 第2章【案例解析3.1】l甲乙两地麻疹发病人数300人,250人是计数资料,对于该类资料的整理,一般是先根据某种属性(即

27、发病,未发病)分组,然后得到每组的观察单位数(绝对数)。l尽管甲地发病的绝对数比乙地多50人,但并不能就肯定地说甲地麻疹发病比乙地严重,需借助相对数进行描述。生物医学研究的统计方法 第2章l一相对数的概念一相对数的概念包括率、构成比、相对比和动态数列,由于它是两个有联系的指标之比,因而叫作相对数。生物医学研究的统计方法 第2章二 常用的相对数(一)率(rate),又称频率指标概念概念:表示在一定条件下,发生某现象的观察单位数与可能发生某现象的观察单位数之比。公式公式:作用作用:说明某现象发生的频率或强度。K数可能发生某现象的总例发生某现象的例数率生物医学研究的统计方法 第2章 式中的K为比例基

28、数,可以为100%、1000、10 000/万、100 000/10万等。选择K的要点:(1)根据习惯用法以便于比较,如治愈率、某病病死率、人工流产率等用百分率;出生率、婴儿死亡率等用千分率;(2)使算得的率至少保留12位整数。生物医学研究的统计方法 第2章 如果【案例3.1】中甲地人口为30000,乙地人口为10000,则:%1%10030000300甲地麻疹发病率=乙地麻疹发病率=%5.2%10010000250 乙地麻疹发病率高于甲地,所以认为乙地麻疹发病比较严重。生物医学研究的统计方法 第2章(二)构成比(constituent ratio),构成指标。概念:概念:表示某一现象内部各组

29、成部分所占的比重或分布。公式:公式:作用:作用:表示某一事物内部各组成部分所占的比重。%100分的个体总数同一事物内部各组成部某一组成部分的个体数构成比%100CBACBA)或(或构成比生物医学研究的统计方法 第2章 表3-1 某地1955年和1956年疟疾的构成 1955 年 1956 年 类别 发病人数 构成比(100%)发病人数 构成比(100%)恶性疟 68 70.1 21 42 间日疟 12 12.4 12 24 三日疟 17 17.5 17 34 合计 97 100.0 50 100 生物医学研究的统计方法 第2章构成比的特征:构成比的特征:l(1)各组成部分的构成比之和为100%

30、。l(2)某一部分构成比增大或减小,必然使其它部分产生相应的变化。生物医学研究的统计方法 第2章l注意区别率和构成比注意区别率和构成比:虽然两者均为两个指标之比,但意义却完全不同。率反应了某项指标的平均强度或平均水平,它具有数值变量中平均数的含意,如甲地麻疹发病率为1%,也可认为该地每个人患麻疹的平均可能性为1%。构成比表示某一现象内部各组成部分所占的比重或分布,不能反应该现象的平均强度或平均水平。生物医学研究的统计方法 第2章生物医学研究的统计方法 第2章(三)相对比(relative ratio)概念:概念:是2个有联系的同类指标之比,说明二者的对比水平。公式:公式:作用:作用:说明A为B

31、的若干倍或百分之几。)(或乙甲相对比%100生物医学研究的统计方法 第2章l例3.2 某市19771979年肺癌死亡率城区为19.39/10万,郊区为9.99/10万,二者的相对比为19.39/9.99=1.94,即城区肺癌死亡率为郊区肺癌死亡率的1.94倍。生物医学研究的统计方法 第2章 计算相对比的指标既可是相对数,计算相对比的指标既可是相对数,也可是两个绝对数或平均数。也可是两个绝对数或平均数。如我们可计算出甲乙两地麻疹发病人数之比为300/250=1.25。生物医学研究的统计方法 第2章三 应用相对数时应注意的问题 1.计算相对数的分母不易过小。2.分析时不能以构成比代替率。生物医学研

32、究的统计方法 第2章3.对观察单位不等的几个率,不能直接相加求其平均率。如:n140 X120 P1=50%n260 X220 P233.3%显然显然:P(P1P2)/2 而是:P(X1+X2)/(n1n2)比例基数=40%4.资料的对比应注意同质。5.对样本率的比较应遵循随机抽样,要作假设检验。生物医学研究的统计方法 第2章l某文章作者根据下表资料,认为沙眼在20-岁组的患病率最高,以后随着年龄的增大而减少。你同意吗?说明理由。某医院门诊沙眼病人年龄构成比某医院门诊沙眼病人年龄构成比 年 龄 组 0 10 20 30 40 50 60 70 合 计 沙 眼 人 数 47 198 330 198 128 80 38 8 1027 构 成 比(%)4.6 19.3 32.1 19.3 12.4 7.8 3.7 0.8 100.0

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(2 统计描述201102.ppt)为本站会员(hwpkd79526)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|