1、卫生统计学方法在医学中的应用卫生统计学方法在医学中的应用 严璟统统 计计o是一种对客观现象数量方面进行的调查是一种对客观现象数量方面进行的调查研究活动研究活动;o是收集、整理、分析、推断、判断等认是收集、整理、分析、推断、判断等认识活动的总称。识活动的总称。o数据汇总仅仅是统计工作的一小部分内数据汇总仅仅是统计工作的一小部分内容。容。统计学统计学 作为一门学科的定义是:关于数据收作为一门学科的定义是:关于数据收集、表达和分析的普遍原理和方法。集、表达和分析的普遍原理和方法。卫生统计学卫生统计学 是用统计学原理和方法研究是用统计学原理和方法研究医药卫生问题的一门学科。医药卫生问题的一门学科。卫生
2、统计学的特点卫生统计学的特点o医学数学,侧重医学,淡化数学。医学数学,侧重医学,淡化数学。o用数量反映质量,如平均期望寿命,用数量反映质量,如平均期望寿命,解放前为解放前为3535岁,现在岁,现在7070岁,可反映国岁,可反映国家医疗卫生服务总体水平的提高。家医疗卫生服务总体水平的提高。o大量观察大量观察+实验数据分析实验数据分析 可以揭示可以揭示医学规律。医学规律。应用应用o医学教学、科研中的运用医学教学、科研中的运用n基础医学基础医学实验研究实验研究n预防医学预防医学环境健康效应、流行病学研究环境健康效应、流行病学研究n临床医学临床医学医学正常值估计、治疗方案筛选、医学正常值估计、治疗方案
3、筛选、治疗效果评价治疗效果评价o卫生事业管理中的运用卫生事业管理中的运用n人群健康状况描述人群健康状况描述n动态监测动态监测n趋势预测趋势预测目的和要求目的和要求o正确地查阅文献资料正确地查阅文献资料o从事基础医学、临床医学和预防医学的科学从事基础医学、临床医学和预防医学的科学研究研究o学会卫生统计学的逻辑思维方式和分析判断学会卫生统计学的逻辑思维方式和分析判断方法,结合专业知识,分析和解决工作中的方法,结合专业知识,分析和解决工作中的实际问题实际问题统计工作基本步骤统计工作基本步骤o设计设计o收集资料收集资料o整理资料整理资料o分析资料分析资料1.1.专业设计:专业设计:选题、建立假说、确定
4、选题、建立假说、确定 研研究对象和技术方法等究对象和技术方法等个性个性2.2.统计设计:统计设计:围绕专业设计确定统计围绕专业设计确定统计 设设类型、样本大小、分组方法、统计分析指类型、样本大小、分组方法、统计分析指标及统计分析方法。标及统计分析方法。一、设计一、设计 专业设计与统计设计比较专业设计与统计设计比较项目项目专业设计专业设计统计设计统计设计要求要求运用专业知识进行设计运用专业知识进行设计运用统计学知识进行设计运用统计学知识进行设计内容内容选题、实验、方法、材料设备、环境选题、实验、方法、材料设备、环境及指标选择等及指标选择等确定设计方案,收集资料,确定统计指确定设计方案,收集资料,
5、确定统计指标、分析与推断方法等标、分析与推断方法等方向方向探讨实验观察结果的实用性和创造性探讨实验观察结果的实用性和创造性探讨实验观察结果的可重复性、高效性探讨实验观察结果的可重复性、高效性目的目的回答和解决科研课题,验证假说,保回答和解决科研课题,验证假说,保证科研成果的先进性证科研成果的先进性减少和控制误差,保证样本的代表性和减少和控制误差,保证样本的代表性和可靠性;保证实验结果的精确性和可重可靠性;保证实验结果的精确性和可重复性复性几种常见设计几种常见设计n完全随机设计(成组设计)完全随机设计(成组设计)n配对设计配对设计n交叉设计交叉设计n随机区组设计(配伍组设计)随机区组设计(配伍组
6、设计)n析因设计析因设计三个原则三个原则n对照原则对照原则n随机原则随机原则n重复原则重复原则n均衡原则均衡原则二、收集资料二、收集资料资料来源资料来源p第一手资料第一手资料 经常性:统计报表(死亡登记、疫情经常性:统计报表(死亡登记、疫情 报告等),报告等),工作记录(病历、化验);工作记录(病历、化验);一时性:专题调查、实验或临床试验。一时性:专题调查、实验或临床试验。p第二手资料:第二手资料:已公布的资料,如数据银行、全国、已公布的资料,如数据银行、全国、全省卫生统计资料。全省卫生统计资料。资料要求资料要求p完整、准确、及时完整、准确、及时 三整理资料三整理资料 整理资料即原始数据的条
7、理化、整理资料即原始数据的条理化、系统化的过程。所采取的手段系统化的过程。所采取的手段合理合理化分组,目的化分组,目的实现专业目标。实现专业目标。o质分组:按事物的属性或性质分组质分组:按事物的属性或性质分组分类变量;分类变量;o量分组:按数据的大小量分组:按数据的大小数值变量。数值变量。统计资料的类型统计资料的类型三种类型三种类型计量资料计量资料计数资料计数资料等级资料等级资料 1.1.计量资料计量资料定义:测量每一个观察单位的量的大小,得到的定义:测量每一个观察单位的量的大小,得到的数据资料。数据资料。特点:有单位特点:有单位 如调查某地如调查某地1010岁男孩的身体发育状况,每个人的岁男
8、孩的身体发育状况,每个人的身高(身高(cmcm)、体重()、血压()、体重()、血压(mmHgmmHg)、脉搏(次)、脉搏(次/分)、红细胞计数(分)、红细胞计数(1010/L/L)等数据均为计量资料。)等数据均为计量资料。某地某地140140名成年男性红细胞数(名成年男性红细胞数(10101212/L)/L)o定义:将全体观测单位按照某种性质或特定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的征分组,然后再分别清点各组观察单位的个数。个数。o特点:没有单位特点:没有单位 如肤色(黑、白)、血型(如肤色(黑、白)、血型(ABOABO)、)、职业职业(工农兵)、性别(男女
9、)(工农兵)、性别(男女)2.2.计数资料计数资料定义:定义:介于计量资料和计数资料之间的一种资料,通介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。过半定量方法测量得到。特点:每一个观察单位没有确切值特点:每一个观察单位没有确切值 各组之间有性质上的差别或程度上的不同。各组之间有性质上的差别或程度上的不同。癌症分期:早、中、晚。癌症分期:早、中、晚。药物疗效:治愈、好转、无效、死亡。药物疗效:治愈、好转、无效、死亡。尿蛋白:尿蛋白:、+、+及以上及以上3.3.等级资料等级资料四分析资料四分析资料 1.1.统计描述:统计描述:用统计指标、统计图表对资用统计指标、统计图表对资料的数
10、量特征及分布规律进行测定和描料的数量特征及分布规律进行测定和描述。述。2.2.统计推断:统计推断:用样本信息推断总体特征:用样本信息推断总体特征:参数估计,参数估计,假设检验。假设检验。统计描述统计描述-计量资料计量资料频数与频数分布频数与频数分布频数频数:某个测量值的个(例)数。:某个测量值的个(例)数。频数分布表频数分布表:又称频数表。又称频数表。是将是将原始数据值适当原始数据值适当分组后得到各组的频数。分组后得到各组的频数。适用样本量较大的资料进行统计描述的常适用样本量较大的资料进行统计描述的常用方法。通过频数表可以显示数据分布的范用方法。通过频数表可以显示数据分布的范围与形态。围与形态
11、。计量资料的统计描述计量资料的统计描述数据7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.
12、2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.
13、7424.6614.1816.52计量资料的统计描述计量资料的统计描述0510152025306810 12 14 16 18 20 22 24 26 28血清铁(mol/L)频率密度计量资料的统计描述计量资料的统计描述对称分布:频数最多的组段在中央正偏态分布:峰向左侧偏移的分布,右侧的组段数多于左侧,为右偏态分布。负偏态分布:峰向右侧偏移的分布,左侧的组段数多于右侧,称为左偏态分布。计量资料的统计描述计量资料的统计描述集中趋势统计指标集中趋势统计指标算术均数:算术均数:适合描述对称分布资料。适合描述对称分布资料。几何均数:几何均数:适用于等比资料。在医学研究中常适用于免疫适用于等比资料。在医
14、学研究中常适用于免疫学的指标(滴度、效价)。学的指标(滴度、效价)。中位数:中位数:可用于各种分布的定量资料。但一般用于偏态分可用于各种分布的定量资料。但一般用于偏态分布或分布趋势不明的资料。布或分布趋势不明的资料。离散趋势统计指标离散趋势统计指标1.1.极差极差:一组变量值最大值与最小值之差。一组变量值最大值与最小值之差。2.2.四分位数间距四分位数间距3.3.方差与标准差方差与标准差离均差离均差:每一个变量值与均数的差值,每一个变量值与均数的差值,离均差平方和离均差平方和:离均差平方后相加得到的值离均差平方后相加得到的值方差方差:离均差平方和除以离均差平方和除以N N得到的值为总体方差。得
15、到的值为总体方差。4.4.标准差:标准差:方差开平方得到的值。方差开平方得到的值。5.5.变异系数变异系数计量资料的统计描述计量资料的统计描述统计描述统计描述定性资料(计数资料)定性资料(计数资料)常用的相对数指标常用的相对数指标率率构成比构成比相对比相对比计数资料的统计描述计数资料的统计描述应用相对数应注意的事项应用相对数应注意的事项防止概念混淆防止概念混淆计算相对数时分母应有足够数量计算相对数时分母应有足够数量 正确地合并估计频率正确地合并估计频率(或强度或强度)型指标型指标 相对数间的比较要具备可比性相对数间的比较要具备可比性:观察的对象是否同质,观察的对象是否同质,研究的方法(如检测手
16、段、抽样方法)是否相同,观研究的方法(如检测手段、抽样方法)是否相同,观察的时间是否一致等;被比较的总体是否具有可比性察的时间是否一致等;被比较的总体是否具有可比性 常用统计图表常用统计图表 统计表统计表统计表的结构与种类统计表的结构与种类简单统计表:只包括一个分组变量简单统计表:只包括一个分组变量组合表:多于一个分组变量组合表:多于一个分组变量常用统计图表常用统计图表图2-5 统计表的结构常用统计图表常用统计图表表2-5 A、B两种药物在甲、乙两医院的疗效药物甲医院乙医院总计有效 无效 合计有效无效合计A40105042850100B351550331750100合计752510075251
17、00200常用统计图表常用统计图表制表原则和要求:制表原则和要求:原则原则:重点突出、简单明了、主谓分明、层次清楚。:重点突出、简单明了、主谓分明、层次清楚。表结构表结构:标题标题标目标目表线表线 表值表值 注释注释常用统计图表常用统计图表统计图统计图 医学文献与报告中常用的统计图主医学文献与报告中常用的统计图主要有直条图、百分条图、圆图、线图、半对要有直条图、百分条图、圆图、线图、半对数线图、直方图等。使用计算机与相应的软数线图、直方图等。使用计算机与相应的软件(如件(如ExcelExcel)可以方便地绘制出各种统计可以方便地绘制出各种统计图。图。常用统计图表常用统计图表制图的基本要求如下制
18、图的基本要求如下:选用图形选用图形:按照资料的性质与分析目的。按照资料的性质与分析目的。标题标题:扼要说明统计图内容:扼要说明统计图内容,位于图的正下方。位于图的正下方。图例图例:图例位于图形与标题之间,对图中的不同事物应:图例位于图形与标题之间,对图中的不同事物应通过不同的图案或颜色加以区别。通过不同的图案或颜色加以区别。坐标坐标统计图(如直条图、线图等),横轴的方向应自左统计图(如直条图、线图等),横轴的方向应自左至右;纵轴的方向应自下而上。横轴与纵轴均应有标至右;纵轴的方向应自下而上。横轴与纵轴均应有标目。表示量的数轴应标注合适的原点、尺度、单位;目。表示量的数轴应标注合适的原点、尺度、
19、单位;统计图的轮廓以高统计图的轮廓以高:宽宽=5:7=5:7为宜。为宜。常用统计图表常用统计图表直条图直条图:用等宽直条的长度来表达参与比较的指标用等宽直条的长度来表达参与比较的指标的大小,条图的数值轴(常用纵轴)尺度必须从的大小,条图的数值轴(常用纵轴)尺度必须从零点起标示零点起标示 单式单式 复式复式图2-6 1995年三城市婴儿死亡率010203040长春吉林松源婴儿死亡率()图2-7 1968-1988年全国出生率与死亡率010203040出生率死亡率出生率与死亡率()1968年1988年常用统计图表常用统计图表百分条图百分条图:用于表达各组成部分在全体中的比重。百用于表达各组成部分在
20、全体中的比重。百分条图可以将多组数据排列在一起便于比较分条图可以将多组数据排列在一起便于比较 图 2-9 两 种 脱 落 牙 再 植 效 果0%2 0%4 0%6 0%8 0%1 0 0%嵌 入 性 脱 位 牙 脱 落 牙成 功良 好较 好失 败常用统计图表常用统计图表圆图圆图:用同一圆形中的扇形的弧度表示全体中各部分用同一圆形中的扇形的弧度表示全体中各部分所占的比重。所以其用途与百分条图相同。多组所占的比重。所以其用途与百分条图相同。多组数据作对比,圆图的效果不如百分条图。数据作对比,圆图的效果不如百分条图。较好23%良好23%失败8%成功46%常用统计图表常用统计图表线图线图:表达一事物的
21、量随另一事物的量变化的趋势,表达一事物的量随另一事物的量变化的趋势,或某事物的量随时间变化的过程。或某事物的量随时间变化的过程。图2-11 1975-1990年某地百日咳与痢疾死亡率(1/10万)00.20.40.60.811.21.41.6197019751980198519901995年死亡率痢疾百日咳常用统计图表常用统计图表直方图直方图:用于表示连续性定量变量的频数分布或频率分用于表示连续性定量变量的频数分布或频率分布。布。0510152025306810 12 14 16 18 20 22 24 26 28血清铁(mol/L)频率密度统计推断统计推断推断:由样本特征推断总体特征假设检验
22、基本思想假设命题计算统计量确定P值结论 H0:A=B t值 p0.05 接受H0 H1:AB 2值 p0.05 拒绝H0,接受H1 F值 H值假设检验示意图假设检验示意图应用假设检验需要注意的问题应用假设检验需要注意的问题o在抽样研究中,研究设计、搜集数据和统计在抽样研究中,研究设计、搜集数据和统计分析是一个整体。每一种假设检验方法都是分析是一个整体。每一种假设检验方法都是与相应的研究设计相联系的与相应的研究设计相联系的o应用检验方法必需符合其适用条件应用检验方法必需符合其适用条件o正确理解正确理解P P值的意义。值的意义。常用统计方法资料描述指标检验方法计量(定量变量)正态分布 s、G、CV偏态分布M A、R、QRt检验、F检验秩和检验计数(无序分类)率、构成比2检验、秩和检验、标准化率等级(有序分类)率、构成比秩和检验、Ridit检验x典型错误典型错误某药治疗肝炎主要指标分析某药治疗肝炎主要指标分析组别例数HBsAg-GTTTT+-阳性率(%)ss治疗组252238852.0 30.7*13.4 6.2*对照组2424010053.5 2.611.5 5.8*与对照组P0.05xx三组肺切除术患者针麻效果(疼痛三组肺切除术患者针麻效果(疼痛 级)采用采用2检验,2=7.10,v=6,P0.05疾病合计肺癌101710455肺化脓病2441337105肺结核4865368159