1、描述性研究 陈维清 博士 教授 医学统计与流行病学系 Tel: 87332199 E-mail: chenwq 教学目的与要求 掌握现况调查的概念与目的;普查的概念、 目的及优缺点;抽样调查的方法。 熟悉抽样调查估计样本大小的原则;现况研 究中常见偏倚及其防止。 了解描述研究的概念与种类,抽样调查估计 样本大小的公式。 第一节 概述 一、定义 描述性流行病学研究(descriptive epidemiology study):就是根据日常记录 资料或通过特殊调查所得到的资料,包括 实验室检查结果,按不同地区、不同时间 及不同人群特征分组,将疾病或健康情况 展现出来。 它主要描述分布的三大特征,
2、即:地区特征 、时间特征和人群特征。 描述性研究一般不需要事先设计的对照组, 所收集的资料也相对地较为粗糙和广泛。 它不能分析暴露与效应之间的联系。 二、特点 三、基本方法 描述性研究的基本方法是以某条件 、特征或变量来分组,然后测量疾病的频 率分布。 在时间上可用:年、季、月、旬、周、日、时等分组; 在地区上按不同的地区、环境,如国家地区、城乡、经纬 度、海拔高度、地形等分组; 人群可按年龄、性别、职业、文化程度、经济状况、民族 、种族、居住条件、生活习惯与生活方式等来分组。 四、种类 q横断面研究(cross-sectional study) q生态学研究(ecologic study)
3、q纵向研究(prospective study) 五、应用 对疾病或健康的有关特征进行全面和定量描述 ,以便认识疾病的特征(个体与人群); 为分析性流行病学研究(病因研究)提供病因 线索或假设; 为卫生医疗管理部门制定疾病预防、医疗服务 措施及其效果评价提供依据。 第二节 横断面研究 一、概念 是指在特定时间内,对某人群疾病、健康及 相关特征的存在情况进行和相互关系描述研究。 从时间上来讲,研究工作是在特定时间内进 行的,即在某一时点或短暂时间内完成的,故称它 为横段面研究(Cross-sectional study)。 又由于所收集的有关因素与疾病或健康之 间的资料,既不是过去的情况,又不是
4、追踪所 获得的结果,而是调查时的实际存在,因所用 的指标主要是患病率,故又称它为现患研究或 患病率调查(Prevalence Study)。 进行现况研究时,疾病或健康状况与发 现的某些因素或特征是在一次调查中得到的, 即因与果是并存的,因而在病因分析时只能对 病因提出初步线索,不能得出有关病因因果关 系的结论。 总体 人群 样本 人群 患 者 非患者 有危险 因素 有危险 因素 有危险 因素 有危险 因素 二、目的与用途 描述疾病或健康状况的分布; 评价一个国家或地方的健康水平; 研究影响人群健康和与疾病有关的因素,为病因 研究提供线素; 用于社区卫生服务需求研究; 用于卫生规划的制订与评估
5、; 用于医疗或预防措施及其效果的评价; 用干有关卫生标准、诊断标准、正常值的制订和 检验; 达到早发现、早诊断和早治疗的目的。 三、横断面研究的种类和方法 (一)普查(Census) 就是指在特定时间范围内,对一定范 围的人群中每一成员进行的调查或检查。 早期发现疾病并及时给予治疗 了解疾病的病情及分布 了解人群的健康水平 建立某些指标的标准值 当某些疾病发生流行时,为了解该病流行的全貌 普查时应注意的原则 要明确普查的主要目的,是为了早期发现病例 并给予及时治疗; 普查的疾病最好是患病率比较高的,以便短时 间内调查能得到足够的病例; 普查应具备灵敏度高、特异性强,且易于在现 场实施的检验或检
6、查的方法; 要有足够的人力、物力和财力支持进行普查。 普查的优点 q能发现普查人群中的全部病例,并给予 及时的治疗; q通过普查能对该地区某病的全貌有一个 了解; q通过普查可进行一次医学的科普宣传, 使群众对某病及其防治有所了解。 普查的缺点 q不适于患病率低和检查方法复杂的疾 病调查; q由于普查对象多,难免漏诊、误诊; q由于工作量大,很难进行深入细致的 调查。 (二)抽样调查(sampling survey) v根据抽取样本所调查出的结果可以估计出该人 群某病的患病率,或某些特征的情况。这种调查 方法称为抽样调查。 v抽样必须遵循随机化的原则,才能获得有较好 代表性的样本,并通过样本信
7、息推断总体。 v随机抽样就是由总体中抽取研究的样本时,使 每个单位都有同等机会可能被抽中。 先将研究对象编号,再用随机数字表或抽签、 摸球、电子计算机抽取等进行抽样。 单纯随机抽样(simple random sampling) q计量资料样本量的估算: n=ta2S2/d2 q计数资料样本量的估算: n=ta2PQ/d2 优点 概念简单 提供了统计理论基础 提供了其他方法赖以比较的基础 缺点 在抽样前,总体中所有N个观察单位都必须确 定编号。这种方法在实际中耗时费钱,因此难以 办到。 样本个体可能高度分散,访问这些样本对象将 非常费时费钱。 总体中某些亚人群有可能全部未被抽取。 系统抽样(s
8、ystematic sampling) 按照一定顺序,机械地每隔一定数量的单位 抽取一个单位。又称间隔抽样或机械抽样。 在单纯随机抽样难以办到时,可以应用系统抽样; 与单纯随机抽样相比,系统抽样所抽取的样本更能规 律地散布于整体之中,因此更有代表性; 在大多数情况下,单纯随机抽参数与方差估计公式适 合于系统抽样; 当总体内部存在周期性分布问题时,不太适合用系统 抽样。 分层抽样(stratified sampling) q 先将研究对象按主要特征(如年龄、性别、职业、教 育程度等)分几层,然后再在各层中进行随机抽样。 q 各层内抽样比例相同,如每层均抽出10的研究对象 ,称为按比例分层随机抽样
9、。 q 按照一定的要求,各层内抽样比例不同。按各层比例 确定随机抽样的数量,可使每层中观察值的变异度小些 ,样本的代表性加强,多层间还可作比较分析。这种抽 样方法称最优分配分层随机抽样。 与相同样本大小的单纯随机抽样相比,分层 随机抽样可提高精确度; 层估计信息易于获得; 无论从调查管理还是后勤角度来看,分层抽 样均比单纯随机抽样易于实施。 其缺点是抽样之前必须设计详细的抽样框架 ,因此费用不比单纯随机抽样低。 整群抽样 (Cluster Sampling ) v用此法抽样时,可抽到的不是个体,而是由 个体所组成的集体(即群体)。 v这些群体是从相同类型的群体中随机抽出的 ,被抽到单位的所有成
10、员都是研究对象。 v这种整群随机抽样便于组织,节约人力、物 力,因而多用于大规模调查,有其一定优点。 v缺点是抽样误差较大,分析工作量也较大。 多级抽样(multistage sampling) 又称多阶段抽样 这是大型调查时常用的一种抽样方法。 例如某学校有9000名大学生,15个系。每个 系的学生数相差不多。如要调查600名学生,抽样 方法如下:先自15个系随机抽取1个系,再自这个 系随机抽取300名学生,这就是两级抽样。 四、资料的收集和利用 流行病学研究的实质就是进行调查分析, 就是收集数据资料,对所收集的资料运用统计学 方法加以整理和分析,对分析出来的结果,结合 生物医学和其它学科的
11、知识,进行科学地合乎逻 辑的解释,最终得出恰当的结论。 (一)、资料的来源 q经常性资料:一些日常医疗卫生工作记录和 报告卡片统计报表 。 q优点:资料容易获得;由于是常年积累,便 于进行动态分析和寻找规律;记录面较广,可 获得许多有价值的信息;在较短的时间内,获 取较多的资料。 q缺点:经常性资料往往完整性较差;由于时 间不同,诊断标准前后可能不一致;资料的可 靠性较差,依工作人员的责任心强弱而异。 q一时性资料:就是为了某项目的,进 行专门的研究设计,围绕本研究目的有 意识地收集必要的资料。 (二)资料的收集方式 q面访(face to face interview) q通讯调查(mail
12、 questionnaire) q电话调查(telephone interview) q自我管理式的调查(selfadministrated questionnaire): 明确要获得哪些数据 指标是什么 测量的方法 疾病的诊断标准 有关变量的定义 调查人员的培训 五、资料整理分析 现况研究所得资料,可按下列步骤整理分析: 检查与核对原始资料的准确性与完整性,填补缺 漏,删去重复,纠正错误; 对疾病或健康状态技已明确规定好的标准,将全 部调查对象分组归类; 将疾病的现况研究资料按不同的人口学特征和时 间、地区、某种生活习惯等方面加以整理,并计算 疾病的发病率、患病率和死亡率。 六、现况研究中常
13、见的偏倚及其防止 q现况研究中可能发生的几种偏倚 选择偏倚 选择性偏倚 无应答偏倚 幸存者偏倚 信息偏倚 调查对象所引起的偏倚:报告偏倚、回忆偏倚 调查员偏倚 测量偏倚 调查环境引起的偏倚 q横断面研究中的质量控制 选择偏性的控制方法 严格按照抽样设计方案进行研究对象的选取, 坚持随机化原则。 提高抽中对象的受检率。 在横断面研究中,要考虑幸存者偏倚的问题, 尽可能病例选择面广一些,并注意收集有关 病程、疾病类型方面的资料,以便在分析结 果时,得出合理的结论。 信息偏性的控制方法 为使调查对象能提供准确的信息,必须在调查问卷 上下功夫。 对于调查员,关键是进行严格的培训,增强工作的 责任感。统
14、一调查程序、方法。 测量仪器要选用标准一致的,不易产生偏性和稳定 的仪器,使用前还要统一校正,从而保证测试结果 的准确与可靠。 对调查环境加以选择与控制的。这主要是根据调查 目的和对象的特点来加以考虑。 第三节 生态学研究 生态学研究(ecological studies),亦称对比研究。是 描述性流行病学研究方法的一种。 它是在群体水平上研究因素与疾病之间的关系,即以群 体为观察、分析单位,通过描述不同人群中某因素的暴露 情况与疾病的频率,分析该因素与疾病的关系 。 一、概 念 提供病因线索,产生病因假 设 评估人群干预措施的效果 二、研究目的 生态比较研究 生态趋势研究 三、研究类型 应用
15、较多的一种方法 最简单的方法 观察不同人群或地区某种疾病的分布, 根据疾病分布的差异,提出病因假设 生态比较研究 Ecological comparison study 例如,通过生态比较研究发现: 大肠癌在发达国家比发展中国家更常见。这促使人们 考虑饮食习惯和环境污染是否与大肠癌发病有关。 大肠癌的发病率和死亡率的性别比接近1。这提示有关 的暴露在男性和女性中应是相近的;并再次提示与饮食 和环境暴露的联系。 大肠癌的发病率城市高于农村。这提示某些危险因素 在城市比农村更为普遍,因此工业活动导致的环境污染 应考虑可能为与大肠癌有关的因素。 连续观察不同人群中某因素平均暴露水平的改 变和(或)某
16、种疾病发病率、死亡率变化的关系,了 解变动趋势,比较暴露水平变化前后疾病频率的变 化情况,判断某因素与某疾病的联系 生态趋势研究 Ecological trend study 例如某研究采用生态趋势研究的方法,定量分析1999 2003年抚顺市大气总悬浮颗粒物(TSP)浓度与心脑血管 疾病死亡率的关系。 在控制了时间、气象等因素后,当日TSP浓度每增加 50g/m3, 男性组、老年男性组心脑血管疾病死亡率增加 的OR 值分别为1.015 42和1.02240; 滞后4日TSP 浓度每增加50g/m3,总人群、男性组和 老年男性组心脑血管疾病死亡率增加的OR 值分别为 1.00826、1.016
17、27 和1.01665, 认为抚顺市区大气TSP污染可能与当地居民心脑血管 疾病死亡率增加有关。 四、研究步骤 1.确定研究人群 根据具体情况,研究人群可大 可小;可以是不同行政区或地理区域的全部人群, 也可以是由其中不同年龄、性别、种族、职业、宗 教和社会经济地位的人群所组成。确定研究人群时 必须考虑到能否收集到有关研究人群疾病的发病率 、死亡率及有关暴露的资料。 2.收集资料 以群体为单位收集资料。例如,若以 全县为基本观察和分析单位,可以从各县的统计资 料中得到有关人口学和社会经济方面的资料。如不 同人群的年龄、性别构成,家庭平均收入,成年人 受教育情况,人口密度,各民族人口所占的比例,
18、 城乡人口的比例,各种职业人口的比例,烟、酒的 人均消费情况以及环境情况等资料;从卫生当局可 以收集到不同年龄组各种疾病的发病率、死亡率、 各种疫苗接种情况,动物传染源和媒介昆虫消长的 资料。在作生态趋势研究时,还可以收集有关疾病 时间趋势的资料。 3.分析资料 比较不同人群组的特征,进行生态比较研究, 观察疾病与有关暴露之间的联系;亦可作生态趋势分析,观 察不同人群组的特征的变化及疾病的变化之间的联系。 此外,由于所分析的各人群人数可能有很大不同,因而 各人群所提供的信息量也就不同,因此,在作相关和回归分 析时,常需进行人数标化(加权分析)。 经济,出结果快 提供病因未明疾病的病因线索 对个
19、体剂量无法测量的情况,是唯一可供选择的方法 适用于研究因素暴露变异范围小,较难测量暴露与疾 病的关系 人群干预措施的评价及估计疾病发展趋势 优 点 五、优点与局限 生态学研究的局限性 生态学上某疾病与某因素分布的一致性,可能 是该疾病与某因素间真正有联系,但也可能毫无 联系。当生态学上的联系与事实并不相符时称为“ 生态学谬误”(ecological fallacy)或“生态偏倚”( ecological bias)。这就是生态学研究的局限性所 造成的。 缺乏暴露与疾病联合分布的资料:这是 指研究者只知道每个研究人群内的暴露数 和非暴露数,患病数和非患病数,但不知 道在暴露者中有多少发生了疾病或
20、非暴露 者中有多少发生了疾病。 缺乏控制可能的混杂因素的能力:生态 学研究是利用群体的暴露资料和疾病资料 评价二者之间的关系,因此不能将潜在混 杂因素的影响分离出来。 相关资料中的暴露水平只是近似值或平 均水平,而不是个体的真实暴露情况,因 此不能精确定评价暴露与疾病的关系,甚 至还可能在疾病和暴露之间蒙上了更复杂 的联系。 第四节 纵向研究 一、纵向研究的概念与基本原理 纵向研究(longitudinal study),也称随访研究 (follow-up study),是描述性研究中常用的研究方 法之一。 与横断面研究在一个时点上人群中疾病、健康状 况或某种事件的存在情况不同,纵向研究是研究
21、疾 病、健康状况或某种卫生事件在一个人群中随着时 间的推移的动态变化情况。 从方法学上讲,纵向研究属于前瞻性研究,但与传统 的队列研究不同,后者在研究开始时研究对象往往是未 患病者,根据所研究的暴露因素不同将研究对象分为暴 露组和对照组,或者不同暴露水平的组别,并进行追踪 观察,探明不同暴露对某病发病的影响。 而纵向研究是对某个人群或该人群中的个体的进行连 续观察,观察某病或健康状况随时间推移的动态变化情 况。 与横断面调查相似,纵向研究一般没有设立对照组。 二、纵向研究的目的与方法 目的 用来研究疾病的自然史 提出或检验某些病因学假设 方法 同一人群的系列横断面研究 出生队列分析 出生队列分
22、析(birth cohort analysis)是一种纵向研究 ,将同一时期出生的人(或者是有共同经历的一组人 )划归一组称为出生队列(或某特殊队列),可对其 随访若干年,以观察疾病或死亡情况。 利用出生队列资料将疾病的年龄分布和时间分布结 合起来描述的一种方法称出生队列分析方法。该方 法在评价疾病的年龄分布长期变化趋势及提供病因 线索等方面具有很大意义。它可以明确地呈现致病 因子与年龄的关系,有助于探明年龄、所处时代特 点和暴露经历在疾病的频率变化中三者的作用。 患病率(1/1000) 年龄(岁 ) 1995年某病不同年龄组患病率 患病率(1/1000) 年龄(岁 ) 1965、1975、1
23、985、1995年某病不同年龄组患病率 患病率(1/1000) 年龄(岁 ) 不同出生队列年某病不同年龄组患病率 疾病监测 (surveillance of disease):疾病监 测就是指对人群某种或某些疾病进行有计划的长 期观察和监视,着重描述疾病的发生、死亡等情 况的发展趋势及变化情况。 也是一种纵向研究,现在已成为流行病学工作 的一个重要部分。 三、纵向研究的优点与局限性 优点 数据的收集更完整、更准确。 可对研究对象暴露于危险因素或随着年龄增长而发生 的变化加以研究,也可以对研究对象经历或未经历的 环境进行研究。 可以对控制和预防疾病的措施进行考核,评价其效果 。 和现况研究不同,
24、纵向研究收集多次调查数据,因此 它的数据质量较高。 由于研究时间较长,纵向研究可考虑季节性、周期性 或其他影响数据的变化。 可以追踪和研究年龄因素的影响。 局限性 随着时间的推移,由于调查对象死亡、退出研究、搬 离研究地区或搬迁未通知研究员等,可导致各种失访 。 研究所需的费用、人力、时间投入比较高。 跟踪研究对象、设计跟踪形式、建立测试过程等都给 研究者带来一定的难度。 要保证测量和重复测量的质量、真实性和可靠性比较 困难。 研究对象死亡、迁移、转换工作或不想继续参加研究 都是研究者所要面对的问题。 第五节 研究实例 明确调查目的和类型 确定研究对象、样本量和抽样方法 确定研究内容和资料的收
25、集方法 资料整理与分析 调查结论 一、明确调查目的和类型 目的 获得全国结核病的患病率及相关的基础资料 。 类型 普查和抽样调查都可以采用,但结核病属较 常见病种,抽样调查是最优的选择。 二、确定研究对象、样本量和抽样方法 研究对象:全国的居民 样本量:约38万人 抽样方法:分层整群等比例随机抽样 具体方案 全国设257个调查点 抽样比例为13200 每个调查的群体人数保持在1500人左右 折算后全国抽样人数约为38万人左右,约每480 万人口中调查1500人 实际调查 平均每个调查点实检人数为1420人 抽样人口为418456人 应检人口为375599人 实检人口为365097人 受检人口占
26、应检人口的97.2%,占抽样人口 的87.3% 三、确定研究内容和资料的收集方法 收集方法 实验室检测 问卷调查 调查、检测项目 肺结核的患病率 涂阳患病率和菌阳患病率 野生株的菌种鉴定和药物敏感试验 结核病及肺结核的死亡专率 结核病防治措施及肺结核患者社会经济情况 四、资料整理与分析 主要对结核病现患流行情况及其人群、空间和 时间分布特征进行了描述 结果 流行状况 活动性肺结核患病率 367/10万 菌阳患病率 160/10万 涂阳患病率 122/10万 估算全国有活动性肺结核患者451万, 菌阳肺结核196万, 涂阳肺结核150万。 结论 我国人群结核患病率依然很高 人群分布 35岁年龄组
27、的涂阳和菌阳肺结核患病率的男女性 别无差异 其余年龄组的各类患病率男性均高于女性 患病率随年龄的增长呈不断增高趋势,55岁后 更为明显,至75岁达到最高 空间分布 将我国分成东、中、西部三类地区,各地区的肺 结核疫情有明显差异 农村是结核病疫情最严重的地区 项目地区活动性、涂阳和菌阳肺结核患病 率明 显低于其他非项目地区 表31 结核病流行的空间分 布 因素活动性肺结 核(例) 涂阳肺结核 (例) 菌阳肺结核 (例) 地理位置 东部地区24593120 中部地区 436 148178 西部地区 451137199 城乡分布 城市 21168117 城镇 319101129 农村 393116169 地区 项目地区 328110150 非项目地区 429143180 时间趋势 标准化处理后 2000年活动性、涂阳和菌阳肺结核患病率 300/10万、97/10万和124/10万 1990年活动性、涂阳和菌阳肺结核患病率 523/10万、134/10万和177/10万 涂阳患病率2000年比1990年下降27.6%,年递降率 为3.2% 五、调查结论 我国结核病的流行虽然呈缓慢下降趋势, 但患病率依然较高 结核病患病率男性高于女性,随着年龄的 增长患病率不断提高 经济不发达地区和农村结核病疫情较为严 重
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。