1、流行病学与卫生统计学描述性研究案例描述性研究案例1.该研究采用什么流行病学设计方法?判断依据是什么?2.研究对象如何选择?如何抽样?是否有代表性?该研究的入选排除标准是否明确?3.主要的结局的指标有哪些?是否准确客观?为什么?4.如何收集相关的资料?5.统计方法和描述是否正确?6.该论文控制了哪些偏倚?如何控制?存在哪些偏倚?7.分析的方法是否得当?如何描述结果?8.课题选题的建议?流行病学研究的类型流行病学研究的类型描述性研究(descriptive study)研究特定时点或期间和特定范围内人群中的有关变量(因素)与疾病或健康状况的关系,又称描述性流行病学。指根据日常记录资料或通过特殊调查
2、所得的资料,包括实验室检查结果。按不同地区、不同时间及不同人群特征分组,将一个社区人群疾病或健康状态分布情况进行简单描述,常常是流行病学调查的第一步,也是分析流行病学的基础。它主要描述分布的三大特征,即:地区特征、时间特征和人群特征。现况调查是一种常用的描述性研究 现况研究 现况研究是流行病学研究方法中的一种基础性研究方法。它是按照事先设计的要求在某一人群中应用普查和抽样调查的方法收集特定时间内疾病的描述性资料,以描述疾病的分布及观察某些因素与疾病之间的关联。亦可称为横断面调查(cross-sectional study),或患病率调查(prevalence study)。因所收集的有关因素与
3、疾病或健康之间的资料既不是过去暴露史,又不是随访调查所得的结果,而是调查当时所获得的资料,故称它为现况研究。现况研究的特点现况研究的种类 n 普查普查(Census):调查特定时点或时期、特定范围内的全部人群(总体)。n 抽样调查抽样调查(Sampling survey):随机抽样,调查特定时点、特定范围人群的一个代表性样本,以样本统计量估计总体参数所在范围。;目的:目的:n根据抽取样本所调查出的结果可以估计出该人群根据抽取样本所调查出的结果可以估计出该人群某病的患病率,或某些特征的情况。某病的患病率,或某些特征的情况。优点:1.按随机化原则抽取调查单位,以样本来代表和说明总体;2.节省人力、
4、物力和时间;3.以样本推断总体的误差可事先估计并加以控制;4.调查的精确度高。缺点:缺点:1.1.只能提供说明整个总体情况的统计资料;只能提供说明整个总体情况的统计资料;2.2.抽样调查的设计、实施与资料分析比较复杂,存抽样调查的设计、实施与资料分析比较复杂,存在抽样误差和偏倚;在抽样误差和偏倚;3.3.不适用于患病率过低的疾病。不适用于患病率过低的疾病。设计与实施一、提出假设 明确研究目的二、制定计划 1.方法 设计类型 2.研究对象选择(必要时估算样本大小)3.确定研究的观察指标 (拟定调查表、暴露的测量、疾病发生的测量)4.确定资料的收集方法 5.其他:如人员组织经费预算质量控制等三、调
5、查员培训四、实施 资料的收集 五、资料的整理分析六、总结报告明确研究目的根据不同的研究目的选择不同的研究设计类型:了解疾病或健康状况的分布情况 开展群体健康检查以上两种情况都可选择普查还是抽样调查确定研究对象选择合适的研究对象是描述性研究成功的关键因素;必须根据研究目的对待调查人群的三间分布的情况确定下来,同时考虑可行性。对象选择:样本含量估计样本大小主要取决于三个因素:估计样本大小主要取决于三个因素:(1)(1)对调查结果精确性的要求高,即容许误差小,则样对调查结果精确性的要求高,即容许误差小,则样本要大些;本要大些;(2)(2)预计现患率或阳性率高,则样本可以小些。预计现患率或阳性率高,则
6、样本可以小些。(3)(3)显著性水平(显著性水平()(1)(1)凭经验凭经验 如如1/101/10(2)(2)凭估算:按公式计算凭估算:按公式计算 软件软件:power and sample size calculation(PS)(3)(3)查表查表样本大小计算举例某卫生机构为了制订驱蛔虫计划,编制经费、药品预算,某卫生机构为了制订驱蛔虫计划,编制经费、药品预算,需要抽样估计当地儿童蛔虫感染率。据该地以往经验,需要抽样估计当地儿童蛔虫感染率。据该地以往经验,儿童蛔虫感染率一般不高于儿童蛔虫感染率一般不高于3030,若规定容许误差为,若规定容许误差为0.2P0.2P,则样本含量至少应为多少人,
7、则样本含量至少应为多少人?样本大小 (3)(3)查表查表按不同预期阳性率和容许误差时现况调查样本大小按不同预期阳性率和容许误差时现况调查样本大小 预期阳性率预期阳性率容许误差容许误差0.1P0.15P0.2P0.057600338219000.0754933219313280.10360016029000.15226410005660.2016007124000.2512005333000.309304152330.35743330186抽样调查的抽样方法单纯随机抽样(simple random sampling)系统抽样(systematic sampling)分层抽样(stratified
8、 sampling)整群抽样(cluster sampling)两级或多级抽样(two-stage or multi-stage sampling)五、资料收集、整理分析和结果解释 资料收集 收集内容:基本情况、疾病有关情况、暴露有关情况收集内容:基本情况、疾病有关情况、暴露有关情况 调查员培训调查员培训 收集方法:收集方法:测定或检查的方法、直接用调查表询问研究测定或检查的方法、直接用调查表询问研究对象对象数据整理分析 原始资料核对原始资料核对 分组、归类等计算各种率分组、归类等计算各种率 比较分析比较分析 结果解释 根据根据“三间三间“分布特征的结果,结合有关因素解释疾病分布特征的结果,结
9、合有关因素解释疾病的分布特点的分布特点 将描述性资料进行对比分析,寻找规律,找病因线索将描述性资料进行对比分析,寻找规律,找病因线索偏倚产生偏倚的原因:主观选择研究对象,随机抽样变成随意抽烟;任意变换抽样方法,住院号抽样改为出院号;调查对象不合作或不能参加;死亡的个体不能调查-幸存者偏倚;无法正确报告调查信息-报告偏倚、回忆偏倚等;调查员有意识地深入调查一部分人;测量方法不正确。现况研究中常见的几种偏倚 选择偏倚:研究者在选择研究对象时由于选择条件受限制或设计失误所致的系统误差。1、无应答偏倚2、选择性偏倚3、幸存者偏倚 现况研究中常见的几种偏倚信息偏倚:在收集和整理有关暴露或疾病资料时出现的
10、系统误差。1、调查对象所引起的偏倚 2、调查员偏倚 3、测量偏倚 偏倚控制 在抽取调查对象时,必须严格遵守随机化原则;提高应答率;控制测量偏倚,选用不易产生偏差大仪器、设备;培训调查员,防止调查员偏倚的产生;做好资料的复查、复核工作;选择正确的统计分析方法。现况研究的优缺点n优点 样本的代表性好:抽样调查的样本一般来自人群;样本的代表性好:抽样调查的样本一般来自人群;获得同期对照;获得同期对照;同时多种暴露因素和多种结局变量的数据。同时多种暴露因素和多种结局变量的数据。n局限性 由于是在同一时点评估暴露和疾病状况,很多情由于是在同一时点评估暴露和疾病状况,很多情况下难以判断孰前孰后、孰因孰果况
11、下难以判断孰前孰后、孰因孰果 许多慢性病都有相对恶化和缓解期,现况研究可许多慢性病都有相对恶化和缓解期,现况研究可能把缓解期(或潜伏期或临床前期)的病例错划能把缓解期(或潜伏期或临床前期)的病例错划为无病为无病 第三节 研究实例明确调查目的和类型确定研究对象、样本量和抽样方法确定研究内容和资料的收集方法资料整理与分析调查结论 2000年第四次全国结核病流行病学抽样调查 一、明确调查目的和类型目的 获得全国结核病的患病率及相关的基础资料。类型 普查和抽样调查都可以采用,但结核病属较常见病种,抽样调查是最优的选择。二、确定研究对象、样本量和抽样方法研究对象:全国的居民样本量:约38万人抽样方法:分
12、层整群等比例随机抽样 具体方案 全国设257个调查点抽样比例为13200每个调查的群体人数保持在1500人左右折算后全国抽样人数约为38万人左右,约每480万人口中调查1500人实际调查 平均每个调查点实检人数为1420人抽样人口为418456人应检人口为375599人实检人口为365097人受检人口占应检人口的97.2%,占抽样人口的87.3%三、确定研究内容和资料的收集方法 收集方法 实验室检测实验室检测 问卷调查问卷调查 调查、检测项目 肺结核的患病率肺结核的患病率 涂阳患病率和菌阳患病率涂阳患病率和菌阳患病率 野生株的菌种鉴定和药物敏感试验野生株的菌种鉴定和药物敏感试验 结核病及肺结核
13、的死亡专率结核病及肺结核的死亡专率 结核病防治措施及肺结核患者社会经济情况结核病防治措施及肺结核患者社会经济情况四、资料整理与分析主要对结核病现患流行情况及其人群、空间和时间分布特征进行了描述结果 流行状况 活动性肺结核患病率活动性肺结核患病率 367/10367/10万万 菌阳患病率菌阳患病率 160/10160/10万万 涂阳患病率涂阳患病率 122/10122/10万万 估算全国有活动性肺结核患者451万,菌阳肺结核196万,涂阳肺结核150万。结论我国人群结核患病率依然很高 35岁年龄组的涂阳和菌阳肺结核患病率的男女性别无差异其余年龄组的各类患病率男性均高于女性患病率随年龄的增长呈不断
14、增高趋势,55岁后更为明显,至75岁达到最高 人群分布人群分布n将我国分成东、中、西部三类地区将我国分成东、中、西部三类地区,各地区的肺各地区的肺结核疫情有明显差异结核疫情有明显差异n农村是结核病疫情最严重的地区农村是结核病疫情最严重的地区n项目地区活动性、涂阳和菌阳肺结核患病项目地区活动性、涂阳和菌阳肺结核患病 率明率明显低于其他非项目地区显低于其他非项目地区空间分布空间分布表31 结核病流行的空间分布 因素因素活动性肺结核活动性肺结核(例)(例)涂阳肺结核涂阳肺结核(例)(例)菌阳肺结核菌阳肺结核(例)(例)地理位置地理位置 东部地区东部地区2452459393120120 中部地区中部地
15、区 436 436 148148178178 西部地区西部地区 451451137137199199城乡分布城乡分布 城市城市 2112116868117117 城镇城镇 319319101101129129 农村农村 393393116116169169地区地区 项目地区项目地区 328328110110150150 非项目地区非项目地区 429429143143180180时间趋势标准化处理后 2000年活动性、涂阳和菌阳肺结核患病率300/10万、97/10万和124/10万1990年活动性、涂阳和菌阳肺结核患病率523/10万、134/10万和177/10万涂阳患病率2000年比199
16、0年下降27.6%,年递降率为3.2%五、调查结论我国结核病的流行虽然呈缓慢下降趋势,但患病率依然较高结核病患病率男性高于女性,随着年龄的增长患病率不断提高经济不发达地区和农村结核病疫情较为严重n 概概 念念n 研究目的研究目的n 研究类型研究类型n 优点与局限优点与局限 n 研究实例研究实例生态学研究生态学研究描述性研究的一种群体的水平上研究某种因素与疾病的关系以群体为观察和分析单位描述不同人群中某因素的暴露状况与疾病的频率,分析该暴露因素与疾病的关系 一、概一、概 念念 提供病因线索,产生病因假设 评估人群干预措施的效果二、研究目的二、研究目的三、研究类型三、研究类型生态学研究的方法:比较
17、生态学研究(ecological comparison study)比较不同人群中某疾病或健康状态,他们的疾病率或死亡率的差别,以了解某疾病或健康状态在不同人群中分布有无异同点。从而探索该现象产生的原因,找到值得进一步深入研究的线索。生态趋势研究(ecological trend study)指连续观察不同人群中某疾病或健康状态的发生率或死亡率,了解其变动趋势。应用较多的一种方法最简单的方法观察不同人群或地区某种疾病的分布,根据疾病分布的差异,提出病因假设生态比较研究生态比较研究 Ecological comparison study 连续观察不同人群中某因素连续观察不同人群中某因素平均暴露水
18、平平均暴露水平的的改变和改变和(或或)某种疾病发病率、死亡率变化的关系,某种疾病发病率、死亡率变化的关系,了解变动趋势,比较暴露水平变化前后疾病频率了解变动趋势,比较暴露水平变化前后疾病频率的变化情况,判断某因素与某疾病的联系的变化情况,判断某因素与某疾病的联系 生态趋势研究生态趋势研究 Ecological trend study美国美国1900-19991900-1999年人均烟草消耗量、男女肺癌死亡率变动趋势年人均烟草消耗量、男女肺癌死亡率变动趋势经济,出结果快提供病因未明疾病的病因线索对个体剂量无法测量的情况,是唯一可供选择的方法适用于研究因素暴露变异范围小,较难测量暴露与疾病的关系人
19、群干预措施的评价及估计疾病发展趋势四、优点与局限优优 点点出现生态学谬误 难以控制混杂因素存在多重共线性问题难以确定因果联系局限性局限性案例描述性研究案例1.该研究采用什么流行病学设计方法?判断依据是什么?2.研究对象如何选择?如何抽样?是否有代表性?该研究的入选排除标准是否明确?3.主要的结局的指标有哪些?是否准确客观?为什么?4.如何收集相关的资料?5.统计方法和描述是否正确?6.该论文控制了哪些偏倚?如何控制?存在哪些偏倚?7.分析的方法是否得当?如何描述结果?8.课题选题的建议?该研究采用什么流行病学设计方法?如何判断的?n该项目属于现况研究该项目属于现况研究n根据研究对象的入选条件:
20、根据研究对象的入选条件:运用阶段性随机整群抽样运用阶段性随机整群抽样方法选择河南信阳平桥区,从方法选择河南信阳平桥区,从22个乡镇中人选个乡镇中人选7个乡镇,个乡镇,筛选当地汉族、年龄筛选当地汉族、年龄40-75岁的农村居民岁的农村居民。研究对象如何选择?如何抽样?是否有代表性?运用阶段性随机整群抽样方法选择河南信阳平桥区,从22个乡镇中人选7个乡镇筛选当地汉族、年龄40-75岁的农村居民2004年10月至2005年3月通过3次筛查13 444人(应答率84.9),入选高血压患者5421例,有卧立位血压资料者5101例,(部分患者因肢体活动不便未行卧立位血压检查),有踝臂血压指数(ABI)者4
21、812例,本研究人选471 l例。其中3937例患者有心脏超声资料。本研究的入选排除条件不明确。采用哪些研究的观察指标?是否准确客观?为什么?血压(OH、OHT)高血压诊断标准为2个月内3次不同时间检查收缩压(SBP)140 mm 和(或)舒张压(DBP)90mm Hg,或已诊断高血压正在药物治疗者。高血压靶器官损害的关系,包括左心室肥厚(LVH),外周血管病(PAD)和肾小球滤过率(eGFR)下降。如何收集相关的资料?通过询问病史、查体、心电图、超声心动图、血尿生化检查等排除继发性高血压及其他系统疾病用便携多普勒测量四肢血压计算ABI体格检查包括身高、体重、腰围、臀围、血压、心电图及超声心动
22、图等该论文控制了哪些偏倚?如何控制?还存在哪些偏倚?控制:选择性偏倚:样本的代表性好、应答率85%检出症候偏倚检出症候偏倚 无应答偏倚无应答偏倚 易感性偏倚易感性偏倚 志愿者偏倚志愿者偏倚 时间效应偏倚时间效应偏倚测量偏倚:血压测量客观、心脏彩超、血清肌酐 回忆偏倚回忆偏倚 诊断怀疑偏倚诊断怀疑偏倚 暴露怀疑偏倚暴露怀疑偏倚 报告偏倚报告偏倚 诱导偏倚诱导偏倚混杂偏倚:sex、age该论文控制了哪些偏倚?如何控制?还存在哪些偏倚?存在的偏倚选择性偏倚 现患新发病例偏倚:新老病人无法区分现患新发病例偏倚:新老病人无法区分测量偏倚 体位性体位性OH和和OHT的定义是否合理,需要论证的定义是否合理,
23、需要论证 如何保证在如何保证在30s的时候能够准确测量的时候能够准确测量BP很重要很重要。混杂偏倚 高血压的患病年限是影响靶器官损害的重要因素高血压的患病年限是影响靶器官损害的重要因素 是否接收药物治疗?什么时候开始治疗?是否规律治疗?治疗的效果如何?是否接收药物治疗?什么时候开始治疗?是否规律治疗?治疗的效果如何?血脂水平、动脉硬化的程度、糖尿病血脂水平、动脉硬化的程度、糖尿病分析的方法是否得当?如何描述结果?表1的分析没有阐明是采用哪种分析方法表2没有调整药物治疗和以上提到的混杂因素;表3和4的结果没有在总的人群中进行分析;并且没有考虑到DBP的作用;表3和4采用了不同的分层变量;可以采用诊断实验的方法进行ROC曲线描述,来寻找合适的诊断切割点。统计分析描述不清晰统计学分析:用SPSSl3.0进行数据分析。正态分布的连续变量组间比较采用t检验或单因素方差分析,非正态分布变量采用非参数检验,分类变量应用x2检验,多元Logistic回归校正年龄、性别等因素分析OH和OHT及体位性血压变化与靶器官损害的关系。该研究中未采用t检验,但是却在统计分析中提及。哪些因素之间的分析采用logistic回归要明确校正哪些因素要明确,不能含糊其辞。课题选题如果能够纳入非高血的研究对象,分析这其中的个体体位性低血压患者血压的变化与相应结局的变化,可能更有证据表明体位性血样对靶器官损害的影响。