1、病例对照研究 Case-control Study 医学统计与流行病学系 周金华 759886201 第一部分:要点复习 目的要求 1、掌握病例对照研究的基本原理; 2、掌握病例对照研究的基本原则; 3、掌握常用指标的计算方法及资料整理分析方 法。 流行病学 研究方法 观察法 描述流行病学 分析流行病学 横断面调查 监测 生态学研究 产生假设 病例对照研究 队列研究 检验假设 实验法 实验流行病学验证假设 数理法 理论流行病学 临床试验 现场试验 社区干预 吸烟/不吸烟人群中肺癌患者比例 肺癌患者/正常人中吸烟的比例 肺癌患者在研究人群中所占比例 A B C 病例对照研究原理图 比较人数暴露疾
2、病 a/a+c b/b+d a c b d 病例对照研究基本原理 以确诊的患有某特定疾病的病人作为病例,以不患有 该病但具有可比性的个体作为对照; 通过询问、实验室检查或复查病史,搜集研究对象既 往各种可能的危险因素的暴露史,测量并比较病例组 与对照组中各因素的暴露比例; 经统计学检验,判断因素与疾病之间是否有统计学关 联的观察性研究方法。 病例对照研究的特点 观察法,无干预; 病例组和对照组,设立对照; 由果到因:疾病 暴露顺序; 探索/检验病因假说。 病例对照研究的优点 1.特别适用于罕见病研究(往往惟一可行); 2.省钱、省力、省时间,易于组织实施; 3.不仅应用于病因探讨,还可广泛应用
3、于许多方面 (疫苗免疫学效果的考核及爆发调查); 4.可同时研究多个因素与某疾病的联系; 5.对研究对象多无损害。 1.不适于研究人群中暴露比例很低的因素; 2.选择偏倚、回忆偏倚难以避免; 3.论证因果关系能力不如队列研究; 4.不能计算发病率,只能计算OR值。 病例对照研究的缺点 研究类型 研究类型 成组的病例-对照研究 (病例与对照不匹配 ) 匹配的病例-对照研究 (病例与对照匹配) 频数匹配/成组匹配个体匹配 探索 检验 匹配(matching) 要求对照在某些因素或特征上与病例保持一致,使 两组进行比较时排除匹配因素干扰的方法。 1、定义 : 2、目的 : 提高研究效率,控制混杂因素
4、 频数匹配(frequency matching): 使匹配因素在(各层)病例与对照中比例相同的匹配方法。 个体匹配 (individual matching): 以病例和对照个体为单位进行匹配的方法交个体匹配。 1:1、1:2、1:3、1:R (1:4时效率最高) 混杂因素 Confounding factor:亦称外来因素,是指与研究因素和 研究疾病均有关,若在比较的人群中分布不均,可歪曲 (夸大或缩小)研究因素与疾病之间真正联系的因素。 (1)是所研究疾病的独立危险因素; (2)与所研究的暴露因素存在统计学联系; (3)不应是暴露因素与疾病因果链中的一个环节或中间变 量。 基本特征(必须
5、同时具备): 匹配过度(over-matching) 把不必要的项目列入匹配,企图使病例与对照尽 量一致,就可能徒然丢失信息,增加工作难度,结果 反而降低了研究效率,这种情况称为匹配过度 (overmatching)。 哪些情况不应该匹配? v研究因素与疾病因果链中的中间变量不应匹配。 如吸烟对血脂有影响,而血脂与心血管疾病有病因关系,如果研究 吸烟与心血管病的病例对照研究中,按血脂水平将病例与对照配对 ,则吸烟与疾病的关联消失。 v只与可疑病因有关而与疾病无关的因素不应匹配。 如避孕药的使用与宗教信仰有关,但宗教信仰与研究的疾病并无关 联,故不应将宗教信仰作为匹配因素。 v可能是疾病的某一危
6、险因素。 如在研究吸烟与肺癌的病例对照研究中,家族史不能作为匹配因 素。 几种不应该匹配的情况 病例与对照的选择 病例与对照选择的基本原则有两个: 一是代表性:病例要足以代表总体的病例;对照要足以 代表产生病例的总体人群或源人群; 二是可比性:病例组与对照组在年龄、性别等主要特征 方面无明显差异; 病例的选择 以医院为基础的(hospital-based)病例对照研究; 以社区为基础的(community-based)病例对照研究。 1、病例选择要求: 诊断可靠:尽量使用金标准; 尽量选择确诊的新发病例,因为其回忆偏倚小 ,容易合作,被调查因素改变少。 2、病例:新发病例、现患病例、死亡病例
7、新发病例: 提供的信息较为可靠(推荐); 现患病例: 掺入疾病迁延及存活因素在内(存活者); 死亡病例: 信息准确性较差。 病例的选择 病例的来源: 1、被研究的总体人群中的全部病例或者总体中随机样本 人群中的全部病例(社区) 这些病例的代表性好,但调查工作比较困难,且耗费 人力、物力较多; 2、医院住院或门诊的病例(医疗机构) 这些病例比较合作,资料容易得到而且比较可靠 ,与对照的可比性好;代表性较差,会产生选择偏倚; 不同类型的医疗机构,病人的特征不同。应结合研究目 的,适当选择病人的来源。 对照的选择 排除选择偏倚; 缩小信息偏倚; 缩小不清楚或不能很好测量的变量引起的残余混杂; 对照是
8、全人群的一个无偏样本。 对照的样本的暴露率反映源人群的暴露水平,能代表 产生病例的人群。 对照的选择 对照的来源 社区对照:邻居、配偶对照 医院对照 (1)排除与研究暴露因素可能有关的病种,如研究吸 烟与肺癌的关系,不能以慢性支气管炎病人作为对照; (2)最好不要只选择一种病种的病例作为对照; (3)多病种的选择有一定的稀释作用。 对照选择是否恰当是病例对照研究成败的关键之一! 1. 描述性统计 (1)描述研究对象的一般特征 (2)均衡性检验 2. 统计性推断 (1)将资料整理为四格表/列联表; (2)暴露比例差异的显著性检验; (3)估计暴露因素疾病之间的联系强度; (4)结果解释。可能存在
9、哪些偏倚?得出什么结论? 资料分析 关联强度指标 比值比(odds ratio, OR) 表示病例组某因素的暴露比值与对照组该因素暴露比值之比 ,反映暴露者的疾病危险性是非暴露者的多少倍。 OR 优势比RR 相对危险度 概念不同 用处不同 相同之处 病例组暴露和非暴露人数 之比与对照组暴露和非暴 露人数之比的比值 (比值比) 暴露组和非暴露组 的发病率之比 (率比) 病例对照研究 (不能计算发病率) 队列研究 都是说明疾病与暴露因素关联强度指标; 都表示暴露组的疾病危险性是非暴露组的多少倍; 在疾病的发病率或患病率较低时,两者近似相等。 病例对照研究能否计算RR值? 不能。病例对照研究一般缺乏
10、暴露与非暴露的总体人数, 且不能计算发病率/死亡率,故不能直接计算RR值。只能通过 计算OR来估计RR。 如果能满足2个条件 所研究疾病的发病率(死亡率)很低 (5%); 病例对照研究中所选择的研究对象代表性好; ORRR 一、成组匹配或不匹配资料的分析 1、整理四格表 2、病例组和对照组暴露率的比较: 3、暴露与疾病的联系强度OR: OR=病例组暴露比值/对照组暴露比=ad/bc OR的95%CI: 二、不匹配分层资料的分析 1、按可能的混杂因素分层,每层整理成一个四格表, 计算每层的值和OR;判断是否为混杂因素; 2、进行齐性检验 (1)若两组资料同质,可计算合并OR值、合并 值和ORMH
11、95%CI; (2)若两组资料不同质,不宜合并计算。 3、计算总的卡方值: 4、估计总OR值95%的可信区间: 1、计算各层的OR值: 当两层的OR值接近时,说明两个资料是同质的 2、计算总的OR值: 三、分级暴露资料的分析 若能获得某暴露不同暴露水平的资料,可用以分析 疾病和暴露的剂量反应关系,以增加因果推断的依据; 分析步骤: (1)将资料整理归纳成列联表; (2)做卡方检验; (3)计算各分组的OR值 通常以不暴露或最低水平的暴露为参照; (4)趋势检验。 四、1:1配对资料的分析 1、病例组和对照组暴露率的比较: 2、暴露与疾病的联系强度: OR的95%CI: (适用于大样本) (校正
12、公式,b+c40) 偏倚及其控制 (一)选择偏倚 由于选入的研究对象与未选入的研究对象在某些 特征上存在差异而引起的误差,这种偏倚常发生于 研究的设计阶段。 1、入院率偏倚/ Berkson偏倚 病例不是全体病人的随机样本,对照亦不是全体 目标人群的随机样本; 控制:设计阶段尽量采用随机选择研究对象,在多 个医院选择对象等方法以减少偏倚程度。 2、现患病例-新发病例偏倚/ 奈曼偏倚(Neyman bias) 如果调查对象选自现患病例,所得的信息很多与存活有关,而未必与 发病有关,从而高估暴露因素的病因作用;或改变生活习惯,降低危险因 素的水平;这样调查的时候夸大或缩小病前某些特征,导致因素与疾
13、病的 关联误差。控制:明确规定纳入标准为新发病例。 3、检出征候偏倚 / 暴露偏倚 病人因与疾病无关的症状而就医,从而提高了早期病例的检出率,致 过高的估计暴露的作用。控制:收集的病例中同时包括早、中、晚期病 人。 4、时间效应倚倚 某些疾病的早期病例在研究时归入非病例组,从而导致结论的误差; 控制:尽量采用敏感的疾病早期检查技术,或开展观察期充分长的纵向调 查。 偏倚及其控制 偏倚及其控制 (二)信息偏倚 又称观察偏倚或测量偏倚,是在收集整理信息过程中由于 测量暴露与结局的方法有缺陷造成的系统误差。 1、回忆偏倚(recall bias) 选择不易为人们所忘记的重要指标做调查,并重视问卷的
14、提问方式和调查技术,将有助于减少回忆偏倚。 2、调查偏倚 尽量采用客观指征,选择合适的人选参加调查,做好调查 技术培训,采取复查等做好质量控制,检查条件尽量一致, 使用精良的检查仪器等。 偏倚及其控制 当我们研究某个因素与某种疾病的关联时,由 于某个既与疾病有制约关系,又与所研究的暴露因素 有联系的外来因素的影响,掩盖或夸大了所研究的暴 露因素与疾病的联系,这种现象或影响称之为混杂偏 倚,该外来因素叫混杂因素。 设计阶段:限制、匹配 资料分析阶段:标准化、分层分析、多因素分析 (三)混杂偏倚 控制: 第二部分:课题讨论 随着汽车的普及,我国车祸发生率和发生总数不 断上升。为了遏制这一势头。需要
15、查明车祸发生的原 因。请通过回答下列问题,设计一项病例对照研究, 以探讨广州市车祸的发生原因。 课题一 交通事故:是指车辆、人员在特定道路通行过程中,由 于当事人违反道路交通管理条例或民法通则应 承担责任的行为而造成的人、畜伤亡和车、物损失的交 通事件。通常将同等责任以上事故称为责任事故。其事 故级别分为:重大及特大事故、一般事故、轻微事故。 课题一 课题一 问题1:是采用频数匹配还是个体匹配的病例对照研究 ?或者两者均可?这两类病例对照研究的异同点是什么 ?各有何适用特征? 答案提示: 两者均可,频数匹配较好。 共同点: 目的相同,都在于提高研究效率和控制混杂因素; 对已匹配的因素,无法分析
16、其与疾病的关系及与其他暴露 因素的交互作用。 课题一 不同点: 个体匹配是以病例和对照个体为单位进行匹配,1:R匹配,适用于罕 见病或所能得到的符合规定的病例数很少的研究; 个体匹配适用于对照在某定量指标的特定范围内与病例匹配,如要 求对照与病例的年龄之差在3岁以内。 频数匹配首先应当知道或估计出匹配变量每一层的病例数,然后从 备选对照中选择对照,直至达到每层所要求的数目,不一定要绝对 数相等,重要是比例相同,适用于广泛地探索疾病的危险因子。 频数匹配适用于定量指标要求在一定范畴内匹配时,如年龄匹配, 病例为5059岁组,则对照也应当为5059岁组。 问题2:列出病例和对照的纳入和排除标准。
17、课题一 参考答案: 病例组纳入标准:近3个月内发生责任交通事故的肇事司机,事 故级别为一般事故以上。碰撞类型包括机动车与机动车相撞、机 动车与非机动车相撞。自愿参加本次调查,无重大精神疾病或智 力障碍,能够清醒了解整个调查,并提供知情同意书; 病例组排除标准:因特殊原因发生车祸(自然灾害,被人蓄意伤 害发生车祸等)。 参考答案: 对照组纳入标准:以近3个月内未发生过交通事故的有机动车驾 驶证的司机为对照, 自愿参加本次调查,无重大精神疾病或智力 障碍,能够清醒了解整个调查,并提供知情同意书; 对照组排除标准。 课题一 课题一 问题3:从获得病例和对照的途径来看,有人群为基础的病例对照 研究和以
18、医院为基础的病例对照研究,分别描述两者获得病例和 对照的方法,病例和对照的获取原则是什么。 参考答案 : 人群为基础的病例对照研究 病例:由交警大队登记在册的曾经发生交通事故的机动车驾驶员; 对照:没有发生过交通事故的机动车驾驶员。 医院为基础的病例对照研究 病例:因交通事故发生严重外伤而入院的机动车驾驶员; 对照:医院其他科室的病人,有机动车驾驶证。 课题一 病例的选择 以医院为基础的对照选择原则: 由尽可能多的病种的病人组成; 新发病人; 不选择当前患多种疾病的病人; 因已知与所研究的危险因素有关的病种病人不能作为对照。 对病例的规定:“金标准”; 对病例其他特征的规定:性别、年龄等;控制
19、非研究因素以增强两组可比性 ; 保证病例达到标准:如病例报告确诊某癌症。 排除选择偏倚; 缩小信息偏倚; 缩小不清楚或不能很好测量的变量引起的残余混杂; 在满足真实性的要求和逻辑限制的前提下使统计把握度达到最 大。 对照的选择 课题一 问题4:估计样本量应考虑哪些因素? 答案提示: 计算样本量需要考虑: 研究因素在对照组中的暴露率P; 预期的该因素的效应强度,即相对危险度RR或暴露的比值比OR ; 希望达到的检验的显著水平 ; 希望达到的检验把握效度(1-)。 课题一 问题5 : 参考答案: 文化程度与车祸关系 : 通常以不暴露或最低水平暴露组为参照组; 本题中以大学及以上文化程度为参照组。
20、课题一 高中文化程度: OR1=a1d/b1c=400*900/400*200=4.5,95%CI:3.75.5; 初中文化程度: OR2=a2d/b2c=900*900/200*300=13.5,95%CI:11.016.5。 卡方趋势检验:自由度为1的卡方趋势检验公式,参考课本 T1=400*1+900*2=2200 T2=800*1+1200*2=3200 T3=800*12+1200*22=5600 Var=1500*1600*(3100*5600-32002)/31002*(3100-1)=574 2=738.611,P0.01;结果说明剂量反应趋势有统计学意义 , 可知:随着文化程
21、度的降低车祸发生风险递增,呈现 明显计量反应关系。 除此,还可以通过比较两级的95%置信区间,没有相交,得出两 级的差异有统计学意义,进而可以说明剂量反应趋势有统计学意 义。 课题三 吸烟和饮酒可能与多种疾病相关,且二者又相互关联,从 而使两者在疾病的关联研究中成为相互的混杂因素。一项病例 对照研究探讨了饮酒量和吸烟对心脏病的影响,获得的数据如 下:吸烟量分为吸烟与不吸;饮酒量分为中度饮酒和不饮酒。 吸烟组中心脏病患者1400人,其中中度饮酒者为1260人,不饮 酒者为140人;吸烟组对照800人,其中中度饮酒者为720人,不 饮酒者为80人。不吸烟组病例600 人,其中中度饮酒者160人,
22、不饮酒者440人;不吸烟组对照1200人,其中中度饮酒者320人 ,不饮酒者880人。 课题三 1.什么是混杂因素和混杂作用?在病例对照研究中,哪些因素可以 控制混杂作用? 2.根据以上研究结果,判断该病例对照研究是频数匹配还是个体匹 配? 3. 试分析饮酒与心脏病的关系,列出统计表格。 4.按吸烟分层,分析饮酒与心脏病的关系,列出表格,分别计算吸 烟与不吸烟层饮酒与心脏病的关系(计算2、OR、OR的95%CI )。 5.在对照组人群中,分析饮酒与吸烟的关系(计算2、OR、OR的 95%CI)。 6.在不饮酒人群中,分析吸烟与心脏病的关系(计算2、OR、OR 的95%CI)。 7.按吸烟分层后
23、,判断两层中饮酒与心脏病关系OR值的同质性。 如同质,计算总OR值及其95%CI;如不同质,表示何意义? 8.按饮酒与否分层,分析吸烟与心脏病的关系,列出统计表格? 9.根据以上内容,总结利用分层分析方法控制混杂作用的步骤。 问题1:什么是混杂因素和混杂作用?在病例对照研究 中,哪些因素可以控制混杂作用? 课题三 答案提示:混杂因素亦称外来因素,是指与研究因素和研究疾病 均有关,若在比较的人群中分布不均,可歪曲(夸大或缩小)研 究因素与疾病之间真正联系的因素,混杂因素所起的作用就是混 杂作用。 控制: 设计阶段:限制、匹配 资料分析阶段:标准化、分层分析、多因素分析 课题三 问题2:根据以上研
24、究结果,判断该病例对照研究是频 数匹配还是个体匹配? 答案提示:频数匹配 课题三 问题3. 试分析饮酒与心脏病的关系,列出统计表 格。 2=152.47,P0.001; OR=1420*960/1040*580=2.260; 95%CI:1.982.58 饮酒是心脏病的危险因素,饮酒导致心脏病的危险性是不饮 酒组的2.26倍。 病例对照 饮酒14201040 不饮酒580960 答案提示: 课题三 问题4:按吸烟分层,分析饮酒与心脏病的关系,列出表 格,分别计算吸烟与不吸烟层饮酒与心脏病的关系(计 算 、OR、OR的95%CI) 答案提示:按是否吸烟分层,饮酒与心脏病的关系: 课题三 在吸烟中
25、:2 = 0.0,P=1.000, OR = (126080)(140720) = 1.0,95% CI:0.751.34; 在不吸烟中:2=0.0,P =1.000, OR= (160880)(440320) = 1.0,95% CI:0.801.25。 饮酒与心脏病的统计学关联是由于吸烟作为混杂因素引起, 其实饮酒与心脏病并无统计学关联。 课题三 问题5:在对照组人群中,分析饮酒与吸烟的关系(计 算 、OR、OR的95%CI) 答案提示:在对照人群中,吸烟与饮酒的关系: 2=771.37,P0.001; OR=720*880/320*80=24.75,饮酒人群中吸烟的是不饮 酒人群中吸烟的
26、24.75倍,OR95%CI:19.0132.23。 问题6:在不饮酒人群中,分析吸烟与心脏病的关系( 计算 、OR、OR的95%CI) 课题三 答案提示:在不饮酒人群中,吸烟与心脏病的关系: 在不饮酒中:2=73.76,P0.001 OR=140*880/440*80=3.5 95%CI:2.64.7。 怎样判断吸烟为混杂因素? (1)吸烟与饮酒有关;-问题5 (2)吸烟与心脏病有关;-问题6 (3)吸烟不是饮酒与心脏病关系的中间环 节。 吸烟是饮酒导致心脏病的一个混杂因素。 课题三 问题7:按吸烟分层后,判断两层中饮酒与心脏病关系 OR值的同质性。如同质,计算总OR值及其95%CI;如 不
27、同质,表示何意义? 答案提示:两层中OR齐性检验,P=1,所以两层OR同质,可以 合并,两层合并后: =1 ,95% CI:0.841.19 。 如不同质,表示吸烟与不吸烟中,饮酒发生心脏病的危险性 不一致, 可能存在交互作用,不能合并,应分别报道。 因此,控制吸烟后,饮酒和心脏病没有关联。 课题三 问题8:按饮酒与否分层,分析吸烟与心脏病的关系, 列出统计表格? 答案提示:按是否饮酒分层,吸烟与心脏病的关系: 在饮酒中:2=145.4,P0.001; OR=(1260320)(160720)=3.5;95%CI:2.844.32 在不饮酒中:2=73.76,P0.001; OR=(14088
28、0)(44080)=3.5;95%CI:2.64.7 在饮酒与不饮酒中,吸烟导致心脏病的危险性都是3.5。 课题三 课题三 问题9:根据以上内容,总结利用分层分析方法控制混 杂作用的步骤。 答案提示: (1)确定分层因素,分层列四格表; (2)分别计算各层的OR值; (3)检验各层OR值的同质性; (4)如果同质,计算并报告合并的OR值; (5)如果不同质,分别报告OR值。 课题四 问题1:可以采用哪些流行病学研究方法?较佳的是那种 ? 答案提示:病例对照研究,队列研究等;较佳的是病例对照研 究。 1. 病例对照研究可以用来探讨疾病的危险因素(多因一果),而 队列研究常用于探讨已知因素对结局的
29、影响(一因多果); 2. 病例对照研究适用于发病率低的疾病研究(题目表明仅部分人 发展为慢性乙肝病持续携带者)。 问题2:如果采用成组病例对照研究方法,病例和对照 的纳入与排除标准分别是什么?并说明原因。 课题四 参考答案: 病例组纳入标准:1.符合慢性乙型肝炎携带者诊断标准 A.血清HBsAg阳性史6个月以上; B.一年内连续随访3次或以上,血清ALT和AST均在正常范围,且 无慢性肝炎的体征如肝掌,蜘蛛痣,脾大; C. 肝组织学检查无明显炎症,坏死或纤维化; D. HbeAg阳性,血清HBV DNA可检出。 2. 自愿参加本次调查,无重大精神疾病或智力障碍,能够清醒 了解整个调查,并提供知
30、情同意书; 病例组排除标准:合并其他肝炎病毒感染者;严重的基础疾病 者,如心衰、肾衰等。 课题四 参考答案: 对照组纳入标准:血清抗HBs 阳性且HBsAg阴性;自愿参加本次 调查,无重大精神疾病或智力障碍,能够清醒了解整个调查, 并提供知情同意书。 对照组排除标准:注射过乙型肝炎疫苗者;严重的基础疾病者 ,如心衰、肾衰等. 问题3:研究因素应该包括哪些。 课题四 参考答案: A.一般情况:年龄、性别、民族、婚姻状况、职业、文化程度、 经济状况、居住地 B.既往史:手术史、口腔诊疗史、内窥镜史、输血史、有偿献血 史、创伤性美容史(纹眉、绣眉、眼线、纹身、打耳洞等)、针灸 史、共用注射器或刮胡刀史、是否与HBsAg阳性者长期共同生活 C.乙肝易感基因 作 业 自学内容:课题五 作业:课题二(P4) 交作业时间:5月29日前交至公共卫生学院722办公室 周金华 Thank you!Thank you!Thank you!Thank you!