1、第五章第五章 病例对照研究病例对照研究 Case Control Study Case Control Study中南大学湘雅公共卫生学院中南大学湘雅公共卫生学院谭红专谭红专 教授教授2023-5-21case control study1第一节第一节 基本原理基本原理第二节第二节 研究类型研究类型 第三节第三节 实施步骤实施步骤第四节第四节 资料的整理与分析资料的整理与分析第五节第五节 常见偏倚及其控制常见偏倚及其控制第六节第六节 研究实例研究实例第七节第七节 优缺点与注意事项优缺点与注意事项可编辑22023-5-21可编辑3第一节第一节 基本原理基本原理 基本原理基本原理 研究示意图研究示
2、意图 发展史发展史2023-5-21 以确诊患某种特定疾病的病人作为病例以确诊患某种特定疾病的病人作为病例 以不患该病但具有可比性的个体作为对照以不患该病但具有可比性的个体作为对照 通过询问、实验室检查或复查病史,搜集既通过询问、实验室检查或复查病史,搜集既 往危险因素暴露史往危险因素暴露史 测量并比较两组各因素的暴露比例,经统计学测量并比较两组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联检验该因素与疾病之间是否存在统计学关联可编辑4一、基本原理一、基本原理2023-5-21可编辑5病例对照研究病例对照研究特点特点 回顾性回顾性 由由果果 因研究因研究 观察法观察法 不能验
3、证病因不能验证病因2023-5-21可编辑6时间病例组对照组研究开始暴露暴露非暴露非暴露调查方向图5-1 病例对照研究示意图(Greenberg 2002)注:阴影区域代表暴露于所研究的危险因素的研究对象二、研究示意图二、研究示意图2023-5-21可编辑718431843年年Guy(Guy(英国英国)向统计学会报告向统计学会报告-最早病例对最早病例对照研究照研究 分析职业暴露与肺结核发生的关系分析职业暴露与肺结核发生的关系18441844年年LouisLouis的著作的著作 最早出现病例对照研究的概念最早出现病例对照研究的概念19261926年年Lane Claypon Lane Clayp
4、on 报告(接近现代概念)报告(接近现代概念)生殖因素与乳腺癌关系的研究生殖因素与乳腺癌关系的研究三、研究简史三、研究简史2023-5-21可编辑819471947年年SchreckSchreck和和LenowitzLenowitz 包皮环切和性卫生与阴茎癌的关系包皮环切和性卫生与阴茎癌的关系19471947年年HartwellHartwell 输血与肝炎关系的研究输血与肝炎关系的研究19501950年年DollDoll和和HillHill 吸烟与肺癌的研究吸烟与肺癌的研究2023-5-21可编辑92020世纪世纪6060年代以来年代以来孕妇服用反应停(孕妇服用反应停(thalidomidet
5、halidomide)与婴儿短肢)与婴儿短肢畸形畸形母亲吸烟与先天性畸形母亲吸烟与先天性畸形早产儿吸入高浓度氧与晶体后纤维组织增生症早产儿吸入高浓度氧与晶体后纤维组织增生症经期使用月经棉与中毒性休克综合征经期使用月经棉与中毒性休克综合征小剂量电离辐射与白血病小剂量电离辐射与白血病母亲早孕期服用雌激素与少女阴道腺癌等之间母亲早孕期服用雌激素与少女阴道腺癌等之间的关系(的关系(19711971年年,只用了只用了8 8个病例个病例3232个对照)个对照)2023-5-21可编辑10第二节第二节 研究类型研究类型 病例与对照不匹配病例与对照不匹配 病例与对照匹配病例与对照匹配 衍生类型衍生类型2023
6、-5-21可编辑11一、病例与对照不匹配一、病例与对照不匹配 从设计所规定病例和对照人群中,分别从设计所规定病例和对照人群中,分别 抽取一定量的研究对象抽取一定量的研究对象 对照组人数对照组人数 病例组人数病例组人数 选择对照没有特殊规定选择对照没有特殊规定2023-5-21 匹匹 配配/配配 比比(matching)要求要求 对照在某些因素或特征上与病例保持一致对照在某些因素或特征上与病例保持一致目的目的 对两组进行比较时排除匹配因素的干扰对两组进行比较时排除匹配因素的干扰 分分 类类 频数匹配频数匹配 个体匹配个体匹配 可编辑12二、病例与对照匹配二、病例与对照匹配 2023-5-21 频
7、数匹配(又称成组匹配)频数匹配(又称成组匹配)匹配因素所占的比例在对照组与病例组一致匹配因素所占的比例在对照组与病例组一致 个体匹配个体匹配 以病例和对照个体为单位进行匹配以病例和对照个体为单位进行匹配可编辑132023-5-21可编辑14 匹配法注意事项匹配法注意事项 慎重选择匹配因素慎重选择匹配因素 可疑病因不作为匹配因素可疑病因不作为匹配因素 比例一般为比例一般为1:11:1,最多不超过,最多不超过1:4 1:4 避免避免“匹配过度(匹配过度(overmatching)”注意匹配的范围注意匹配的范围 匹配的目的匹配的目的 提高研究效率提高研究效率 控制混杂因素控制混杂因素2023-5-2
8、1可编辑15三、衍生的研究类型三、衍生的研究类型 巢式病例对照研究巢式病例对照研究 单纯病例研究单纯病例研究 病例病例-队列研究队列研究 病例交叉研究病例交叉研究病例时间对照设计病例时间对照设计2023-5-211 1、巢式病例对照研究、巢式病例对照研究 (nested case control studynested case control study)基本原理基本原理 按队列研究方式进行:选择一队列,收集基按队列研究方式进行:选择一队列,收集基线资料,采集所研究的生物学标志的组织或体线资料,采集所研究的生物学标志的组织或体液标本储存备用液标本储存备用 随随 访:随访到出现能满足病例对照研
9、究样本访:随访到出现能满足病例对照研究样本量的病例数为止量的病例数为止可编辑162023-5-21匹配:按病例进入队列的时间、疾病出现匹配:按病例进入队列的时间、疾病出现时间与性别、年龄等匹配条件,从同一队时间与性别、年龄等匹配条件,从同一队列选择列选择1 1个或数个非病例作对照,抽取病例个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本与对照的基线资料并检测收集的标本资料处理:按匹配病例对照研究方法处理资料处理:按匹配病例对照研究方法处理资料资料可编辑172023-5-21 19921992年年RossRoss用巢式病例对照研究用巢式病例对照研究:上海地区肝癌与尿中黄曲霉素生物学
10、标志关系上海地区肝癌与尿中黄曲霉素生物学标志关系 1824418244名中年男性队列中发现名中年男性队列中发现2222例肝癌例肝癌 每例配每例配5 5或或1010个对照个对照 检测研究开始时的尿样:检测研究开始时的尿样:发现黄曲霉素发现黄曲霉素B1B1及其代谢产物和及其代谢产物和DNADNA加成物的加成物的OROR值值经调整混杂因素后,为经调整混杂因素后,为3.8(1.23.8(1.212.2)12.2)。黄曲霉素作为肝癌致病因素最直接的证据黄曲霉素作为肝癌致病因素最直接的证据可编辑18实例实例2023-5-212 2、病例、病例-队列研究队列研究(case-cohort studycase-
11、cohort study)基本原理基本原理 研究开始时,在队列中随机选取一组样本作为对照组研究开始时,在队列中随机选取一组样本作为对照组 观察结束时,队列中出现被研究疾病所有病例作病例组观察结束时,队列中出现被研究疾病所有病例作病例组 与随机对照组进行比较与随机对照组进行比较 这种研究模式,可同时研究几种疾病,不同疾这种研究模式,可同时研究几种疾病,不同疾病有不同病例组,但对照组都是同一组随机样本病有不同病例组,但对照组都是同一组随机样本可编辑192023-5-21病例病例-队列与巢式病例对照研究的区别队列与巢式病例对照研究的区别对照是随机选取,不与病例进行匹配对照是随机选取,不与病例进行匹配
12、随机对照组中成员如发生被研究疾病,既随机对照组中成员如发生被研究疾病,既为对照,又同时为病例为对照,又同时为病例1 1个随机对照组可以同时和几个病例组比个随机对照组可以同时和几个病例组比较分析较分析可编辑202023-5-21病例病例-队列与巢式病例对照研究的优点队列与巢式病例对照研究的优点 因果关系清楚因果关系清楚 资料可靠资料可靠 论证强度高论证强度高 省时省力省钱省时省力省钱 适合于分子流行病学研究适合于分子流行病学研究可编辑212023-5-21背背 景景 19941994年由年由PiegorsehPiegorseh、BegsBegs等提出等提出 遗传与环境的关系遗传与环境的关系 交互
13、作用(主要用途)交互作用(主要用途)可编辑223 3、病例病例研究(、病例病例研究(case case case case studystudy)应用前提条件应用前提条件 在正常人群中基因型与环境暴露各自独立发生,所研在正常人群中基因型与环境暴露各自独立发生,所研究疾病为罕见病究疾病为罕见病(此时可用此时可用OROR来估计来估计RRRR值值)2023-5-21可编辑23基本原理基本原理2023-5-21可编辑24研究示意图研究示意图单纯病例研究单纯病例研究环境暴露环境暴露基因型基因型病人病人+-+-+-2023-5-21可编辑25 OR=ad/bc OR=ad/bc当当ORge1ORge1时时
14、,有正相乘模型交互作用有正相乘模型交互作用当当ORge=1ORge=1时时,无相乘模型交互作用无相乘模型交互作用当当ORge1ORge1时时,有负相乘模型交互作用有负相乘模型交互作用E+E+E-E-G-G-G+G+b ba ad dc c环境暴露与基因型环境暴露与基因型 2023-5-21解决问题解决问题 19911991年美国年美国MaclureMaclure提出病例交叉设计提出病例交叉设计 日常生活中一些突发事件之后日常生活中一些突发事件之后,常会伴随常会伴随某些结果的发生。究竟是这些突发事件某些结果的发生。究竟是这些突发事件导致了结果的发生导致了结果的发生,还是仅仅由于机会所还是仅仅由于
15、机会所致致?可编辑264 4、病例交叉研究、病例交叉研究(case-crossover design)(case-crossover design)2023-5-21暴露与某急性事件有关暴露与某急性事件有关 比较相同研究对象暴露情况:在急性事件发生前一比较相同研究对象暴露情况:在急性事件发生前一段时间与未发生事件的某段时间段时间与未发生事件的某段时间可编辑27基本原理基本原理 如果暴露与少见的事件如果暴露与少见的事件(或疾病或疾病)有关有关,那么刚好在事件发那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露生前一段时间内的暴露频率应该高于更早时间内的暴露频率。频率。2023-5-
16、21 研究对象研究对象 病例和对照病例和对照,两部分的信息均来自于同一个体两部分的信息均来自于同一个体 病例部分病例部分“危险期危险期,疾病或事件发生前的一段时间疾病或事件发生前的一段时间 “对照部分对照部分”对照期对照期,危险期外特定的一段时间危险期外特定的一段时间 研究是对个体危险期和对照期内的暴露信息进行比较研究是对个体危险期和对照期内的暴露信息进行比较可编辑282023-5-21 例如例如 据报道某种药物可以引发猝死,如果该报据报道某种药物可以引发猝死,如果该报道正确,则应该可以观察到服用此药物后一段道正确,则应该可以观察到服用此药物后一段时间内猝死增多,或者说在猝死前几天或几周时间内
17、猝死增多,或者说在猝死前几天或几周内应有服药增多的报道。内应有服药增多的报道。可编辑292023-5-215 5、病例时间对照设计、病例时间对照设计 Case-time-control designCase-time-control designn是在病例交叉研究的基础上发展而来。n病例交叉研究能解决两组本身的可比性问题。n本设计另设一组对照(没有发生某事件),同样调查两个时段的暴露情况,目的是要消除时间的可能影响2023-5-21可编辑30可编辑31第三节第三节 实施实施步骤步骤提出假设提出假设明确适宜的研究类型明确适宜的研究类型病例与对照的选择病例与对照的选择样本含量的估计样本含量的估计研
18、究因素的选定与测量研究因素的选定与测量资料的来源与收集方法资料的来源与收集方法2023-5-21一、提出假设一、提出假设 根据以往疾病分布的记录或现况调查得根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,提出病因假到的结果,结合文献资料,提出病因假设。设。可编辑322023-5-21二、明确适宜的研究类型二、明确适宜的研究类型匹配或成组,匹配或成组,如用匹配法,需确定病例与对如用匹配法,需确定病例与对照的比例及匹配条件照的比例及匹配条件广泛探索还是重点检验广泛探索还是重点检验经典设计还是衍生类型经典设计还是衍生类型可编辑332023-5-21 三三、病例与对照的来源与选择、病例与对照
19、的来源与选择 对照的选择是整个研究的关键之一。对照的选择是整个研究的关键之一。研究得出的结论是否可靠,首先要看对研究得出的结论是否可靠,首先要看对照的选择是否合理。照的选择是否合理。病例与对照选择的病例与对照选择的基本原则:代表性基本原则:代表性和可比性和可比性 选择方法选择方法可编辑34随机抽样随机抽样 匹配匹配2023-5-21(一)病例的选择(一)病例的选择1 1、选择病例的要求、选择病例的要求诊断可靠诊断可靠 使用金标准,对病例其他使用金标准,对病例其他特征的规定特征的规定选择确诊的新病例选择确诊的新病例可编辑35 回忆偏倚小回忆偏倚小代表性好代表性好容易合作容易合作 被调查因素改变少
20、被调查因素改变少2023-5-212 2、来、来 源源 总体人群中全部病例或总体随机样本人群中全部总体人群中全部病例或总体随机样本人群中全部(population-based)population-based)医院住院或门诊的病例医院住院或门诊的病例(hospital-based)(hospital-based)可编辑36代表性好代表性好工作开展比较困难工作开展比较困难耗费人力物力耗费人力物力病例病例比较合作比较合作 资料易得到且比较可靠资料易得到且比较可靠与对照的可比性好与对照的可比性好代表性差代表性差2023-5-21(二)对照的选择(二)对照的选择1 1、原、原 则则 候选对象必须来自于
21、产生病例的总体候选对象必须来自于产生病例的总体 意味意味着对照一旦发生所研究的疾病,就着对照一旦发生所研究的疾病,就能成为病例组的研究对象。能成为病例组的研究对象。可编辑372023-5-212 2、对照选择的方法、对照选择的方法 成组法成组法(group comparison)匹配法匹配法(matching)可编辑38频数匹配频数匹配个体匹配个体匹配2023-5-213 3、来、来 源源 研究的总体人群或抽样人群研究的总体人群或抽样人群 医院中患有其它疾病的病人医院中患有其它疾病的病人 亲属、邻居、同事、同学等亲属、邻居、同事、同学等可编辑392023-5-21三、样本含量的估计三、样本含量
22、的估计1 1、影响因素(有关参数)、影响因素(有关参数)人 群 中(对 照 组)被 研 究 因 素 的 暴 露 率人 群 中(对 照 组)被 研 究 因 素 的 暴 露 率(exposure rate)RRRR的近似值的近似值 OROR值(查阅文献或预调查获得)值(查阅文献或预调查获得)值值 把握度把握度可编辑402023-5-21 2 2、计算方、计算方 法法l查表法(表查表法(表5-35-3)l公式法:求病例对照研究样本含量的公式公式法:求病例对照研究样本含量的公式(病例组与对照组人数相等)病例组与对照组人数相等)病例组暴露率病例组暴露率对照组暴露率对照组暴露率22102()/()npq
23、zzpp0101(1)p RRpp RR100.5()ppp1qp 2023-5-21case control study41 例:为研究某市肺癌与吸烟的关系,欲进行一次病例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。例对照研究。某市普通人群中吸烟率某市普通人群中吸烟率 P P0 0=20%=20%OR=2.0 =0.05 OR=2.0 =0.05 把握度把握度0.90 0.90 问需要多少病例与对照问需要多少病例与对照?10.2 2/1 0.2 10.3330.20.333/20.2671 0.2670.733ppq 2023-5-21case control study42、值查
24、表,值查表,Z Z 为为1.961.96,Z Z 为为1.2821.282代入公式得:代入公式得:病例组与对照组,各需病例组与对照组,各需232232人。人。222 0.267 0.7331.96 1.282/0.3330.2232n 2023-5-21case control study43病例组与对照组例数不等时的公式:病例组与对照组例数不等时的公式:病例数病例数:对照数对照数=1:c=1:c对照组例数为对照组例数为c c*n n2210(1 1/)()/()nc pq zzpp 10/1ppcpc1qp 2023-5-21case control study442023-5-21451:
25、11:1匹配设计匹配设计总对子数总对子数 p0 p0和和p1p1分别代表目标人群中对照组与病例组分别代表目标人群中对照组与病例组 的的估计暴露率估计暴露率 m m为暴露状况不一致的对子数为暴露状况不一致的对子数22/2(1)/(1/2)mzzppp/1/1pORORRRRR0 110/Mmp qp q100/1(1)pp RRp RR111qp 001qp 2023-5-21case control study46四、研究因素的选定与测量四、研究因素的选定与测量 变量的选定:根据研究的目的或具体的变量的选定:根据研究的目的或具体的目标,确定调查变量的数目和每一个变目标,确定调查变量的数目和每一
26、个变量的具体项目。量的具体项目。变量的定义:每项变量都要有明确的定变量的定义:每项变量都要有明确的定义。义。变量的测量:研究中应尽可能地采用定变量的测量:研究中应尽可能地采用定量或半定量的量度。量或半定量的量度。2023-5-2147可编辑五、资料来源与收集方法五、资料来源与收集方法1 1、资料来源、资料来源 医院病案记录医院病案记录疾病登记报告等摘录疾病登记报告等摘录致病因素数据需检测病人的标本或环境获得致病因素数据需检测病人的标本或环境获得询问调查获得询问调查获得可编辑482023-5-21 2 2、调查及其质量控制、调查及其质量控制询问调查是个十分复杂而又细致的工作询问调查是个十分复杂而
27、又细致的工作调查是信息传达、接受和反映的过程,是属于行调查是信息传达、接受和反映的过程,是属于行为科学的范畴。被调查者要通过感受、回忆、思为科学的范畴。被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题维、联想和反映等过程来回答问题从拟订调查表开始到调查完成,不论哪一步不恰从拟订调查表开始到调查完成,不论哪一步不恰当,都会产生偏倚当,都会产生偏倚可编辑492023-5-21可编辑50第四节第四节 资料的整理与分析资料的整理与分析 整理与描述整理与描述 成组比较法资料的分析成组比较法资料的分析(分层与不分层)分层与不分层)分级暴露资料的分析分级暴露资料的分析 1:11:1配对资料的分析配
28、对资料的分析 功效功效2023-5-21一、整理与描述一、整理与描述1 1、资料整理:、资料整理:包括检查、修正、补齐、验收2 2、录入:、录入:编码、录入3 3、描述:、描述:包括样本数、应答率、构成及主要人口学特征描述可编辑512023-5-21 4 4、均衡性检验、均衡性检验检验两组除研究因素外的其它主要特征有否可检验两组除研究因素外的其它主要特征有否可比性比性两组间非研究因素均衡可比,才能认为两组暴两组间非研究因素均衡可比,才能认为两组暴露率差异与发病有关露率差异与发病有关均衡性检验,应把两组的这些特征逐一加以比均衡性检验,应把两组的这些特征逐一加以比较,必要时作显著性检验较,必要时作
29、显著性检验可编辑522023-5-21 二、成组设计资料的分析(不分层)二、成组设计资料的分析(不分层)1、2 2检验检验 是检验研究因素与疾病之间有否统计学是检验研究因素与疾病之间有否统计学联系?联系?可用传统的四格表公式可用传统的四格表公式 也可用也可用antel-Haenszel(M-H)方法方法 可编辑532023-5-2155.53695174514358862886126208243309nnmmN)2Nbcad(2212122可编辑54 结果表明吸烟与食管癌有联系,但联系强度如何,要计算OR2023-5-212 2、效应估计:、效应估计:OR OR及其可信限的计算与意义及其可信限
30、的计算与意义 病例组中暴露人数与非暴露人数的比值除以对照病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值,叫比值比组中暴露人数与非暴露人数的比值,叫比值比(Odds ratio,OR)Odds ratio,OR),可信区间的计算有基于方差,可信区间的计算有基于方差的方法和基于检验(卡方)的方法。的方法和基于检验(卡方)的方法。bcadOR 可编辑552023-5-21 与与RRRR一样,比值比反映暴露者患某种疾一样,比值比反映暴露者患某种疾病的危险性较无暴露者高的程度。病的危险性较无暴露者高的程度。前提条件前提条件所研究疾病的发病率(死亡率)很低所研究疾病的发病率(死亡
31、率)很低病例对照研究中所选择的研究对象代表病例对照研究中所选择的研究对象代表性好,则性好,则OROR值就很接近甚至等于值就很接近甚至等于RRRR值值可编辑562023-5-21)78.3,18.2(2/96.11)(OR可编辑57bcadOR87.2126208243309OR 结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.183.78之间2023-5-21 三、三、1:11:1配对资料的分析配对资料的分析 匹配资料是由病例与对照结合成匹配资料是由病例与对照结合成对子对子,分析结果时不应把对子拆开分析分析结果时不应把对子拆开分析 先将资料列成表先将资料列成表5-
32、145-14的格式的格式 注意表内的数字注意表内的数字a a、b b、c c、d d是病例与是病例与对照配成对的对子数对照配成对的对子数可编辑582023-5-21可编辑59cbcb22)1(bcOR 2023-5-21 93 93对男性食管癌与对照的吸烟史对男性食管癌与对照的吸烟史 18.10,84.133.428.1196.1112zOR可编辑602 2=11.28,OR=4.33=11.28,OR=4.33表明男性吸烟者患食管癌的危险性是不吸烟者的表明男性吸烟者患食管癌的危险性是不吸烟者的4.34.3倍倍OR95%OR95%可信限可信限2023-5-21可编辑61四、成组分层资料的分析四
33、、成组分层资料的分析2023-5-211 1、按饮酒与否分层、按饮酒与否分层 计算计算OROR值值可编辑62饮酒者中吸烟的饮酒者中吸烟的OR(2.98)OR(2.98),不饮酒者中吸烟的,不饮酒者中吸烟的OR(1.67)OR(1.67),均不同于不分层均不同于不分层OR(2.87)OR(2.87)饮酒可能饮酒可能是混杂因素?是混杂因素?按饮酒分层分析吸烟与食管癌的关系按饮酒分层分析吸烟与食管癌的关系2023-5-21 2 2、齐性检验、齐性检验 n如果层间如果层间OROR值无明显差别,则提示饮酒可能是混杂因素,值无明显差别,则提示饮酒可能是混杂因素,资料分析可进一步计算资料分析可进一步计算合并
34、合并 与与OROR值值n如果层间如果层间OROR值有显著差异,则提示饮酒可能不是值有显著差异,则提示饮酒可能不是混杂因混杂因子,而可能是效应修饰因子(交互作用),此时,资料子,而可能是效应修饰因子(交互作用),此时,资料分析转入效应修饰的描述分析转入效应修饰的描述 n本例齐性检验无显著差异,计算合并本例齐性检验无显著差异,计算合并OROR与与 2 2可编辑632023-5-21 计算合并计算合并OROR与与 2 2值值 公式(公式(M-HM-H法):法):合并合并可编辑642iii2HM)V(a21)(Eaa)Ncb()Nda(ORiiiiiiHM2023-5-21可编辑6574.3421.4
35、55.07.26830922hm42.2)3005763)58615163()30013644()586107265(HMOR=37.74=2.42 2 2M-H表表5-9 5-9 分层计算结果整理表分层计算结果整理表 11/iiiiE am nt101021()(1)Iiiiiiiiim m n nVar att2023-5-21结果判断n经饮酒分层调整后,吸烟的经饮酒分层调整后,吸烟的OROR(2.42)2.42)较未调较未调整的整的OR(2.87)OR(2.87)为低为低n 吸烟与食饮酒之间有显著的关联吸烟与食饮酒之间有显著的关联n 按饮酒与食管癌的关系列表计算按饮酒与食管癌的关系列表计
36、算 2=31.9,2=31.9,RR=2.29RR=2.29,可见可见饮酒与食管癌有联系饮酒与食管癌有联系n饮酒不是吸烟与食管癌关系的中间变量饮酒不是吸烟与食管癌关系的中间变量n因此,饮酒是一个值得调整的混杂因素。因此,饮酒是一个值得调整的混杂因素。可编辑662023-5-21五、暴露分级资料的分析五、暴露分级资料的分析n 将资料归纳成列联表n 对列联表数据作卡方检验n 计算出各暴露水平的比值比n 计算趋势性卡方可编辑672023-5-21实例:吸烟与肺癌关系按性别与吸烟量归纳表可编辑684.213.200.981.00OR21291951合计6101232对照X2=11.28df=3P0.0
37、011519719病例女性17.9311.528.101.00OR6385438829合计274(b3)293(b2)55(b1)27(d)对照X2=43.15df=3P0.001364(a3)250(a2)33(a1)2(c)病例男性15-5-1-0-每日吸烟数 组别2023-5-21六、归因分值与功效六、归因分值与功效1、归因分值(attributable fraction,AF),也叫病因分值(etiologic fraction,EF)1)暴露人群的归因分值记为AFe,AFe指暴露人群内某种疾病的发病中,由该暴露引起的发病占全部发病的比例。2023-5-21可编辑69n式中Ip为总人群
38、发病率,I0为非暴露组发病率,Pe为人群的暴露率(或以对照组的暴露代替)。AFp反映暴露对人群发病的影响,表示总人群中某种疾病的发病,由该暴露引起的发病占全部发病的比例。2023-5-21可编辑702 2、功效、功效n研究功效(power)也叫做把握度,可以解释为拒绝无效假设的能力,即当无效假设不成立时,该假设被拒绝的概率。2023-5-21可编辑71结果:-0.30时,=0.62,功效P1-38%一、选择偏倚(一、选择偏倚(selection biasselection bias)产生原因产生原因 选择的研究对象不能代表总体人群选择的研究对象不能代表总体人群发生阶段:主要在设计阶段发生阶段:
39、主要在设计阶段控制方法:控制方法:尽量合理地选择病例与对照尽量合理地选择病例与对照 尽可能地从多家尽可能地从多家(类类)医院选择病例与对照医院选择病例与对照可编辑72第五节第五节 常见偏倚及其控制常见偏倚及其控制2023-5-21常见的选择偏倚类型入院率偏倚(入院率偏倚(Berksons bias):由于医院和病人的相互选:由于医院和病人的相互选择,导致对象缺乏代表性。择,导致对象缺乏代表性。现患病例与新发病例偏倚(现患病例与新发病例偏倚(Neyman bias)Neyman bias):难以区分发:难以区分发病与存活的因素。病与存活的因素。检出症候偏倚:病人常因与疾病无关的症状而就医,从而检
40、出症候偏倚:病人常因与疾病无关的症状而就医,从而提高了早期病例的检出率。如使用雌激素导致阴道出血就提高了早期病例的检出率。如使用雌激素导致阴道出血就诊发现子宫内膜癌,从而发现两者的关系。诊发现子宫内膜癌,从而发现两者的关系。时间效应偏倚:即早期(或启动期)的病例可能进入对照。时间效应偏倚:即早期(或启动期)的病例可能进入对照。可编辑732023-5-21二、信息偏倚二、信息偏倚(information biasinformation bias)回忆偏倚和调查偏倚,以回忆偏倚为主。回忆偏倚和调查偏倚,以回忆偏倚为主。病例对照研究的主要弱点,很难完全避免。病例对照研究的主要弱点,很难完全避免。回忆
41、偏倚:病例对照研究是回顾性调查,难回忆偏倚:病例对照研究是回顾性调查,难避免回忆偏倚避免回忆偏倚倾向性:被调查者与调查员均可能有倾向性,倾向性:被调查者与调查员均可能有倾向性,盲法可以克服盲法可以克服可编辑742023-5-21三、混杂偏倚三、混杂偏倚(confounding confounding biasbias)混杂:混杂:在研究某疾病与某因子的关系时,由于一个或多个既与疾病有制约关系,又与暴露因子密切相关的第三变量的影响,掩盖或夸大了所研究的暴露因子与疾病的联系。这种作用就称为混杂,这些第三变量就称为混杂因子。可编辑752023-5-21病例对照研究中会遇到很多混杂因素,不病例对照研究
42、中会遇到很多混杂因素,不易识别易识别,不易确定不易确定 控制控制混杂因素作为匹配因素混杂因素作为匹配因素分层分析分层分析进行多因素分析进行多因素分析(限制)限制)可编辑762023-5-21可编辑77第六节第六节 研究实例研究实例 研究背景研究背景 研究方法研究方法 研究结果研究结果2023-5-21一、研究背景一、研究背景美国波士顿美国波士顿VincentVincent纪念医院妇产科医生纪念医院妇产科医生HerbstHerbst发现发现 1966196619691969年收治年收治7 7例阴道腺癌患者例阴道腺癌患者 年龄年龄15152222岁岁过去年龄均大于过去年龄均大于2525岁岁7 7例
43、在例在15152222岁之间岁之间7 7例全是腺癌例全是腺癌阴道癌占女性生殖系统癌的阴道癌占女性生殖系统癌的2%2%阴道腺癌仅占阴道癌的阴道腺癌仅占阴道癌的5%5%10%10%,非常罕见,非常罕见可编辑782023-5-21可编辑79 Herbst Herbst对阴道腺癌危险因素进行探索对阴道腺癌危险因素进行探索 7 7例患者加上另一个医院例患者作为病例组例患者加上另一个医院例患者作为病例组 每个病人配每个病人配4 4个对照,共个对照,共3232个对照个对照 调查员用调查表对病例、对照与她们的母亲进调查员用调查表对病例、对照与她们的母亲进行了调查,经统计学处理后的主要结果见表行了调查,经统计学
44、处理后的主要结果见表5-165-16二、研究方法二、研究方法2023-5-21可编辑80三、研究结果三、研究结果2023-5-21可编辑81第七节第七节 优缺点与注意事项优缺点与注意事项(与队列研究比较)(与队列研究比较)病例对照研究的优点病例对照研究的优点队列研究的优点队列研究的优点病例对照研究的局限性病例对照研究的局限性队列研究的局限性队列研究的局限性研究设计检查提纲研究设计检查提纲2023-5-21 一、病例对照研究的优点一、病例对照研究的优点 特别适用于少见病、罕见病的研究特别适用于少见病、罕见病的研究 省力、省钱、省时间,并易于组织实施省力、省钱、省时间,并易于组织实施 还可用于疫苗
45、免疫学效果考核及暴发调查等还可用于疫苗免疫学效果考核及暴发调查等 可同时研究多个因素与某种疾病的联系可同时研究多个因素与某种疾病的联系 对研究对象多无损害对研究对象多无损害可编辑822023-5-21二、队列研究的优点二、队列研究的优点 研究者亲自收集资料,信息可靠,回忆偏倚小研究者亲自收集资料,信息可靠,回忆偏倚小 直接计算直接计算RRRR和和ARAR等反映疾病危险关联的指标等反映疾病危险关联的指标 可证实病因联系可证实病因联系 有助于了解人群疾病的自然史有助于了解人群疾病的自然史 分析一因与多种疾病的关系分析一因与多种疾病的关系 样本量大,结果比较稳定样本量大,结果比较稳定可编辑83202
46、3-5-21 三、病例对照研究的局限性三、病例对照研究的局限性 不适于研究暴露比例很低的因素不适于研究暴露比例很低的因素 选择偏倚难以避免选择偏倚难以避免 暴露与疾病时间先后难以判断,信息真实性差暴露与疾病时间先后难以判断,信息真实性差 存在回忆偏倚存在回忆偏倚 不能测定暴露和非暴露组疾病的率不能测定暴露和非暴露组疾病的率可编辑842023-5-21 四、队列研究的局限性四、队列研究的局限性 不适于发病率很低的疾病病因研究不适于发病率很低的疾病病因研究 依从性差,易出现失访偏倚依从性差,易出现失访偏倚 样本量大,耗费人力、物力、财力和时样本量大,耗费人力、物力、财力和时 间,组织与后勤工作亦相
47、当艰巨间,组织与后勤工作亦相当艰巨 研究设计要求更严密研究设计要求更严密可编辑852023-5-21可编辑86五、研究设计检查提纲五、研究设计检查提纲 假设目的是否清楚?假设目的是否清楚?疾病与暴露变量的定义明确?疾病与暴露变量的定义明确?病例与对照的来源,诊断方法?病例与对照的来源,诊断方法?新发病例还是现患病例?新发病例还是现患病例?排除标准是否明确?排除标准是否明确?2023-5-21可编辑87 抽样的方法与样本大小的估计是否明确?抽样的方法与样本大小的估计是否明确?病例与对照是否匹配及匹配变量是哪些?病例与对照是否匹配及匹配变量是哪些?调查表是否完全?是否详尽?调查表是否完全?是否详尽
48、?调查表是否能够收集到需要的数据?调查表是否能够收集到需要的数据?调查表是否经过试用?调查表是否经过试用?调查表的真实性与可靠性是否经过评估?调查表的真实性与可靠性是否经过评估?2023-5-21可编辑88 调查员、质控员、编码员等工作手册是否编好?调查员、质控员、编码员等工作手册是否编好?调查员是否做了专门培训?调查员是否做了专门培训?组织机构、人员、设备、经费是否已落实?组织机构、人员、设备、经费是否已落实?方法试剂是否符合标准?方法试剂是否符合标准?结果的真实性与可靠性是否经过考核?结果的真实性与可靠性是否经过考核?资料整理、统计处理方法及分析内容是否明确?资料整理、统计处理方法及分析内容是否明确?如何控制或调整混杂及其他偏倚?如何控制或调整混杂及其他偏倚?结论的真实性如何?结论的真实性如何?2023-5-21谢谢!谢谢!可编辑892023-5-212023-5-2190