1、1 病例对照研究 Case control study2 第一节 病例对照研究的基本原理 第三节 病例对照研究实例 总结 第四节 病例对照研究的实施 第五节 病例对照研究的数据整理与分析 第六节 病例对照研究中的偏倚及其控制 第八节 病例对照研究的优缺点 第二节 病例对照研究的设计类型 第七节 病例对照研究实施中应注意的问题讲课提纲概念病例对照研究病例对照研究是一种常用于探索病因的分析性流行是一种常用于探索病因的分析性流行病学研究方法;通过对一组患有某种疾病人群病学研究方法;通过对一组患有某种疾病人群(病例病例组组)和一组或几组未患该病的对照人群和一组或几组未患该病的对照人群(对照组对照组)既
2、往既往暴露于某个或某些可能危险因素暴露于某个或某些可能危险因素(或保护因素或保护因素)频率频率的比较,来考察这些因素是否与该病存在联系及联的比较,来考察这些因素是否与该病存在联系及联系的程度。系的程度。第一节 病例对照研究的基本原理4设计原理Study objectControlsCasesExposureNon-exposureExposureNon-exposureabcdbaadccTimeNow5表2 病例对照研究资料分析表病例组对照组合 计有暴露史aba+b无暴露史cdc+d合 计a+cb+dN61 1、分析性研究,属观察法、分析性研究,属观察法2 2、回顾性研究、回顾性研究3 3、
3、时间顺序:从、时间顺序:从“果果”“因因”4 4、通常不能够确证因果关联、通常不能够确证因果关联特点7 第二节 病例对照研究的设计类型8病例与对照不匹配病例与对照不匹配在病例和对照人群中,分别抽取一定量的在病例和对照人群中,分别抽取一定量的研究对象,一般对照数目应等于或多于病研究对象,一般对照数目应等于或多于病例人数。例人数。9病例与对照匹配病例与对照匹配匹配(匹配(matchingmatching)就是要求对照组在某些就是要求对照组在某些因素或特征上与病例组保持相同,目的是因素或特征上与病例组保持相同,目的是进行两组比较时排除匹配因素的干扰。进行两组比较时排除匹配因素的干扰。如以年龄做匹配因
4、素。如以年龄做匹配因素。10匹配方式匹配方式频数匹配:频数匹配:又称为群体匹配,即在选择好又称为群体匹配,即在选择好一组病例之后,在选择对照组时要求其某一组病例之后,在选择对照组时要求其某些特征或变量的构成比例与病例组的一致些特征或变量的构成比例与病例组的一致(即在两组的总体分布一致)。(即在两组的总体分布一致)。例如例如性别、年龄构成一致,具体做法上类性别、年龄构成一致,具体做法上类似分层抽样。如病例组中男女各半,似分层抽样。如病例组中男女各半,6565岁岁以上者占以上者占1/31/3,则对照人群也是如此。,则对照人群也是如此。11匹配方式匹配方式个体匹配:个体匹配:就是以病例和对照的个体为
5、单就是以病例和对照的个体为单位进行匹配。选择少数几个特征或变量方位进行匹配。选择少数几个特征或变量方面与病例一致的一个或几个对照者组成一面与病例一致的一个或几个对照者组成一个计数单位或计数和分析单位。一个病例个计数单位或计数和分析单位。一个病例匹配一个对照的(即匹配一个对照的(即1:11:1匹配)一般称为配匹配)一般称为配对。对。12病例对照研究采用匹配的目的n提高研究效率,表现为每一研究对象提供提高研究效率,表现为每一研究对象提供的信息量的增加。的信息量的增加。n其次,在于控制混淆因素的作用。所以匹其次,在于控制混淆因素的作用。所以匹配的特征或变量必须是已知的混淆因子,配的特征或变量必须是已
6、知的混淆因子,至少也应有充分的理由这样怀疑,否则不至少也应有充分的理由这样怀疑,否则不应匹配。应匹配。13匹配过头匹配过头匹配过头:匹配过头:把与结局变量关联性很强的独把与结局变量关联性很强的独立变量作为匹配因素或条件,从而低估了立变量作为匹配因素或条件,从而低估了真实病因的作用,称为匹配过头。因为一真实病因的作用,称为匹配过头。因为一个因素一旦作为匹配条件,就不可能作为个因素一旦作为匹配条件,就不可能作为与疾病有关的因素加以分析。与疾病有关的因素加以分析。14衍生类型衍生类型巢式病例对照研究巢式病例对照研究将传统的病例对照研究和队列研究的一些要素进将传统的病例对照研究和队列研究的一些要素进行
7、组合后形成的一种研究方法,也就是在对一个行组合后形成的一种研究方法,也就是在对一个事先确定好的队列进行随访观察的基础上,再应事先确定好的队列进行随访观察的基础上,再应用病例对照研究的设计思路进行研究分析。分为用病例对照研究的设计思路进行研究分析。分为前瞻性和回顾性两种。前瞻性和回顾性两种。15巢式病例对照研究运做开始运做开始是按照是按照队列研究队列研究的方式进行:选择一队的方式进行:选择一队列,收集基线资料,采集所研究的生物学标志的列,收集基线资料,采集所研究的生物学标志的组织或体液标本储存备用,然后组织或体液标本储存备用,然后随访随访到出现能满到出现能满足病例对照研究样本量的病例数为止。将这
8、些病足病例对照研究样本量的病例数为止。将这些病例作为例作为病例组病例组,按病例进入队列的时间、疾病出,按病例进入队列的时间、疾病出现的时间与性别、年龄等其他现的时间与性别、年龄等其他匹配匹配条件,从同一条件,从同一队列中选择队列中选择1个或数个非病例作对照,抽取病例个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本,资料按匹与对照的基线资料并检测收集的标本,资料按匹配病例对照研究处理。配病例对照研究处理。16巢式病例对照研究19921992年年RossRoss报道了上海地区肝癌与尿中黄曲霉素报道了上海地区肝癌与尿中黄曲霉素生物学标志关系的巢式病例对照研究的结果,在生物学标志关系的巢
9、式病例对照研究的结果,在1824418244名中年男性队列中发现名中年男性队列中发现2222例肝癌,每例配例肝癌,每例配5 5或或1010个对照,检测研究开始时的尿样发现,黄曲个对照,检测研究开始时的尿样发现,黄曲霉素霉素B1B1及代谢产物和及代谢产物和DNADNA加成物的加成物的OROR值为值为2.3-6.22.3-6.2,经调整混杂因素后,经调整混杂因素后,OROR值为值为3.83.8。这是至今关于。这是至今关于黄曲霉素作为肝癌致病因素最直接的证据。黄曲霉素作为肝癌致病因素最直接的证据。17 第三节 病例对照研究实例年青女性阴道腺癌与母亲服妊娠期用己烯雌酚的关系年青女性阴道腺癌与母亲服妊娠
10、期用己烯雌酚的关系18第四节 病例对照研究的实施一、复习文献,提出假设二、明确研究目的,选择适宜的对照形式三、病例和对照的来源和选择四、获取研究因素信息19(一)提出假设(一)提出假设 根据以往疾病分布的研究或现况研究的结果,结根据以往疾病分布的研究或现况研究的结果,结合文献资料,提出疾病的病因假设。合文献资料,提出疾病的病因假设。(二)根据研究目的选择对照形式(二)根据研究目的选择对照形式 1 1、广泛探索危险因素,可采用不匹配或频数匹广泛探索危险因素,可采用不匹配或频数匹配;配;2 2、根据提供研究用的病例数量;根据提供研究用的病例数量;3 3、能否以较小的样本获得较高的检验效率。能否以较
11、小的样本获得较高的检验效率。20病例和对照的来源和选择Hospital-based case control studyCommunity-based case control study21病例的选择病例的选择从医院病人选择从医院病人选择优点:优点:诊断正确、获取方便、诊断正确、获取方便、对象合作、信息较可靠对象合作、信息较可靠缺点:缺点:入院率偏倚、代表性差入院率偏倚、代表性差从某特定人群选择病例从某特定人群选择病例优点:优点:代表性强代表性强缺点:缺点:不易获得不易获得22原则 诊断标准诊断标准 最好是新发病例最好是新发病例 尽最大限度收集某地医院或社区的所有病例尽最大限度收集某地医院或
12、社区的所有病例23 对照选择的原则2、对照一定是未患所研究的疾病,如有可能,应尽、对照一定是未患所研究的疾病,如有可能,应尽 可能排除亚临床或处于潜伏期的疾病可能排除亚临床或处于潜伏期的疾病3、对照可为不健康者,但所患疾病病因不应与所研、对照可为不健康者,但所患疾病病因不应与所研 究疾病的病因相同究疾病的病因相同4、注意研究因素以外其它因素的均衡性、注意研究因素以外其它因素的均衡性5、无应答者事先要有统一合理的更换办法,慎重处理、无应答者事先要有统一合理的更换办法,慎重处理1、对照最好是、对照最好是全人群的一个无偏样本全人群的一个无偏样本;或者是产生病;或者是产生病 例的例的源人群(源人群(s
13、ource population)中全体未患该病者中全体未患该病者 的一个随机样本的一个随机样本24 样本含量的估计1、人群中暴露者的比例人群中暴露者的比例。如人群中吸烟的比例 比例比例 样本量样本量2、假定暴露造成的相对危险度(假定暴露造成的相对危险度(RR)。可通过既往研 究或查阅文献获得 RR 样本量样本量3、要求的显著性水平,即第一类错误要求的显著性水平,即第一类错误 样本量样本量4、要求的把握度,即要求的把握度,即1-1-样本量样本量决定因素25样本大小计算公式样本大小计算公式n非匹配设计病例数与对照数相等时每组所需人非匹配设计病例数与对照数相等时每组所需人数数n非匹配设计病例数与对
14、照数不相等时每组所需非匹配设计病例数与对照数不相等时每组所需人数人数n1:11:1匹配设计匹配设计n1:R1:R配比病例对照研究设计配比病例对照研究设计26样本大小计算公式样本大小计算公式1 1 非匹配设计病例数与对照数相等时每组非匹配设计病例数与对照数相等时每组 所需人数所需人数式中式中P P0为对照人群估计暴露率,为对照人群估计暴露率,P P1P P0RR/1RR/1P P0(RR(RR1)1),P P的均值为的均值为0.5(P0.5(P1P P0),q q1 1P P。22)()(201qpzzqpN27样本大小计算公式样本大小计算公式2 2 非匹配设计病例数与对照数不相等时每组非匹配设
15、计病例数与对照数不相等时每组 所需人数所需人数 设病例数:对照数设病例数:对照数=1=1:c c,22)()()/11(01qpzzqpcNpqccppp1,10128样本大小计算公式样本大小计算公式3 1:13 1:1匹配设计匹配设计p=OR/(1+OR)=RR/(1+RR)p=OR/(1+OR)=RR/(1+RR)p p0为对照人群估计暴露率为对照人群估计暴露率P P1为暴露组的估计暴露率。为暴露组的估计暴露率。P P1=p=p0RR/1+pRR/1+p0(RR-1)(RR-1),q q1=1-p=1-p1,q q0=1-p=1-p022)5.0()1(2/1pppUUm0110qpqpm
16、M29样本大小计算公式样本大小计算公式4 1:R4 1:R配比病例对照研究设计配比病例对照研究设计 病例数为病例数为N N,对照数为,对照数为RNRN30获取研究因素信息Ascertainment of Exposure Personal interviews Existing records Physical measurements and lab testsExposure Yes/No Intensity Length of exposure变量的选定、规定、测量和如何作到研究变量符合变量的选定、规定、测量和如何作到研究变量符合规定。规定。31 资料的收集资料的收集 主要在研究现场以询
17、问方式,填写调查表而主要在研究现场以询问方式,填写调查表而 收集。有些情况下辅以查阅档案,采取样品收集。有些情况下辅以查阅档案,采取样品 化验等。化验等。32一、资料的整理 1、原始资料的重新核查原始资料的重新核查 2、资料的分组、归纳,或者编码、输入计算机资料的分组、归纳,或者编码、输入计算机 二、数据的分析 1、描述性统计 1)描述研究对象的一般特征)描述研究对象的一般特征 2)均衡性检验均衡性检验 2、关联性的统计推断 第五节 病例对照研究的数据整理与分析33关联性的统计推断步骤(1)将资料整理成)将资料整理成表格形式表格形式(2)病例和对照组暴露比例差异的)病例和对照组暴露比例差异的显
18、著性检验显著性检验 即回答即回答E和和D是否有联系?是否有联系?(3)估计暴露因素和疾病之间的联系强度)估计暴露因素和疾病之间的联系强度(4)结果解释)结果解释 可能存在哪些偏倚?得出什么结论?可能存在哪些偏倚?得出什么结论?34Exposure Cases Controls Total Yes a b a+b=n1 No c d c+d=n0 Total a+c=m1 b+d=m0 a+b+c+d=t 资料整理表格病例组暴露比例:病例组暴露比例:对照组暴露比例:对照组暴露比例:caadbb显著性检验:显著性检验:2检验检验关联强度?关联强度?35不匹配或成组匹配的资料分析显著性检验Expos
19、ure Cases Controls Total Yes a b a+b=n1 No c d c+d=n0 Total a+c=m1 b+d=m0 a+b+c+d=t )()()()()(2010122dcdbcabatbcadnnmmtbcad36病例对照研究的资料分析病例对照研究的资料分析 病例组的暴露比值(病例组的暴露比值(a/c)n比值比比值比=对照组的暴露比值(对照组的暴露比值(b/d)说明:说明:指暴露组的疾病危险性为非暴露组的多指暴露组的疾病危险性为非暴露组的多 少倍。少倍。OR1OR1,说明疾病的危险度因暴露而增加,暴露说明疾病的危险度因暴露而增加,暴露与疾病之间为正关联。与疾
20、病之间为正关联。OR1OR1,说明疾病的危险说明疾病的危险度因暴露而减少,暴露与疾病之间为负关联。度因暴露而减少,暴露与疾病之间为负关联。3795%confidence interval of OR:Miettinen2961195.OR%CIOR38dcbaORVar1111)(ln)(ln96.1ln%95lnORVarORCIOR)%95exp(lnOR95%CICIOR95%confidence interval of OR:Woolf成成 组组 资资 料料 的的 基基 本本 分分 析析:表4 母 亲 围 产 期 的 放 射 暴 露 与 儿 童 白 血 病 的 关 系 放 射 暴 露
21、病 例 组 对 照 组 合 计 有 3 0(a)4 5(b)7 5 无 7 0(c)1 5 5(d)2 2 5 合 计 1 0 0 2 0 0 3 0 0 基 本 公 式:(a d-b c)2N 2=(a+b)(c+d)(a+c)(b+d)校 正 公 式:(|a d-b c|-N/2)2N 2=(a+b)(c+d)(a+c)(b+d)a d O R=R R b c O R 值 的 可 信 限(M i e t t i n e n 法):O RL,O RU=O R(1 Z /)40 不匹配或成组匹配分层数据资料的分析41Group Cases Controls Total Exposure ai
22、bi n1i Non-exposure ci di noi Total m1i m0i ti The tabulation of the i th stratum42表 7 不同年龄组妇女最近使用 OC 与 MI 的关系 年龄组 OC 病例 对照 2 P OR 用 4 62 25-29 未用 2 224 4.59 0.035 7.226 用 9 33 30-34 未用 12 390 12.25 0.001 8.864 用 4 26 35-39 未用 33 330 0.13 0.738 1.538 用 6 9 40-44 未用 65 362 4.73 0.038 3.713 用 6 5 45-4
23、9 未用 93 301 4.09 0.046 3.884 合 计 234 1742 34.46 0.001 3.970 43暴暴露露分分级级 0 0 1 1 2 2 3 3 4 4 合合计计 病病例例 )(0ca 1a 2a 3a 4a 1m 对对照照 )(0db 1b 2b 3b 4b 0m 合合计计 0n 1n 2n 3n 4n t 分级暴露资料的分析(1)将资料整理成列联表)将资料整理成列联表(2)各分级的)各分级的2 检验检验(3)计算各分级的)计算各分级的OR值值(4)趋势性)趋势性2检验剂量反应关系检验剂量反应关系44 每日吸烟支数 0 1-5-15-合计 病例 2(c)33(a1
24、)250(a2)364(a3)649(m1)对照 27(d)55(b1)293(b2)274(b3)649(m0)合计 29(n0)88(n1)543(n2)638(n3)1298(t)OR 1.0 8.10 11.52 17.93 2=43.15,=3,P0.001 男性每日吸烟的支数与肺癌的关系45 1:1配对资料的分析 Cases Controls Exposure Non-exposure Total Exposure a c a+c Non-exposure b d b+d Total a+b c+d t 1dfcbcb22,)(40)c(b1,df,cb1)|cb(|22cbOR)
25、(0t 46病例对照研究的偏倚病例对照研究的偏倚选择偏倚选择偏倚 入院率偏倚、现患病例入院率偏倚、现患病例-新发病例偏倚、新发病例偏倚、检出征候偏倚、时间效应偏倚检出征候偏倚、时间效应偏倚 信息偏倚信息偏倚 回忆偏倚和调查偏倚回忆偏倚和调查偏倚混杂偏倚混杂偏倚 47病例对照研究的选择偏倚病例对照研究的选择偏倚n入院率偏倚:入院率偏倚:当利用医院病人作为病例和对照时,当利用医院病人作为病例和对照时,因为对照不是全体目标人群的一个随机样本,同时因为对照不是全体目标人群的一个随机样本,同时病例也不是全体病人的随机样本。病例也不是全体病人的随机样本。n现患病例现患病例-新发病例偏倚:新发病例偏倚:如果
26、调查对象来自存活病如果调查对象来自存活病例,可能得到更多的信息,但是其中很多信息与存例,可能得到更多的信息,但是其中很多信息与存活有关,未必与疾病有关,因此高估了某些暴露因活有关,未必与疾病有关,因此高估了某些暴露因素的病因作用。素的病因作用。48病例对照研究的选择偏倚病例对照研究的选择偏倚n检出征候偏倚:检出征候偏倚:病人因某些与致病无关的症状就医,病人因某些与致病无关的症状就医,提高早期病例的检出率,高估了暴露程度而产生系提高早期病例的检出率,高估了暴露程度而产生系统误差。统误差。n时间效应偏倚:时间效应偏倚:对于一些慢性病来说,病程较长,对于一些慢性病来说,病程较长,在病例对照研究时,有
27、可能将那些已发生早期病变在病例对照研究时,有可能将那些已发生早期病变而不能检出的人作为对照组。而不能检出的人作为对照组。49病例对照研究的信息偏倚病例对照研究的信息偏倚n回忆偏倚:回忆偏倚:病例对照研究主要调查研究对象既往的病例对照研究主要调查研究对象既往的暴露情况,由于被调查者记忆失真或不完整造成系暴露情况,由于被调查者记忆失真或不完整造成系统误差。统误差。n调查偏倚:调查偏倚:病例与对照调查环境与条件不同,或调病例与对照调查环境与条件不同,或调查技术、质量不高以及仪器设备的问题。查技术、质量不高以及仪器设备的问题。50 第七节 病例对照研究实施中应注意的问题1 1、主要假设、研究目的是否清
28、楚?是否可以检验?、主要假设、研究目的是否清楚?是否可以检验?2 2、疾病与暴露变量的定义是否清楚明确?、疾病与暴露变量的定义是否清楚明确?3 3、病例与对照的来源、诊断方法和排除是否一致?、病例与对照的来源、诊断方法和排除是否一致?4 4、抽样方法和样本大小?是否匹配及匹配变量?、抽样方法和样本大小?是否匹配及匹配变量?5 5、调查表设计是否合理?真实性和可靠性评估?、调查表设计是否合理?真实性和可靠性评估?6 6、质量控制:人员培训?调查方法?检验方法和试剂?、质量控制:人员培训?调查方法?检验方法和试剂?7 7、数据整理和统计分析:方法选择?结论的解释?、数据整理和统计分析:方法选择?结
29、论的解释?避免偏倚的方法避免偏倚的方法:1研究对象有代表性 随机抽样 避免选择偏倚 多个、多类医院 2 选用新病例,减少回忆偏倚 避免信息偏倚 3研究内容尽量用客观、定量指标 4配比研究 分层分析 减少混杂偏倚 多因素分析 521 1、特别适用于罕见病的研究、特别适用于罕见病的研究2 2、省力、省钱、省时间,易于组织实施、省力、省钱、省时间,易于组织实施3 3、同时调查多个暴露因素与疾病的关系、同时调查多个暴露因素与疾病的关系4 4、不仅用于病因探讨,而且可广泛用于其它方面、不仅用于病因探讨,而且可广泛用于其它方面 第八节 病例对照研究的优点及其局限性优点531 1、不适于研究人群暴露比例很低
30、的因素、不适于研究人群暴露比例很低的因素2 2、选择研究对象时,难以避免选择性偏倚、选择研究对象时,难以避免选择性偏倚3 3、暴露和疾病的时间先后常难以判断、暴露和疾病的时间先后常难以判断4 4、获取既往信息时,难以避免信息偏倚、获取既往信息时,难以避免信息偏倚5 5、不能计算发病率和相对危险度、不能计算发病率和相对危险度6 6、通常不能够确证因果关联、通常不能够确证因果关联局限性54三种流行病学研究方法的比较方法学特点方法学特点队列研究队列研究病例对照研究病例对照研究现况调查现况调查样本组成样本组成无病个体无病个体病例与对照病例与对照暴露者、现患者或存活者暴露者、现患者或存活者分组标准分组标
31、准暴露或未暴露暴露或未暴露患病或未患病患病或未患病前两者之一前两者之一时间顺序时间顺序前瞻性(从因到果)前瞻性(从因到果)回顾性(从果推因)回顾性(从果推因)现况现况比较内容比较内容暴露者与未暴露者发暴露者与未暴露者发病或死亡情况病或死亡情况病例与对照过去的暴露病例与对照过去的暴露情况情况暴露者的患病情况或患病暴露者的患病情况或患病者的暴露情况者的暴露情况率率发病率或死亡率发病率或死亡率暴露百分比暴露百分比患病率、暴露率患病率、暴露率关联指标关联指标RR,RD、PAROR、PARRR、RD、PAR优点优点暴露资料较正确;可计暴露资料较正确;可计算发病率和算发病率和RR;可同时;可同时研究一种研
32、究一种E和多种和多种D的关的关系;用于检验假设。系;用于检验假设。样本小、获得结果快;费样本小、获得结果快;费用低;无失访;可同时研用低;无失访;可同时研究一种究一种D和多种和多种E的关系;的关系;可用于少见病研究。可用于少见病研究。获结果迅速;获结果迅速;获得基线资料。获得基线资料。缺点缺点需要大样本和长期随需要大样本和长期随访;费用高;失访问访;费用高;失访问题多;不适用少见病。题多;不适用少见病。样本代表性差,对照选样本代表性差,对照选择不易得当;多回忆便择不易得当;多回忆便宜,仅能计算宜,仅能计算OR。因果时间顺序不易确定;因果时间顺序不易确定;不适用于病程短、死亡快不适用于病程短、死
33、亡快的疾病和少见病。的疾病和少见病。55n掌握:掌握:病例对照研究的基本原理和方法;选择病例对照研究的基本原理和方法;选择病例和选择对照的基本原则和注意事项;病例病例和选择对照的基本原则和注意事项;病例对照研究的类型;匹配与匹配过头的概念。对照研究的类型;匹配与匹配过头的概念。n熟悉:熟悉:病例对照研究的特点;决定样本大小的病例对照研究的特点;决定样本大小的条件和方法;资料的分析方法;比值比及其可条件和方法;资料的分析方法;比值比及其可信区间的计算;暴露者归因分值与人群归因分信区间的计算;暴露者归因分值与人群归因分值。值。n了解:了解:病例对照研究容易发生的偏倚有哪些;病例对照研究容易发生的偏倚有哪些;病例对照研究的主要优缺点。病例对照研究的主要优缺点。