1、12【学习要求】? 掌握病例对照研究的原理、实施过程? 熟悉病例对照研究优缺点偏倚及其控制?了解病例对照研究的新的研究类型和分层分析3 病例对照研究是分析流行病学研究方法中最基本、最重要的的研究类型之一,是验证病因假说的重要工具,是一种由果及因的回顾由果及因的回顾性研究方式性研究方式 4一、病例对照研究一、病例对照研究( Case-control study ) 选择患有特定疾病的人群作为病例组,和未患这种疾未患这种疾病病的人群作为对照组,调查两组人群过去暴露于某种(些)可能危险因素的比例,判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。 5 疾病发生后进行 按发病以否分成病
2、例组与对照组 暴露是由研究对象从现在对过去的回顾 由果推因 分析暴露与疾病的联系6三、病例对照研究原理示意图三、病例对照研究原理示意图)(dbbacbda/(a+c)7目标人群目标人群发病时序发病时序工作时序工作时序暴露暴露未暴露未暴露暴露暴露未暴露未暴露某病患者某病患者( (病例病例) )非患者非患者( (对照对照) )可可 比比acbda/(a+c)b/(b+d)比比 较较8 暴暴 露露 病病 例例 组组 对对 照照 组组 合合 计计 有有 a a b b a a+ +b b 无无 c c d d c c+ +d d 合合 计计 a a+ +c c b b+ +d d a a+ +b b+
3、 +c c+ +d d 病例对照研究资料整理表病例对照研究资料整理表9用 途 广泛探索疾病的可疑危险因素 深入检验某个或某几个病因假设 为队列研究提供明确的病因线索 10暴露暴露(ExposureExposure):):研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。暴露因素可以是机体的特征,也可以是体外的;可以是先天的,也可以是后天获得的;可以是有害的,也可以是有益的。如:血型、特殊职业暴露、环境污染、疾病家族史、某种基因型、吸烟、少食果蔬、高盐饮食、运动、平衡膳食四、暴露四、暴露11F2020世纪世纪2020年代:年代: 生殖因素与乳腺癌 F40405050年代:年代:吸烟与肺
4、癌吸烟与肺癌(Doll and Hill) F6060年代:年代:?口服避孕药与心梗、静脉栓塞;?孕妇服用反应停与婴儿先天畸形;?早孕服用雌激素与阴道腺癌。12 Doll与与Hill于19481952年进行研究。从伦敦20所医院及其他几个地区选取确诊的肺癌病例。每一病例按性别、年龄组、职业等配一个非肺癌对照,调查两者吸烟暴露情况。13吸烟史病例对照合计吸烟6886501 338不吸烟215980合计7097091 41814吸烟史病例对照合计吸烟6476221 269不吸烟22729合计6496491 29815吸烟史病例对照合计吸烟412869不吸烟193251合计606012016分析结果
5、:分析结果: 肺癌病人中不吸烟者的比例远小于对照组; 肺癌病人在病前10年内大量吸烟者(20支/日)显著多于对照组; 随着日吸烟量增加,肺癌预期死亡率升高; 肺癌病人开始吸烟的年龄较早,持续的年数较多。171. 1. 病例与对照不匹配病例与对照不匹配 :又称成组比较法,按与病例组可比的原则,根据样本的大小,选择一定数量的对照,数量不需成严格的比例关系,但对照的数量等于或多于病例。1819 2. 2. 病例与对照匹配:病例与对照匹配:或称配比(matching),即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰 。 分为个体匹配和频数匹配分为个体匹配和频数匹配
6、 目的:提高研究效率,增加统计检验效率,控制混杂因素的作用20个体匹配个体匹配(individual matching):给每一个病例选择给每一个病例选择一个或几个对照,配成对(一个或几个对照,配成对(pairpair)或配成伍,使对)或配成伍,使对照在某些因素或特征(如照在某些因素或特征(如年龄、性别年龄、性别等)方面与其等)方面与其相配的病例相同或基本相同相配的病例相同或基本相同 21222353岁岁(5059岁组岁组)5059岁岁2453岁岁53 3岁岁研究类型研究类型25频数匹配(频数匹配(frequency matching,又称成组匹配):又称成组匹配):要求研究组和对照组中匹配变
7、量的频数分布相要求研究组和对照组中匹配变量的频数分布相似,限制研究因素以外的某些因素干扰研究结似,限制研究因素以外的某些因素干扰研究结果的一种手段,使研究组和对照组具有可比性。果的一种手段,使研究组和对照组具有可比性。26? 匹配的因素不宜过多,防止匹配过头匹配的因素不宜过多,防止匹配过头(overmatching):把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能丢失信息,增加工作难度,结果反而降低了研究效率 ?慎重选择匹配因素,可疑病因决不能作为匹配因素一慎重选择匹配因素,可疑病因决不能作为匹配因素一般多只匹配般多只匹配age、gender ?比例一般为比例一般为1:1,也可以 1
8、:2,甚至1:3或 1:4,最多不超过1:427一、研究步骤一、研究步骤提出假设(“病因”对应疾病)选择合适的对照形式(一般采用不匹配或频数匹配,罕见病例采用个体配比)病例与对照的选择样本含量的估计研究因素的选择和资料的收集 资料的整理和分析28暴露暴露 ?疾病疾病 ?提出病因假设提出病因假设课题课题研究实施研究实施选择研究课题选择研究课题1.1.确定题目确定题目2.2.查阅文献查阅文献3.3.咨询专家咨询专家4.4.确定意义确定意义5.5.科学性论证科学性论证29(一)基本原则(一)基本原则 代表性:代表性:选择的病例要足以代表总体的病例,对照足以代表能够产生病例的总体人群(实际操作最难把握
9、的)可比性:可比性:病例组与对照组在年龄、性别等主要特征方面无明显差异301. 要求诊断可靠,尽量使用金标准 ,国际通用或国内统一的诊断标准选择确诊的新病例:提供的信息较为可靠 2. 来源 总体人群中的全部病例或者随机样本人群中的全部病例医院住院或门诊的病例311. 要求候选对象必须来自产生病例的总体,代表无该病的随机样本(其他疾病的病人和健康抽样)对照一旦发生所研究的疾病便成为病例不能为有共同危险因素的疾病病人2. 来源(社区或医院) 研究的总体人群或抽样人群中具有代表性的非病例医院中患有其他疾病的病人亲属、邻居、同事、同学32病 例对 照一个医院所有已诊断的病例同个医院内患其他病的病例一个
10、门诊部所有已诊断的病例同个门诊部诊断的其他病例多个医院或门诊部诊断的病例多个医院或门诊部诊断的其他病例以上任何一种方法选出的病例病例所在同一街道或住宅区中的健康人在人群中普查或抽查出的所有病例 在人群中抽查的非病例社会团体中所有诊断的病例社会团体中抽样的非病例以上任何方法选出的病例病例的配偶、同胞、同事、亲朋、同班同学等33(一)有关参数病例组的暴露率(P1)和对照组暴露(P0) 比值比 (odds ratio,OR) 值,检验的显著性水平,统计推断上弃真的概率把握度1-,为假设检验第类错误,即假设检验存伪的概率 34(二)方法(二)方法20120011)PP()PI (P)P1 (PZ)P1
11、 (P2ZN2012)PP()P1 (P2)ZZ(N10()/2PPP2. 公式法公式法非配比的样本大小估计非配比的样本大小估计 1. 查表法查表法近似公式近似公式其中,N:样本含量;P0:对照组暴露率;P1:病例组暴露率; Z, Z根据标准正态差简表查出;1000/(1)PORPPORP35或Z(单侧检验)Z(双侧检验)Z(单侧和双侧检验)0.0013.0903.2900.0022.8783.0900.0052.5762.8070.0102.3262.5760.0202.0582.3260.0251.9602.2420.0501.6451.9600.1001.2821.6450.2000.8
12、421.28236RR/ORP00.010.100.200.400.600.800.90 0.1142013766312018230.563236583472031762293782.032063782291762033476583.010741338571891633194.0599775146611172325.0406543735489619410.0150231820316613720.0661211142454115 37 例:现拟用非配比病例对照研究方法调查孕妇暴露于食品中某污染因素与婴儿畸形之间的关系,估计孕妇中该因素暴露率为30%,假定暴露引起的比值比为2, =0.05(双侧)
13、, =0.1,需调查多少人?38例:现拟用非配比病例对照研究方法调查孕妇暴露于食品中某污染因素与婴儿畸形之间的关系,估计孕妇中该因素暴露率为30%,假定暴露引起的比值比为2, =0.05(双侧), =0.1,需调查多少人? P0=0.3, Z=1.96, Z=1.28, OR=2P1=2*0.3/(1-0.3+2*0.3)=0.46, P=(0.3+0.46)/2=0.38N=193, 可以确定样本人数为2002012)PP()P1 (P2)ZZ(N10()/2PPP1000/(1)PORPPORP39RR/ORP00.010.100.200.400.600.800.90 0.11420137
14、66312018230.563236583472031762293782.032063782291762033476583.010741338571891633194.0599775146611172325.0406543735489619410.0150231820316613720.0661211142454115 P0=0.3, Z=1.96, Z=1.28, OR=2,查表得N=20040例:小儿先天性心脏病与母亲孕期口服某激素药关系的病例对照研究中,假定育龄妇女中应用某激素药占30,孕期服用某激素药与小儿先天性心脏病的RR=3,=0.05(双侧检验), =0.10,确定样本量?N=7
15、3,查表N=7541 配比研究样本大小的公式估算不作要求 ,亦可查病例对照研究得样本含量表病例对照研究得样本含量表确定.20120011)()11(PPRqpqpqpRnzzmZZppp211222()42(一)资料来源(一)资料来源 医院病案记录,疾病登记报告等摘录医院病案记录,疾病登记报告等摘录 检测病人的标本或病人所处的的环境检测病人的标本或病人所处的的环境 对病例或对照的询问调查中取得对病例或对照的询问调查中取得43调查:调查:是信息传达、接受和反映的过程,被调查者是信息传达、接受和反映的过程,被调查者要通过感受、回忆、思维、联想和反映等过程来回要通过感受、回忆、思维、联想和反映等过程
16、来回答问题答问题 原则原则 调查表的设计需要各专家参加讨论调查表的设计需要各专家参加讨论 调查员要经过严格的培训调查员要经过严格的培训 监督与审查监督与审查44(1)(1)访谈访谈(2)(2)信函信函(3)(3)电话电话(4)(4)档案档案(5)(5)实验室检测实验室检测(6)(6)临床查体临床查体资料收集方法资料收集方法 面对面询问,填表,面对面询问,填表,是最常用的调查方法是最常用的调查方法 将调查表及说明通过将调查表及说明通过信件发给调查对象,应信件发给调查对象,应答率受到影响,可补充答率受到影响,可补充调查调查 适合调查内容较少的适合调查内容较少的研究研究 病历、职业史、医疗病历、职业
17、史、医疗保险、户籍管理保险、户籍管理 病理、生化、分子生病理、生化、分子生物学物学 常规、特殊检查常规、特殊检查45调查表:也称“调查问卷”,通过把拟收集的数据项目用恰当的措词构成一系列问题的答卷,是资料收集的最主要工具 内容 调查表的名称、编号 一般项目:姓名、性别、民族等 研究项目:研究变量,疾病史、吸烟史等 结尾部分:调查员签名、调查日期等46(一)资料整理资料核查、检错、归档、分组、编码、录入计算机471. 成组比较法资料的整理48用卡方检验验证,两组暴露率是否存在差异, 即验证研究因素与疾病之间有否统计学联系。其计算方法传统的四格表的专用公式(重点掌握)antel-Haenszel
18、(M-H)方法(自学)方法(自学)成组资料统计学假设检验:49 成成组组比比较较法法病病例例对对照照研研究究资资料料整整理理表表 暴暴露露 病病例例组组 对对照照组组 合合计计 有有 a a b b a a+ +b b= =n n1 1 无无 c c d d c c+ +d d= =n n2 2 合合计计 a a+ +c c= =m m1 1 b b+ +d d= =m m2 2 a a+ +b b+ +c c+ +d d= =N N d)(bc)(ad)(cbabcad22n212122)2(nnmmNNbcad校正公式502目的:两个分类变量之间有无关联性(1) 建立检验假设,确定检验水平
19、。H0:1 =2H1:12=0.05或0.01。512d)(bc)(ad)(cbabcad22n(2)求检验统计量值)求检验统计量值(3)查表,比较)查表,比较与与 (df, )四格表中四格表中df1自由度自由度v=(行数(行数-1)(列数(列数-1) 22522p若若 (1, 0.05 ),P 0.05,说明两者差异显著,暴露和疾病有关联。p若若 0.05,说明两者差异不不显著,暴露和疾病没有关联。X2(0.05, 1)=3.84 X2(0.01, 1)=6.63222若干若干2 2分布的概率密分布的概率密度曲线度曲线53比值比(odds ratio, OR):指病例组中暴露人数与非暴露人数
20、的比值除以对照组中暴露人数与非暴露人数的比值。OR的特点:反映暴露者患某种疾病的危险性较无暴露者高的程度计算关联强度:bcadOR54OR=1:无关联, OR1:正关联,OR1:负关联,OR在0.91.1,暴露与疾病无联系OR在0.60.8或1.21.6,有弱联系OR在0.40.5或1.72.5,有中度联系OR在0 0.3或2.6,有强联系危险因素保护因素55OR可信区间由于OR值是通过一组样本调查所得的点估计值,存在抽样误差。因此,应该估计其可信区间如果OR的95%可信区间包含1,则表明联系无统计学意义。若OR1.0,则因素为疾病的保护因素)(2/96.11OROR 95%C.I.=561、
21、调查资料的整理成四格表2、关联性检验,卡方值的计算与比较(3.83或6.63) P P P 0.05,说明两者差异不不显著,暴露和疾病没有关联。3、关联强度计算,计算OR值及可信95区间,指出暴露和疾病的关联强度。 成成组组比比较较法法病病例例对对照照研研究究资资料料整整理理表表 暴暴露露 病病例例组组 对对照照组组 合合计计 有有 a a b b a a+ +b b= =n n1 1 无无 c c d d c c+ +d d= =n n2 2 合合计计 a a+ +c c= =m m1 1 b b+ +d d= =m m2 2 a a+ +b b+ +c c+ +d d= =N N bcad
22、OR 212122)2(nnmmNNbcad57 例:为了研究黄曲霉毒素与肝癌的关系,进行了成组对照研究。从某肿瘤研究所登记处获得300例肝癌患者,从某医院获得非肝癌患者的对照组500例。经调查,病例组中 210人有黄曲霉毒素接触史,对照组中 170人有黄曲霉毒素接触史,请你整理上述资料,并对黄曲霉毒素与肝癌的关系进行综合分析。58病例组对照组合计暴露史210(a)170(b)380(n1)非暴露史90(c)330(d)420(n2)合计300(m1)500(m2)800(N)592、关联性的检验X2 = 96 X2(0.01, 1)P1 说明接触黄曲霉毒素是危险因素OR 95%. C.I 为
23、3.356.13 说明接触黄曲霉毒素诱发肝癌的危险度是无黄曲霉毒素接触史人群的3.356.13倍。bcadOR )(2/96.11OROR 95%C.I.=结论:黄曲霉毒素可能是诱发肝癌的重要原因,有待队列研究进一步确认。612. 配对病例对照研究的结果分析621:1配对研究计算公式整理表整理表对照组对照组病例组病例组合计对子合计对子数数+ a cb da+b c+d合计对子合计对子数数a+cb+dN casecontrol+ + + + a b c d1:1配对病例对照研究资料整理bcORcbcb221)(2/96. 11OROR 95%C.I.=631、调查资料的整理成四格表(与成组有区别
24、)2、关联性检验,卡方值的计算与比较: P P P 0.05,说明两者差异不不显著,暴露和疾病没有关联。3、关联强度计算,计算OR值及可信95区间,指出暴露和疾病的关联强度。bcORcbcb22164例:为了了解食用水果与肝癌之间的关系。水果中以猕猴桃为研究对象。有人对100例病人做了1:1的配比对照试验。经调查,病例组中有60人有食用猕猴桃的习惯,配对后发现,病例组与对照组中均有食用猕猴桃的习惯52对,病例组与对照组中均无食用猕猴桃的习惯11对,请整理资料,并进行综合分析。65对照组病例组合计食用史无食用史食用史52(a)29(b)81无食用史8 (c)11(d)19合计6040100662
25、、关联性的检验X2 = 10.8 X2(0.01, 1)P0.01,差异极显著,说,差异极显著,说明食用猕猴桃与肝癌明食用猕猴桃与肝癌有关联。X2(0.05, 1)=3.84 X2(0.01, 1)=6.63bcORcbcb22167OR=c/b=0.28 1 说明无食用猕猴桃饮食习惯的人群患肝癌的危险度是有食用猕猴桃饮食习惯的人群的3.6倍。 结论:食用猕猴桃这种饮食习惯为保护因素,无食用猕猴桃这种饮食习惯可能是肝癌一个重要原因。69分层的目的:排除混杂因素的干扰分层的目的:排除混杂因素的干扰i层的发病情况暴露特征 病例 对照合计有无 ai bi ci di n1i n0i合计 m1i m0
26、iti40岁40岁 服OC 未服OC 合计服OC 未服OC 合计病例对照21(a1) 26(b1) 47(m11)17(c1) 59(d1) 76(m01)18(a2) 88(b2) 106(m12) 7(c2) 95(d2) 102(m02)合计38(n11) 85(n01) 123(t1)25(n12) 183(n02) 208(t2)701.选择偏倚(selection bias):由于选入的研究对象与未选入的研究对象某些特征上存在差异而引起的误差 ,对象选择阶段入院率偏倚无应答偏倚 检出症候偏倚:虚假因果联系 奈曼偏倚/幸存者偏倚 控制:合理选择病例与对照71 2.信息偏倚 (info
27、rmation bias):在收集整理信息过程中由于测量暴露与结局的方法有缺陷造成的系统误差,资料收集阶段 回忆性偏性调查偏倚 控制:采用客观指标、做好调查技术培训与质量控制,两组调查条件一致72 3、混杂偏倚(confounding bias):研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,年龄、性别最常见 控制 匹配:把混杂因素作为匹配因素 分层分析:按混杂因素进行分层 多因素分析73一、优点1、所需样本量小,省时、省钱、省人力,易于组织,出结果快; 2、可同时进行一病多因的研究; 3、特别
28、适于病因复杂、潜伏期长的疾病及罕见病的病因研究; 4、可初步评价治疗措施的疗效与副作用74二、缺点1、不能直接计算发病率、死亡率,不能直接计算RR,也不能证实因素与疾病因果关系。 2、易造成选择偏倚; 3、难以避免回忆偏倚; 4、混杂的影响较难控制。5、结果的可靠性不如队列研究 75进行病例对照研究时应注意的事项(一)病例和对照的选择应应规定严格的定义、入选标准、除外标准。 (二)病例应尽量选用新诊断的病例。 (三)研究的关键是如何选择对照。在危险因素的暴露方面,对照是一般人群的代表。对照与病例应有同等的暴露机会。 (四)病例和对照的暴露资料来源和资料搜集方法应尽可能相似。 (五)匹配时,应注
29、意勿匹配过头76巢式病例对照研究( nested case control study ):按队列研究的方式进行,收集每个队列成员的暴露信息及有关混杂因素,确定随访期内发生的病例作为病例组,对照来自同一队列,然后进行病例对照研究。 病例-队列研究(case-cohort study):研究开始时在队列中随机选取一组样本作为对照,观察结束时,队列中出现被研究疾病的所有病例作为病例组 77 统计效率高统计效率高 统计方法常用统计方法常用 收集资料简便收集资料简便78对照随机选择,代表性好 对照选择不受时间限制,选择快 一组对照可同时与几种病例组比较可以同时研究几种疾病,不同的疾病有不同的病例组,对照组是同一组随机样本