1、1一起食物中毒暴发调查一起食物中毒暴发调查病例发病周前曾于餐馆就餐病例发病周前曾于餐馆就餐 排除厨师和服务员是传染源(发病时间)排除厨师和服务员是传染源(发病时间) 什么食物被污染?什么食物被污染?调查:所有病例发病前在餐馆食用食物调查:所有病例发病前在餐馆食用食物 食用频率最高的食物?(现况研究)食用频率最高的食物?(现况研究)2募集同时期餐馆进餐但未发病者募集同时期餐馆进餐但未发病者 对照组对照组 与病例组比较:食用食物的差异与病例组比较:食用食物的差异 沙拉:沙拉: 病例病例 . 对照对照 辣菜:病例辣菜:病例 . 对照对照青洋葱青洋葱3检验假设检验假设 验证假设验证假设 研究方法研究方
2、法观观察察法法实实验验法法数数理理法法描述流行病学描述流行病学 分析流行病学分析流行病学 横断面调查横断面调查监测监测生态学研究生态学研究病例对照研究病例对照研究队列研究队列研究实验流行病学实验流行病学 临床试验临床试验现场试验现场试验社区干预项目社区干预项目理论流行病学理论流行病学 产生假设产生假设 4病例对照研究病例对照研究 刘丽刘丽流行病与卫生统计学系流行病与卫生统计学系5主要内容主要内容 什么是病例对照研究?什么是病例对照研究? 病例对照研究的特点?病例对照研究的特点? 如何进行病例对照研究?如何进行病例对照研究? 病例对照研究的优缺点是什么?病例对照研究的优缺点是什么?6第一节第一节
3、 基本原理基本原理. . 基本概念:基本概念: 病例对照研究:选择患有某病和未患有某特定疾病病例对照研究:选择患有某病和未患有某特定疾病的人群,分别作为病例组和对照组,调查并比较两的人群,分别作为病例组和对照组,调查并比较两组研究对象既往某些因素的暴露情况,判断该暴露组研究对象既往某些因素的暴露情况,判断该暴露因素是否与该病有关联及关联程度大小的一种观察因素是否与该病有关联及关联程度大小的一种观察性研究方法。性研究方法。从疾病出发,去探讨可能的病因从疾病出发,去探讨可能的病因 回顾性研究回顾性研究 ( ) ) 7l暴露暴露 () l 指研究对象接触过某种待研究的物质(如重金指研究对象接触过某种
4、待研究的物质(如重金属、线)、具备某种待研究的特征(如年龄、属、线)、具备某种待研究的特征(如年龄、性别及基因突变等)或行为(如吸烟)。性别及基因突变等)或行为(如吸烟)。l暴露因素暴露因素 可以是有害的,也可以是有益的,也可以是有害的,也可以是有益的,也叫研究因素。叫研究因素。7 78l危险因素(危险因素( )l引起某特定不良结局发生或引起某特定不良结局发生或使其概率增加的因素。使其概率增加的因素。l保护因素(保护因素( )l导致疾病事件降低的暴露因导致疾病事件降低的暴露因素称为保护因素素称为保护因素 决定因素研究因素暴露即是具有该研究因素9时间时间病例组病例组对照组对照组研究开始研究开始暴
5、露暴露暴露暴露非暴露非暴露非暴露非暴露调查方向调查方向图图 病例对照研究示意图(病例对照研究示意图(Greenberg ,2002)()()人数人数比较比较源源人人群群对比的思维(求异法)、概率统计的思维对比的思维(求异法)、概率统计的思维人群基线或期人群基线或期望暴露水平望暴露水平. . 基本原理基本原理10以确诊患某种特定疾病的病人作为病例组以确诊患某种特定疾病的病人作为病例组以不患该病但具有可比性的个体作为对照组以不患该病但具有可比性的个体作为对照组搜集既往危险因素保护因素的暴露史搜集既往危险因素保护因素的暴露史测量并比较两组各因素的暴露比例,经统计学测量并比较两组各因素的暴露比例,经统
6、计学检验该因素与疾病之间是否存在统计学关联;检验该因素与疾病之间是否存在统计学关联;利用病因推断技术,对统计学关联进行分析。利用病因推断技术,对统计学关联进行分析。. . 基本原理基本原理11. 病例对照研究特点病例对照研究特点 l观察法观察法l按照是否患病分组,设立对照按照是否患病分组,设立对照( (分析性方法分析性方法) )l测量的是暴露情况,而非疾病情况测量的是暴露情况,而非疾病情况l回顾性,由果回顾性,由果 因研究因研究l一般不能验证病因一般不能验证病因12. .病例对照研究的应用病例对照研究的应用l 广泛探索疾病的可疑危险因素广泛探索疾病的可疑危险因素l 检验病因假说检验病因假说l
7、防治措施效果的评价防治措施效果的评价l 药物不良反应的研究药物不良反应的研究l 疾病预后因素的研究疾病预后因素的研究13第二节第二节 研究类型研究类型l病例与对照不匹配病例与对照不匹配l病例与对照匹配病例与对照匹配14. . 病例与对照不匹配病例与对照不匹配 从规定病例源人群中,分别抽取一定量的患病从规定病例源人群中,分别抽取一定量的患病与非患病的研究对象分别作为病例组和对照组与非患病的研究对象分别作为病例组和对照组 对照组人数对照组人数病例组人数病例组人数 对照组应能代表产生病例的源人群对照组应能代表产生病例的源人群 此外没有其他限制与规定。此外没有其他限制与规定。15 进行吸烟与肺癌关系研
8、究,若因某种原因,进行吸烟与肺癌关系研究,若因某种原因,肺癌组以女性患者较多,而对照组以男性占多数,肺癌组以女性患者较多,而对照组以男性占多数,结果显示吸烟与肺癌无关。原因?结果显示吸烟与肺癌无关。原因?16研究对象的选择有问题,即女性患者吸烟比例较研究对象的选择有问题,即女性患者吸烟比例较低,而男性较高。性别分布在两组不均衡,产生混低,而男性较高。性别分布在两组不均衡,产生混杂作用。杂作用。研究吸烟与肺癌关系时,肺癌组和对照组在性别研究吸烟与肺癌关系时,肺癌组和对照组在性别保持一致,依此比较吸烟与肺癌关系,可消除性别保持一致,依此比较吸烟与肺癌关系,可消除性别对结果影响。对结果影响。?如何使
9、病例组和对照组的性别分布保持一致?如何使病例组和对照组的性别分布保持一致?采用匹配,可控制混杂偏倚对结果的影响。采用匹配,可控制混杂偏倚对结果的影响。17. .病例与对照匹配病例与对照匹配 l 匹配配比匹配配比()()l要求对照在某些因素或特征上与病例保持一致要求对照在某些因素或特征上与病例保持一致l对两组进行比较时排除匹配因素的干扰对两组进行比较时排除匹配因素的干扰l 分类分类l频数匹配频数匹配 l个体匹配个体匹配 18频数匹配(又称成组匹配)频数匹配(又称成组匹配) 匹配因素所占比例在对照组与病例组一致的整体匹配因素所占比例在对照组与病例组一致的整体匹配。匹配。个体匹配个体匹配 以病例和对
10、照个体为单位进行匹配。以病例和对照个体为单位进行匹配。 匹配,又称配对;匹配,又称配对;, , , , 匹配。匹配。匹配因素的一致程度:匹配因素的一致程度: 离散变量,完全匹配;离散变量,完全匹配; 连续变量,在一定范畴内匹配(分组或分连续变量,在一定范畴内匹配(分组或分类)类)19l 匹配法注意事项匹配法注意事项 l避免匹配过度()避免匹配过度()l慎重选择匹配因素(已知混杂因素或有理由怀慎重选择匹配因素(已知混杂因素或有理由怀疑为混杂因素!)疑为混杂因素!) l 匹配的目的匹配的目的l 提高研究效率提高研究效率 l 控制混杂因素的作用控制混杂因素的作用 20匹配过度()匹配过度() 把不必
11、要的项目进行匹配,企图使病例和对照把不必要的项目进行匹配,企图使病例和对照尽量一致,可能导致信息丢失,增加工作难度,尽量一致,可能导致信息丢失,增加工作难度,反而降低研究效率。反而降低研究效率。不应进行匹配的情况(非混杂因素)不应进行匹配的情况(非混杂因素)疾病因果链上的中间变量;疾病因果链上的中间变量;只与暴露因素有关,与疾病无关的因素;只与暴露因素有关,与疾病无关的因素;可能是疾病的某一危险因素。可能是疾病的某一危险因素。慎重选择匹配因素(已知混杂因素或有理由怀慎重选择匹配因素(已知混杂因素或有理由怀疑为混杂因素!)疑为混杂因素!) 21第三节第三节 研究设计与实施研究设计与实施确定研究目
12、的及研究假设确定研究目的及研究假设确定研究类型确定研究类型研究对象的选择研究对象的选择样本量估计样本量估计研究因素的选定与测量研究因素的选定与测量资料收集资料收集资料整理和分析资料整理和分析偏倚的识别与控制偏倚的识别与控制22. . 确定研究目的(拟解决的科学问确定研究目的(拟解决的科学问题是什么?)题是什么?)研究假设(科学问题)研究假设(科学问题): : 根据以往疾病分布的记录或现况根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,调查得到的结果,结合文献资料,提出研究假设。提出研究假设。研究目的:研究目的: 广泛探索疾病的可疑危险因素广泛探索疾病的可疑危险因素深入检验病因假说深入
13、检验病因假说药物不良反应的研究药物不良反应的研究疾病预后因素的研究疾病预后因素的研究防治措施效果的评价防治措施效果的评价23. . 明确适宜的研究类型明确适宜的研究类型 形式形式: : 非匹配、频数匹配、个体匹配非匹配、频数匹配、个体匹配原则:原则:广泛探索病因,采用不匹配或频数匹配广泛探索病因,采用不匹配或频数匹配罕见病采用个体匹配罕见病采用个体匹配防止匹配过度防止匹配过度 24. .明确研究对象(病例与对照的来源与选择)明确研究对象(病例与对照的来源与选择)基本原则:基本原则:代表性代表性: : 病例能代表总体的病例病例能代表总体的病例; ; 对照能代表产生病例的总体人群或源人群对照能代表
14、产生病例的总体人群或源人群 可比性(合理的比较往往更重要)可比性(合理的比较往往更重要)来源:来源: 以医院为基础以医院为基础 以社区为基础以社区为基础 25()病例的选择()病例的选择判断病人的标准如何获得符合标准的病人?判断病人的标准如何获得符合标准的病人?选择病例的要求:选择病例的要求:诊断可靠诊断可靠 使用金标准使用金标准 对病例的患病部位、病理学分型等明确限对病例的患病部位、病理学分型等明确限制。制。 同是胃癌病人,病理学分类有未分化同是胃癌病人,病理学分类有未分化弥漫性腺癌和分化肠型腺癌,病因有差异。弥漫性腺癌和分化肠型腺癌,病因有差异。对病例的外部特征(年龄、性别、种族、职对病例
15、的外部特征(年龄、性别、种族、职业等)明确规定,控制非研究因素,增强业等)明确规定,控制非研究因素,增强比较组的可比性。比较组的可比性。26l病例类型:新发病例、现患病例、死亡病病例类型:新发病例、现患病例、死亡病例例l首选新发病例首选新发病例 回忆偏倚小回忆偏倚小代表性好代表性好容易合作容易合作 被调查因素改变少被调查因素改变少27l病例来源:病例来源:l l 医院住院或门诊的病例医院住院或门诊的病例代表性好代表性好工作开展比较困难工作开展比较困难耗费人力物力耗费人力物力社区的病例社区的病例(最优)(最优)比较合作比较合作 资料易得到且比较可靠资料易得到且比较可靠与对照的可比性好与对照的可比
16、性好代表性差代表性差28()对照的选择(整个研究的关键之一)()对照的选择(整个研究的关键之一)原原 则则未患此病的人(可以是其它疾病);未患此病的人(可以是其它疾病); 如研究吸烟与肺癌关系,能否以慢性支气管炎如研究吸烟与肺癌关系,能否以慢性支气管炎病人作为对照?病人作为对照? 不能患有与所研究疾病有共同病因的疾病。不能患有与所研究疾病有共同病因的疾病。 足以代表产生病例的总体(代表性);足以代表产生病例的总体(代表性);除研究因素外其它条件与病例组一致(可比性);除研究因素外其它条件与病例组一致(可比性);必须具有暴露于研究因素的可能性;必须具有暴露于研究因素的可能性;对照是否匹配以及匹配
17、类型设置。对照是否匹配以及匹配类型设置。 29l对照来源对照来源l 社区来源的健康人或非该病人(最接近社区来源的健康人或非该病人(最接近全人群的无偏样本)全人群的无偏样本)l 医院来源的其他病例(使用最多)医院来源的其他病例(使用最多)l医院为基础的对照选择注意事项:医院为基础的对照选择注意事项:l对照所患疾病与病例的病因无关对照所患疾病与病例的病因无关l选择多个病种的病人组成选择多个病种的病人组成l不选择当前患有多种疾病的病人不选择当前患有多种疾病的病人l从新发病人中选取对照从新发病人中选取对照30病例对照研究病例对照研究社区为基础医院为基础社区为基础医院为基础以社区为基础的病例对照研以社区
18、为基础的病例对照研究究以医院为基础的病例对照研以医院为基础的病例对照研究究可以较好的确定源人群可以较好的确定源人群研究对象的可及性好研究对象的可及性好容易保证病例和对照来自同容易保证病例和对照来自同一源人群一源人群研究对象更易合作研究对象更易合作对照的暴露史更可能反映病对照的暴露史更可能反映病例源人群的暴露情况例源人群的暴露情况比较容易从医疗记录和生物比较容易从医疗记录和生物标本收集暴露信息标本收集暴露信息尽可能设立多种对照尽可能设立多种对照 设立两种或两种以上的对照,可以增强设立两种或两种以上的对照,可以增强结果的可信度。如果多种对照均获得一致性结果,则结果的说结果的可信度。如果多种对照均获
19、得一致性结果,则结果的说服力便大大增强。服力便大大增强。31l 影响样本大小的因素影响样本大小的因素( (发现比较组的暴露率差异)发现比较组的暴露率差异)l 人群中被研究因素的暴露率(对照组中的暴露率)人群中被研究因素的暴露率(对照组中的暴露率)l 暴露与疾病关联强度指标或的估计值(查阅文献暴露与疾病关联强度指标或的估计值(查阅文献或预调查获得)或预调查获得) 病例组的暴露率病例组的暴露率l 值(值( ,研究结果的可信程度),研究结果的可信程度) l 值(值( ,研究把握度),研究把握度)l 根据以上有关参数查表或代入公式计算根据以上有关参数查表或代入公式计算. .样本含量的估计样本含量的估计
20、样本量估计方法样本量估计方法查表法查表法公式法:公式法: 不匹配(病例组与对照组人数相等)不匹配(病例组与对照组人数相等)病例组暴露率病例组暴露率对照组暴露率对照组暴露率()33例:为研究某市肺癌与吸烟的关系,欲进行一次病例例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。对照研究。 某市普通人群中吸烟率某市普通人群中吸烟率 把握度把握度 问需要多少病例与对照问需要多少病例与对照? 10.2 2 / 1 0.2 10.3330.20.333 /20.2671 0.2670.733ppq 、值查表,值查表,为,为, 为为代入公式得:代入公式得:病例组与对照组,各需人。病例组与对照组,各需人
21、。222 0.267 0.7331.96 1.282/ 0.3330.2232n 35病例组与对照组例数不等时的公式:病例组与对照组例数不等时的公式:病例数病例数: :对照数对照数对照组例数为对照组例数为* *2210(1 1/ )() /()nc pq zzpp 10/ 1ppcpc1qp 36匹配设计匹配设计总对子数总对子数 和分别代表目标人群中对照组与病例组和分别代表目标人群中对照组与病例组 的估的估计暴露率计暴露率 为暴露状况不一致的对子数为暴露状况不一致的对子数22/2(1)/(1/2)mzzppp/ 1/ 1pORORRRRR0 110/Mmp qp q100/ 1(1)pp RR
22、p RR111qp 001qp 37. .研究因素的选定与测量研究因素的选定与测量 根据研究目的或具体的目标,确定调查变根据研究目的或具体的目标,确定调查变量和每一个变量的具体项目。量和每一个变量的具体项目。每项变量都要有明确的定义。每项变量都要有明确的定义。研究中应尽可能地采用定量或半定量的量研究中应尽可能地采用定量或半定量的量度。度。 吸烟与肺癌的关系的研究吸烟与肺癌的关系的研究吸烟的定义:一生中连续或累积吸烟个月或以上者吸烟的定义:一生中连续或累积吸烟个月或以上者吸烟与否;吸烟与否;开始吸烟的年龄、吸烟的年限、每天吸烟量、是否戒烟、开始吸烟的年龄、吸烟的年限、每天吸烟量、是否戒烟、戒烟的
23、时间;是否被动吸烟(被动吸烟的定义);戒烟的时间;是否被动吸烟(被动吸烟的定义);三手烟?三手烟?38. . 资料来源与收集资料来源与收集 资料来源:资料来源: 医院病案记录医院病案记录疾病登记报告等摘录疾病登记报告等摘录检测病人的标本或环境获得检测病人的标本或环境获得询问调查获得询问调查获得39资料收集的方法资料收集的方法()询问:包括面询、函询、电话询问、计算机辅助()询问:包括面询、函询、电话询问、计算机辅助询问、自填问卷。询问、自填问卷。()查阅记录:包括出生、疾病死亡、健康体检记录()查阅记录:包括出生、疾病死亡、健康体检记录等。等。()测量:包括测量各种指标,如机体、环境的测量,(
24、)测量:包括测量各种指标,如机体、环境的测量,区域、个体采样器监测、生物监测,血清学、组织区域、个体采样器监测、生物监测,血清学、组织学分析等。学分析等。40第四节第四节 资料的整理与分析资料的整理与分析. .资料整理资料整理. .描述统计描述统计. .统计推断统计推断不匹配资料的分析不匹配资料的分析配对资料的分析配对资料的分析混杂因素作用的估计与分层分析混杂因素作用的估计与分层分析l比较病例与对照中研究因素暴露比较病例与对照中研究因素暴露的比例,估计研究因素与疾病发的比例,估计研究因素与疾病发生的危险度。生的危险度。l控制潜在混杂作用,对研究因素控制潜在混杂作用,对研究因素与疾病的关系做出正
25、确的估计。与疾病的关系做出正确的估计。41. .资料整理资料整理核查原始资料(查漏补缺纠错)核查原始资料(查漏补缺纠错)原始资料的分组、归纳、或编码输入计算机原始资料的分组、归纳、或编码输入计算机 双人平行录双人平行录入入42. .描述统计:描述统计:研究对象的一般特征描述:研究对象的一般特征描述: 病例组和对照组样本量,人口学特征构成,病例组和对照组样本量,人口学特征构成,目的是分析研究对象的代表性。目的是分析研究对象的代表性。均衡性检验均衡性检验 比较病例组和对照组某些基本特征是否相比较病例组和对照组某些基本特征是否相似或齐同,检验病例组和对照组的可比性。似或齐同,检验病例组和对照组的可比
26、性。 如有统计学差异的因素,应分析其是否对如有统计学差异的因素,应分析其是否对其他因素产生影响(多因素模型,分层分其他因素产生影响(多因素模型,分层分析等)。析等)。43()将资料整理成表格形式;()将资料整理成表格形式;()病例组和对照组暴露比例差异的统计学检验:()病例组和对照组暴露比例差异的统计学检验:即回答和是否有联系?即回答和是否有联系?()估计暴露因素疾病之间的联系强度;()估计暴露因素疾病之间的联系强度;()评价剂量()评价剂量反应关系(等级暴露资料);反应关系(等级暴露资料);()结果解释。可能存在哪些偏倚?得出什么结论?()结果解释。可能存在哪些偏倚?得出什么结论? . .推
27、断统计推断统计( (按不同的研究类型分析按不同的研究类型分析 ) )44()资料整理成四格表()资料整理成四格表()统计学检验()统计学检验(检验)检验) 检验研究因素与疾病之间有否统计学联系?检验研究因素与疾病之间有否统计学联系? l非匹配或频数匹配病例对照资料的分析非匹配或频数匹配病例对照资料的分析 , 说明疾病的危险度因暴露而增加;说明疾病的危险度因暴露而增加;, 说明疾病的危险度因暴露而减少。说明疾病的危险度因暴露而减少。 的前提条件的前提条件所研究疾病的发病率(死亡率)很低所研究疾病的发病率(死亡率)很低病例对照研究中所选择的研究对象代表性好,则病例对照研究中所选择的研究对象代表性好
28、,则值就很接近甚至等于值值就很接近甚至等于值48l的置信区间的置信区间( , )估计(为什么?)估计(为什么?)l)自然对数转换法:以自然对数转换法:以 方差为基础方差为基础l()l l ( )l) 卡方值法卡方值法l置信区间不包括,即可认为该在的水平上有统计学置信区间不包括,即可认为该在的水平上有统计学意义。意义。)(lnORVar)/.(29611 ORCI 95%OR 结果表明吸烟者患食管癌的危险性是不吸烟者的结果表明吸烟者患食管癌的危险性是不吸烟者的倍,的置信范围是在之间。倍,的置信范围是在之间。87.2126208243309bcadOR)78. 3 ,18. 2(2/96. 11)
29、(OR()研究因素与疾病的关联强度评价研究因素与疾病的关联强度评价50l匹配资料是由病例与对照结合成对子,分析时不应把对匹配资料是由病例与对照结合成对子,分析时不应把对子拆开分析。子拆开分析。l l 、分别代表病例和对照不同暴露情况的对子、分别代表病例和对照不同暴露情况的对子数数l配对资料的分析配对资料的分析()51cb22) c-b(cbcb22) 1(bcOR ()()/.(29611 ORCI 95%OR ()(), 表明男性吸烟者患食管癌的危险性是不吸烟者的倍 :吸烟与食管癌无统计学关联 :吸烟与食管癌有统计学关联18.10,84. 133. 428.1196. 1112zORl分级暴
30、露资料分析分级暴露资料分析分析暴露与疾病的剂量反应关系分析暴露与疾病的剂量反应关系根据暴露因素的分级将资料归纳成列联表根据暴露因素的分级将资料归纳成列联表对列联表数据进行卡方检验对列联表数据进行卡方检验以最低暴露水平为参照,计算出各暴露水平的以最低暴露水平为参照,计算出各暴露水平的卡方趋势检验卡方趋势检验暴露分级合计病例对照54男性每日吸烟的支数与肺癌关系男性每日吸烟的支数与肺癌关系卡方卡方检验检验():):, , 说说明吸烟量按吸烟水平分明吸烟量按吸烟水平分级级后,后,组间组间差差别别有有统计学统计学意意义义。各暴露分各暴露分级级的:的:以不吸烟以不吸烟为参为参照。,照。, , 随随吸烟吸烟
31、剂剂量的增加而量的增加而递递增。增。卡方卡方趋势检验趋势检验: , ,剂剂量反量反应趋势应趋势具有具有统计学统计学意意义义,说说明吸烟明吸烟与与男性肺癌之男性肺癌之间间存在存在剂剂量反量反应关应关系。系。55l 病例对照研究中偏倚的种类病例对照研究中偏倚的种类l 偏倚的控制偏倚的控制第五节第五节 常见偏倚及其控制常见偏倚及其控制56. .选择偏倚(选择偏倚( )选入的研究对象与未选入的研究对象在某些特征上存选入的研究对象与未选入的研究对象在某些特征上存在差异而引起的误差(选择的研究对象不能代表总在差异而引起的误差(选择的研究对象不能代表总体人群)。体人群)。最常见偏倚最常见偏倚 入院率偏倚入院
32、率偏倚现患病例新发病例偏倚现患病例新发病例偏倚检出症候偏倚检出症候偏倚l病例对照研究中常见偏倚的种类病例对照研究中常见偏倚的种类 无应答偏倚无应答偏倚 时间效应偏倚时间效应偏倚57入院率偏倚(入院率偏倚( ) ) 常见于医院基础的病例对照研究。常见于医院基础的病例对照研究。当利用医院的病例当利用医院的病例( (门诊或住院病例门诊或住院病例) )作为研究对作为研究对象时,由于疾病在不同医院入院率的不同而导致象时,由于疾病在不同医院入院率的不同而导致的偏倚,称入院率偏倚。的偏倚,称入院率偏倚。 不同医院技术专长、患者所患疾病的严重程度、不同医院技术专长、患者所患疾病的严重程度、经济状况等不同,患者
33、对医院具有选择性,医院经济状况等不同,患者对医院具有选择性,医院对患者亦具有选择性。暴露和疾病影响研究对象对患者亦具有选择性。暴露和疾病影响研究对象的选择导致倾向性入院率差异。的选择导致倾向性入院率差异。 本质:病例或对照的不能够代表总体。本质:病例或对照的不能够代表总体。 控制:多家医院的病例来源;多个对照组。控制:多家医院的病例来源;多个对照组。58检出症候偏倚( )、暴露偏倚f年研究妇女服用复方雌激素子宫内膜癌f妇女服用复方雌激素导致阴道出血,就医后检出子宫内膜癌。用这种病例研究时,得出:雌激素与子宫内膜癌有关。f实际情况是,病例即使不服用雌激素,若接受检查,也可能被检出子宫内膜癌。f服
34、用复方雌激素加快其被检出的可能性。59 作者就此进行深入调查,结果发现服用复方雌作者就此进行深入调查,结果发现服用复方雌激素的病例中有为第一期病例,而未服用复方雌激素的病例中有为第一期病例,而未服用复方雌激素病例中,只有为第一期病例;病例组由非同激素病例中,只有为第一期病例;病例组由非同质人群组成。质人群组成。 本质:病例的代表性问题本质:病例的代表性问题 控制:延长收集病例的时间,使其超过由早期向控制:延长收集病例的时间,使其超过由早期向中晚期过渡的时间,则检出病例中的暴露者比例中晚期过渡的时间,则检出病例中的暴露者比例接近一般病例。接近一般病例。60 现患病例新发病例偏倚现患病例新发病例偏
35、倚( )( )、 d由于现患病例和新病例在某些特征或行为上的差异,造成研由于现患病例和新病例在某些特征或行为上的差异,造成研究结果的偏倚。究结果的偏倚。d以现患病例为对象,收集到的信息可能只与存活有关,而与以现患病例为对象,收集到的信息可能只与存活有关,而与研究的暴露因素无关;幸存者可能改变以往的生活习惯,即研究的暴露因素无关;幸存者可能改变以往的生活习惯,即降低或增加某研究因素的暴露水平。降低或增加某研究因素的暴露水平。d调查者得到疾病与暴露之间的虚假联系。调查者得到疾病与暴露之间的虚假联系。d控制:尽量选择新病例;增加新老病例比较分析;对暴露强控制:尽量选择新病例;增加新老病例比较分析;对
36、暴露强度时间与结局进行分析度时间与结局进行分析61无应答偏倚无应答偏倚( ) 无应答是流行病学研究中常见问题。研究者应尽可能对确定的研究对象一个不漏地予以调查,无应答可造成偏倚。 如儿童意外伤害的病例对照研究。 控制:尽量取得调查对象的合作。62时间效应偏倚时间效应偏倚 慢性病由于潜隐期长,当病例与对照判断标准不明确,或划分界限有缺陷,则具有早期症状者可能被选入对照组,或把一些轻型、非典型病人误划入对照组,则会引发此种偏倚,掩盖暴露与疾病的真正关联。 控制:采用准确可靠、标准化的诊断标准并严格遵守,或延长观察期,可以抵消此类偏倚。63 回忆偏倚回忆偏倚: 回忆既往暴露情况时准确性和系统性存在的
37、系回忆既往暴露情况时准确性和系统性存在的系统误差统误差; 与调查时间和发病时间间隔、被调查者构成及询与调查时间和发病时间间隔、被调查者构成及询问技术等有关。问技术等有关。 控制:选择不易忘记的重要指标做调查,并重视问卷调控制:选择不易忘记的重要指标做调查,并重视问卷调查技术,有助于减少回忆偏倚。查技术,有助于减少回忆偏倚。 值得注意的是,即使应用相同调查方法,两组回忆误差值得注意的是,即使应用相同调查方法,两组回忆误差可能不一致,病例组可能记忆清楚,但也可能夸大暴露信可能不一致,病例组可能记忆清楚,但也可能夸大暴露信息;对照组则相反。息;对照组则相反。 . . 信息偏倚信息偏倚64调查偏倚调查
38、偏倚( (疑诊偏倚疑诊偏倚) ) 调查环境不同或调查质量不高可造成偏倚。如两组收集数据的方法(询问重点和方式)不同;调查时间、地点有差别。调查员对项目理解及掌握标准不一致、态度不认真等,均可造成偏倚。 控制:尽量采用客观指标,做好质量控制:优化调查表、统一标准、培训调查员、核查调查结果,采用盲法等。65 在评价暴露因素与疾病之间的关联时,由于在评价暴露因素与疾病之间的关联时,由于一个或多个既与暴露因素有关,同时与研究疾病一个或多个既与暴露因素有关,同时与研究疾病有关的外来因素存在,使得暴露因素的效应和外有关的外来因素存在,使得暴露因素的效应和外来因素的效应混在一起,从而歪曲了暴露因素与来因素的
39、效应混在一起,从而歪曲了暴露因素与疾病的关联性。此外来因素即为混杂因素。这种疾病的关联性。此外来因素即为混杂因素。这种歪曲联系真实性的偏倚称为混杂偏倚。歪曲联系真实性的偏倚称为混杂偏倚。.混杂偏倚66 混杂因素的基本特征(判断混杂因素的基本条件):混杂因素的基本特征(判断混杂因素的基本条件): ()混杂因素与研究疾病有关()混杂因素与研究疾病有关 ()混杂因素与研究因素有关()混杂因素与研究因素有关 ()混杂因素不是研究因素与疾病因果链上的中间环节。()混杂因素不是研究因素与疾病因果链上的中间环节。 混杂因素导致混杂偏倚的条件:混杂因素在各组分布不均。混杂因素导致混杂偏倚的条件:混杂因素在各组
40、分布不均。 混杂偏倚类型:混杂偏倚类型:正混杂偏倚:夸大暴露与疾病的关联正混杂偏倚:夸大暴露与疾病的关联负混杂偏倚:减弱暴露与疾病的关联负混杂偏倚:减弱暴露与疾病的关联67流行病学研究中,发现统计学意义上的联系,在流行病学研究中,发现统计学意义上的联系,在进行病因学推论前,必须首先排除潜在混杂因素进行病因学推论前,必须首先排除潜在混杂因素的作用,估计和调整混杂偏倚的影响。的作用,估计和调整混杂偏倚的影响。混杂偏倚的识别混杂偏倚的识别根据专业知识提出可能的混杂因素:人口统计学根据专业知识提出可能的混杂因素:人口统计学指标;研究因素以外的其他危险因素;指标;研究因素以外的其他危险因素;利用分层分析
41、进行判断。利用分层分析进行判断。68混杂因素作用的控制混杂因素作用的控制配比法配比法 ( (设计阶段设计阶段) )限制(设计阶段)限制(设计阶段)随机化分组(实验流行病学)随机化分组(实验流行病学)分层分析分层分析 (资料分析阶段)(资料分析阶段)多因素分析(资料分析阶段)多因素分析(资料分析阶段)标准化分析(资料分析阶段)标准化分析(资料分析阶段)统计调整统计调整69非个体匹配分层资料非个体匹配分层资料分层分析是按照某种特征(如年龄、性别等)把研究人群分分层分析是按照某种特征(如年龄、性别等)把研究人群分为不同的层次,然后分别分析各层中暴露与疾病的关联。为不同的层次,然后分别分析各层中暴露与
42、疾病的关联。评价分层因素本身作用及其与暴露之间关系评价分层因素本身作用及其与暴露之间关系评价分层因素与暴露因素在疾病中的交互作用评价分层因素与暴露因素在疾病中的交互作用识别混杂因素,控制混杂,同时提高检验效率。识别混杂因素,控制混杂,同时提高检验效率。帮助正确设计多因素模型帮助正确设计多因素模型 研究吸烟与食管癌的关系,考虑饮酒为混杂因素,如何研究吸烟与食管癌的关系,考虑饮酒为混杂因素,如何进一步分析?进一步分析? 吸烟吸烟 食管癌食管癌 饮酒饮酒70分层分析识别和控制混杂偏倚的步骤:分层分析识别和控制混杂偏倚的步骤:()按可能的混杂因素分层,每层整理一个四格表,计算每()按可能的混杂因素分层
43、,每层整理一个四格表,计算每层的卡方和值;层的卡方和值;()判断分层因素是否为混杂因素(三个基本条件)()判断分层因素是否为混杂因素(三个基本条件)()如果两层值接近(同质,混杂作用),计算合并卡方值,()如果两层值接近(同质,混杂作用),计算合并卡方值,合并值()及合并值()及 ;如果两层不同质如果两层不同质(交互作用),不能合并,分别交互作用),不能合并,分别报告;报告;71l 按饮酒与否分层按饮酒与否分层 计算值计算值饮酒者中吸烟的饮酒者中吸烟的()()稍高于不分层稍高于不分层() () 不饮酒者中吸烟的不饮酒者中吸烟的()()却低得很多却低得很多吸烟与食管癌的关系列表计算吸烟与食管癌的
44、关系列表计算 齐性检验。齐性检验。72l 进行齐性检验进行齐性检验 (层别效应的一致性假设与检验)(层别效应的一致性假设与检验) l 齐性检验齐性检验 合并合并与值与值l 值无明显差别,则饮酒产生混杂作用值无明显差别,则饮酒产生混杂作用 合并合并值值l 值有显著差异,则饮酒与吸烟存在交互值有显著差异,则饮酒与吸烟存在交互 合合并值并值l 本例齐性检验无显著差异(本例齐性检验无显著差异( ),计算合并与),计算合并与73l 计算合并与计算合并与值值 l 公式(法):公式(法):l 2iii2HM)V(a5.0)(Eaa)Ncb()Nda(ORiiiiiiHM7474. 3421. 455 . 0
45、 7 . 26830922 h m42. 2)3005763)58615163()30013644( )586107265( HMOR经饮酒分层调整后,吸烟的经饮酒分层调整后,吸烟的与(即合并与(即合并与合并)虽较未调与合并)虽较未调整的整的 ()与与()为低,但仍有一定强度与统计学上的显著性。为低,但仍有一定强度与统计学上的显著性。吸烟与食管癌之间有显著的关联。吸烟与食管癌之间有显著的关联。饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作用用表表 分层计算结果整理表分层计算结果整理表 75偏 倚控制措施.选择偏倚选入者与未选入者某些特征上存
46、在差异引起(入院率偏倚、现患新发病例偏倚、检出征候偏倚、时间效应偏倚)尽量合理地选择病例与对照.信息偏倚收集信息时由于测量及获得数据的方法不正确而造成(回忆偏倚、调查偏倚)多人或多次询问并比较结果,采用盲法.混杂偏倚某因素既与疾病有关系又与研究因素有联系,其掩盖或夸大了暴露与疾病的联系匹配、限制、随机化、分层分析、多因素分析、标准化分析小结:偏倚及其控制小结:偏倚及其控制 76第六节第六节 研究实例研究实例 研究背景研究背景 研究方法研究方法 研究结果研究结果77 研究背景研究背景美国波士顿纪念医院妇产科医生发现美国波士顿纪念医院妇产科医生发现 年收治例阴道腺癌患者年收治例阴道腺癌患者例在岁之
47、间例在岁之间例均为腺癌例均为腺癌阴道腺癌应为中老年女性的疾病阴道腺癌应为中老年女性的疾病 阴道癌占女性生殖系统癌的阴道癌占女性生殖系统癌的 阴道腺癌仅占阴道癌的,非常罕见阴道腺癌仅占阴道癌的,非常罕见78 对阴道腺癌危险因素进行探索对阴道腺癌危险因素进行探索 例患者加上另一个医院例患者作为病例组例患者加上另一个医院例患者作为病例组 每个病人配个对照,共个对照每个病人配个对照,共个对照 调查员用调查表对病例和对照的母亲进行了调查员用调查表对病例和对照的母亲进行了 调查,经统计学处理后的主要结果见表调查,经统计学处理后的主要结果见表 研究方法研究方法79 研究结果研究结果80研究结果研究结果 在比
48、较的因素中,只有三个因素有显著差别在比较的因素中,只有三个因素有显著差别 母亲怀孕期间使用过己烯雌酚激素治疗母亲怀孕期间使用过己烯雌酚激素治疗 () () 母亲以前流产史母亲以前流产史()() 此次怀孕阴道出血史此次怀孕阴道出血史()() 因有后两个因素存在才使用己烯雌酚治疗因有后两个因素存在才使用己烯雌酚治疗 做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中的做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中的女儿以后发生阴道腺癌的危险性增加女儿以后发生阴道腺癌的危险性增加 81第七节第七节 优点与局限性及优点与局限性及实施时应注意的问题实施时应注意的问题82. 病例对照研究的优点特别适用
49、于少见病、罕见病的研究省力、省钱、省时间,并易于组织实施还可用于疫苗免疫学效果考核及暴发调查等可同时研究多个因素与某种疾病的联系83. 病例对照研究的局限性病例对照研究的局限性不适于研究暴露比例很低的因素不适于研究暴露比例很低的因素选择偏倚难以避免选择偏倚难以避免存在回忆偏倚存在回忆偏倚暴露与疾病时间先后难以判断,不能证实因暴露与疾病时间先后难以判断,不能证实因果关系果关系不能计算发病率或死亡率,一般只能计算间不能计算发病率或死亡率,一般只能计算间接估计关联强度接估计关联强度84. . 实施病例对照研究应注意的问题实施病例对照研究应注意的问题l 假设目的是否清楚?假设目的是否清楚?l 疾病与暴露变量的定义明确?疾病与暴露变量的定义明确?l 病例与对照的来源,诊断方法?病例与对照的来源,诊断方法?l 新发病例还是现患病例?新发病例还是现患病例?l 排除标准是否明确?排除标准是否明确? 85l 抽样的方法与样本大小的估计是否恰当?抽样的方法与样本大小的估计是否恰当?l 调查表是否经过试用?调查表是否经过试用?l 调查表的真实性与可靠性是否经过评估?调查表的真实性与可靠性是否经过评估?l 资料整理、统计方法及分析内容是否明确?资料整理、统计方法及分析内容是否明确?l 如何控制或调整偏倚?如何控制或调整偏倚?l 结论的真实性如何?结论的真实性如何?86