1、1临床研究中常见的误差及其控制临床研究中常见的误差及其控制 (Control the Common Errors in Clinical Research)流行病与卫生统计学流行病与卫生统计学黄民主黄民主 教授教授 在流行病学研究中,总希望得到科在流行病学研究中,总希望得到科学准确而又真实的结果,但在实际工作学准确而又真实的结果,但在实际工作中,由于各种因素的影响,使研究结果中,由于各种因素的影响,使研究结果偏离真实情况,产生偏离真实情况,产生误差误差。因此为了获。因此为了获得真实可靠的临床研究结果,必须在研得真实可靠的临床研究结果,必须在研究的究的设计、实施及分析设计、实施及分析的各个阶段充
2、分的各个阶段充分认认识识、控制和消除各种误差,使研究结、控制和消除各种误差,使研究结果尽可能与客观真实情况相一致。果尽可能与客观真实情况相一致。3 内容提要内容提要 真实性和可靠性真实性和可靠性 选择偏倚选择偏倚 信息偏倚信息偏倚 混杂偏倚混杂偏倚 4第一节第一节 真实性和可靠性真实性和可靠性 一、一、概念概念 (一)(一)真实性真实性 指研究结果对研究对象的真实情况的反映指研究结果对研究对象的真实情况的反映程度。如果研究结果与客观实际存在差异,这程度。如果研究结果与客观实际存在差异,这就是就是误差误差。误差误差包括包括随机误差随机误差和和系统误差系统误差两大类。误两大类。误差影响着研究结果的
3、差影响着研究结果的真实性真实性和和可靠性可靠性。5真实性包括真实性包括内部真实性内部真实性和和外部真实性外部真实性。内部真实性(内部真实性(internal validity)定义定义 研究结果能真实反映研究人群实际状况的程研究结果能真实反映研究人群实际状况的程度。内部真实性是由研究本身的范围所决定的。度。内部真实性是由研究本身的范围所决定的。改善措施改善措施 限制研究对象的类型和研究条件。限制研究对象的类型和研究条件。6外部真实性(外部真实性(external validity)定义定义 研究结果能够被应用到其他人群的程度。也研究结果能够被应用到其他人群的程度。也就是结果外推的可靠性。就是结
4、果外推的可靠性。改善措施改善措施 增加研究对象的异质性,使得研究对象的代增加研究对象的异质性,使得研究对象的代表性范围扩大。表性范围扩大。7 一项研究首先要具有内部真实性,不具有内一项研究首先要具有内部真实性,不具有内部真实性的研究,不可能具有外部真实性,部真实性的研究,不可能具有外部真实性,内部内部真实性是外部真实性的前提真实性是外部真实性的前提。在实际研究时,需要综合平衡考虑研究对象在实际研究时,需要综合平衡考虑研究对象的的同质性同质性和和异质性异质性问题。问题。8(二)(二)可靠性(可靠性(reliability)定义定义 是反映研究质量的另一个方面,包含两层含义:是反映研究质量的另一个
5、方面,包含两层含义:一是一是研究结果的可重复性研究结果的可重复性:即不同的研究者,按照:即不同的研究者,按照相同的研究方法和研究条件,研究结果重现的程度。相同的研究方法和研究条件,研究结果重现的程度。二是二是样本含量样本含量要具有要具有一定的重复数一定的重复数。9 要评价一项研究真实性和可靠性的好坏主要要评价一项研究真实性和可靠性的好坏主要反映在反映在研究者对研究中的误差的认识和处理研究者对研究中的误差的认识和处理,也,也就是对研究中出现的随机误差和系统误差的处理就是对研究中出现的随机误差和系统误差的处理和控制。和控制。10 二、二、误差误差 在流行病学研究中由于:在流行病学研究中由于:使用方
6、法不同使用方法不同 测量结果测量结果 存在差异存在差异 使使 与与 (即出现(即出现误差误差)各种因素的影响各种因素的影响 事物的真实情况事物的真实情况 导致错误结论导致错误结论 必须认识、估计和排除各种误差。必须认识、估计和排除各种误差。11 (一)(一)随机误差随机误差定义定义 随机误差随机误差是研究过程一类不恒定的、随机变化的是研究过程一类不恒定的、随机变化的误差。可以细分为两类:误差。可以细分为两类:随机测量误差随机测量误差和和抽样误差抽样误差。由于由于个体差异个体差异的客观存在,抽样研究中的客观存在,抽样研究中抽样误差抽样误差虽然是虽然是不可避免不可避免的,但研究发现抽样误差的分布具
7、有的,但研究发现抽样误差的分布具有一定的规律,可以用统计学的方法对其进行估计和评一定的规律,可以用统计学的方法对其进行估计和评价。价。随机误差无固定方向和固定大小,一般随机误差无固定方向和固定大小,一般呈正态分呈正态分布布。12 随机测量误差随机测量误差可以采用可以采用多次重复测量取平均值多次重复测量取平均值的的方法进行控制。方法进行控制。抽样误差抽样误差可以采用可以采用假设检验假设检验和和区间估计区间估计的方法来的方法来处理。处理。传统的假设检验方法用传统的假设检验方法用P P值大小值大小来估计研究中发生来估计研究中发生假阳性错误的可能性的大小。假阳性错误的可能性的大小。区间估计法采用区间估
8、计法采用可信区间可信区间来显示随机误差的影响。来显示随机误差的影响。13 (二)(二)系统误差(偏倚,系统误差(偏倚,biasbias)定义定义 系统误差系统误差是在实验过程中产生的,表现为是在实验过程中产生的,表现为有系有系统统或或周期性周期性。不像随机误差一样能随着样本量的增。不像随机误差一样能随着样本量的增加而减少,而是要通过采用加而减少,而是要通过采用严密的研究设计严密的研究设计和和严格严格的技术操作规范的技术操作规范加以消除或控制,是另外一种常见加以消除或控制,是另外一种常见的影响研究结果的误差。的影响研究结果的误差。14 偏倚产生的原因:偏倚产生的原因:1.1.研究者或研究对象研究
9、者或研究对象主观原因主观原因造成造成2.2.由某些由某些未知因素未知因素导致导致3.3.研究设计研究设计的缺陷的缺陷4.4.调查方法调查方法不适宜不适宜5.5.操作人员操作人员的技术水平和责任心不强的技术水平和责任心不强 偏倚可以通过:偏倚可以通过:科学的研究设计科学的研究设计 合理地选择研究对象合理地选择研究对象 等手段减少或控制等手段减少或控制 正确应用调查方法正确应用调查方法 准确收集信息准确收集信息15 由于临床科研的研究对象主要是由于临床科研的研究对象主要是人人,不可能像动,不可能像动物实验那样做到两组情况基本相同,再加上物实验那样做到两组情况基本相同,再加上患者有心患者有心理变化、
10、社会环境的差异、失访等情况理变化、社会环境的差异、失访等情况,都可以影响,都可以影响结果的准确性,因此临床研究更容易产生偏倚。结果的准确性,因此临床研究更容易产生偏倚。16 不同类型的流行病学研究方法,可能产生的偏倚不同类型的流行病学研究方法,可能产生的偏倚各有其特殊的来源和种类,一般分三大类:各有其特殊的来源和种类,一般分三大类:选择偏倚选择偏倚主要发生在设计阶段主要发生在设计阶段 信息偏倚信息偏倚主要发生在实施阶段主要发生在实施阶段 混杂偏倚混杂偏倚主要发生在研究设计或资料分析阶段主要发生在研究设计或资料分析阶段 17 第二节第二节 选择偏倚选择偏倚 选择偏倚(选择偏倚(selection
11、 biasselection bias)指选入的研究对指选入的研究对象与未选入者之间,出现了某些特征上的差异,从而象与未选入者之间,出现了某些特征上的差异,从而导致研究结果偏离真实情况。导致研究结果偏离真实情况。研究的设计阶段(主要的)研究的设计阶段(主要的)产生于产生于 资料收集过程中的失访或者是无应答资料收集过程中的失访或者是无应答 病因研究病因研究 常见于常见于 临床防治试验临床防治试验18 常见的选择偏倚常见的选择偏倚:p入院率偏倚入院率偏倚p现患病例现患病例新病例偏倚新病例偏倚p无应答偏倚无应答偏倚p检出症候偏倚检出症候偏倚p志愿者偏倚志愿者偏倚p排除偏倚排除偏倚p时间效应偏倚时间效
12、应偏倚p失访偏倚失访偏倚p健康工人效应偏倚健康工人效应偏倚19 1.入院率偏倚入院率偏倚(admission rate bias)又称伯克森又称伯克森偏倚偏倚(berksons bias)指在利用医院就诊或者住院病人作为研究对象指在利用医院就诊或者住院病人作为研究对象时,由于入院率不同而导致的系统误差。时,由于入院率不同而导致的系统误差。行业性医院、专科医院行业性医院、专科医院只收本行业、本专科病人只收本行业、本专科病人 如如 疾病严重程度不同,就医条件不同疾病严重程度不同,就医条件不同 20例如,某研究者要研究皮肤癌与高血压的关系。例如,某研究者要研究皮肤癌与高血压的关系。表表1 1 社区人
13、群中皮肤癌、外伤和高血压患病的分布情况社区人群中皮肤癌、外伤和高血压患病的分布情况表表1 1中可知皮肤癌与高血压之间并无联系(中可知皮肤癌与高血压之间并无联系(OR=1OR=1)。)。皮肤病皮肤病外伤外伤合计合计有高血压有高血压85858585170170无高血压无高血压325325325325650650合计合计41041041041082082021 如果以社区某所医院为基础收集病例,假设皮肤如果以社区某所医院为基础收集病例,假设皮肤癌、外伤入院率分别为癌、外伤入院率分别为6060和和2525,同时伴有高血压同时伴有高血压者的入院率为者的入院率为4040时,从该社区某医院随机抽取皮肤时,从
14、该社区某医院随机抽取皮肤癌患者和外伤患者进行同一研究时,根据不同的住院癌患者和外伤患者进行同一研究时,根据不同的住院率计算住院的人数:具体见表率计算住院的人数:具体见表2 2。22 表表2 2 某医院皮肤癌、外伤及高血压患者的分布情况某医院皮肤癌、外伤及高血压患者的分布情况 计算皮肤癌与高血压关联强度的计算皮肤癌与高血压关联强度的OROR值值=0.575,=0.575,高血压是皮高血压是皮肤肤 癌的保护因素癌的保护因素(OR1)(OR1),为虚假联系。,为虚假联系。因此,在医院选择研究对象时应防止这种偏倚的产生。因此,在医院选择研究对象时应防止这种偏倚的产生。232.2.现患病例现患病例-新病
15、例偏倚新病例偏倚(prevalence-incidence bias)又称又称奈曼偏倚奈曼偏倚(Neyman bias)在研究中选择现患病例为研究对象时,由于他们在研究中选择现患病例为研究对象时,由于他们与新病例在某些特征或者行为上的差异,而造成研究与新病例在某些特征或者行为上的差异,而造成研究结果的偏倚。结果的偏倚。在病例对照研究和现况研究中的病例,往往选用在病例对照研究和现况研究中的病例,往往选用现患病例为研究对象,而不包括死亡病例和病程短、现患病例为研究对象,而不包括死亡病例和病程短、轻型、不典型病例,造成现患病例与新病例之间存在轻型、不典型病例,造成现患病例与新病例之间存在差异(即报道
16、的患病率低于实际发病率的差异)。差异(即报道的患病率低于实际发病率的差异)。243.3.无应答偏倚无应答偏倚(non-respondent bias)在研究过程中,某些研究对象不按照研究设计的在研究过程中,某些研究对象不按照研究设计的要求对被调查的内容给予回答或不依据研究设计接受要求对被调查的内容给予回答或不依据研究设计接受治疗、对治疗效果、治疗反应等情况不予回答,由于治疗、对治疗效果、治疗反应等情况不予回答,由于这部分人群在这部分人群在身体素质、暴露水平、生活习惯、患病身体素质、暴露水平、生活习惯、患病情况情况等方面可能与应答者不同,由此而产生的偏倚。等方面可能与应答者不同,由此而产生的偏倚
17、。25 判断无应答是否造成偏倚,可根据无应答者在疾判断无应答是否造成偏倚,可根据无应答者在疾病暴露方面的特征与应答者是否有区别来判断,如果病暴露方面的特征与应答者是否有区别来判断,如果两者有差别,则产生了无应答偏倚。两者有差别,则产生了无应答偏倚。无应答偏倚可在各种研究中产生,尤其是对无应答偏倚可在各种研究中产生,尤其是对敏感敏感问题问题的调查中(如询问性病史)。的调查中(如询问性病史)。在研究报告中必须说明应答率,并评价其对结果在研究报告中必须说明应答率,并评价其对结果可能造成的影响。一项研究中可能造成的影响。一项研究中应答率应达到应答率应达到90%90%以上以上,如果应答率很低,需作专项调
18、查,查明原因。如果应答率很低,需作专项调查,查明原因。264.4.检出征候偏倚检出征候偏倚(detection signal bias)征候征候指在疾病和暴露因素之外存在着一个因素,指在疾病和暴露因素之外存在着一个因素,即一种临床症状或体征。该征候不是疾病的危险因素。即一种临床症状或体征。该征候不是疾病的危险因素。某因素如能引起或促进某征候的出现,使患者因某因素如能引起或促进某征候的出现,使患者因此而去就医,提高了该病的检出机会,使人误以为某此而去就医,提高了该病的检出机会,使人误以为某因素与该病有因果联系,这种虚假联系造成的偏倚称因素与该病有因果联系,这种虚假联系造成的偏倚称检出征候偏倚检出
19、征候偏倚。27 如:有人研究子宫内膜癌与服用雌激素有关如:有人研究子宫内膜癌与服用雌激素有关是虚是虚 假联系。假联系。雌激素可以刺激子宫内膜生长,使得子宫容易雌激素可以刺激子宫内膜生长,使得子宫容易出血,正是如此,服用雌激素者比不服用雌激素者出血,正是如此,服用雌激素者比不服用雌激素者可能由于子宫出血而更加频繁地求医,使处于早期可能由于子宫出血而更加频繁地求医,使处于早期的子宫内膜癌患者容易被发现。因此导致子宫内膜的子宫内膜癌患者容易被发现。因此导致子宫内膜癌患者中口服雌激素的比重被人为的加大,从而得癌患者中口服雌激素的比重被人为的加大,从而得出雌激素与子宫内膜癌有关的虚假关联。出雌激素与子宫
20、内膜癌有关的虚假关联。28 在研究设计中为避免检出征候偏倚,应对在研究设计中为避免检出征候偏倚,应对观察对象进入研究的条件加以限制,使病例组观察对象进入研究的条件加以限制,使病例组和对照组间主要的和对照组间主要的非研究因素特征保持一致非研究因素特征保持一致。295.志愿者偏倚志愿者偏倚(volunteer bias)这类偏倚常常出现在实验性研究中。一般志愿者这类偏倚常常出现在实验性研究中。一般志愿者与非志愿者在关心实验的程度、配合实验、关心健康与非志愿者在关心实验的程度、配合实验、关心健康程度以及生活习惯等方面均有差别。若将志愿者选作程度以及生活习惯等方面均有差别。若将志愿者选作观察对象,而非
21、志愿者落选,这样的研究结果大多存观察对象,而非志愿者落选,这样的研究结果大多存在选择偏倚,这种偏倚称为在选择偏倚,这种偏倚称为志愿者偏倚志愿者偏倚。30 6.排除偏倚排除偏倚(exclusive bias)在确定研究对象时,没有按在确定研究对象时,没有按对等对等的原则或的原则或标准自观察组或对照组中排除某些研究对象,标准自观察组或对照组中排除某些研究对象,导致因素与疾病之间联系的错误估计。导致因素与疾病之间联系的错误估计。例如:例如:在研究利血平与乳腺癌关系的病例对照在研究利血平与乳腺癌关系的病例对照研究中,由于高血压患者倾向于服用利血平降研究中,由于高血压患者倾向于服用利血平降压,若病例组和
22、对照组中高血压患者分布不均压,若病例组和对照组中高血压患者分布不均时,就会产生这种偏倚。时,就会产生这种偏倚。317.时间效应偏倚时间效应偏倚(time effect bias)许多疾病,如慢性疾病,从接触暴露因素到发病许多疾病,如慢性疾病,从接触暴露因素到发病需要很长的时间,在这段时间内实际上这些人有暴露需要很长的时间,在这段时间内实际上这些人有暴露史但没有出现临床症状、体征或未能用现有的检查手史但没有出现临床症状、体征或未能用现有的检查手段发现疾病的病人,而常被错误的划入健康组或对照段发现疾病的病人,而常被错误的划入健康组或对照组,所产生的系统误差成为时间效应偏倚。组,所产生的系统误差成为
23、时间效应偏倚。例如:例如:一些遗传性疾病未达到外显年龄时,临床表现一些遗传性疾病未达到外显年龄时,临床表现是正常的,这样的研究对象被纳入健康对照组,常会是正常的,这样的研究对象被纳入健康对照组,常会导致研究结果估计过低。导致研究结果估计过低。32 8.失访偏倚失访偏倚 在研究过程中,某些最初选定的研究对象在研究过程中,某些最初选定的研究对象因为种种原因脱离了观察,研究者无法继续追因为种种原因脱离了观察,研究者无法继续追踪随访到他们,这种现象叫踪随访到他们,这种现象叫失访,失访,由此而产生由此而产生的对研究结果的影响的对研究结果的影响称为失访偏倚。称为失访偏倚。队列研究队列研究由于观察人数较多、
24、观察时间较由于观察人数较多、观察时间较长,长,失访是很难避免的。失访是很难避免的。在开展队列研究时,在开展队列研究时,要尽量减少失访现象,还可以考虑在设计时要尽量减少失访现象,还可以考虑在设计时增增加一定比例的样本量。加一定比例的样本量。339.9.健康工人效应偏倚健康工人效应偏倚(health worker effect)健康工人效应偏倚常见于健康工人效应偏倚常见于职业流行病学研究职业流行病学研究。通常受雇佣的工人比一般人群更健康;有些通常受雇佣的工人比一般人群更健康;有些行业还对雇员的健康有专门的要求。在进行相关行业还对雇员的健康有专门的要求。在进行相关研究时,可能发现职业暴露人群疾病发生
25、的危险研究时,可能发现职业暴露人群疾病发生的危险性低于非暴露人群,这种违背常理的结果实际上性低于非暴露人群,这种违背常理的结果实际上是因为这些健康工人比一般人群更加健康,且对是因为这些健康工人比一般人群更加健康,且对暴露因素的易感性可能要低于一般人群而产生的,暴露因素的易感性可能要低于一般人群而产生的,这就是健康工人效应偏倚。这就是健康工人效应偏倚。34选择偏倚的控制选择偏倚的控制1.1.设计阶段设计阶段(1 1)采用严格科学的研究设计采用严格科学的研究设计 设计方案及研究方法的选择。设计方案及研究方法的选择。从设计之初就要考虑到各个环节可能出现的偏从设计之初就要考虑到各个环节可能出现的偏倚,
26、防止、减少其发生。倚,防止、减少其发生。(2 2)严格限定纳入与排除的标准严格限定纳入与排除的标准 有严格、明确的原则与标准。有严格、明确的原则与标准。病例入选原则病例入选原则35 不患所研究的疾病且有暴露研究因素可能不患所研究的疾病且有暴露研究因素可能 对照入选原则对照入选原则 不患与研究因素有关的其他病不患与研究因素有关的其他病 可比:某些特征与病例组可比等可比:某些特征与病例组可比等2.2.实施阶段实施阶段 严格按照设计计划要求进行,纳入和排除研究对严格按照设计计划要求进行,纳入和排除研究对象的标准在实验组和对照组保持一致,尽量提高应答象的标准在实验组和对照组保持一致,尽量提高应答率。率
27、。36 3.3.分析阶段分析阶段 如无应答率或失访率大于如无应答率或失访率大于10%10%,应对无应答者进行,应对无应答者进行随机抽样调查,与应答者进行比较,估计无应答偏倚随机抽样调查,与应答者进行比较,估计无应答偏倚对结果的影响程度。如果影响程度大,对结论应持慎对结果的影响程度。如果影响程度大,对结论应持慎重态度。重态度。在分析过程中,还可采用适当的统计分析方法,在分析过程中,还可采用适当的统计分析方法,对偏倚进行控制。对危险因素的估计还可用多因素进对偏倚进行控制。对危险因素的估计还可用多因素进行分析。行分析。37 第三节第三节 信息偏倚信息偏倚 信息偏倚信息偏倚(information b
28、ias)又称又称观察偏倚观察偏倚(observation bias)。)。指在研究实施过程中由于收集的指在研究实施过程中由于收集的有关暴露或疾病的信息不有关暴露或疾病的信息不完整、不准确完整、不准确而产生的系统误差。而产生的系统误差。研究对象研究对象 来自来自 研究者研究者 仪器、设备、方法仪器、设备、方法 表现是:表现是:使研究对象的某种特征被错误分类使研究对象的某种特征被错误分类 暴露者错误地认为非暴露者暴露者错误地认为非暴露者 如如 患者错误地认为非患者患者错误地认为非患者38 常见的信息偏倚常见的信息偏倚p回忆偏倚回忆偏倚p报告偏倚报告偏倚p测量偏倚测量偏倚p调查者偏倚调查者偏倚p错分
29、偏倚错分偏倚 391.回忆偏倚回忆偏倚(recall bias)研究对象对以往发生的事情或者经历回忆不准确研究对象对以往发生的事情或者经历回忆不准确或者不完整而造成的系统误差。或者不完整而造成的系统误差。产生的原因产生的原因:1.1.调查的事情过于久远,研究对象已记忆不清。调查的事情过于久远,研究对象已记忆不清。2.2.所调查事件发生频率低或者不太重要,研究对所调查事件发生频率低或者不太重要,研究对象对此印象不深。象对此印象不深。3.3.研究对象对调查事件不关心。研究对象对调查事件不关心。4.4.研究对象来源不同时,提供的信息也可能不同研究对象来源不同时,提供的信息也可能不同 5.5.有些调查
30、是由调查者亲属代为回答有些调查是由调查者亲属代为回答 402.报告偏倚报告偏倚(reporting bias)研究对象有意夸大或缩小某些信息而导致的偏倚。研究对象有意夸大或缩小某些信息而导致的偏倚。常见于常见于敏感问题敏感问题的调查。的调查。3.测量偏倚测量偏倚(measurement bias)由于研究中所用的由于研究中所用的仪器、设备、试剂、方法仪器、设备、试剂、方法和和检检验条件验条件的不标准、不统一或者的不标准、不统一或者研究指标研究指标设计不合理、设计不合理、记录记录不完整、不完整、调查人员的态度调查人员的态度不好或水平不高等原因不好或水平不高等原因造成研究结果偏离真实值的现象成为测
31、量偏倚。造成研究结果偏离真实值的现象成为测量偏倚。414.调查者偏倚调查者偏倚(interviewer bias)由于研究者倾向于发现一些阳性结果,建立或验由于研究者倾向于发现一些阳性结果,建立或验证某些病因关系。因此,在研究中研究者常常尽可能证某些病因关系。因此,在研究中研究者常常尽可能的去发现或诱导研究对象提供所需要的信息,使得调的去发现或诱导研究对象提供所需要的信息,使得调查结果偏离真实情况而产生的误差。查结果偏离真实情况而产生的误差。暴露怀疑偏倚暴露怀疑偏倚 都属于调查者偏倚。都属于调查者偏倚。诊断怀疑偏倚诊断怀疑偏倚 42暴露怀疑偏倚(病例对照研究)暴露怀疑偏倚(病例对照研究)病例组
32、诱导病例组诱导 对对 产生虚假的结论产生虚假的结论 对照组不诱导对照组不诱导诊断怀疑偏倚(队列研究)诊断怀疑偏倚(队列研究)研究者已知研究对象对研究因素的暴露情况,怀研究者已知研究对象对研究因素的暴露情况,怀疑已经患了某病,主观上倾向于应出现某种阳性结果,疑已经患了某病,主观上倾向于应出现某种阳性结果,在作诊断分析时,倾向于自己的判断。在作诊断分析时,倾向于自己的判断。暴露组暴露组细致检查细致检查 对对 使研究结果出现偏差使研究结果出现偏差 非暴露组非暴露组则不然则不然 43 5.错分偏倚错分偏倚(misclassification bias)在暴露测量或疾病的判断测量中,由于测量标准在暴露测
33、量或疾病的判断测量中,由于测量标准和诊断标准不统一,使得暴露或疾病状态的判断出现和诊断标准不统一,使得暴露或疾病状态的判断出现了不同程度的错分而导致的偏倚称为错分偏倚了不同程度的错分而导致的偏倚称为错分偏倚。错分偏倚在病例对照研究或队列研究中都可能发错分偏倚在病例对照研究或队列研究中都可能发生。既可发生在对疾病的判断中,又可发生在对暴露生。既可发生在对疾病的判断中,又可发生在对暴露状态的判断中。状态的判断中。44 错分偏倚错分偏倚 如诊断试验或测定仪器、方法都有一定的灵敏度如诊断试验或测定仪器、方法都有一定的灵敏度和特异度,两者不可能都是和特异度,两者不可能都是100%100%,必然会产生一些
34、假,必然会产生一些假阳性(误诊)、假阴性(漏诊)的错误。这样就会将阳性(误诊)、假阴性(漏诊)的错误。这样就会将本来是病人诊断为非病人而分入健康对照组;把本来本来是病人诊断为非病人而分入健康对照组;把本来不是病人误诊为病人而分入病例组。这就出现了错分不是病人误诊为病人而分入病例组。这就出现了错分现象。现象。45信息偏倚的控制信息偏倚的控制1.研究设计阶段研究设计阶段 统一的调查表、询问、体检、记录等统一的调查表、询问、体检、记录等 包括包括 调查员需经过统一的培训等调查员需经过统一的培训等 2.2.资料收集阶段资料收集阶段 尽可能采用盲法尽可能采用盲法:使信息偏倚减少到最低限度的:使信息偏倚减
35、少到最低限度的重要方法。重要方法。如双盲:研究者与研究对象对分组情况及有关内如双盲:研究者与研究对象对分组情况及有关内容均不知道,可避免报告偏倚和调查者偏倚。容均不知道,可避免报告偏倚和调查者偏倚。46 根据调查所得的资料获得某种信息的灵敏度和特根据调查所得的资料获得某种信息的灵敏度和特异度异度可将含有信息偏倚的资料予以校正。可将含有信息偏倚的资料予以校正。47第四节第四节 混杂偏倚混杂偏倚(一)基本概念(一)基本概念 混杂偏倚混杂偏倚(confounding bias)在流行病学在流行病学研究中,在评价研究因素和疾病之间关联时,由于一研究中,在评价研究因素和疾病之间关联时,由于一个(多个)潜
36、在的混杂因素的影响,从而歪曲(低估个(多个)潜在的混杂因素的影响,从而歪曲(低估或高估)了研究因素与疾病之间的真正联系,称为混或高估)了研究因素与疾病之间的真正联系,称为混杂偏倚。杂偏倚。混杂因素混杂因素(confounding factor)()(混杂因子、混杂因子、外来因素)外来因素)指与研究因素和研究疾病均有关,如指与研究因素和研究疾病均有关,如在比较的人群组中分布不均,可掩盖或夸大因素与疾在比较的人群组中分布不均,可掩盖或夸大因素与疾病之间真正联系的因素病之间真正联系的因素。48 (二)混杂因子的判断(二)混杂因子的判断 混杂因素必须具备混杂因素必须具备三个特征三个特征:1.1.必须与
37、所研究疾病的发生有关,是该疾病的危必须与所研究疾病的发生有关,是该疾病的危险因子之一;险因子之一;2.2.必须与研究因素有关;必须与研究因素有关;3.3.不应是研究因素与研究疾病因果链上的中间变不应是研究因素与研究疾病因果链上的中间变量。量。49混杂偏倚的判断混杂偏倚的判断 是否存在混杂因素及混杂偏倚的方向与程度可通过研究因是否存在混杂因素及混杂偏倚的方向与程度可通过研究因素与研究疾病的效应估计值(素与研究疾病的效应估计值(cRRcRR或或cORcOR)及排除掉该因素的可)及排除掉该因素的可能混杂作用后的效应估计值能混杂作用后的效应估计值 aRRaRR(f f)或)或aORaOR(f f)予以
38、测量。予以测量。值的大小反映的是值的大小反映的是混杂偏倚的大小混杂偏倚的大小 若值若值=0=0,为无混杂;,为无混杂;0 0,为正值,为正混杂偏倚;,为正值,为正混杂偏倚;0 0,为负值,为负混杂偏倚;,为负值,为负混杂偏倚;aRR(f)aRR(f)-cRR混杂偏倚50(三)混杂偏倚的控制(三)混杂偏倚的控制1.1.研究设计阶段研究设计阶段(1 1)限制限制(restriction)是对纳入的研究对象限制在特定的客观标是对纳入的研究对象限制在特定的客观标准范围内,减少彼此间的差异,有利于对观察准范围内,减少彼此间的差异,有利于对观察因素作出正确的结论。因素作出正确的结论。(2 2)匹配匹配(m
39、atching)匹配是要求对照组在某些因素或者特性上匹配是要求对照组在某些因素或者特性上与病例组保持相同,目的是进行两组比较时排与病例组保持相同,目的是进行两组比较时排除匹配因素的干扰,是一种限制手段。除匹配因素的干扰,是一种限制手段。51 缺点缺点:同时也失去了对这一因素进行分析的机会,造成同时也失去了对这一因素进行分析的机会,造成信息丢失,低估暴露对疾病的作用。信息丢失,低估暴露对疾病的作用。研究因素不能作为匹配条件,否则就不能得到研研究因素不能作为匹配条件,否则就不能得到研究因素在比较组的差异,出现这种情况又称为究因素在比较组的差异,出现这种情况又称为匹配过匹配过度度(over-matc
40、hingover-matching)。)。52(3 3)随机化随机化(randomization):):常用于实验性研究常用于实验性研究 指用随机化原则使研究对象以同等的机会被分配指用随机化原则使研究对象以同等的机会被分配到各个处理组中,使潜在的混杂因素和一些主要的非到各个处理组中,使潜在的混杂因素和一些主要的非处理因素在各组间分布均衡。处理因素在各组间分布均衡。简单随机分配简单随机分配 随机分配方法随机分配方法 分层随机分配分层随机分配 53 1.1.资料分析阶段资料分析阶段 (1 1)分层分析分层分析(stratified analysis)将资料按照将资料按照某个或某些需要控制的因素的不
41、同分类进行分层,然某个或某些需要控制的因素的不同分类进行分层,然后估计某暴露因素(研究因素)与某疾病之间的关系后估计某暴露因素(研究因素)与某疾病之间的关系的一种资料分析方法。的一种资料分析方法。54 (2 2)多因素分析多因素分析(multifactorial analysis)要要控制的混杂因素多、样本量的限制或者希望研究多种控制的混杂因素多、样本量的限制或者希望研究多种因素(包括研究因素和混杂因素)对疾病的综合作用因素(包括研究因素和混杂因素)对疾病的综合作用影响时,分层分析就受到了限制,这时可以考虑应用影响时,分层分析就受到了限制,这时可以考虑应用多因素分析。多因素分析。在多因素分析时
42、,研究因素和混杂因素都同等程在多因素分析时,研究因素和混杂因素都同等程度作分析。常用的多元分析方法有:度作分析。常用的多元分析方法有:多元协方差多元协方差 LogisticLogistic回归模型回归模型 CoxCox比例风险模型等比例风险模型等 55 结束语结束语 要保证研究结果真实、可靠,研究者就要正确地要保证研究结果真实、可靠,研究者就要正确地认识和估计研究中可能出现的随机误差和系统误差,认识和估计研究中可能出现的随机误差和系统误差,针对不同的误差采用不同的方法进行识别和控制。在针对不同的误差采用不同的方法进行识别和控制。在研究研究设计、实施、分析阶段都要加强对误差的处理设计、实施、分析
43、阶段都要加强对误差的处理,以保证研究的真实性和可靠性。以保证研究的真实性和可靠性。56 思考题思考题1.1.什么是偏倚?常见的偏倚有哪几大类?什么是偏倚?常见的偏倚有哪几大类?2.常见的选择偏倚包括哪些?常见的选择偏倚包括哪些?3.混杂因素应具备的基本特征?混杂因素应具备的基本特征?4.混杂偏倚如何判断?如何控制?混杂偏倚如何判断?如何控制?57 8年制临床流行病学考试题 请根据你所学的临床流行病学课程中临床流行病学研究设计的基本步骤(研究目的和假设、研究设计类型、研究因素、研究对象、测量指标、资料分析方法和统计方法、结果评价、质量控制等),结合你的研究生课题,设计一份设计书(标书)。要求设计书首页写好自己的姓名、年级、专业、学号,并用纸质打印全部的设计书,于2012年3月15日前交班长,由班长于3月15日(星期四)呈送流行病学教研室。流行病学教研室 2012年2月27日