1、研究设计与文献评阅要点赵耐青复旦大学生物统计教研室评阅关注点l正确理解研究题目l确定该研究是干预性研究还是观察性研究l考察研究对象是否符合研究要求l考察评价指标是否能回答研究所针对的问题l考察可能的混杂偏倚,测量偏倚和选择性偏倚l考察样本量是否足够l结论得到本研究结果的支持论文题目的解读l论文题目:由题目可以基本了解研究的目的l如果研究目的与题目有较大差异,说明研究者不太了解研究目的与研究内容的关系,也没有对研究有整体的掌控。l例如:研究Treg细胞对肿瘤的发生和发展的关联性。研究肿瘤的影响因素l 肿瘤的发生是指肿瘤发病,这类研究一般可以用病例对照研究或队列研究。通过比较发病的对象与没有发病的
2、对象的Treg细胞水平,评价Treg细胞与发病之间的关联性。l 肿瘤的发展是指肿瘤患者的预后,这类研究人群均是肿瘤患者,通过观察不同生存期与Treg细胞水平,评价Treg细胞与发病之间的关联性。l肿瘤发生与发展是完全两回事。观察性研究l 横断面研究l 诊断试验l 比较性研究(Comparative Study)通常是指观察性研究 病例对照研究 队列研究 回顾性队列研究 前瞻性队列研究横断面调查研究横断面研究l 优点:简单,效率高,可以得到多个疾病的患病率估计,各个观察变量之间的关联性结果。l 缺点:患病率很低的情况下,需要很大的样本量,所以在这种情况下不太合适;不能估计发病率。不能得到因果关系
3、的推断。l 关注点:抽样的代表性,抽样框架是否具有代表性,抽样的响应率不能低于70%,要考虑户籍人群,常住人群和流动人口的人群。要根据研究问题,选择合适的抽样人群。l 根据主要的研究问题,收集合适的观察指标。横断面研究的样本量估计l 横断面研究的主要研究问题是估计患病率。l 根据患病率的95%可信区间公式:l 患病率的估计精度:可信区间的宽度的一半为(又称为容许误差:l 研究者根据研究的要求给出容许误差w和预估的患病率P,则样本量估计为(1)1.96PPPn(1)1.96PPwn221.96(1)PPnw病例对照研究病例对照研究的优缺点l 优点:回顾性研究,效率比较高,患病率很低的情况下可以用
4、病例对照设计进行研究。l 缺点:不能估计患病率和发病率,容易发生回忆偏倚,选择性偏倚和混杂偏倚。l 关注点:对照的选择是否有选择性偏倚 数据缺失情况 暴露的观察指标取值是否在发病前或者与发病前的情况相同 混杂因素控制情况 样本量是否足够样本量估计l 两个率的比较l 记检验的分辨能力:l第一类错误的概率,第二类错误的概率为(Power=1-),记:l则每组样本量为012:H112:H12 2/200112222(1)(1)(1)ZZn0120.5()样本量估计l 两个率的比较(实际研究是总体率是未知的),通常用文献的结果或预试验的结果估计的。l 例如:研究吸烟与肺癌的关系,采用病例对照研究。文献
5、报告:病例组的吸烟率为0.4,对照组的吸烟率为0.2,则l=0.05,=0.2(即:Power=1-0.2=0.8),l ,则每组样本量为00.40.20.2,0.5(0.40.2)0.3p 0.05/20.21.96,0.84ZZ干预性研究设计二、实验设计v实验性研究的三个基本要素v实验设计的三个基本原则v样本大小的估计v常见的实验性研究设计类型实验研究的三个基本要素 研究因素(处理因素)受试对象(研究对象)实验效应(研究观察指标)研究因素(处理因素)在实验性研究中,研究因素就是干预措施,亦称处理措施。例如:为了研究某中药治疗过敏性鼻炎的疗效。收治200名过敏性鼻炎的患者,随机分成两组:试验
6、组和对照组。并采用双盲研究。试验组服用该中药,对照组服用安慰剂,通过一个疗程的资料,评价两组对象的过敏性鼻炎症状评分的差异。受试对象(研究对象)受试对象(研究对象)研究对象可以是人,也可以是动物或细胞等。受试对象选择一般要考虑干预措施的承受程度,是否有临床意义。一般要制定入选标准和排除标准在动物研究对象时,往往要制作患某种疾病的动物模型,动物模型存在是否找某成功,如果评价造模是否成功的问题。实验效应(观察指标)实验效应(观察指标)实验效应是研究因素作用于受试对象的客观反应与结果,通过观察指标来表达;指标能反映原始研究问题的。指标可以分为客观指标和主观指标,一般而言,尽可能选用客观指标。指标能够
7、较好反映研究因素对观察指标的反应指标至少要满足必要的精确性和正确性。二、实验设计的三个基本原则重复原则重复原则随机化原则随机化原则对照原则对照原则实验设计的三个基本原则 重复原则重复原则 对照原则对照原则 随机化原则随机化原则 对照原则(一)对照的意义对照的意义 没有对照,没有比较,没有鉴别;设立合理的对照没有对照,没有比较,没有鉴别;设立合理的对照组组 1 1、鉴别处理因素与非处理因素的作用、鉴别处理因素与非处理因素的作用 2 2、控制和减少试验误差、控制和减少试验误差 3 3、对比作用与实验条件监控作用、对比作用与实验条件监控作用 合理对照的原则合理对照的原则:各组例数相等:各组例数相等
8、各组间均衡可比各组间均衡可比 组间均衡性(齐同可比性组间均衡性(齐同可比性)1 1、什么叫组间均衡性、什么叫组间均衡性对照原则(二)组间均衡性组间均衡性:比较各组间除研究因素外,对试验有影响的非研究因素和试验条件均应相同或相近。2、在研究设计和试验过程中应从下列四个方面考虑组间均衡性:(1)研究对象性质相同 (2)试验条件要一致 实验环境 仪器 试剂 (3)研究者或操作者要一致 交叉 随机分配对照原则(三)(4)(4)时间或试验次序要一致时间或试验次序要一致 同时交叉进行同时交叉进行 3 3、实现均衡可比的手段或方法:、实现均衡可比的手段或方法:(1)(1)随机化随机化 研究对象、操作者、试验
9、次序研究对象、操作者、试验次序 要随机分配要随机分配 (2)(2)配对与分层配对与分层 配对、配伍组设计、分层随机配对、配伍组设计、分层随机 (3)(3)双盲双盲 盲法的意义和概念盲法的意义和概念 单盲单盲 双盲双盲 安慰剂安慰剂 揭盲揭盲 (4)(4)交叉均衡交叉均衡对照原则(四)4、组间均衡性测定(检验)组间均衡性测定(检验)是指在获得资料后通过主要非处理因素(混杂因素)进行组间假设检验以考察各比较组间的均衡可比性。均衡性检验方法:首先要考察样本例数,再对各项混杂因素在组间分布或构成进行检验,数值变量既要检验平均水平又要检验离散趋势,分类资料检验其构成。对照原则(五)不均衡的处理:应用多因
10、素统计方法对不均衡因素进行调整基础上再进行组间比较。(混杂因素两段调整)例:在对某滴眼液治疗角膜炎的在对某滴眼液治疗角膜炎的期临床试验中需对期临床试验中需对“就诊时已发病天数就诊时已发病天数”进行均衡性检验。进行均衡性检验。试验组试验组 对照组对照组 P P值值 均均 数数 3.77 6.70 0.053.77 6.70 0.05 标准差标准差 5.67 57.66 0.015.67 57.66 0.01对照原则(六):对照种类对照种类 空白对照空白对照 对照组不施加任何处理措施对照组不施加任何处理措施 标准对照标准对照 公认有效的药物、现有的标准方法或常规方法公认有效的药物、现有的标准方法或
11、常规方法 相互对照相互对照 各比较组互为对照各比较组互为对照 实验对照实验对照 在对实验组实施处理因素时必须伴随一个对试验有影响的在对实验组实施处理因素时必须伴随一个对试验有影响的因素,此因素称为实验因素,对照组必须施加实验因素。举例说明因素,此因素称为实验因素,对照组必须施加实验因素。举例说明对照原则(七):对照种类对照种类 自身对照自身对照 对照与实验措施在同一实验对象身上实施对照与实验措施在同一实验对象身上实施 安慰剂对照安慰剂对照 对照组施加安慰剂对照组施加安慰剂 阳性对照阳性对照 采用已肯定疗效的药物为对照,如标准对照、弱阳性对照采用已肯定疗效的药物为对照,如标准对照、弱阳性对照 阴
12、性对照阴性对照 不含研究中处理因素的对照,如空白对照、安慰剂对照、不含研究中处理因素的对照,如空白对照、安慰剂对照、(实验对照)(实验对照)历史对照历史对照 不能实验研究中的对照不能实验研究中的对照 随机化原则u保证各组间均衡可比的重要手段保证各组间均衡可比的重要手段u在实验研究中,研究对象有同等的可能被分到比较各组中去在实验研究中,研究对象有同等的可能被分到比较各组中去u在调查研究中,总体中每个个体有同等的可能被抽到样本中来在调查研究中,总体中每个个体有同等的可能被抽到样本中来u随机数字表、随机排列表和计算机产生的随机数随机数字表、随机排列表和计算机产生的随机数重复原则(样本含量)意义意义
13、样本含量少,抽样误差大,样本含量大,非抽样误差也可能大;样本含量少,抽样误差大,样本含量大,非抽样误差也可能大;组间均衡性、实验结果的可靠性和重现性;组间均衡性、实验结果的可靠性和重现性;概念概念 保证研究结论具有一定可靠性的前提条件下,所确定的最少样保证研究结论具有一定可靠性的前提条件下,所确定的最少样本含量;本含量;考虑因素考虑因素应用范围与人力、物力和财力;应用范围与人力、物力和财力;方法方法 查表法或计算法查表法或计算法前提条件前提条件 允许误差、允许误差、总体变异、资料类型与设计类型。、总体变异、资料类型与设计类型。第三节 样本大小的估计样本大小估计的前提条件(决定参数)样本大小估计
14、的前提条件(决定参数)允许误差:研究者提出的希望发现或允许控制的样本与总体或两样本间差别大小;如=|X1-X2|,=|X-|,=|p-|;和 大小已知或单双侧、设计类型、指标类型样本大小的估计方法对于两个率的比较,与观察性研究的病例对照设计的样本量估计相同对于两个均数的比较:其中例如:文献查阅:22/222()ZZn12 1212110,105,6,5XXSS2222(1.960.84)6235n120.05,0.2,max(,),1101055SS S 常见研究设计类型(1)完全随机设计(最常用)配对设计(最常用)配伍组设计(最常用)交叉试验设计 析因试验设计 正交试验设计完全随机试验设计(
15、1)1 1、设计方法、设计方法 确定研究因素与水平确定研究因素与水平(单因素两组或多单因素两组或多 组)组)确定研究对象(入选与排除标准)确定研究对象(入选与排除标准)将研究对象随机分到各组,或从不同将研究对象随机分到各组,或从不同 的总体中随机抽取样本进行比较的总体中随机抽取样本进行比较 试验或测定试验或测定完全随机试验设计(2)2 2、随机化分组、随机化分组3 3、优缺点:、优缺点:(1)(1)设计与分析简单设计与分析简单,易于实施;易于实施;(2)(2)只能安排单因素;只能安排单因素;(3)(3)随机误差相对较大;随机误差相对较大;(4)(4)个体变异较大,有些混杂因素难以控制或需要探索
16、时,可采用分层个体变异较大,有些混杂因素难以控制或需要探索时,可采用分层随机设计随机设计完全随机试验设计(3)v完全随机化分组 例:试将18个病人随机分成3组:1)编号;2)产生随机数,3)按随机数排队,最小的6个随机数对应为第一组,其次为第二组,最大的6个随机数对应为第3组。完全随机试验设计(4)预选对象预选对象实验组实验组对照组对照组随机化随机化受受 试试 者者按按纳纳入入标标准准完全随机试验设计(5)实验组实验组对照组对照组实验组实验组实验组实验组第一层第一层第二层第二层受试者受试者预选对象预选对象按按纳纳入入标标准准按特征分层按特征分层随机化随机化随机化随机化完全随机设计的关注点l 随
17、机是否做好,是否双盲,特别主观性评价指标而言,双盲是需要的。l 对照处理设置是否合理,能否反映研究目标l 观察指标是否合理l 干预强度如何?l 干预持续时间有多长?l 有多少对象脱落(失访),脱落是否与评价指标独立l 干预的依从性如何?l 干预的伴随处理和不良事件配对试验设计(1)1 1、设计方法、设计方法 确定一个因素和两个水平确定一个因素和两个水平(实验组与对实验组与对 照组)照组)确定研究对象和配对条件,将对象按配对条件确定研究对象和配对条件,将对象按配对条件相同的原则配成对子相同的原则配成对子 随机将每对对象分到两组中去随机将每对对象分到两组中去 一个试验由若干对组成一个试验由若干对组
18、成(5)(5)配对条件配对条件 :主要非处理因素(研究对象的特征、:主要非处理因素(研究对象的特征、实验环境或条件),动物试验中条件可严些,临实验环境或条件),动物试验中条件可严些,临床上条件不可过多床上条件不可过多配对试验设计(2)(6)(6)配对设计变型配对设计变型 治疗前后的比较,同一批治疗前后的比较,同一批标本分别用两种方法检测,同一批病人分标本分别用两种方法检测,同一批病人分别用两种方法诊断,局部试验中人体左右别用两种方法诊断,局部试验中人体左右侧的对比;侧的对比;2 2、随机分组、随机分组 3 3、优缺点、优缺点 (1)(1)组间可比性好,节省样本大小,组间可比性好,节省样本大小,
19、试验效率高;试验效率高;(2)(2)对研究对象有一定的要求,临床上有一定对研究对象有一定的要求,临床上有一定难度,并且代表性差难度,并且代表性差。随机区组(配伍组)设计(1)1 1、设计方法、设计方法 (1)确定研究因素和水平(多个处理组);(2)确定研究对象和匹配条件,将研究对象按匹配条件一致的原则配成区组(配伍组);(3)每一区组内的个体随机分到各处理组;(4)一个试验由若干个区组组成。随机区组(配伍组)设计(2)(5)区组的定义:实验条件相同,实验对象性质相近的组称为区组(配伍组)。(6)随机区组设计的三个条件:a 一个试验由若干个区组组成 b 区组内研究对象的个数等于处理组数 c 区组
20、内对象随机分到各处理组(7)随机区组设计的变型:治疗前后不同时间的比较,同一批样品不同方法或不同实验室检测进行比较。随机区组(配伍组)设计(3)2 2、随机化分组、随机化分组 (例例)已按动物特征配成已按动物特征配成6 6区组区组,每每个区组个区组4 4个体个体,现进行随机化分组。现进行随机化分组。对每个区分别进行简单随机分组,对应得到随机区对每个区分别进行简单随机分组,对应得到随机区组的随机分组。组的随机分组。随机区组(配伍组)设计(4)3、优缺点 (1)可安排一个因素,也可安排两个因素;(2)误差小、均衡性好、节省样本含量,统计效率高;(3)不能分析交互作用(4)区组内的对象在试验中易发生
21、意外,影响整个试验。医学诊断试验研究设计与评价 问题提出问题提出v医学诊断均需借助一定的检测手段,根据检测医学诊断均需借助一定的检测手段,根据检测结果作出诊断,这类手段称为诊断试验;结果作出诊断,这类手段称为诊断试验;v应用于病因和病源学诊断,疾病病理或功能损应用于病因和病源学诊断,疾病病理或功能损害诊断,疗效或预后判断,药物毒副作用的检害诊断,疗效或预后判断,药物毒副作用的检测,普查或筛查;测,普查或筛查;v寻找或探索新的较好的诊断试验,修正现有的寻找或探索新的较好的诊断试验,修正现有的诊断试验;诊断试验;v怎样进行研究设计?怎样对试验诊断试验结果怎样进行研究设计?怎样对试验诊断试验结果进行
22、分析、评价和比较?进行分析、评价和比较?医学诊断试验研究设计与评价 研究设计研究设计确立金标准 病理学诊断,手术探查 影像学诊断,如造影 公认的诊断标准 长期随访结果 所有研究对象必需经金标准确诊医学诊断试验研究设计与评价 研究设计研究设计研究对象的选择根据研究的诊断试验确定研究对象:包括病例组和对照组;病例组应考虑疾病的分型和分期以及疾病的轻、中、重;对照组为正常人或需鉴别诊断的其他疾病病人;用于筛查的诊断试验,研究对象应注意代表性和抽样比例。应用盲法评价诊断试验医学诊断试验研究设计与评价 评价与统计分析评价与统计分析l 数值变量和有序多分类变量的诊断指标;可用ROC曲线方法;l 对所有变量
23、的诊断指标在诊断或鉴别诊断中的有效性和实用性进行分析评价 如敏感度、特异度等指标;l 不同诊断试验的比较 可用ROC曲线、敏感度、特异度等方法和指标。医学诊断试验研究设计与评价 评价与统计分析评价与统计分析诊断试验评价的资料格式诊断试验评价的资料格式诊断试验评价用的四格表诊断试验评价用的四格表 某诊断试验某诊断试验 金标准金标准 合计合计 有病有病 无病无病 阳性阳性 a(a(真阳性)真阳性)b(b(假阳性假阳性)a+b)a+b 阴性阴性 c(c(假阴性假阴性)d()d(真阴性真阴性)c+d)c+d 合计合计 a+c b+d Na+c b+d N医学诊断试验研究设计与评价 统计分析方法统计分析
24、方法诊断试验有效性评价指标诊断试验有效性评价指标敏感度=a/(a+c)检出真有病的人能力特异度=d/(b+d)检出真阴性的人能力 假阴性率=c/(a+c)=1-敏感度 漏诊率 假阳性率=b/(b+d)=1-特异度 误诊率诊断试验实用性评价指标诊断试验实用性评价指标诊断试验的联合作用两个或多个诊断试验同时应用;串联:一系列诊断试验均为阳性时,才受试者考虑为阳性(病人),其中有一个试验为阴性时,受试者为阴性(非病人);并联:任一个诊断结果为阳性,考虑受试者为病人,每一个试验均为阴性,才划归为非病人诊断试验的样本量估计l 由于诊断试验主要是估计灵敏度和特异度l 根据研究目的,给出灵敏度和特异度的容许
25、误差(95%可信区间宽度的一半w)221.96(1)sesenw221.96(1)spspnw举例说明概念混淆影响研究设计肿瘤研究设计中的误区l 对于研究肿瘤的易感性因素,病例组应该为肿瘤患者,对照组应该是“正常人”,研究因素的资料原则上是肿瘤患者在发病前的资料l 对于研究肿瘤的预后因素,则研究对象均为肿瘤患者,只是不同干预方案或某些基因的不同表达对预后的影响肿瘤研究设计中的误区:对照l 肿瘤比较性的观察性研究中,往往需要确定不同的对照l 如果对照组选择癌旁组织,病例组选择癌组织,则病例组与对照组的基因表达差异不能反映易感性问题,一般用于肿瘤的诊断基因,特殊情况下,差异基因也可以成为预后评价的
26、标记物肿瘤研究设计中的误区:对照l 为了寻找易感基因,则采用病例对照研究,比较理想的方法是采用巢式病例对照研究,这是比较完备的设计l 如果采用一般的病例对照研究,测量基因的样品为患肿瘤后的血样,病例组为肿瘤患者,对照组为健康人,则基因表达的差异可能是易感性所致,也可能是肿瘤发病所致(诊断基因)混杂因素对结果影响的示意图消除混杂效应的关键是在研究设计时使混杂因素与研究因素无关联结果研究因素混杂因素混杂效应控制的举例肥胖与DM的关系中也含有年龄效应如果肥胖与正常体重之间的平均年龄是相同的,则肥胖对DM的效应中不含有年龄效应DM或健康肥胖或正常年龄临床诊断试验的误区l 临床诊断试验:研究诊断某个疾病的标志物,注意:临床诊断试验不是比较性研究l 有两组研究对象:病例组为患某个疾病的对象,非病例组(不能称为对照组)为需要接受检查对象中未患这个疾病的对象l 不能用正常人,更不能用健康人,否则研究结果的实际应用的特异性会很差Thank You