科研设计中的误差分析课件.ppt

上传人(卖家):晟晟文业 文档编号:4143560 上传时间:2022-11-14 格式:PPT 页数:72 大小:196.55KB
下载 相关 举报
科研设计中的误差分析课件.ppt_第1页
第1页 / 共72页
科研设计中的误差分析课件.ppt_第2页
第2页 / 共72页
科研设计中的误差分析课件.ppt_第3页
第3页 / 共72页
科研设计中的误差分析课件.ppt_第4页
第4页 / 共72页
科研设计中的误差分析课件.ppt_第5页
第5页 / 共72页
点击查看更多>>
资源描述

1、第一节第一节流行病学研究基本思维方法流行病学研究基本思维方法一、研究的外部真实性与内部真实性一、研究的外部真实性与内部真实性1外部真实性:外部真实性:指研究样本的结果和结论可以外指研究样本的结果和结论可以外推到研究的总体人群。遵循随机抽样原则和避免推到研究的总体人群。遵循随机抽样原则和避免产生严重的选择偏倚是保证样本代表性的重要措产生严重的选择偏倚是保证样本代表性的重要措施。施。2内部真实性:内部真实性:指研究样本的结果真实可靠。严指研究样本的结果真实可靠。严格控制和减少测量偏倚和混杂偏倚对结果的影响,格控制和减少测量偏倚和混杂偏倚对结果的影响,保证研究结果真实性的关键。保证研究结果真实性的关

2、键。二、误差与偏倚二、误差与偏倚医学研究中,从研究设计、指标测量、数据医学研究中,从研究设计、指标测量、数据分析到结果推论均可因设计和处理不当而产生各分析到结果推论均可因设计和处理不当而产生各种各样的误差种各样的误差(error),其中因人为因素造成的观,其中因人为因素造成的观察结果偏离真实值则被称为偏倚察结果偏离真实值则被称为偏倚(bias)。2.观察偏倚观察偏倚(observationalbiasorinformationbias)3.混杂偏倚混杂偏倚(confoundingbias)当研究某个暴露因素与某疾病的关联时,由于当研究某个暴露因素与某疾病的关联时,由于研究中存在某些既与疾病有关

3、联,又与所研究暴露研究中存在某些既与疾病有关联,又与所研究暴露因素有联系的外部因素影响,使暴露因素与疾病真因素有联系的外部因素影响,使暴露因素与疾病真实关联性被人为歪曲,这种导致研究结果存在误差实关联性被人为歪曲,这种导致研究结果存在误差的现象叫混杂。这些外部因素称混杂因素,由它们的现象叫混杂。这些外部因素称混杂因素,由它们产生的偏倚称混杂偏倚。产生的偏倚称混杂偏倚。口服避孕药口服避孕药(OC)与心机梗死与心机梗死(MI)病例对照研究病例对照研究(未分层的分析结果未分层的分析结果)-服未服合计-对照-合计-cOR=(39/114)/(24/154)=.20口服避孕药口服避孕药(OC)与心机梗死

4、与心机梗死(MI)病例对照研究病例对照研究(按年龄分层后的结果按年龄分层后的结果)-=40岁 -(+)(-)合计 (+)(-)合计-21 26 47 18 88 106对照 17 59 76 7 95 102-合计 38 85 123 25 183 208-OR12.80OR22.78对照对照:76/178=0.43;MI:47/153=0.31;40岁岁:25/208=0.12三、比较与对照三、比较与对照试验组和对照组间的良好可比性是分析性比试验组和对照组间的良好可比性是分析性比较研究的基础,是保证研究结果内部真实性的关较研究的基础,是保证研究结果内部真实性的关键。键。1可比性:可比性:指比

5、较的各组间在下述方面的一致指比较的各组间在下述方面的一致(1)影响结局产生的非研究)影响结局产生的非研究(外部混杂外部混杂)因素在因素在比较组间分布应相同。比较组间分布应相同。研究研究(暴露暴露)因素因素-结局结局 外部混杂因素外部混杂因素对于观察性研究对于观察性研究:病例对照研究病例组和对照组间,或定群研究暴病例对照研究病例组和对照组间,或定群研究暴露组和非暴露组间的外部因素分布频率应该完全露组和非暴露组间的外部因素分布频率应该完全相同;相同;对于实验研究对于实验研究:临床试验临床试验(或人群干预试验或人群干预试验)中的治疗中的治疗(或干预或干预)组与组与对照组间外部因素的分布频率应该完全相

6、同。对照组间外部因素的分布频率应该完全相同。(2)研究指标定义在任何研究时点、任何研究参研究指标定义在任何研究时点、任何研究参加单位或研究者均应该采用相同的指标定义,如病例加单位或研究者均应该采用相同的指标定义,如病例诊断标准等。诊断标准等。(3)组间采用的实验室检测方法应该相同。组间采用的实验室检测方法应该相同。(4)组间资料收集方法应该相同。组间资料收集方法应该相同。2统计学推断:统计学推断:以拒绝无效假设和接受备择假设作以拒绝无效假设和接受备择假设作为判断比较组间有无差异的根据。此外,比较两组为判断比较组间有无差异的根据。此外,比较两组95%可信限区间也是精确估计真实差异的重要方法。可信

7、限区间也是精确估计真实差异的重要方法。四、因果推论四、因果推论现场观察研究和临床试验或现场实验研究所现场观察研究和临床试验或现场实验研究所获得的因素与结局之间的关联,究竟是表面上的获得的因素与结局之间的关联,究竟是表面上的虚假联系还是本质上的因果关系,必须经过因果虚假联系还是本质上的因果关系,必须经过因果推论的论证。推论的论证。1.首先确定研究结果有无偏倚的影响:首先确定研究结果有无偏倚的影响:存在严重偏倚的研究资料不宜用来进行统计存在严重偏倚的研究资料不宜用来进行统计学检验,不能用来确立因果关系。学检验,不能用来确立因果关系。2.确定因素与结局是否存在统计学上的关联:确定因素与结局是否存在统

8、计学上的关联:关联性研究获得的结果可做三种解释:关联性研究获得的结果可做三种解释:(1)真实的效应;)真实的效应;(2)机遇)机遇(随机误差随机误差)所致;所致;(3)由偏倚所致。)由偏倚所致。统计学检验:统计学检验:帮助研究者了解该帮助研究者了解该OR、RR或或RD值由机遇所致的值由机遇所致的概率概率(P值值)P 0.05或或P 0.01:所获样本的所获样本的OR、RR或或RD值是因机遇而非暴露因值是因机遇而非暴露因素所致的可能性素所致的可能性 5%或或 1%;P0.05:无论是观察性研究还是实验性研究所获的结果,如无论是观察性研究还是实验性研究所获的结果,如经统计学检验无显着意义时,不能由

9、此便下结论认经统计学检验无显着意义时,不能由此便下结论认为因素和结局之间没有本质的关联或药物无疗效,为因素和结局之间没有本质的关联或药物无疗效,可能还有样本数量是否足够大的问题需要考虑。可能还有样本数量是否足够大的问题需要考虑。3.按判断因果关系的原则确定研究结果的因果性质:按判断因果关系的原则确定研究结果的因果性质:任何一项观察性研究或实验性研究所获结果,任何一项观察性研究或实验性研究所获结果,若要下因果关系的结论,除要保证研究结果不存在若要下因果关系的结论,除要保证研究结果不存在任何偏倚的影响和经统计学检验证实存在统计学显任何偏倚的影响和经统计学检验证实存在统计学显著意义外,还必须按严格的

10、判断因果关系的下述法著意义外,还必须按严格的判断因果关系的下述法则进行逻辑关系的检验:则进行逻辑关系的检验:原因和结局的时间顺续原因和结局的时间顺续(temporality)剂量反应关系剂量反应关系(doseresponserelationship)联系的强度联系的强度(strength)一致性一致性(consistency)合理性合理性(plausibility)实验证据实验证据(experimentevidence)在有了严格的临床设计并实施后,会得到许多研究所需要的信息,如何运用概率论和数理统计的原理和方法来分析医学信息就是医学统计学的任务了。统计学是描述、归纳、探索数据分布规律、解释数

11、据的科学和艺术,也是研究人员合理地、灵活地运用统计学原理和方法,充分提取试验信息,深入揭示研究事物客观规律的一种手段。二、二、统计学的内容统计学的内容1 统计研究设计2 统计资料的收集、整理、描述和表达3 统计分析方法的选择4 统计结果的解释统统计计研研究究设设计计 实验性研究(有干预)实验性研究(有干预):优点:能够较好地控制非处理因素(即混杂因素)的影响,避免人为造成的偏倚,使要比较的组之间具有均衡性和可比性。缺点:如果样本量小时,不能保证非处理因素(即混杂因素)在组间有较好的均衡性和可比性。对实验因素作有计划安排:以人为受试对象的称谓 临床试验设计临床试验设计 以动物为实验对象的称谓 实

12、验设计实验设计 观察性研究(无干预)观察性研究(无干预)属于调查设计调查设计。实验设计的三要素:实验因素 实验单位 实验效应 实验设计的四个基本原则:随机 对照 重复 盲法 实验设计类型实验设计类型:随机对照试验随机对照试验(randomizedcontroltrail,RCT)交叉试验交叉试验(cross-overdesign)队列研究队列研究(cohortstudy)病例病例对照研究(对照研究(casecontrolstudy)三、统计学方法实验设计 资料收集整理 统计分析 参数估计(点估计、区间估计)假设检验:样本均数差数间的显著性检验 样本率的差数间的显著性检验 变量间的回归和相关问题

13、四、应用中的错误-1.实验设计 1、随机化概念不清 某文报道“120例肩周炎不同疗法的对比研究”中明确交代病人的分组方法,即“根据病情和就诊先后顺序分组,每组40人”。对差错的分析:这里显然忽视了受试对象的分组应遵守“随机化原则”的要求。因为随机化是削弱或消除非试验因素对试验结果干扰和影响的重要措施之一。病人就诊的先后顺序,往往暗示其病情不同,尤其是当病人的病情轻重难以判断时,若将先来就诊者分为一组,后来就诊的分为另一组,则不可避免地引入顺序误差,从而得出错误的结论。2、假对照 某人在研究某药物的治疗铅中毒的驱铅效果时,涉及如下试验,30名铅中毒工人脱离现场后住院治疗的结果 观测指标 治疗前

14、治疗后 血铅(mg/L)0.181 0.029 0.073 0.019*尿铅(mg/L)0.116 0.009 0.087 0.010*与治疗前比 p0.01 结论:此药有明显的驱铅作用。对错误地分析:本研究试图利用前后对照来说明此药的驱铅效果,统计分析的结果清楚的显示两组之间的差别具有非常显著性。但不能说明此药具有驱铅作用,因为脱离现场后即使不治疗亦有尿铅排出,实际上此研究成了具有“假对照”的研究。正确的设计:如果仅有一种治疗方法需要考察其疗效,就必须有不给于任何治疗的空白对照组。如果患者都必须接受某种治疗,就必须具有两种或两种以上的不同治疗方法。3、对照不全 研究者为研究ADI药物预防肠道

15、传染病的效果,设计如下试验:在甲幼儿园随机抽取大、中、小班儿童各50名组成试验组,服用ADI 药物(剂量按年龄、体重严格计算);在乙幼儿园随机抽取大、中、小班儿童各50名组成对照组,不服用ADI 药物。但两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的。结果发现:甲幼儿园150名儿童肠道传染病的发病率明显低于乙幼儿园150名儿童肠道传染病的发病率(P0.001)。于是,研究者得出结论:ADI药物有预防肠道传染病的作用。对错误地分析:本研究试图利用两个幼儿园并随机设立对照来说明ADI药物有预防肠道传染病的作用。但设计出现了问题,即使两个幼儿园参加此项试验的儿童的饮食、作息时

16、间和体育活动情况是完全相同的,但还有一些目前不了解的影响因素,因此,目前的设计不能得出作者的结论。正确的设计:在甲、乙幼儿园分别随机抽取大、中、小班儿童各50名,然后按随机的原则,每个儿童均有相同的机会被分配到对照组或实验组,这样在每个幼儿园的每个班,均有对照组和实验组,已达到均衡可比。4、组间均衡性差 在研究耐力训练与提高战士体质的关系时,设计了如下的实验:以血乳酸为主要观察指标,用20名连队的战士按训练方案进行耐力训练,以机关同龄的20名战士为对照,对照组进行日常活动,观察经4周训练后,两组战士进行一定量的运动时血乳酸的变化。两组战士训练前后血乳酸两组战士训练前后血乳酸(mg/L)的观测结

17、果的观测结果 组 别 训练前 训练后 训练组 38.2 3.5 33.1 3.1*对照组 40.0 4.0 38.9 3.5 *与训练前比 p0.01;与对照组比 p0.05 0.051.标准差大于均数 2.资料不符合正态分布3.方差不满足齐性要求 2、错误使用 t 检验 胃癌或巨型胃溃疡13人,在实行全胃切除术前后的体重(kg)如下:试比较手术前后体重有无变化?术前 42.5 48.0 39.0 46.0 58.5 47.5 39.0 58.0 51.0 43.0 38.0 50.0 57.5 术后 52.0 51.5 45.0 52.5 49.0 55.0 52.0 52.0 50.5 5

18、0.0 41.0 51.5 72.2 本题目经 t 检验,得到 t=1.536 p=0.138,于是得到手术前后体重无显著性变化的结论。对错误的分析:本项目本身用的设计是自身治疗前后的两次测定,用选用配对 t 检验的方法。Group Statistics N Mean S.D S.E 术前 1347.5385 7.2585 2.0131 术后 1351.8615 7.0875 1.9657 而错误的选用独立样本检验时加大了误差,计算 t=1.536 p=0.138,使本来差异有显著性的变为无显著性。按配对设计进行的检验结果Paired Samples Statistics N MeanStd.

19、Deviation Std.Error Mean Pair 1 疗前13 47.5385 7.2585 2.0131 疗后13 51.8615 7.0875 1.9657Paired DifferencesMean Std.Deviation Std.Error Mean t Sig.(2-tailed)-4.3231 6.8671 1.904 -2.27 0.042统计结果:p0.05 手术前后体重有显著性变化,术后体重增加。3、t 检验代替方差分析测量三组人的舒张压(mmHg),数据如下:A 组 B 组 C 组1351301381261401391361321401321381411351

20、38142136138140139141138133140137140142136141143145NMean Std.DeviationStd.Error10135.3 4.37 1.3810138.2 4.18 1.3210139.6 2.63 .83ANOVASBP96.200248.1003.312.052392.1002714.522488.30029Between GroupsWithin GroupsTotalSum of SquaresdfMean SquareFSig.组别 t p 1-2 1.515 0.147 1-3 2.664 0.016 2-3 0.895 0.382

21、 SBPStudent-N ew m an-K eulsa10135.300010138.2000138.200010139.6000.100.419分 组123Sig.N12Subset for alpha=.05M eans for groups in hom ogeneous subsets are displayed.Uses Harm onic M ean Sam ple Size=10.000.a.t检验与方差分析的比较检验与方差分析的比较 比较的内容 t 检验 方差分析加q检验 资料的利用率 低:每次仅用两组 高:每次要用全部数据 对原试验设计的影响 残:割裂了整体设计 全:与原

22、试验设计呼应 犯假阳性错误的概率 大:1-(1-0.05)n 小:=0.05 结论的可靠性 低:统计量的自由度小 高:统计量的自由度大 df=n1+n2-2 组内误差的自由度 4、重复测定数据的处理 重复测量资料系指同一受试对象的某项观测指标进行多次测量所得的数据。这类数据间往往有相关性存在,违背了方差分析要求数据满足独立性的基本条件。此时若用一般方差分析方法,将会增大犯I类错误的概率。单因素重复测量资料的方差分析 1、方差分析方法同随机区组资料的方差分析。2、两两比较时可进行两组资料之间的配对t检验,但检验水准需进行转换,=/k,k 是进行两两比较的次数 两种不同剂型在血中的浓度(g/ml)

23、剂型 受试者 服药后测定时间(j)(i)K 1h 2h 4h 6h 8h 1 胶 2 囊 3组 .I=1 8片 1剂 2组 3I=2 .8 方差分析表 变异来源 离均差平方和 自由度 F p组间(剂型)2635.81 1 4.03 0.0645组内(时间)41880.79 4 50.77 0.0001 剂型 时间 951.19 4 1.15 0.3413(剂型)对象 9163.55 14误差 11548.64 56合计 66179.98 79 经过调整系数统计学推断:不同剂型药物的血液浓度间的差别无统计学意义,不同时间的血药浓度间的差别有统计学意义,剂量与时间之间无明显的交互作用。应用中的错误

24、 4.相关和回归的应用 研究在专业上有一定联系的两个定量变量之间呈直线关研究在专业上有一定联系的两个定量变量之间呈直线关系的密切程度和方向的统计分析方法称为直线相关分析。系的密切程度和方向的统计分析方法称为直线相关分析。相关分析:1、计算相关系数 r 2、对相关系数进行检验 3、结合专业知识,评价此相关方法是否有临床实用价值 4、计数资料用Spearman秩相关 研究在专业上有一定联系的两个定量变量中一个变量随另研究在专业上有一定联系的两个定量变量中一个变量随另一个变量变化的依赖关系的统计分析方法称为直线回归分析。一个变量变化的依赖关系的统计分析方法称为直线回归分析。依据自变量的个数回归分类为

25、:自变量仅有一个时为一元回归分析 自变量有多个时为多元回归分析 若自变量个数相同,但同时考察有联系的多个应变 量时,称为多重回归分析。为研究小鼠S78-3 肉瘤体积Y(cm3)随时间X(日)增长规律,将以下数据回归分析,所得结果如下:时间(日)0 6 9 11 13 15 17 19 21 23 25 27 29 31肉瘤体积 0.0042 0.0308 0.0614 0.0744 0.1028 0.1516 0.2101(cm3)0.3390 0.5201 0.7623 1.1020 1.5690 2.0214 2.7661 Y=-0.7178+0.00803 x t=-2.527 p=0.

26、027 r=0.849 X403020100-10Y3.02.52.01.51.0.50.0-.5若按因变量的性质分类为:若按因变量的性质分类为:因变量为连续性变量时因变量为连续性变量时 为非时间的连续性变量(如:身高、体重、血压、胆固醇含量等),可用一元、多元回归分析,可直线化的曲线回归分析等。为时间变量(如:患者治疗后的生存时间、复发时间等等),需要运用生存分析中的回归分析方法,如COX半参数回归分析或特定的参数回归模型进行分析。为随时间变化的连续型随机变量(如:某种流行病的发病率等),则通常运用时间序列分析。因变量为离散性变量时因变量为离散性变量时 为二值变量(如:患者经过治疗后在规定的

27、一段时间内存活情况,常分为“生存”、“死亡”两种情况,患者经过治疗后在规定的一段时间内复发情况,常分为“复发”、“未复发”两种情况,等等)此时,若自变量多为连续性变量,可考虑选用多元逐步Logistic回归分析;若自变量多为定性变量,可考虑选用有序变量的多元逐步Logistic回归分析。为多值有序变量(如:患者经过治疗后的疗效,分为治愈、显效、好转、无效、死亡;糖尿病患者经过一段时间治疗后血糖的测定结果可分为、,等等)此时可用有序变量的多元逐步Logistic回归分析。多变量分析多变量分析 logistic 回归已成为现代流行病学危险因素研究的首选方法。在病因和发病因素的研究中,危险因素和疾病

28、的关系是非常复杂的,各种危险因素之间可以相互影响,它们对结果的影响大小也不同。logistic 回归能在复杂关系中平衡多种混杂因素的作用,进一步筛选出主要的危险因素,及其在决定病因和发病因素中的相对比重。为多值名义变量为多值名义变量(如研究者关心的结果变量为血型,分为O、A、B、AB型,等等)此时 若自变量为定性变量,多用对数线性模型。若自变量为连续变量,可用多项logit模型回归分析 应用中的错误 5.样本含量的估算样本含量估计充分反映科研设计中“重复”的原则,过大过小都有些弊端。样本量过大导致浪费(人力、时间、物力)、引入更多混杂因素,对研究结果造成不良影响。样本量过小,导致检验效能过低,

29、出现“假阴性”结果。样本含量(sample size)是临床科学研究中一个非常重要的组成部分。选择样本含量不当 某研究者为了证明 A(HP-1000型超声诊断仪)和 B(研究者自制的成像系统)两台仪器测定的结果无差别,作了如下实验设计:选择一个健康人作为受试对象,用A、B两台仪器前后两次(间隔1个月)对此人分别重复测定4次。观测定量指标分别为:二尖瓣前叶EC幅度、左室右壁运动幅度、R-R间期。数据处理方法:每个指标下有4个数据,对其进行方差齐性检验,然后作了配对 t 检验,结果为p值均大于0.10,结论为两台仪器的测定结果无差别,可用自制的成像系统取代费用很高的同类进口仪器。对差错的分析:样本量太少,实际临床应用中每台仪器每天要测定多个受试着,由于不同受试者之间存在很大的个体差异,两台仪器对某一个人的测定结果之间无差别,并不能推出在多数人身上测定的结果之间的差别也一定无显著性。正确的设计:本研究涉及3个因素:实验因素仪器,两个区组因素测定时间和受试对象。应选用交叉设计安排实验(若变异较小n=6或n=8即可)。交叉实验设计格式受试对 实验因素的水平编号及观测指标(单位)象编号 实验顺序 I II 1 A()B()2 B()A()3 B()A()4 A()B().

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(科研设计中的误差分析课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|