1、1统计分析统计分析 陈锡明2什么是统计学?统计学是一门关于如何收集、分析、解释和表达数据的科学Websters International Dictionary统计学是研究随机现象规律性的方法学3三类现象n自然界和人类社会活动中,普遍存在三类现象现象确定性现象 在相同的条件下出现相同的结果 或称必然现象 如自由落体随机性现象 在相同的条件下出现不同的结果 但结果是确定的 如掷硬币模糊性现象 在相同的条件下出现不确定的结果 如美人与丑人4不同现象与研究方法研究方法现象现象研究方法研究方法确定性现象经典数学随机性现象概率统计学模糊性现象模糊数学5医学统计学是统计学与医学结合形成的一门学科是统计学在
2、医学中的应用生物统计学是统计与生物医学结合形成的一门学科.6统计学的重要性7据调查,新英格兰医学杂志(New England J.Medical)、美国医学杂志(JAMA)、英国医学杂志(BritishJ.Medical)和Lancet等著名医学杂志发表的文章中,有70%应用了统计学,而且杂志有统计学的常务编审。“统计学是现代医学大厦的一个重要支柱”。-美国医学会杂志(JAMA)主编8医学工作者在从事科研工作时经常要进行统计咨询和统计分析工作一些著名医科大学和医院中,要求硕士和博士毕业论文的开题报告有统计方面的思考和统计学家参加,毕业论文答辩前要求请统计学家进行审阅9国外研究项目中,统计的工作
3、量和资金的投入占总科研的比例为20%至30%。“统计学的地位不仅仅做配角,做装饰,而是顾问、参谋,甚至是决策者。”-胡良平10统计学的基本内容统计学的基本内容试验设计试验设计数据管理和质量控制数据管理和质量控制数据分析数据分析11总体、个体与样本总体、个体与样本 总体(总体(population)是根据研究目的性质相是根据研究目的性质相同的所有观察单位集合同的所有观察单位集合.个体(个体(individual)是总体中的基本观察单位是总体中的基本观察单位(observation unit),可以是一个人、一个动可以是一个人、一个动物、一个家庭、一个地区、一份样品等,物、一个家庭、一个地区、一份
4、样品等,样本样本(sample)是从总体中随机抽取的部分观察是从总体中随机抽取的部分观察单位的集合。单位的集合。12同质和变异同质和变异 同质(同质(homogeneity)就是性质相同,)就是性质相同,它是进行统计分析的前提它是进行统计分析的前提.变异变异 研究对象之间的研究对象之间的差异.13统计量和参数统计量和参数统计量统计量(statistic)是反映样本特征的数量)是反映样本特征的数量参数(参数(parameter)是反映总体特征的数量)是反映总体特征的数量.14样本均数的变异性质l较大样本的均数的变异小于较小样本的均数的变异l样本均数的变异小于观测值的变异l样本均数的变异随观测值变
5、异的增大而增大15I型错误与II型错误Type I and Type II errors尽管是小概率事件,它还是有可能发生的。I型错误:虽然无效假设为真,但由于抽到了较大(检验统计量)的样本,使得P值小于检验水准而导致被拒绝。l是否为小概率事件是由检验水准而定,所以犯错误的概率也由检验水准而定。II型错误:虽然无效假设为假,但由于抽到了较小(检验统计量)的样本,使得P值大于检验水准而导致不被拒绝。l犯II型错误的概率由另一水准而定。16单侧检验还是双侧检验?One-sided or two-sided test?双侧检验永远是正确的单侧检验只有在少数情况下才是合适的即使要做单侧检验,也必须事先
6、确定17误用统计学案例18“非典非典”中典型统计错误中典型统计错误2003年有人撰文并在网上报道:第一阶段医护人员感染率为33%,并解释说:就是在感染“非典”的100人中,有33人是医护人员。是否有错误?其后果是什么?19 非典中的统计问题报道:香港医务人员用已康复者血浆治疗20例非典病人无一例死亡,而其对照组20例中,有3人死亡。这表明用康复病人血浆治疗非典病人是有效的。-摘自2003.5.28 用康复病人血浆治疗非典病人真有效吗?20用软件进行卡方检验,得出结论:FishersP=0.23080.05经过统计分析,两组差别无统计意义现在实事也不支持原研究者的用康复病人血浆治疗非典病人结论2
7、1统计学的误用问题统计学的误用问题中国医学杂志近800种,其中代表医学最高水平的中华、中国系列杂志近百种据统计l中华系列医学杂志发表的论文中有统计问题和错误的达到70l国际著名医学杂志有统计问题和错误也达50%。(胡良平 主编 军事医科院出版2003年)22国内对中华系列医学期刊的调查结果凌瑞珠发现中华医学检验杂志发表论文中存在统计误用高达70%王倩 调查了1995年5种具有较高水平的中华系列杂志,发现发表的论文不能正确应用统计分析方法占54%23程萍 评阅了19931995年中华内科杂志论著栏内发表的论文,发现存在统计学方法上的问题或错误占68%。毛宗福等报告了5种中华核心期刊论著中统计推断
8、应用缺陷率为62%。24中华麻醉学杂志论文中中华麻醉学杂志论文中t t检验的误用分析检验的误用分析本人查阅本人查阅2004年在中华麻醉学杂志上发年在中华麻醉学杂志上发表的全部论文表的全部论文对其中在方法中明确注明采用对其中在方法中明确注明采用t检验作为检验作为统计分析方法的统计分析方法的167篇论文作为研究对象,篇论文作为研究对象,观察误用观察误用t检验的情况检验的情况由于论文不提供原始资料,故对资料是否满足正态性或方差齐性等由于论文不提供原始资料,故对资料是否满足正态性或方差齐性等t检验检验的前提不做分析的前提不做分析25t t检验的使用概况检验的使用概况采用t检验的论文167篇 占全部论文
9、47.2%l成组t检验106篇l配对t检验81篇l共计187篇次(其中部分论文同时采用两种t检验方法)26t t检验的使用概况检验的使用概况 栏目篇 数使用率%临床研究5471.1实验研究2933.0论著摘要2057.1经验交流4757.3疼痛治疗1341.9其他栏目49.527t t检验的误用情况检验的误用情况t检验误用误用率%成组t检验14篇13.2配对t检验52篇64.2总计66篇次35.3 28成组t检验的误用用成组t检验处理单因素K(K3)水平设计的定量资料13篇l其中处理3、4、5、9水平 分别为4、5、3、1篇用成组t检验处理重复测量设计的定量资料(3水平)1篇。29配对t检验的
10、误用处理具有重复测量设计K(K=3)水平的定量资料50篇l用于处理3、4、5、6、7、8、9、13、18水平 分别为13、6、11、10、1、4、2、2、1 篇处理单因素设计的定量资料1篇处理具有两个重复测量因素设计的定量资料1篇30t t检验的误用情况检验的误用情况栏目篇 次数误用率%临床研究2033.3实验研究1445.2论著摘要1045.5经验交流1935.2疼痛治疗320.0其他栏目0031典型案例分析典型案例分析用t检验处理单因素K(K3)水平设计的定量资料用t检验处理具有重复测量设计的定量资料32t检验误用于3组或3组以上定量资料逐对的两两比较,多次套用t检验l分裂了原先的整体设计
11、,失去了总变异和总剩余误差,与原设计思想不符,结论片面l多次使用t检验,使犯第1类错误(假阳性错误)的概率增大l损失部分信息,资料的利用率低,降低了检验效率因此,结论不可靠33比较次数获得P0.05的概率校正阈值(I误差=0.05)15%0.0500210%0.0253314%0.0170419%0.0127523%0.0102626%0.0085730%0.0073834%0.0064937%0.00571040%0.00512064%0.00265092%0.001010099%0.0005N100(1.00-0.95N)1.00-0.95(1/N)34组数(水平数比较次数获得P0.05的
12、概率假阳性(I误差)3310%4626%51040%61552%72168%82876%93684%104590%1713799.91%35多组间计量资料的仍用t检验对每两个对比组作比较,会使犯第一类错误的概率a增大如有3个组对比,若每次比较时检验水准a=0.05,这时每次比较所犯第一类错误的概率为0.1 4,比0.05大了许多因此,多重比较不应采用t检验分别作两两比较应在方差分析的基础上进行q检验36多组间计量资料l应在方差分析的基础上进行两两比较q检验l如SNK法、Dunnett法等l当各组均数进行排序后,间隔组数越多的比较,其检验效率越高37误用误用t t检验分析具有一个检验分析具有一个
13、重复测重复测量量的单因素设计资料的单因素设计资料 38 39表4.9 吸入地氟醚前及不同剂量MAC时的血液动力学参数变化()项目 吸入前 0.5MAC 1.0MAC 1.5MAC 2.0MAC CO(L/min)4.20.6 4.10.7 4.10.6 4.00.7 4.00.7 HR(bpm)79.08.9 79.09.9 85.111.9*96.110.6*102.912.0*MAP(mmHg)87.412.1 89.616.9 82.212.2 80.813.9*75.914.2*FTC(sec)0.3210.036 0.3340.025 0.3500.038*0.3620.034*0.
14、3760.050*CVP(cmH2O)8.271.38 10.101.98*10.972.05*11.521.63*12.982.22*CI(Lmin-1)2.820.39 2.970.42 2.940.46 2.900.77 2.840.61 PV(cmsec-1)56.279.42 54.9011.32 53.6012.53 52.432.64 52.2713.42 SVR(dyneseccm-5)2.797531 2.074514 1.911514*1.605452*1.308356*与吸入前相比,*P0.05*P0.01;与0.5MAC相比,P0.05 P0.01 与1.0MAC相比,
15、P0.05 P0.01;与1.5MAC相比,P0.05 P0.01404142点评我科在二医学报麻醉学专刊论文的统计方法的误用案例 43点评1张剑蔚,等.不同剂量乌司他丁在婴幼儿体外循环中的肺保护.上海第二医科大学,2004,24(11):933C 对照组 不用乌司他丁 U1 小剂量处理组 乌司他丁5000U/kg U2 大剂量处理组 乌司他丁10000U/kg在麻醉诱导后、体外循环结束、术后测循环指标和多种细胞因子的变化统计学处理 应用SPSS软件,以xs表示 测定结果,组间比较采用配对t检验,P0.05作为显著性差异。44TimeGroupIL-6麻醉诱导 U111.823.73U210.
16、903.61C10.683.89停体外U143.6829.22*U225.9911.22*C64.3826.36术后U122.488.61*U217.755.72*C36.2617.62Compared with control group:*P0.05,*P0.01;Compared with T1:P0.05,P0.01.原表45修改后GroupT1T2T3IL-6U111.823.73 43.6829.22*22.488.61*U210.903.61 25.9911.22*17.755.72*C10.683.89 64.3826.3636.2617.6246点评1误用配对t检验处理具有一
17、个重复测量因素的设计的定量资料 3组 3时间47点评148点评1l实验控制问题l可试行数据转换或采用非参数的统计方法49吴韬,等.丙泊酚复合硝普钠控制性降压对机体应激反应的影响,上海第二医科大学,2004,24(11):936I 组 硝普钠不用丙泊酚 II 组 硝普钠复合丙泊酚在降压前、降压后10min、40min、及停降压后10min测多种应激激素等的变化统计学处理 数据以xs表示,Statpal软件包进行统计分析。不同时间点、组间、的比较采用方差分析,P0.05作为显著性差异。点评250Index GroupT1T2T3T4AT-III126.1313.44145.2111.19*257.
18、3715.27*249.1520.36*II129.1714.38141.3815.28*150.4120.19*#151.2212.42*#Compared with control group:*P0.05,*P0.01;Compared with T1:#P0.05,#P0.01.Statpal软件包进行统计分析。不同时间点、组间、的比较采用方差分析51点评2Statpal软件包进行了方差分析后能做两两比较吗?既然不能两两比较吗,随后用了何处理?t检验?4个不同时间点!组间比较有必要用方差分析吗?2组!I组不用丙泊酚了,用何方法补充麻醉的不足的?如果两组的处理差别仅仅是不用丙泊酚,那么结
19、论就是:用丙泊酚加深麻醉可以减少控制性降压时硝普钠用量!文章还有新意吗?52陈绮,等.胆囊切除术中PHC对血流动力学、肺內分流和氧合的影响。上海第二医科大学,2004,24(11):93620例无分1组麻醉前、插管后气腹前、PHC5min、10min、30min 测血流动力学、肺內分流和氧合的变化.统计学处理 应用Statpal软件包进行统计分析。数据以xs表示。各时间点参数采用t检验。点评353点评3IndexBaselineBefore PHCAfter PHC5minAfter PHC10minAfter PHC30minQs/Qt%30.55.717.8 3.7*18.54.0*18.
20、04.1*17.53.9*Compared with Baseline:*P0.05,Compared with PHC:#P0.0554点评3t检验!5个不同时间点!比几次?主要研究PHC因素的作用l但无任何对照组(非PHC因素,其他处理完全相同)l能说明各种变化就是PHC因素引起的吗?l能排除时间和手术刺激等其他因素引起的吗?55点评3IndexBaselineBefore PHCAfter PHC5minAfter PHC10minAfter PHC30minQs/Qt%30.55.717.8 3.7*18.54.0*18.04.1*17.53.9*Compared with Basel
21、ine:*P0.05,Compared with PHC:#P0.0556点评3想研究PHC肺內分流影响采用Qs/Qt作为指标l这些正常人麻醉前的Qs/Qt=30.5%l而麻醉后Qs/Qt=18%,+PHC等处理后Qs/Qt=18%(P0.05)!文章结论:PHC对肺內分流无明显影响。l结论与结果不一致!lQs/Qt的正常值是多少?符合常理吗?l从表中结果看麻醉使肺內分流明显减少!符合常理吗?l不符合常理!是新发现吗?57点评3原因 采用的简化计算公式l该简化计算公式假定许多变量为常数(FiO2,PaCO2,Ca-vO2)l本实验中这些变量是恆定不变的吗?l这个简化计算公式适合本实验吗?58国
22、外对英文权威医学期刊调查结果统计学误用率为50%的不在少数,有的甚至高达70%或100%。Glantz调查了1977年Circulation Research和Circulation杂志中发表的文章,在考虑使用统计学方法的文章中,分别有61%和44%具有统计学错误。59Kanter等调查了1992年至1993年Transfusion杂志发表的文章发现75%的文章至少存在一处统计问题和错误6030年前,美国医学杂志(JAMA)一位编审曾说:“医学论文作者统计知识和统计水平低下”近30年来,临床医学论著中统计应用缺陷没有发生根本改善,误用率仍很高61误用统计问题产生的原因误用统计问题产生的原因62
23、对统计学的作用重视不够统计教育普及不够我国很多企业投入上千万资金进行计算机数据平台建设,但投入数据统计分析方面很少。其结果是获得的只是一些简单的报表,有价值的信息很少。-中科院张永光教授63统计学教学观念和方法落后l教学中比较多的在统计推理和计算l科研设计、质量控制和统计分析分离l教学与实际应用脱离64计算机统计软件应用问题 面对大量数据的统计分析,无法用手工方式完成。只能采用计算机来实现。以前手工一个月的工作,计算机几分钟就能完成。计算机软件给统计学带来革命性的变化。65乱用计算机统计软件现象很普遍 对于同一份数据资料,统计学可提供多种不同的分析方法,各种方法都有一定的前提条件,采用不同方法
24、所得到的结果不完全相同。66软件与统计的关系 一方面,很多人不管统计方法的前提条件是否満足,将数据直接代入计算机软件中,得出的结果与实际相差堪远。另一方面,现有的统计软件使用不太方便,造成用户的误用。67统计数据造假的问题68统计是支持研究结论的证据之一一些想在研究中走捷径的人不惜抛开科学道德伪造统计数据69据1976年New Science 杂志关于科研舞弊行为的调查l74%的调查表反映有不正当修改数据的情况l17%拼凑实验结果l7%凭空捏造数据l2%故意曲解结果。70年月,美国劳伦斯伯克利国家实验室名研究人员在学术刊物物理评论通讯上联合发表论文称通过铅原子核和氪原子核的撞击,他们发现了元素
25、周期表上空缺的号元素,以及由号元素衰变产生的号元素这一成果曾被视为年最重要的科技突破之一71美国劳伦斯伯克利国家实验室公开承认数据造假新华网华盛顿新华网华盛顿2002年月日年月日美国劳伦斯伯克利国家实验室最近公开承认,该实验室一个研究小组年发现的两种超重元素的实验数据是“捏造”的,有关研究人员从事了“不正当科学行为”。72其他科学家随后进行的重复研究,却无法获得类似结果尼诺夫是人研究小组成员之一,在最初的研究中主要负责数据的分析,目前已被该实验室开除73中国“学术腐败”2004年初,南京中医院、南京中医大学学术带头人博士导师王刚造假事件74北京大学教授和博士生导师王铭铭剽窃美国人类学家哈维兰的
26、当代人类学(中译本)和王铭铭的近作想象的异邦,这两本书大约有10万字的内容几乎是一模一样 75北大一副教授剽窃被解聘北大一副教授剽窃被解聘黄宗英,男,1993年攻读北大美国文学博士学位,1996年7月留校任教,1997年8月晋升为副教授,事发前是系工会主席。北京大学英语系核查组关于黄宗英学术剽窃行为的评价报告称,根据美国语文学会研究论文写作指南对剽窃行为的定义,黄宗英的艾书剽窃部分占到全书的74%.76历史上许多事实说明l科学容不得半点虚假l造假者一旦被揭露就背上了永远洗脱不掉的耻辱l最终精神错乱或自杀身亡的也不乏其人77“科学诚实”“在一篇论文发表之前,所有作者都有责任核实数据。”“对一个实
27、验室来说,没有比科学诚实更重要的东西了。只有拥有了这种诚实,资助研究的公众才会对我们有信心。”-尚克美国劳伦斯伯克利国家实验室主任78赞贝尔实验室“揭丑”精神 光明日报 2002年10月9日 贝尔实验室是全世界科学工作者敬仰和向往的地方。该实验室自1925年成立以来共推出2.8万项专利,下属科学家曾获得6个诺贝尔物理学奖。世界最负盛名的贝尔实验室向世人公布了该实验室研究人员舍恩在16篇论文中捏造或篡改实验数据的丑闻。79各种情形下最常用统计方法索引各种情形下最常用统计方法索引 80应变量:连续单个自变量 l二分类 T检验l多分类 单因素方差分析l连续 相关分析,回归分析多个自变量l分类变量为主
28、 方差分析模型l连续变量为主 线性回归模型81应变量:有序分类单个自变量l二分类 秩和检验l多分类 秩和检验l连续 Logistic回归分析多个自变量l分类变量为主 Logistic回归分析l连续变量为主 判别分析、Logistic回归分析82应变量:无序分类(含二分类)单个自变量l二分类 卡方检验l多分类 卡方检验l连续 Logistic回归分析多个自变量l分类变量为主 Logistic回归分析、最优尺度分析l 连续变量为主 判别分析、Logistic回归分析83 希望将变量/纪录分成若干个类别,但类别数不清楚,或各类别的特征不明:聚类分析希望建立判别方程,对以后新进入的案例进行所属类别的预
29、测:判别分析需要探索多个变量间的内在联系或内在结构:因子分析、对应分析生存时间和生存结局都是需要关心的因素,同时数据中存在大量的失访:生存分析得到的是时间序列数据,需要对以后的情形加以预测:时间序列模型考察的特征需要有多个应变量来表示,同时研究多个自变量对他们的影响:多元方差分析模型8485讨论讨论误用t检验对定量资料进行分析具有许多缺点不了解所采用的设计类型,也不了解实验涉及到几个因素和几个水平,只是一味地采用t检验进行两两比较,就不可避免地造成t检验的误用和滥用观察不同时间点上的实验效应宜采用具有重复测量设计的方差分析等方法总之,误用t检验是当前医学期刊中最多的统计学错误类型应当引起作者、编者、读者的高度重视