1、医学杂志论文中常见的统计学错误及对策医学杂志论文中常见的统计学错误及对策同济大学医学院同济大学医学院 医学统计学教研室医学统计学教研室 艾自胜艾自胜2014-9-28内容内容n(1)描述性分析中的常见错误)描述性分析中的常见错误n(2)假设检验中常见的统计学方法选择)假设检验中常见的统计学方法选择错误错误n(3)研究设计中的常见错误)研究设计中的常见错误n(4)纠正错误的对策)纠正错误的对策描述性分析中的常见错误描述性分析中的常见错误 在医学论文中在医学论文中,对不同类型的研究资料需要用不对不同类型的研究资料需要用不同的统计指标进行描述。实际工作中统计指标选择同的统计指标进行描述。实际工作中统
2、计指标选择常见的问题有常见的问题有:计量资料无论是否服从正态分布计量资料无论是否服从正态分布,统统用均数统统用均数标准差描述研究结果的数据特征标准差描述研究结果的数据特征;计数资料混淆率和构成比计数资料混淆率和构成比(百分比百分比)的概念的概念,常将构常将构成比误用为率来说明事物发生的强度成比误用为率来说明事物发生的强度;率和构成比率和构成比的分母太小的分母太小,却计算相对数来进行描述和比较。却计算相对数来进行描述和比较。计量资料描述常见错误分析计量资料描述常见错误分析(1)误用正态分布的描述性统计指标描述呈偏态分布)误用正态分布的描述性统计指标描述呈偏态分布的资料的资料(标准差(标准差均数均
3、数)仍采用)仍采用“均数均数标准差标准差”表示表示,特别当表中采用标准误,特别当表中采用标准误 取代标准差取代标准差s时,前述的错误时,前述的错误很难被察觉出来很难被察觉出来;(2)统计图方面的主要错误有两个,其一,横坐标轴上统计图方面的主要错误有两个,其一,横坐标轴上的刻度值不准确,等长的间隔代表的数量不等;在直的刻度值不准确,等长的间隔代表的数量不等;在直角坐标系中,从任何一个数值开始作为横轴或纵轴上角坐标系中,从任何一个数值开始作为横轴或纵轴上的第一个刻度值。其二,的第一个刻度值。其二,用条图或复式条图表达连用条图或复式条图表达连续性变量的变化趋势;续性变量的变化趋势;(3)统计表中数据
4、的含义未表达清楚,令人费解;统计表中数据的含义未表达清楚,令人费解;(4)运用相对数时,混淆运用相对数时,混淆“百分比百分比”与与“百分率百分率”;计量资料的案例一计量资料的案例一计量资料的案例一的分析与对策计量资料的案例一的分析与对策 各项指标的均数均大于各项指标的均数均大于2倍标准差倍标准差,说明资料说明资料为偏态分布为偏态分布,用均数、标准差描述资料的集中趋用均数、标准差描述资料的集中趋势和离散程度显然是不妥当的势和离散程度显然是不妥当的,案例一中只列出案例一中只列出P 值值,也未说明具体的统计学也未说明具体的统计学方法。方法。正确的做法应用中位数描述集中趋势正确的做法应用中位数描述集中
5、趋势,用四分用四分位数间距表示离散程度。或者是将原始数值经位数间距表示离散程度。或者是将原始数值经对数等转换后对数等转换后,再计算转换值的平均数和标准差再计算转换值的平均数和标准差,同时在表格中应该列出具体的统计量及同时在表格中应该列出具体的统计量及P 值。值。计数资料描述性分析中的常见错误计数资料描述性分析中的常见错误(1)错误地将构成比当作率使用)错误地将构成比当作率使用(2)错误地计算平均率)错误地计算平均率(3)计算相对数时分母过小)计算相对数时分母过小计数资料的案例一计数资料的案例一计数资料的案例一的分析与对策计数资料的案例一的分析与对策 研究者对计数资料的案例一资料进行分析研究者对
6、计数资料的案例一资料进行分析,认为认为“轮状病毒腹泻的发病率最高为轮状病毒腹泻的发病率最高为43.1%,43.1%,痢痢疾次之疾次之28.8%,28.8%,伤寒最低为伤寒最低为13.1%13.1%”。这是将这是将构成比当作发病率使用的典型错误构成比当作发病率使用的典型错误,是临床科是临床科研中最常见的错误之一。研中最常见的错误之一。实际上表中所提供的信息实际上表中所提供的信息,只能用来说明在只能用来说明在该腹泻门诊就诊的该腹泻门诊就诊的521例病人中例病人中,各种腹泻各种腹泻病人所占的比重病人所占的比重,并不能反映出各自发病率并不能反映出各自发病率的高低的高低,而且计数资料的案例一所列的而且计
7、数资料的案例一所列的%号也未指明是构成比还是发病率号也未指明是构成比还是发病率,容易引起容易引起歧义。正确的描述应该是在腹泻门诊病人歧义。正确的描述应该是在腹泻门诊病人中中,轮状病毒引起的腹泻所占的比例最高轮状病毒引起的腹泻所占的比例最高,伤寒最低。伤寒最低。计数资料的案例二计数资料的案例二计数资料的案例二的分析与对策计数资料的案例二的分析与对策 某研究者为了研究三种不同值班情况孕妇的早某研究者为了研究三种不同值班情况孕妇的早产发生情况产发生情况,作者在计算平均率时作者在计算平均率时,错误地将几个率错误地将几个率相加后取其平均值相加后取其平均值,这种类型的错误也是临床科研这种类型的错误也是临床
8、科研论文中常见的错误之一。论文中常见的错误之一。如计算如计算计数资料的案例二计数资料的案例二中三种值班女工的早中三种值班女工的早产的合计发生率产的合计发生率(即平均率即平均率)时时,以以(2.7+4.8+10.3)(2.7+4.8+10.3)/3=5.9,/3=5.9,即平均发生率为即平均发生率为5.9%5.9%。正确的算法是正确的算法是:(94/1547)100%=6.1%。假设检验中常见的统计学方法选择错误假设检验中常见的统计学方法选择错误n定量资料进行假设检验的方法很多定量资料进行假设检验的方法很多,其常其常见错误是见错误是:n(1)忽视)忽视t 检验和检验和F(方差分析方差分析)检验的
9、前检验的前提条件;提条件;n(2)误用)误用t检验代替检验代替F 检验;检验;n(3)误用参数检验代替非参数检验;)误用参数检验代替非参数检验;n(4)各种方差分析混用。)各种方差分析混用。假设检验中常见的统计学方法选择错误假设检验中常见的统计学方法选择错误 计数资料统计分析的常见错误是:计数资料统计分析的常见错误是:(1 1)错误选择了四格表卡方检验方法)错误选择了四格表卡方检验方法,未未选用选用FisherFisher精确检验;精确检验;(2 2)等级变量资料一律地使用卡方检验。)等级变量资料一律地使用卡方检验。计量资料统计分析的常见错误计量资料统计分析的常见错误n(1)忽视了)忽视了t检
10、验的使用条件;检验的使用条件;n(2)多个样本均数比较错误地用多个)多个样本均数比较错误地用多个t 检验代替方差分析;检验代替方差分析;n(3)误用)误用t检验分析重复测量设计资料检验分析重复测量设计资料t检验的使用条件检验的使用条件 单样本单样本t检验的应用条件:样本服从正检验的应用条件:样本服从正态分布;态分布;成组成组t检验的应用条件:样本服从正态分检验的应用条件:样本服从正态分布布;两样本的总体方差相等即方差齐性。两样本的总体方差相等即方差齐性。配对配对t检验的应用条件:差值服从正态分检验的应用条件:差值服从正态分布。布。假设检验的案例一假设检验的案例一假设检验的案例一的分析与对策假设
11、检验的案例一的分析与对策这类错误是临床医学科研论文中定量资料这类错误是临床医学科研论文中定量资料分析中最常见的错误分析中最常见的错误,而且是原则性错误而且是原则性错误,会会增加犯第一类错误的概率。假设检验的案增加犯第一类错误的概率。假设检验的案例一资料为不同年龄组不同性别基础能耗例一资料为不同年龄组不同性别基础能耗情况情况,原作者用原作者用t t检验分别对各组均数逐一进检验分别对各组均数逐一进行比较行比较,得出在男女研究对象青年组与中年得出在男女研究对象青年组与中年、老年组的基础能耗差异有显著性。、老年组的基础能耗差异有显著性。假设检验的案例一的分析与对策假设检验的案例一的分析与对策 这种检验
12、方法有误这种检验方法有误,因为该资料为多组因为该资料为多组基本均数间的比较基本均数间的比较,正确的方法是用单因素正确的方法是用单因素方差分析方差分析,只有在方差分析有显著性的基础只有在方差分析有显著性的基础上有必要再作均数间的两两比较上有必要再作均数间的两两比较,用用q检验检验,而不是而不是t检验检验,同时假设检验的案例一中应该同时假设检验的案例一中应该列出方差分析的统计量列出方差分析的统计量F值及具体的值及具体的P值。值。假设检验的案例二假设检验的案例二假设检验的案例二的分析与对策假设检验的案例二的分析与对策重复测量数据是指同一受试对象的同一指标重复测量数据是指同一受试对象的同一指标在不同时
13、间点上进行多次测量所获得的资料在不同时间点上进行多次测量所获得的资料,常用来分析某项观察指标在不同时间点上的常用来分析某项观察指标在不同时间点上的变化特点变化特点,这类资料在临床试验中较为常见。这类资料在临床试验中较为常见。本案例是两种不同处理方案对病人血浆本案例是两种不同处理方案对病人血浆ET ET 浓浓度度(pg/m l)(pg/m l)变化比较变化比较,分别在麻醉前、术毕、分别在麻醉前、术毕、术后术后24 h24 h、术后、术后48 h48 h测量病人血浆测量病人血浆ETET浓度浓度,观观察两种处理方案对病人血浆察两种处理方案对病人血浆ETET浓度的影响及浓度的影响及变化趋势。变化趋势。
14、假设检验的案例二的分析与对策假设检验的案例二的分析与对策 原文作者用配对比较原文作者用配对比较t t检验对不同时间两个处检验对不同时间两个处理方式血浆理方式血浆ETET浓度的差异进行检验浓度的差异进行检验,发现有统计发现有统计学差异学差异,并认为并认为A A 组术后组术后ETET浓度相对稳定浓度相对稳定,术后术后无明显升高。我们认为资料的统计处理不恰当无明显升高。我们认为资料的统计处理不恰当,因为这时一个典型的重复测量的多个样本均数因为这时一个典型的重复测量的多个样本均数的比较的比较,故应该采用重复测量方差分析检验不同故应该采用重复测量方差分析检验不同处理组间和时间因素及处理因素与时间的交互处
15、理组间和时间因素及处理因素与时间的交互效应是否具有统计学意义效应是否具有统计学意义,如果差异有显著性如果差异有显著性,然后再作两均数间的两两比较。然后再作两均数间的两两比较。假设检验的案例三假设检验的案例三假设检验的案例三的分析与对策假设检验的案例三的分析与对策 本案例反映不同分娩方式重症肝炎孕妇本案例反映不同分娩方式重症肝炎孕妇结局的比较。结局的比较。原作者使用一般四格表卡方检验原作者使用一般四格表卡方检验,得得:卡卡方值方值=7.24,P=0.007;但观察了但观察了22例例,总例总例数小于数小于40,不适合使用一般卡方检验。应用不适合使用一般卡方检验。应用Fisher精确概率检验法。精确
16、概率检验法。假设检验的案例三的分析与对策假设检验的案例三的分析与对策本例正确的计算结果为本例正确的计算结果为P=0.011(双侧概率双侧概率)。很多分析人员认为两种方法分析的结果都是认很多分析人员认为两种方法分析的结果都是认为不同分娩方式重症肝炎孕妇结局有差别为不同分娩方式重症肝炎孕妇结局有差别,但但统计学意义是不一样的统计学意义是不一样的,因为因为P 值大小不一样值大小不一样,拒绝和不拒绝无效假设的概率是不一样的。拒绝和不拒绝无效假设的概率是不一样的。假设检验的案例四假设检验的案例四假设检验的案例四的分析与对策假设检验的案例四的分析与对策 本文作者将资料中三个等级中的本文作者将资料中三个等级
17、中的“有效有效”和和“显效显效”合并合并,使之成为二分变量。然后使之成为二分变量。然后,用用四格表卡方检验四格表卡方检验,得卡方值得卡方值=3.302,P=0.069,作出两组治疗总有效率差异无统计学的结论作出两组治疗总有效率差异无统计学的结论。原统计分析中将三个等级合并为两个等级。原统计分析中将三个等级合并为两个等级,导致信息丢失导致信息丢失,结果得出两处理组总疗效无显结果得出两处理组总疗效无显著性差异的结论。著性差异的结论。假设检验的案例四的分析与对策假设检验的案例四的分析与对策 从本案例中可见到对照组从本案例中可见到对照组“有效有效”的构成的构成比为比为28.57%,高于治疗组的,高于治
18、疗组的“有效有效”构成比构成比17.64%,而治疗组而治疗组“显效显效”构成比构成比76.47%高高于对照组于对照组“显效显效”构成比构成比50.00%,另外显效另外显效与有效在临床上都是表示治疗的有利效果与有效在临床上都是表示治疗的有利效果,盲盲目合并会导致错误的结果。目合并会导致错误的结果。假设检验的案例四的分析与对策假设检验的案例四的分析与对策正确显著性检验方法应该正确显著性检验方法应该 用用Ridit分析分析 或者非参数检验或者非参数检验(秩和检验秩和检验)或者或者CMH检验检验 或者或者Logistic回归分析回归分析 本案例采用秩和检验分析本案例采用秩和检验分析,z=2.27,P=
19、0.023,差异有统计学意义差异有统计学意义,说明治疗组的疗效优于对说明治疗组的疗效优于对照组。照组。研究设计中的常见错误研究设计中的常见错误n(1)随机分组与随机抽样没有真正遵循)随机分组与随机抽样没有真正遵循随机化原则;随机化原则;n(2)无对照或对照设计不合理;)无对照或对照设计不合理;n(3)样本含量太少。)样本含量太少。随机分组与随机抽样的错误随机分组与随机抽样的错误 无论是随机抽样还是随机分组都要有足够的无论是随机抽样还是随机分组都要有足够的样本作前提样本作前提,要在文章中描述清楚随机抽样的抽要在文章中描述清楚随机抽样的抽样总体、样本含量、抽样方法样总体、样本含量、抽样方法,随机分
20、组的随机随机分组的随机方法、各组的样本含量与基本特征等。医学科研方法、各组的样本含量与基本特征等。医学科研论文中最普遍的问题是滥用论文中最普遍的问题是滥用“随机随机”,只要是抽只要是抽样或分组样或分组,不管实际是否采用了随机的方法不管实际是否采用了随机的方法,在论在论文中均不谈采用了什么样的随机方法文中均不谈采用了什么样的随机方法,就将就将“随随机机”写上写上,将随机误解为随意、随便、不采用随将随机误解为随意、随便、不采用随机化处理方法机化处理方法,导致结果缺乏可靠性。导致结果缺乏可靠性。随机分组与随机抽样的错误的对策随机分组与随机抽样的错误的对策 随机化原则是由随机化原则是由Fisher在创
21、建实验设计在创建实验设计理论的过程中首先提出的理论的过程中首先提出的,随机化原则是实验随机化原则是实验研究中保证取得无偏估计的重要措施。随机研究中保证取得无偏估计的重要措施。随机化方法由最初的抽签、掷硬币和抓阄等方法化方法由最初的抽签、掷硬币和抓阄等方法发展到随机数字表、随机排列表和用计算机发展到随机数字表、随机排列表和用计算机软件或计算器产生的伪随机数。软件或计算器产生的伪随机数。对照的错误与对策对照的错误与对策 医学研究医学研究,尤其是实验设计的研究尤其是实验设计的研究,需要需要设立合适的对照组设立合适的对照组,只有设立了对照只有设立了对照,才能消才能消除非处理因素对实验结果的影响除非处理
22、因素对实验结果的影响,从而将所从而将所关心的处理因素的效应分离出来。在论文关心的处理因素的效应分离出来。在论文中应说明对照取自的总体中应说明对照取自的总体,如何得来的如何得来的,样本样本含量多大?含量多大?是否与实验匹配或配伍是否与实验匹配或配伍,与试验与试验组的均衡性如何?组的均衡性如何?对照的错误与对策对照的错误与对策 有些文章虽然设立了对照组有些文章虽然设立了对照组,却使用非同却使用非同期对照或历史对照期对照或历史对照,组间的基础状况如性别、组间的基础状况如性别、年龄、病情等不一致年龄、病情等不一致,缺乏可比性。还有些作缺乏可比性。还有些作者虽然设立了正常对照组者虽然设立了正常对照组,在
23、分析的时候却未在分析的时候却未考虑考虑,使该设计失去了原有的意义。使该设计失去了原有的意义。样本量问题与对策样本量问题与对策 研究的实验单位要达到一定的数量研究的实验单位要达到一定的数量,才能避免将个才能避免将个别情况误认为普遍情况别情况误认为普遍情况,将偶然性或巧合的现象当成将偶然性或巧合的现象当成必然的规律必然的规律,以致将实验结果错误地推广到群体。在以致将实验结果错误地推广到群体。在医学论文中医学论文中,有些有些P P0.050.05的的“阴性结果阴性结果”,样本含量不样本含量不够致检验效能不足是一个主要的原因。实验之前不够致检验效能不足是一个主要的原因。实验之前不进行样本含量估计会带来
24、两个问题进行样本含量估计会带来两个问题:一是杂志上论文一是杂志上论文的发表偏倚的发表偏倚,即当实验结果出现即当实验结果出现P P0.050.050.05的阴性结论的阴性结论,则锁进抽屉则锁进抽屉,以至于有些医学期刊几乎找不到阴性结果的研究论以至于有些医学期刊几乎找不到阴性结果的研究论文。文。样本量问题与对策样本量问题与对策 二是用二是用P0.05错误地支持错误地支持“两种干预措两种干预措施效果相同施效果相同”或或“两种检测方法可以互相两种检测方法可以互相替代替代”等结论。实际上等结论。实际上,由于样本含量小由于样本含量小,检检验效能不够验效能不够,容易得到容易得到P0.05的结果。的结果。因此因此,提倡在试验前进行样本含量大小的提倡在试验前进行样本含量大小的估计。估计。谢谢!