1、BG1如何正确选择统计方法如何正确选择统计方法BG2资料类型资料类型设计方案设计方案实验分组实验分组检验条件检验条件BG3表表1 1 单变量资料差异比较的分析方法小结单变量资料差异比较的分析方法小结RC22RR22BG41111种形式的列联表种形式的列联表2 22 2表表有序(配对)有序(配对)无序(成组)无序(成组)2 2C C表表有序有序无序无序R R2 2表表有序有序无序无序多维列联表多维列联表单向有序单向有序R RC C表表有序有序无序无序双向有序双向有序属性相同属性相同属性不同属性不同分组变量有序分组变量有序指标变量有序指标变量有序BG5表表2 双变量双变量(多变量多变量)资料的关联
2、性分析方法小结资料的关联性分析方法小结R C2BG6二、计量资料分析常见的统计问题二、计量资料分析常见的统计问题2.1 2.1 忽视忽视t t检验的前提条件检验的前提条件2.2 2.2 误用成组设计资料的误用成组设计资料的t t检验分析配对设计资料检验分析配对设计资料2.3 2.3 忽视方差分析的前提条件忽视方差分析的前提条件2.4 2.4 误用误用t t检验分析等级资料检验分析等级资料2.5 2.5 误用误用t t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计2.6 2.6 误用配对设计资料的误用配对设计资料的t t检验处理单因素检验处理单因素k(k3)k(k3)水平设计的
3、资料水平设计的资料BG72.1 2.1 忽视忽视t t检验的前提条件检验的前提条件 文题:文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表表5 5。原文作者用。原文作者用t t检验分析此资料。检验分析此资料。请问:这样做正确吗请问:这样做正确吗? ?辨析:辨析:1.1.对表对表5 5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用不能满足方差齐性的要求,故不能采用t t检验进行分析。检验进行分析。正确的做法:正确的做法:采用变量变换使
4、数据服从正态分布且方差齐,然后进行采用变量变换使数据服从正态分布且方差齐,然后进行t t检验,检验,否则,采用非参数检验。否则,采用非参数检验。2.2.给出确切的统计量和给出确切的统计量和P P值。值。BG82.2 2.2 误用成组设计资料的误用成组设计资料的t t检验分析配对设计资料检验分析配对设计资料BG9辩析:辩析:1.1.考虑到对数据进行变换是正确的。但是如果采用成组考虑到对数据进行变换是正确的。但是如果采用成组t t检验,检验,还需要两总体方差齐性。还需要两总体方差齐性。 但本研究是配对设计,如果采用成组但本研究是配对设计,如果采用成组t t检验,会降低检验效检验,会降低检验效率。率
5、。应该采用配对应该采用配对t t检验进行分析。注意配对检验进行分析。注意配对t t检验的条件:要检验的条件:要对每对数据的差值(对每对数据的差值(d d)进行正态性检验。如果不满足,改用)进行正态性检验。如果不满足,改用WilcoxonWilcoxon符号秩检验。符号秩检验。2.2.应给出确切的统计量和应给出确切的统计量和P P值。值。2.2 2.2 误用成组设计资料的误用成组设计资料的t t检验分析配对设计资料检验分析配对设计资料BG102.3 忽视方差分析的前提条件忽视方差分析的前提条件确切的统计量和确切的统计量和P P值值文题:文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。姜黄素抑制
6、晶状体上皮细胞增殖的信号转导机制。问题:问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。培养,取第三代细胞进行实验。实验分实验分3 3组:组:空白对照组、模型组、姜黄素组,每组设空白对照组、模型组、姜黄素组,每组设6 6个样本。个样本。请问:请问:采用方差分析正确吗采用方差分析正确吗? ?均数均数标准标准差?差?BG11辨析:辨析:此实验分此实验分3 3组,应为单因素三水平设计定量资料,应首先进组,应为单因素三水平设计定量资料,应首先进行行“独立性独立性”、“正态性正态性”和和“方差齐性方
7、差齐性”检验,如果满足检验,如果满足方差分析的方差分析的3 3个前提条件则用方差分析;如果不满足,则采个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果用变量变换或秩和检验。如果P0.05P0.05P0.05,组间差异无统计学意义,组间差异无统计学意义;: :与治疗前比较,与治疗前比较,P0.05P0.05,组内,组内差异有统计学意义;差异有统计学意义;: :与对照组(与对照组(G G2 2)比较,)比较,P0.05P0.05P0.05,组间差异无统计学意义,不必在备注中,组间差异无统计学意义,不必在备注中表示。表示。 应写出确切的统计量和应写出确切的统计量和P P值。值。2.
8、4 2.4 误用误用t t检验分析等级资料检验分析等级资料BG152.5 误用误用t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计1文文题:题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成益气活血法预防老年患者髋部术后下肢深静脉血栓形成统计学处理统计学处理:采用采用SPSS10SPSS10. .0 0统计软件,两组间计量资料比较用统计软件,两组间计量资料比较用t t检验。检验。 辨析辨析:本研究本研究设计类型为设计类型为:两因素(处理和时间)重复测量设计资料。:两因素(处理和时间)重复测量设计资料。 在在资料满足资料满足“独立性独立性”、“正态性正态性”和和“方差齐性方差
9、齐性”的前提条件下,及的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析进行球对称检验,应选用两因素设计的重复测量的方差分析,选用,选用t t检验分析检验分析该资料该资料是不妥的是不妥的。BG16v 文题:文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T T淋巴细胞亚群的影淋巴细胞亚群的影响。响。v 设计:作者选取设计:作者选取6060例恶性肿瘤患者,随机分成例恶性肿瘤患者,随机分成2 2组。组。试验组在伽玛刀放射治疗试验组在伽玛刀放射治疗的同时给予复方苦参注射液的同时给予复方苦参注射液20ml20ml加入生理盐水加入生理盐水5
10、00ml500ml,静脉滴注,静脉滴注,1 1次次d d,1010d d为为1 1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7 7。v 请问:统计分析方法选用请问:统计分析方法选用t t检验正确吗检验正确吗? ?2.5 误用误用t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计2确切的统计量和确切的统计量和P P值。值。BG17辨析:辨析:1.1.统计分析错误统计分析错误 本试验中,每位受试者在试验前、后两个不同的时间点上被重复本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数
11、据并不相互独立,这测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用量有关的试验因素。原作者用t t检验进行两两比较,则割裂了整体设检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。计,不能准确地估计和控制误差,因而不能得到可靠的结论。正确的做法:正确的做法:应将表应将表7 7的形式改成重复测量试验设计的标准形式,采用的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。与之对应的方差
12、分析进行数据处理。2.5 误用误用t检验处理重复测量的两因素试验设计检验处理重复测量的两因素试验设计2BG18原文题目:原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观,文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,察莪术水煎剂对未孕大鼠子宫肌电活动的影响,4040只大鼠被随机分成只大鼠被随机分成4 4组,对组,对照组:按照组:按10ml10mlkgkg鼠重灌服生理盐水,莪术组:按鼠重灌服生理盐水,莪术组:按10ml10mlkgkg鼠重分别灌服鼠重分别灌服2525 、5050 、100100莪术水煎液分成莪术水煎液分成3 3组
13、。观察每个大鼠子宫肌电爆发波的峰面组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的积、持续时间和个数。原作者应用配对设计定量资料的t t检验进行统计处理,检验进行统计处理,资料见表资料见表4 4。剂量剂量(g(gkg)kg)峰面积峰面积(mWms)(mWms)持续时间持续时间(s)(s)爆发波个数爆发波个数0 0142.65142.6534.6434.643.503.501.321.320.540.540.100.102.52.5337.74337.74250.91250.918.828.822.782.781.061.060.340.345.05.0449
14、.50449.50154.45154.459.829.822.892.891.421.420.470.477.57.5651.08651.0898.2098.2013.0713.071.881.881.401.400.250.25表表 莪术水煎剂对大鼠子宫肌电活动的影响(均数莪术水煎剂对大鼠子宫肌电活动的影响(均数标准差)标准差)2.6 误用误用t检验处理单因素检验处理单因素k(k3) 设计的资料设计的资料BG19辨析:辨析:v 没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。v 本资料有四个剂量,属于本资料有四个
15、剂量,属于单因素四水平设计单因素四水平设计的定量资料,不可以用成组设的定量资料,不可以用成组设计或配对设计的计或配对设计的t t检验。检验。v 措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用DunDunnett tnett t检验或检验或LSDLSD检验。检验。v 如果在专业上有必要对如果在专业上有必要对3 3项指标同时进行考察,还应选用该设计的定量资料项指标同时进行考察,还应选用该设计的定
16、量资料的三元方差分析对资料进行处理。的三元方差分析对资料进行处理。2.6 误用配对设计资料的误用配对设计资料的t检验检验处理单因素处理单因素k(k3)水平设计的资料水平设计的资料BG203.1 3.1 计算相对数时分母太小计算相对数时分母太小3.2 3.2 误用误用2 2 检验分析结果变量为有序变量的资料检验分析结果变量为有序变量的资料3.3 3.3 误用误用2 2检验回答相关性问题检验回答相关性问题3.4 3.4 多值有序变量的高维列联表资料多值有序变量的高维列联表资料3.5 3.5 不满足连续性不满足连续性2 2检验条件时未做校正检验条件时未做校正3.6 3.6 十一种形式的列联表十一种形
17、式的列联表3.7 3.7 误用误用2 2检验取代检验取代FisherFisher精确检验精确检验3.8 3.8 对对R RC C表直接分割进行两两比较表直接分割进行两两比较三、计数资料分析方法的常见问题三、计数资料分析方法的常见问题BG21 文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4 4。请问:在表达资料方面有何不妥之处请问:在表达资料方面有何不妥之处? ?3.1 计算相对数时分母太小计算相对数时分母太小辨析:辨析: 计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事计算相对数时,分母过小,相对数很
18、不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。实真相,还往往会造成错觉。 在表在表4 4中,各组样本例数都小于中,各组样本例数都小于2020,样本例数偏小,不宜计算率,直接给出例,样本例数偏小,不宜计算率,直接给出例数就可以。数就可以。确切的统计量和确切的统计量和P P值。值。BG223.2 3.2 误用误用2 2 检验分析结果变量为有序变量的资料检验分析结果变量为有序变量的资料某医生用某医生用A A、B B两药治疗某病各两药治疗某病各240240例例, ,其疗效分为四个等级:痊愈、显效、其疗效分为四个等级:痊愈、显效、好转、无效好转、无效, ,见表见表4 4。经。经R RC C
19、表表2 2检验检验, ,2 2=53.33 ,=53.33 ,P P 0.01 ,0.01 ,认为两组疗认为两组疗效之间的差异有统计学意义。效之间的差异有统计学意义。辨析:辨析:u本资料属于单项有序的本资料属于单项有序的R RC C表,临床疗效有等级之分,对于等级资料可采用表,临床疗效有等级之分,对于等级资料可采用R Riditidit分析或秩和检验。而不应用分析或秩和检验。而不应用R RC C的的2 2检验,检验,R RC C表表2 2 检验只能检验两检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。
20、不难看出,若对表看出,若对表4 4资料任意两列数字进行对换资料任意两列数字进行对换, ,可以清楚地发现可以清楚地发现, ,2 2值仍为值仍为53.33,53.33,不会有改变。不会有改变。确切的统计量确切的统计量P P值。值。BG233.3 3.3 误用误用2 2检验回答相关性问题检验回答相关性问题l 上述资料上述资料用用2 2检验得:检验得:2 2 =163 =163. .0101,P P 0 0. .005005,结论为:可认为,结论为:可认为冠状动冠状动脉硬化的程度脉硬化的程度与与年龄年龄有关,结合本资料可见有关,结合本资料可见冠状动脉硬化等级冠状动脉硬化等级有随有随年龄年龄增高而增加的
21、趋势。增高而增加的趋势。l 问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处? ?年龄年龄冠状动脉硬化等级冠状动脉硬化等级正常正常轻度轻度中度中度高度高度5043188142456019672169706175578合计合计50301141492表表 不同年龄冠状动脉粥样硬化程度的分布不同年龄冠状动脉粥样硬化程度的分布BG24辨析辨析1: 本资料为本资料为“双向有序且属性不同的二维列联表资料双向有序且属性不同的二维列联表资料”,处理这种资料有,处理这种资料有3 3个个目的,因此,就对应着目的,因此,就对应着3 3套不同的统
22、计分析方法。套不同的统计分析方法。 分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。料,选用秩和检验。 分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。 分析两者间是否存在线性变化趋势则应用线性趋势检验。分析两者间是否存在线性变化趋势则应用线性趋势检验。 作者欲考察作者欲考察“两个有序变量之间是否呈相关关系两个有序变量之间是否呈相关关系”,而,而2 2检验结果是检验结果是P0.0P0.05 5,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。
23、,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。 事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的2 2检验的统计量数值是不会变化的,说明检验的统计量数值是不会变化的,说明2 2检验用于处理有序变量形成的二检验用于处理有序变量形成的二维列联表资料是不合适的。维列联表资料是不合适的。3.3 3.3 误用误用2 2检验回答相关性问题检验回答相关性问题BG25辨析辨析2 2:欲考察欲考察“两个有序变量之间是否呈相关关系两个有序变量之间是否呈相关关系”,应选用分析定性,应选用分析定性资料的相关分析方法,如:资料的相关
24、分析方法,如:SpearmanSpearman秩相关分析,秩相关分析,KendallKendall秩相秩相关分析或典型相关分析。关分析或典型相关分析。本例采用本例采用SpearmanSpearman秩相关分析,得:秩相关分析,得:r rs s=0.53215=0.53215,P0.0001P0.050.05或或P P0.05 0.05 、P P0.010.01便称结果无显著差异,或结果非常显著。便称结果无显著差异,或结果非常显著。四、统计分析方法表述问题四、统计分析方法表述问题5 5u 假设检验结果正确的表达方法是:假设检验结果正确的表达方法是: 应写出描述性统计量,如样本均数、率、相关系数、回应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统归系数、相对危险度、半数效量等,及其可信区间、检验统计量,如计量,如2 2、t t、u u、F F 值等值等) )、P P值;然后根据值;然后根据P P值大小作出值大小作出统计学推断,并作出相应的医学专业结论。统计学推断,并作出相应的医学专业结论。