1、医学研究数据管理与医学研究数据管理与统计分析统计分析2SPSSSPSS统计分析模块统计分析模块u统计描述统计描述u统计推断统计推断医学研究数据管理与统计分析3一、均数的计算方法一、均数的计算方法计量资料的均数和标准差计算可采用上节课介绍计量资料的均数和标准差计算可采用上节课介绍的的分析分析描述统计描述统计*如果分组(如按性别)计算均数和标准差可以如果分组(如按性别)计算均数和标准差可以:(1)(1)拆分文件拆分文件 或或(2)(2)选择个案选择个案 或或(3)(3)分析分析 描述统计描述统计 探索探索还有什么方法吗?还有什么方法吗?医学研究数据管理与统计分析4均数与均数间的比较均数与均数间的比
2、较一、均数的计算方法一、均数的计算方法分析分析Analyze比较均值比较均值Compare Means均值均值Means试采用多种方法计算试采用多种方法计算example.savexample.sav中,男性和女性中,男性和女性的平均年龄与标准差。的平均年龄与标准差。分组变量分组变量可选的统计量可选的统计量可再添加分组变量可再添加分组变量医学研究数据管理与统计分析5均数与均数间的比较均数与均数间的比较上例仅是对男女性年龄的均数和标准差进行了描上例仅是对男女性年龄的均数和标准差进行了描述,那么男性和女性的年龄差异是否存在统计学述,那么男性和女性的年龄差异是否存在统计学意义呢?意义呢?这类资料应该
3、采用何种统计学检验方法?这类资料应该采用何种统计学检验方法?性别MeanStd.Deviation男55.109.991女54.579.500Total54.909.787age 医学研究数据管理与统计分析6均数间的比较均数间的比较一、一、t t检验检验 1 1、样本均数与总体均数的比较、样本均数与总体均数的比较 2 2、完全随机设计(成组设计)的两样本均数的比较、完全随机设计(成组设计)的两样本均数的比较 3 3、配对设计的两样本均数比较、配对设计的两样本均数比较二、方差分析二、方差分析 1 1、完全随机设计(成组设计)的单因素方差分析、完全随机设计(成组设计)的单因素方差分析 2 2、随机
4、区组设计(配伍设计)的两因素方差分析、随机区组设计(配伍设计)的两因素方差分析三、协方差分析三、协方差分析医学研究数据管理与统计分析7样本均数与已知总体均数的比较样本均数与已知总体均数的比较医学研究数据管理与统计分析8样本均数与已知总体均数的比较样本均数与已知总体均数的比较例:通过大量调查例:通过大量调查,已知某地正常男婴体重为已知某地正常男婴体重为3.26Kg,3.26Kg,某医生随机抽取某医生随机抽取2020名难产男婴,测得出名难产男婴,测得出生体重如下:问,该地难产男婴体重是否不同于生体重如下:问,该地难产男婴体重是否不同于本地正常男婴?本地正常男婴?3.5 3.5 3.2 3.5 3.
5、3 3.0 3.3 3.2 3.4 2.7 3.4 3.6 3.5 2.8 3.4 2.9 3.5 3.5 4.0 4.0 SPSS 分析命令:分析命令:分析分析Analyze比较均值比较均值Compare Means单样本单样本t检验检验 One-Sample T Test数据库:one sample T test.sav医学研究数据管理与统计分析9样本均数与已知总体均数的比较样本均数与已知总体均数的比较总体均数总体均数医学研究数据管理与统计分析10样本均数与已知总体均数的比较样本均数与已知总体均数的比较结论:结论:不能认为难产男婴的出生体重与正常男婴不同。不能认为难产男婴的出生体重与正常男
6、婴不同。P 值值自由度自由度t 值值医学研究数据管理与统计分析11 成组比较成组比较t检验需注意:检验需注意:n个体之间相互独立n两组资料均取自正态分布的总体n满足方差齐性医学研究数据管理与统计分析12完全随机设计(成组设计)两个样本均数的比较完全随机设计(成组设计)两个样本均数的比较例:某医生测得例:某医生测得1212名正常人和名正常人和1313名病毒性肝炎患者血清转铁名病毒性肝炎患者血清转铁蛋白含量(蛋白含量(g/Lg/L)结果如下:问肝炎患者和正常人血清转铁结果如下:问肝炎患者和正常人血清转铁蛋白含量有无差异?蛋白含量有无差异?病毒性肝炎患者:病毒性肝炎患者:2.34 2.47 2.22
7、 2.31 2.36 2.38 2.15 2.57 2.19 2.25 2.28 2.31 2.42正常人:正常人:2.61 2.71 2.73 2.64 2.68 2.81 2.76 2.55 2.91 2.85 2.71 2.64Q:此类数据如何录入?:此类数据如何录入?数据库:Independent Samples T Test.sav医学研究数据管理与统计分析13完全随机设计(成组设计)两个样本均数的比较完全随机设计(成组设计)两个样本均数的比较分析变分析变量量分组变分组变量量医学研究数据管理与统计分析14完全随机设计(成组设计)两个样本均数的比较完全随机设计(成组设计)两个样本均数的
8、比较统计描述统计描述方差齐性检验方差齐性检验结论:结论:病毒性肝炎患者与正常人血清转铁蛋白含量差病毒性肝炎患者与正常人血清转铁蛋白含量差异有统计学意义。异有统计学意义。医学研究数据管理与统计分析15医学研究数据管理与统计分析16配对配对t检验检验医学研究数据管理与统计分析17配对设计的两个样本均数比较配对设计的两个样本均数比较(配对(配对t检验)检验)例:为比较某新药与常规药降血脂的效果,将性别相同、血例:为比较某新药与常规药降血脂的效果,将性别相同、血清总胆固醇水平相近的高血脂患者配成对子,每对中随机抽清总胆固醇水平相近的高血脂患者配成对子,每对中随机抽取一个人服用新药,另一个人服用常规药。
9、服用一段时间后,取一个人服用新药,另一个人服用常规药。服用一段时间后,测得血清总胆固醇含量(测得血清总胆固醇含量(mmol/Lmmol/L)如下:问新药与常规药降)如下:问新药与常规药降血清总胆固醇效果是否相同?血清总胆固醇效果是否相同?新新 药:药:6.57 6.46 6.27 6.89 6.21 7.61 7.60 7.04 6.68 7.42常规药:常规药:6.00 6.83 5.97 7.28 6.30 6.64 7.38 7.00 6.03 7.22 SPSS 分析命令:分析命令:Q:此类数据如何录入?:此类数据如何录入?paired-sample T test.sav医学研究数据管
10、理与统计分析18配对设计的两个样本均数比较配对设计的两个样本均数比较选中欲比较的两个因素,再点击选中欲比较的两个因素,再点击医学研究数据管理与统计分析19配对设计的两个样本均数比较配对设计的两个样本均数比较结论:结论:不能认为新药与常规药降低血清总胆固醇的效不能认为新药与常规药降低血清总胆固醇的效果不同。果不同。配对差值配对差值医学研究数据管理与统计分析20Q:能否采用我们前面学过的能否采用我们前面学过的单样本单样本T检验检验(样本均数与已知(样本均数与已知总体均数比较)总体均数比较)比较新药与常规药降血清总胆固醇效比较新药与常规药降血清总胆固醇效果是否相同?果是否相同?医学研究数据管理与统计
11、分析21Compute 计算产生一新变量计算产生一新变量 d,d=group1-group2检验检验 d=0医学研究数据管理与统计分析222组均数比较可采用组均数比较可采用t-test多组均数如何比较?多组均数如何比较?医学研究数据管理与统计分析23方差分析方差分析Analysis of Variance,ANOVA方差分析的目的:方差分析的目的:推断两个或多个总体均数是否相等推断两个或多个总体均数是否相等方差分析的使用条件:方差分析的使用条件:n各处理组样本来自正态总体各处理组样本来自正态总体n各样本是相互独立的随机样本各样本是相互独立的随机样本n各处理组的总体方差相等,即方差齐性各处理组的
12、总体方差相等,即方差齐性医学研究数据管理与统计分析24n 方差分析的结果解释:方差分析的结果解释:方差分析的方差分析的F F 检验,当检验,当P0.05P0.05,可以认为各组总体均数,可以认为各组总体均数不等或不全相等,但并不可认为任意两组总体均数都有不等或不全相等,但并不可认为任意两组总体均数都有差别。需要进一步作两两比较才能知道哪些组间有差别。差别。需要进一步作两两比较才能知道哪些组间有差别。n 多个样本均数间的两两比较多个样本均数间的两两比较 当样本组数大于当样本组数大于2 2时,不宜再用前述的时,不宜再用前述的t t检验分别作两两检验分别作两两比较,否则会增大犯第一类错误的概率。比较
13、,否则会增大犯第一类错误的概率。n 方差分析与方差分析与t t检验的联系检验的联系 t t检验可以看作时方差分析的特例检验可以看作时方差分析的特例:方差分析的注意事项方差分析的注意事项tF 医学研究数据管理与统计分析25完全随机设计方差分析完全随机设计方差分析(成组设计)(成组设计)医学研究数据管理与统计分析26医学研究数据管理与统计分析27完全随机设计(成组设计)的单因素方差分析完全随机设计(成组设计)的单因素方差分析1个因素,k个水平例:某社区随机抽取例:某社区随机抽取3030名糖尿病患者、糖耐量减低(名糖尿病患者、糖耐量减低(IGTIGT)者和正常)者和正常人进行载脂蛋白人进行载脂蛋白(
14、mg/dl)(mg/dl)测定,结果如下:问三种人载脂蛋白水平有测定,结果如下:问三种人载脂蛋白水平有无差别?无差别?糖尿病患者:糖尿病患者:85.70 105.20 109.50 96.00 115.20 95.30 110.00 100.00 125.60 111.00 106.50IGT异常者:异常者:96.00 124.50 105.10 76.40 95.30 110.00 95.20 99.00 120.00正正 常常 人:人:144.00 117.00 110.00 109.00 103.00 123.00 127.00 121.00 159.00 115.00 方法一:方法一:
15、Q:此类数据如何录入?:此类数据如何录入?One-way ANOVA.sav医学研究数据管理与统计分析28完全随机设计(成组设计)的单因素方差分析完全随机设计(成组设计)的单因素方差分析1个因素,k个水平分组变量分组变量分析变量分析变量医学研究数据管理与统计分析29方差齐性检验方差齐性检验输出描述统计量输出描述统计量医学研究数据管理与统计分析30完全随机设计(成组设计)的单因素方差分析完全随机设计(成组设计)的单因素方差分析1个因素,k个水平结论:结论:可以认为三种人血清载脂蛋白水平有差别。可以认为三种人血清载脂蛋白水平有差别。但哪两组间有区别呢?但哪两组间有区别呢?医学研究数据管理与统计分析
16、31两两比较两两比较假定方差假定方差齐时齐时假定方差假定方差不齐时不齐时医学研究数据管理与统计分析32两两比较两两比较医学研究数据管理与统计分析33两两比较两两比较每两个均数进行比较AB、AC、BCABC医学研究数据管理与统计分析34两两比较两两比较分别与对照组进行比较AC、BCABC(对照)医学研究数据管理与统计分析35前述的方差分析还可以通过一般线性模型实现前述的方差分析还可以通过一般线性模型实现AnalyzeGeneral Linear ModelUnivariate因变量因变量分组变量分组变量协变量协变量医学研究数据管理与统计分析36组间变异组间变异组内变异组内变异总变异总变异除了方差
17、分析表不同以外,方法一和方除了方差分析表不同以外,方法一和方法二的其他输出结果是一致的:法二的其他输出结果是一致的:医学研究数据管理与统计分析37 SPSS 分析命令:分析命令:AnalyzeGeneral Linear ModelUnivariate随机区组设计(配伍组设计)资料的方差分析随机区组设计(配伍组设计)资料的方差分析(1个研究因素a个水平,1个配伍组因素b个水平)例:为探索丹参对肢体缺血再灌注损伤的影响,将例:为探索丹参对肢体缺血再灌注损伤的影响,将3030只纯种只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为新西兰实验用大白兔,按窝别相同、体重相近划分为10 10 个个区组
18、区组。每个区组。每个区组3 3 只大白兔随机采用只大白兔随机采用A A、B B、C C 三种处理方案三种处理方案,即在松止血带前分别给予丹参即在松止血带前分别给予丹参2ml/kg2ml/kg、丹参、丹参1ml/kg1ml/kg、生理盐、生理盐水水2ml/kg2ml/kg,在松止血带前及松后,在松止血带前及松后1 1小时分别测定血中白蛋白小时分别测定血中白蛋白含量(含量(g/Lg/L),算出白蛋白减少量。问三种方案的处理效果),算出白蛋白减少量。问三种方案的处理效果是否不同?是否不同?GLM Univariate.sav医学研究数据管理与统计分析38白蛋白减少量白蛋白减少量A A、B B、C C
19、 三种处三种处理方案理方案区组因素(配伍组)区组因素(配伍组)医学研究数据管理与统计分析39分组变量分组变量分析变量分析变量医学研究数据管理与统计分析40分析主效应分析主效应或或交互作用交互作用分析所有主效分析所有主效应应和和交互作用交互作用医学研究数据管理与统计分析41随机区组设计资料的方差分析随机区组设计资料的方差分析组间组间区组区组组内组内结论:结论:认为认为10 个区组的总体均数相同。但是,个区组的总体均数相同。但是,A、B、C 三种方案的三种方案的处理效果不全相同,即三个总体均数中至少有两个不同。至于三个总处理效果不全相同,即三个总体均数中至少有两个不同。至于三个总体均数中哪些不同,
20、同样需要进行多个均数间的两两比较。体均数中哪些不同,同样需要进行多个均数间的两两比较。医学研究数据管理与统计分析42随机区组设计资料的方差分析随机区组设计资料的方差分析结论:结论:认为认为A、B种方案的处理效果没有差异,但均与种方案的处理效果没有差异,但均与 C 种处理方案种处理方案的效果有差异,的效果有差异,松止血带前给予丹参能使血中白蛋白含量降低。松止血带前给予丹参能使血中白蛋白含量降低。SNK法法两两比较两两比较医学研究数据管理与统计分析43协方差分析协方差分析Analysis of Covariance,ANCOVAANCOVA的目的的目的将协变量对因变量的影响从自变量中分离出去,可以
21、将协变量对因变量的影响从自变量中分离出去,可以进一步提高实验精确度和统计检验灵敏度进一步提高实验精确度和统计检验灵敏度ANCOVA的适用条件的适用条件n各处理组样本来自正态总体各处理组样本来自正态总体n各样本是相互独立的随机样本各样本是相互独立的随机样本n各处理组的总体方差相等,即方差齐性各处理组的总体方差相等,即方差齐性n各组的回归斜率相等,即回归齐性各组的回归斜率相等,即回归齐性医学研究数据管理与统计分析44一元协方差分析一元协方差分析例:研究镉作业工人暴露于烟尘的年数与肺活量的关系。按例:研究镉作业工人暴露于烟尘的年数与肺活量的关系。按暴露年数将工人分为两组:甲组暴露暴露年数将工人分为两
22、组:甲组暴露 1010年,乙组暴露年,乙组暴露100.05),满足回归齐性的假定,因此可以),满足回归齐性的假定,因此可以采用采用ANCOVA。交互作用项交互作用项医学研究数据管理与统计分析542、ANCOVA方法方法医学研究数据管理与统计分析55结论:结论:扣除了年龄对肺活量的影响后,不能认为扣除了年龄对肺活量的影响后,不能认为甲、乙两组工人的肺活量有差别甲、乙两组工人的肺活量有差别。医学研究数据管理与统计分析56分类变量的统计分析分类变量的统计分析 1 1、成组设计的两样本率比较、成组设计的两样本率比较 2 2、配对设计的两样本率比较、配对设计的两样本率比较 3 3、完全随机设计的多个样本
23、率比较、完全随机设计的多个样本率比较医学研究数据管理与统计分析57完全随机设计两个样本率的比较完全随机设计两个样本率的比较例例1 1:某中药在改变剂型前曾在临床观察:某中药在改变剂型前曾在临床观察152152例,治愈例,治愈129129例,例,未治愈未治愈2323例;改变剂型后又在临床观察例;改变剂型后又在临床观察130130例,治愈例,治愈101101例,例,未治愈未治愈2929例,能否得出新剂型疗效与旧剂型不同的结论?例,能否得出新剂型疗效与旧剂型不同的结论?crosstabs1.sav医学研究数据管理与统计分析58完全随机设计两个样本率的比较完全随机设计两个样本率的比较医学研究数据管理与
24、统计分析59完全随机设计两个样本率的比较完全随机设计两个样本率的比较医学研究数据管理与统计分析60SPSS 分析命令:分析命令:Descriptive StatisticsCrosstabs医学研究数据管理与统计分析61行变量行变量列变量列变量医学研究数据管理与统计分析62医学研究数据管理与统计分析63医学研究数据管理与统计分析64医学研究数据管理与统计分析65例例2 2:某矿石粉厂当生产一种矿石粉时,在数天内即有部分:某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮炎,本生产季节开始,随机抽取工人患职业性皮炎,本生产季节开始,随机抽取1515名车间工名车间工人穿上新防护服,其中人
25、穿上新防护服,其中1 1名患皮炎,其余名患皮炎,其余2828名工人仍穿旧防名工人仍穿旧防护服,其中护服,其中1010名患皮炎。生产一段时间后,检查两组工人皮名患皮炎。生产一段时间后,检查两组工人皮炎患病率,问两组工人皮炎患病率有无差异?炎患病率,问两组工人皮炎患病率有无差异?crosstabs2.sav医学研究数据管理与统计分析66医学研究数据管理与统计分析67例例3 3:某医师:某医师A A药治疗药治疗9 9例病人,治愈例病人,治愈7 7人;用人;用B B药治药治疗疗1010例病人,治愈例病人,治愈1 1人,问两药疗效是否有差别?人,问两药疗效是否有差别?crosstabs3.sav医学研究
26、数据管理与统计分析68医学研究数据管理与统计分析69配对设计两个样本率的比较配对设计两个样本率的比较例例1 1:分别用反向血凝法和酶标法对:分别用反向血凝法和酶标法对200200名献血员进行名献血员进行HBsAgHBsAg检测,结果如下,问两种检验方法检出率有无差异?检测,结果如下,问两种检验方法检出率有无差异?pair-crosstab.sav医学研究数据管理与统计分析70方法一:交叉表方法一:交叉表 Crosstabs医学研究数据管理与统计分析71医学研究数据管理与统计分析72医学研究数据管理与统计分析73方法方法 二:非参数检验二:非参数检验 Nonparametric Test医学研究
27、数据管理与统计分析74非参数检验非参数检验 Nonparametric Test医学研究数据管理与统计分析75非参数检验非参数检验 Nonparametric Test精确概率法精确概率法医学研究数据管理与统计分析76完全随机设计的多个样本率的比较完全随机设计的多个样本率的比较例:某省从水氟含量不同的地区随机抽取例:某省从水氟含量不同的地区随机抽取10-1210-12岁儿童,进岁儿童,进行第一恒齿患病率的调查,问行第一恒齿患病率的调查,问3 3个地区第一恒齿患病率是否个地区第一恒齿患病率是否不同?不同?医学研究数据管理与统计分析77完全随机设计的多个样本率的比较完全随机设计的多个样本率的比较资
28、料整理资料整理crosstabs4.sav医学研究数据管理与统计分析78SPSS 分析命令:分析命令:AnalyzeDescriptive StatisticsCrosstabs完全随机设计的多个样本率的比较完全随机设计的多个样本率的比较crosstabs4.sav医学研究数据管理与统计分析80分层分析与混杂偏倚分层分析与混杂偏倚医学研究数据管理与统计分析81混杂偏倚混杂偏倚 ConfoundingExposure OutcomeThird variable(Confounder)混杂因素具有下述三项特点:混杂因素具有下述三项特点:(1)混杂因素必须与所研究疾病的发生有关,是该疾病的危险混杂因
29、素必须与所研究疾病的发生有关,是该疾病的危险因素之一。因素之一。(2)混杂因素必须与所研究因素有关。混杂因素必须与所研究因素有关。(3)混杂因素必须不是研究因素与疾病病因链上的中间环节或混杂因素必须不是研究因素与疾病病因链上的中间环节或中间步骤。中间步骤。医学研究数据管理与统计分析82混杂偏倚的控制混杂偏倚的控制医学研究数据管理与统计分析83M-H(Mantel-Haenszel)分层分析法分层分析法医学研究数据管理与统计分析84AlcoholSmokingLung cancer饮酒与肺癌的病例对照研究饮酒与肺癌的病例对照研究(吸烟为可能的混杂因素)(吸烟为可能的混杂因素)医学研究数据管理与统
30、计分析85饮酒与肺癌的病例对照研究饮酒与肺癌的病例对照研究饮酒不饮酒合计肺癌病例241034对照264066合计5050100(吸烟为可能的混杂因素)(吸烟为可能的混杂因素)医学研究数据管理与统计分析86(1)按可能的混杂因素吸烟分层按可能的混杂因素吸烟分层吸烟层(i=1)不吸烟层(i=2)饮酒不饮酒小计饮酒 不饮酒小计肺癌病例21627347对照9413173653合计301040204060医学研究数据管理与统计分析87(2)异质性检验异质性检验121 41.566 9OR121 41.566 9OR23 361.594 17OR23 361.594 17OR12OROR医学研究数据管理与
31、统计分析88(3)计算综合或调整计算综合或调整OR,并与粗,并与粗OR比较比较 21 4/403 36/601.576 9/404 17/60 MHOR 24 403.6910 26 cORMHcOROR调整调整OR粗粗OR比较(比较(一一般而言,如果差值有般而言,如果差值有0.5以上的改变(以上的改变(RR或或OR1时)或者有时)或者有0.1以上的改变(以上的改变(RR或或OR描述统计描述统计交叉表交叉表M-H.sav医学研究数据管理与统计分析91分层资料的卡方检验分层资料的卡方检验分层变量分层变量医学研究数据管理与统计分析92分层资料的卡方检验分层资料的卡方检验计算计算OR值值层间齐性检验
32、层间齐性检验合并合并OR值计算值计算医学研究数据管理与统计分析93分层资料的卡方检验分层资料的卡方检验医学研究数据管理与统计分析94分层资料的卡方检验分层资料的卡方检验医学研究数据管理与统计分析95分层资料的卡方检验分层资料的卡方检验结果显示:结果显示:在剔除了混杂因素性别的影响后,吸烟与肺在剔除了混杂因素性别的影响后,吸烟与肺癌仍然显著相关,即吸烟是导致肺癌发生的危险因素。癌仍然显著相关,即吸烟是导致肺癌发生的危险因素。医学研究数据管理与统计分析96Mantel-Haenszel Common Odds Ratio Estimate4.5241.509.320.0002.4178.467.8
33、832.136Estimateln(Estimate)Std.Error of ln(Estimate)Asymp.Sig.(2-sided)Lower BoundUpper BoundCommon OddsRatioLower BoundUpper Boundln(CommonOdds Ratio)Asymp.95%ConfidenceIntervalThe Mantel-Haenszel common odds ratio estimate is asymptotically normallydistributed under the common odds ratio of 1.000 assumption.So is the natural log ofthe estimate.医学研究数据管理与统计分析
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。