SPSS统计分析基础课件2.ppt

上传人(卖家):晟晟文业 文档编号:4290814 上传时间:2022-11-26 格式:PPT 页数:77 大小:12.88MB
下载 相关 举报
SPSS统计分析基础课件2.ppt_第1页
第1页 / 共77页
SPSS统计分析基础课件2.ppt_第2页
第2页 / 共77页
SPSS统计分析基础课件2.ppt_第3页
第3页 / 共77页
SPSS统计分析基础课件2.ppt_第4页
第4页 / 共77页
SPSS统计分析基础课件2.ppt_第5页
第5页 / 共77页
点击查看更多>>
资源描述

1、1 SAS (Statistics Analysis System)美国的美国的SASSAS软件以其强大的数据管理能力、全面的统计方法、高精度的计算以及独软件以其强大的数据管理能力、全面的统计方法、高精度的计算以及独特的多平台自适应技术,成为统计软件包的标准,被国内外许多学者誉为最权威的统计特的多平台自适应技术,成为统计软件包的标准,被国内外许多学者誉为最权威的统计软件包。软件包。2020世纪世纪8080年代进入中国。但该软件操作复杂,不能为广大普通用户接受,仅适年代进入中国。但该软件操作复杂,不能为广大普通用户接受,仅适合专业统计人员使用。合专业统计人员使用。2 SPSS (Statisti

2、cal Package for Social Sciences)(Statistical Product and Service Solutions)已被广泛应用于自然科学、社会科学各个领域中,如工程技术、应用数学、经济学、已被广泛应用于自然科学、社会科学各个领域中,如工程技术、应用数学、经济学、商业、金融、生物学、教育、医疗卫生、体育、心理学、管理学、农林等。商业、金融、生物学、教育、医疗卫生、体育、心理学、管理学、农林等。3 BMDP (Biomedical Computer Programs)该软件包曾和该软件包曾和SASSAS、SPSSSPSS共称为三大统计软件包,在国际上影响很大。它

3、方法全面、共称为三大统计软件包,在国际上影响很大。它方法全面、灵活,早期曾有很多独具特色的分析方法。不过其发展路途不畅,从灵活,早期曾有很多独具特色的分析方法。不过其发展路途不畅,从19911991年的年的7.07.0版本版本以后就没有推出新版本,最后被以后就没有推出新版本,最后被SPSSSPSS公司收购。公司收购。1 变量编辑窗口(变量编辑窗口(Variable View)变量名的定义变量名的定义l数值型(数值型(Numeric):系统默认系统默认 “Width”(整数位宽度)(整数位宽度)“Decimal Places”(小数位数)(小数位数)l逗点数值型逗点数值型l园点数值型园点数值型l

4、科学计数法型科学计数法型l日期型日期型l美元记号型美元记号型l习惯金融记号型(自定义型)习惯金融记号型(自定义型)l字符型字符型(String):不能进行运算,可输汉字。不能进行运算,可输汉字。“Characters”(可存字符数)可存字符数)变量类型、宽度、小数位变量类型、宽度、小数位变量标签变量标签 对变量做出解释,输入字符。对变量做出解释,输入字符。标量值标签标量值标签 解释变量值的含义,对等级变量或名义变量尤其有用。解释变量值的含义,对等级变量或名义变量尤其有用。如如11,男;,男;2 2,女,女。缺失值缺失值 列宽列宽 用以控制数据编辑窗口中的数据值占用的宽度。用以控制数据编辑窗口中

5、的数据值占用的宽度。对齐方式对齐方式 数值型变量默认为右对齐,字符型变量默认为左对齐。数值型变量默认为右对齐,字符型变量默认为左对齐。变量测度变量测度 选择相应的变量测度:选择相应的变量测度:尺度型(尺度型(Scale)名义型(名义型(Nominal)等级型(等级型(Ordinal)行行:代表观察:代表观察个体个体(例,(例,Case)列列:代表观察到的:代表观察到的变量变量(Variable)数据格数据格:观察值观察值左侧为左侧为输出大纲窗口输出大纲窗口右侧为右侧为内容窗口内容窗口浏览窗口的内容可保存为多种文本,如浏览窗口的内容可保存为多种文本,如 Word (Word/RTF file)P

6、PT (PowerPoint)(一)计量资料的参数检验(一)计量资料的参数检验1 描述性分析描述性分析 均值及标准差均值及标准差 应用条件应用条件(1)样本资料符合样本资料符合正态分布正态分布。(2)单样本数据:一般说每组例数)单样本数据:一般说每组例数60例。例。两样本数据,一般说两组例数之和两样本数据,一般说两组例数之和 60例,而且例数例,而且例数 基本均等。基本均等。(3)理论上,要求单样本是从总体中随机抽取,两)理论上,要求单样本是从总体中随机抽取,两 样本为随机分组资料。观察性资料要求样本为随机分组资料。观察性资料要求组间具组间具 有可比性有可比性,即比较组之间除了研究因素以外,即

7、比较组之间除了研究因素以外,其他可能有影响的非研究因素均应相同或相近。其他可能有影响的非研究因素均应相同或相近。(1)Explore法检验是否符合正态分布法检验是否符合正态分布上表中:上表中:N50N50,采用,采用K-SK-S方法。方法。N50N50,采用,采用K-WK-W方法。方法。本例符合正态分布本例符合正态分布T Te es st ts s o of f N No or rm ma al li it ty y.08440.200*.97640.538血清总胆固醇StatisticdfSig.StatisticdfSig.Kolmogorov-SmirnovaShapiro-WilkTh

8、is is a lower bound of the true significance.*.Lilliefors Significance Correctiona.O O n n e e-S S a a m m p p l l e e K K o o l l m m o o g g o o r r o o v v-S S m m i i r r n n o o v v T T e e s s t t404.7995.87050.084.084-.047.531.941NMeanStd.DeviationNormal Parametersa,bAbsolutePositiveNegativeM

9、ost ExtremeDifferencesKolmogorov-Smirnov ZAsymp.Sig.(2-tailed)血清总胆固醇Test distribution is Normal.a.Calculated from data.b.例例 data1-2D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs s1065001500 805.79170.960106肺活量Valid N(listwise)NMinimum MaximumMean Std.Deviationt 检验的应用条件检验的应用条件当样本含量较小时

10、,理论上要求样本为来自正态分当样本含量较小时,理论上要求样本为来自正态分布总体的随机样本;布总体的随机样本;当两小样本均数比较时,要求两总体方差相等(方当两小样本均数比较时,要求两总体方差相等(方差齐性)。在实际工作中,若上述条件略有偏离,差齐性)。在实际工作中,若上述条件略有偏离,仍可进行仍可进行t 检验分析。检验分析。例例5-1该方法测得的结果与标准浓度值有所不同。该方法测得的结果与标准浓度值有所不同。采用题中所指方法测量该标准浓度溶液的效果欠佳。采用题中所指方法测量该标准浓度溶液的效果欠佳。单侧检验单侧检验(2-sided,2-talled):需注明。例如,健康男子脉搏平均):需注明。例

11、如,健康男子脉搏平均72次次/m,山山 区区25名男子脉搏平均名男子脉搏平均74.2次次/m,二者是否一致?此时根据经验知山区脉搏二者是否一致?此时根据经验知山区脉搏 快,故应取单侧(正侧)。单侧检验更容易得出有差异的结论。快,故应取单侧(正侧)。单侧检验更容易得出有差异的结论。双侧检验双侧检验(1-sided,1-talled):一般比较保守的以双侧为好。不注明时均表示):一般比较保守的以双侧为好。不注明时均表示 为双侧检验。为双侧检验。例例SPSS统计方法统计方法G Gr ro ou up p S St ta at ti is st ti ic cs s10122.000022.24610

12、7.034839103.000019.416496.47216group高蛋白组低蛋白组weightNMeanStd.DeviationStd.ErrorMeanI In nd de ep pe en nd de en nt t S Sa am mp pl le es s T Te es st t.089.7701.97317.065 19.000009.63144-1.3205739.320571.98816.990.063 19.000009.55917-1.1690039.16900Equal variancesassumedEqual variancesnot assumedweigh

13、tFSig.Levenes Test forEquality of Variancestdf Sig.(2-tailed)MeanDifferenceStd.ErrorDifference LowerUpper95%ConfidenceInterval of theDifferencet-test for Equality of Means本例方差齐,所以看上行结果本例方差齐,所以看上行结果,p=0.065。两种膳食对小鼠体重无明显影响。两种膳食对小鼠体重无明显影响。配对资料包括:配对资料包括:(1)同对同对(年龄、性别、体重、病况等非处理(年龄、性别、体重、病况等非处理 因因 素相同或相似者

14、);素相同或相似者);(2)同一研究对象分别给予两种不同处理同一研究对象分别给予两种不同处理的效果的效果 比较;比较;(3)同一研究对象处理前后同一研究对象处理前后的效果比较。的效果比较。应用条件应用条件 理论上,计量资料的配对样本均数比理论上,计量资料的配对样本均数比较时,各样本均应来自正态总体。较时,各样本均应来自正态总体。由于受严格配对条件的限制,此时多由于受严格配对条件的限制,此时多为小样本资料,此时个别书籍中提出对为小样本资料,此时个别书籍中提出对资料的分布类型不做要求。资料的分布类型不做要求。(李竹,郑俊池李竹,郑俊池.新编实新编实用医学统计方法与技能,中国医药科技出版社,北京,用

15、医学统计方法与技能,中国医药科技出版社,北京,1997,p63)两种饲料喂养的大白鼠肝中两种饲料喂养的大白鼠肝中Vit A含量差别有统计学意义。含量差别有统计学意义。抽取抽取8批溶液,每批分成批溶液,每批分成3分,分别由甲、乙、丙三种分离机析分,分别由甲、乙、丙三种分离机析出某种物质,数据如表。问析出效能有无差异?出某种物质,数据如表。问析出效能有无差异?样号12345678甲4.03.54.15.54.66.05.14.3乙3.03.03.82.14.95.33.12.7丙3.23.84.33.64.04.94.72.4 与两配对变量的与两配对变量的t检验相似,将甲、乙、丙检验相似,将甲、乙

16、、丙三个变量两两配对,进入三个变量两两配对,进入“Paired-Sample T Test”,其余使用默认值。,其余使用默认值。上图:上图:X,S中图:相关关系中图:相关关系下图:两两比较结果:下图:两两比较结果:甲甲-乙、甲乙、甲-丙有丙有 差异,乙差异,乙-丙无丙无 差异。差异。P Pa ai ir re ed d S Sa am mp pl le es s S St ta at ti is st ti ic cs s4.63758.83826.296373.487581.10510.390714.63758.83826.296373.86258.81405.287813.487581.1

17、0510.390713.86258.81405.28781甲乙Pair1甲丙Pair2乙丙Pair3MeanNStd.DeviationStd.ErrorMeanP Pa ai ir re ed d S Sa am mp pl le es s C Co or rr re el la at ti io on ns s8.309.4568.486.2228.596.119甲&乙Pair 1甲&丙Pair 2乙&丙Pair 3NCorrelationSig.P Pa ai ir re ed d S Sa am mp pl le es s T Te es st t1.150001.16251.4110

18、1.17812 2.121882.7987.027.77500.83794.29626.07446 1.475542.6167.035-.37500.90040.31834-1.12775.37775-1.1787.277甲-乙Pair 1甲-丙Pair 2乙-丙Pair 3MeanStd.DeviationStd.ErrorMeanLowerUpper95%ConfidenceInterval of theDifferencePaired DifferencestdfSig.(2-tailed)方差分析的应用条件方差分析的应用条件 各组样本是相互独立的随机样本。各组样本是相互独立的随机样本。

19、均来自正态总体。均来自正态总体。各组总体方差相等,即方差齐性(各组总体方差相等,即方差齐性(homoscedasticity)。)。例例5-4注意注意:此时应用两样本均数:此时应用两样本均数比较的比较的t检验,不仅麻烦,而检验,不仅麻烦,而且使假设检验犯且使假设检验犯I型错误的概型错误的概率增大。原则上不能应用。率增大。原则上不能应用。如果误用上述方法,应改如果误用上述方法,应改变变P值的标准:值的标准:P=0.05/比较次数比较次数不同时期切痂对大鼠肝脏不同时期切痂对大鼠肝脏ATP含量有影响。含量有影响。方差分析中,方差分析中,P0.05只说明各水平的均数不全相等,并不排只说明各水平的均数不

20、全相等,并不排除某两个或某几个水平均数相等的情况,因此需做均数间的两两除某两个或某几个水平均数相等的情况,因此需做均数间的两两比较。例比较。例5-4。Analyze Compare Means One-Way Anova 选择分析变量进入选择分析变量进入Dependent List 选择分组变量进入选择分组变量进入Factor 选择选择“Post-Hoc”选择选择Post-Hoc方法:方法:方差齐时有方差齐时有14种,最常用种,最常用Bonferroni,S-N-K.方差不齐时有方差不齐时有4种,最常用种,最常用Games-Howell.OKlA A与与B B比较:比较:P P0.00010.

21、0001lA A与与C C比较:比较:P=0.162P=0.162lB B与与C C比较:比较:P P0.00010.0001M Mu ul lt ti ip pl le e C Co om mp pa ar ri is so on ns sDependent Variable:ATPLSD-4.61000*.85055.000-6.3552-2.8648-1.22300.85055.162-2.9682.52224.61000*.85055.0002.86486.35523.38700*.85055.0001.64185.13221.22300.85055.162-.52222.9682-3

22、.38700*.85055.000-5.1322-1.6418(J)groupB组C组A组C组A组B组(I)groupA组B组C组MeanDifference(I-J)Std.ErrorSig.Lower Bound Upper Bound95%Confidence IntervalThe mean difference is significant at the.05 level.*.例5-5第第1行:对整个模型的检验:行:对整个模型的检验:F=28.561,p=0.000,整个模型有统计学意义。整个模型有统计学意义。第第2行:对处理组行:对处理组treat的检验:的检验:F=16.603,

23、p=0.000,表明不同浓度的血水草总生物表明不同浓度的血水草总生物 碱对尾蚴存活率有影响。碱对尾蚴存活率有影响。第第3行:对区组变量行:对区组变量block的检验:的检验:F=1.887,p=0.078,表明不同区组的小鼠尾蚴,表明不同区组的小鼠尾蚴 存活率总体均数相等。存活率总体均数相等。T Te es st ts s o of f B Be et tw we ee en n-S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable:rate8.059a15.53728.561.000.9373.31216.603.0

24、00.39011.0351.887.078.62133.0198.67948SourceModeltreatblockErrorTotalType III Sumof SquaresdfMean SquareFSig.R Squared=.928(Adjusted R Squared=.896)a.标准差的平方标准差的平方。两小样本比较的。两小样本比较的t检验,要求样本所在的总体方差相等,检验,要求样本所在的总体方差相等,但由于存在抽样误差,即使两总体方差相等,样本方差也会有差别。方差齐性检但由于存在抽样误差,即使两总体方差相等,样本方差也会有差别。方差齐性检验用来判断两个总体方差是否齐。方差

25、齐性检验:验用来判断两个总体方差是否齐。方差齐性检验:(1)两个独立样本的方差齐性检验:如前述,在结果中看上行或下行。)两个独立样本的方差齐性检验:如前述,在结果中看上行或下行。(2)单向方差分析时的方差齐性检验:)单向方差分析时的方差齐性检验:例例5-4.P0.05,表明方差齐。,表明方差齐。(3)双向方差分析时的方差齐性检验:例)双向方差分析时的方差齐性检验:例5-5。单击单击“Option”选择选择“Homogeneity tests OK.然后再将然后再将“Block”选入选入“Fixed Factor”单击单击“Option”选择选择“Homogeneity testsOK.上表为各

26、处理组的方差齐性检验:方差齐。上表为各处理组的方差齐性检验:方差齐。下表为各区组的方差齐性检验:方差齐。下表为各区组的方差齐性检验:方差齐。非参数检验不受总体分布的限制,是总体不服非参数检验不受总体分布的限制,是总体不服从正态分布或分布情况不明(从正态分布或分布情况不明(包括不服从正态分布包括不服从正态分布的计量资料的计量资料、计数资料、计数资料、等级资料等级资料)时的检验方法。)时的检验方法。适合参数检验的资料,应首选参数检验。此时适合参数检验的资料,应首选参数检验。此时 如果选用非参数检验,其效率约为参数检验方法的如果选用非参数检验,其效率约为参数检验方法的 95%,常需要更多的样本例数才

27、能检验出参数检验,常需要更多的样本例数才能检验出参数检验 方法所能检出的同样大小的差异。方法所能检出的同样大小的差异。主要介绍以下主要介绍以下4种计量资料的非参数检验:种计量资料的非参数检验:(1)两个独立样本检验)两个独立样本检验 (2)多个独立样本检验)多个独立样本检验 (3)两个相关样本检验)两个相关样本检验 (4)多个相关样本检验)多个相关样本检验例例 某实验室观察局部温热治疗小鼠移植肿瘤的某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日作为观察指标,实验结果如表。疗效,以生存日作为观察指标,实验结果如表。问小鼠生存日有无差别?问小鼠生存日有无差别?欲知两个独立样本的均数、中位数、

28、离散趋势,欲知两个独立样本的均数、中位数、离散趋势,最终确定两样本是否服从相同分布。最终确定两样本是否服从相同分布。实验组10121515161718202390合计合计10例例对照组2345678910111213合计合计12例例lAnalyzelNonparametric Testsl2 Independent Samplesl分别进入实验变量,分组变量分别进入实验变量,分组变量l单击单击“Define Groups”,赋值,赋值1,2lContinuel在在“Test Type”中选择一种方法(默认第一种)中选择一种方法(默认第一种)lOKP=0.000,两组生存日数有差异。两组生存日数

29、有差异。T Te es st t S St ta at ti is st ti ic cs sb b5.00083.000-3.630.000.000aMann-Whitney UWilcoxon WZAsymp.Sig.(2-tailed)Exact Sig.2*(1-tailedSig.)VAR00002Not corrected for ties.a.Grouping Variable:VAR00001b.例例 三组血浆总皮质醇测定值(三组血浆总皮质醇测定值(g/L),),试比较是否有差异?试比较是否有差异?正常正常人人单纯单纯肥胖肥胖皮质皮质醇增醇增多症多症0.40.69.81.91.

30、210.22.22.010.62.52.413.02.83.114.03.14.114.83.75.015.63.95.915.64.67.421.67.013.624.0lAnalyzelNonparametric Testslk Independent Samplesl分别进入实验变量,分组变量l单击“Define Groups”,赋值1,3lContinuel在“Test Type”中选择一种方法(默认第一种)lOK结果:差异有显著性,第结果:差异有显著性,第3组高于前两组。组高于前两组。T Te es st t S St ta at ti is st ti ic cs sa a,b b

31、18.1302.000Chi-SquaredfAsymp.Sig.PZCKruskal Wallis Testa.Grouping Variable:groupsb.同一受试对象测试同一受试对象测试2 2个或多个观测值,数据不再相互独立,而是彼此相关。个或多个观测值,数据不再相互独立,而是彼此相关。例例 两方法测定空气中两方法测定空气中SO2含量(含量(mg/m3),如表。,如表。样品样品号号12345678910化学化学法法50.73.328.846.21.225.22.95.43.81.0色谱色谱法法603.330.043.22.227.54.95.03.24.0lAnalyzelNonp

32、arametric Testsl2 Related Samplesl将两个实验变量同时进入“Test pair list”l在“Test Type”中选择一种方法(默认第一种)lOK Wilcoxon法检验不能认为两法测定法检验不能认为两法测定的二氧化硫含量有差异。的二氧化硫含量有差异。T Te es st t S St ta at ti is st ti ic cs sb b-1.424a.154ZAsymp.Sig.(2-tailed)色谱法-化学法Based on negative ranks.a.Wilcoxon Signed Ranks Testb.例例 患者四个阶段的血清患者四个阶

33、段的血清GPT值如表,有无差异?值如表,有无差异?注意注意:本例四组均服从正态分布,应首选多个配对样本的:本例四组均服从正态分布,应首选多个配对样本的T检验。此处用以演示检验。此处用以演示“不服从正态分布时的多个相关样本的不服从正态分布时的多个相关样本的非非 参数检验参数检验”方法。方法。患者号治疗前治疗后1周治疗后2周治疗后3周163188138542902382201443543008392445140213100554175150366723001639076420718587lAnalyzelNonparametric Testslk Related Samplesl将所有实验变量同时

34、进入“Test for Serveral Related Samples”l在“Test Type”中选择一种方法(默认第一种)lOK结论:结论:Friedman方法方法 x2=16.714,df=3,P=0.001,故认为治疗四阶段故认为治疗四阶段GTP差异有显著性。差异有显著性。T Te es st t S St ta at ti is st ti ic cs sa a716.7143.001NChi-SquaredfAsymp.Sig.Friedman Testa.医学研究中经常要研究两个变量的关系问题,医学研究中经常要研究两个变量的关系问题,如年龄与体重,血压与病死率等。在弄清两个变如

35、年龄与体重,血压与病死率等。在弄清两个变量关系之后,可以从一个变量的数值去估计另一量关系之后,可以从一个变量的数值去估计另一个变量的数值,例如可根据前人研究个变量的数值,例如可根据前人研究“体重体重(Kg)=年龄(周岁)年龄(周岁)2+8”对体重做出估计,对体重做出估计,从而省去测量体重的麻烦。从而省去测量体重的麻烦。应用条件应用条件 1 X、Y双变量均为正态分布的资料。双变量均为正态分布的资料。2 相关的变量应有内在联系。如年龄与体重,年龄与相关的变量应有内在联系。如年龄与体重,年龄与 身高有内在联系;而儿童身高与树高是伴随关系,身高有内在联系;而儿童身高与树高是伴随关系,变量变量“时间时间”与身高及树高的潜在联系造成了身高与身高及树高的潜在联系造成了身高与与 树高似有正相关关系的假象。树高似有正相关关系的假象。3 奇异值应剔除。奇异值应剔除。4 P0.05时,时,r 无意义。无意义。P0.05,如果,如果r过小,相关过小,相关 程度较低,例如程度较低,例如r=0.20,r2=0.04,说明因变量中只有,说明因变量中只有 4%的量与自变量相关。的量与自变量相关。例例

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(SPSS统计分析基础课件2.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|