1、Statistical Product and Service Solutions SPSS 统计软件包应用统计软件包应用(基础篇)(基础篇) 概 要 Outline1. 简介简介2. SPSS for Windows主界面菜单主界面菜单3. SPSS的数据管理功能与实现的数据管理功能与实现4. SPSS的统计分析功能与实现的统计分析功能与实现1. 简简 介介 Introduction SPSS(Statistics Package for Social Science) 是社会科学用的是社会科学用的统计软件包。它与统计软件包。它与SAS一样是世一样是世界上通用的统计软件包之一。界上通用的统计
2、软件包之一。 事实上,它不仅适用于社会科学,事实上,它不仅适用于社会科学,同样可应用于经济学、心理学、同样可应用于经济学、心理学、医学等各个领域。医学等各个领域。 这样无须编写程序,完全可以在这样无须编写程序,完全可以在Windows下通过下通过“菜单菜单”、“对对话框话框”使用鼠标来操作,对读者使用鼠标来操作,对读者提供极大的方便,深受用户欢迎提供极大的方便,深受用户欢迎。SPSS 的窗口(文件)的窗口(文件) Data 文件文件 (*.sav) 数据文件数据文件Output 文件(文件(*.spv)输出(结果)文件)输出(结果)文件Syntax 文件(文件(*.sps)程序文件)程序文件1
3、. 简简 介介 Introduction 2. SPSS for Windows主界面菜单主界面菜单 File File 文件操作文件操作 Edit Edit 文本编辑文本编辑 View View 视图视图 Data Data 数据文件的建立和编辑数据文件的建立和编辑 Transform Transform 数据转换数据转换 Analyze Analyze 统计分析统计分析 Graphs Graphs 统计图表的建立和编辑统计图表的建立和编辑 Utilities Utilities 实用的一些工具实用的一些工具 Windows Windows 窗口信息与控制窗口信息与控制 Help Help
4、帮助帮助2. SPSS for Windows主界面菜单主界面菜单3.3.SPSS的数据管理的数据管理Data view Variable view数据库结构变量+观察单位3.3.SPSS的数据管理的数据管理Variable view变量定义 变量名 变量标签 变量赋值3.3.SPSS的数据管理的数据管理 DATA TRANSFORMDATA DATA Identify duplicate caseIdentify duplicate case 查找识别重复录入的观察单位查找识别重复录入的观察单位 3.3.SPSS的数据管理的数据管理DATA DATA Merge filesMerge fil
5、es 合并数据库文件合并数据库文件 3.3.SPSS的数据管理的数据管理追加观察单位追加观察单位追加变量追加变量DATA DATA Split fileSplit file 分割数据库文件:按某个变量的变分割数据库文件:按某个变量的变量值分离数据库,便于分别进行分析。量值分离数据库,便于分别进行分析。 3.3.SPSS的数据管理的数据管理DATA DATA Select casesSelect cases 挑选符合某种条件的观察单位进行分析:例如只选择老年人进行分挑选符合某种条件的观察单位进行分析:例如只选择老年人进行分析。析。 3.3.SPSS的数据管理的数据管理DATA DATA Weig
6、ht cases Weight cases 加权:为观察单位加权加权:为观察单位加权 3.3.SPSS的数据管理的数据管理Transform Transform Compute variable Compute variable 通过数据库中已有变量的运算,生成新通过数据库中已有变量的运算,生成新的变量。如有身高和体重计算体重指数的变量。如有身高和体重计算体重指数(BMI)BMI)通过应用通过应用IFIF语句,可以实现按照不同语句,可以实现按照不同的条件对对应的观察单位计算新的变量。的条件对对应的观察单位计算新的变量。例如:男性和女性判定腹型肥胖的标例如:男性和女性判定腹型肥胖的标准不一样。(
7、男性腰围准不一样。(男性腰围102102厘米、女性厘米、女性腰围腰围8888厘米厘米 )在计算腹型肥胖这个新变量时,就可在计算腹型肥胖这个新变量时,就可以应用这个程序。以应用这个程序。 3.3.SPSS的数据管理的数据管理Transform Transform recode into same variable recode into same variable 编码替换原变量编码替换原变量 recode into different variable recode into different variable 编码生成新变量编码生成新变量如按年龄分组如按年龄分组 形成变量形成变量- -年龄
8、组;按体重指数分组,形成肥胖分组年龄组;按体重指数分组,形成肥胖分组 3.3.SPSS的数据管理的数据管理4.4.SPSS的数据分析的数据分析4.1 统计描述连续型数值变量连续型数值变量 判断数据分布类型判断数据分布类型是否为正态分布(近似)是否为正态分布(近似)计算统计指标计算统计指标均数均数 标准差标准差 中位数中位数 百分位数百分位数 率率 构成比构成比 统计图表统计图表统计分析-正态性检验经验判断通过均数与标准差通过频数分布图表判断通过峰度系数和偏度系数判断拟合优度检验P-P PlotsQ-Q PlotsOne sample - Kolmogorov-Smirnov test统计分析-
9、正态性检验AnalyzeDescriptive statistics Descriptives统计分析-正态性检验AnalyzeDescriptive statistics Descriptives统计分析-正态性检验Analyze Nonparametric Test 1-sample K-S统计分析-正态性检验Analyze Nonparametric Test 1-sample K-S4.1 统计描述连续型数值变量连续型数值变量 计算统计指标计算统计指标均数均数 标准差标准差 中位数中位数 百分位数百分位数 率率 构成比构成比 AnalyzeAnalyze Descriptive sta
10、tistics FrequenciesFrequencies4.1 统计描述连续型数值变量连续型数值变量 计算统计指标计算统计指标均数均数 标准差标准差 中位数中位数 百分位数百分位数AnalyzeAnalyze Descriptive statistics Frequencies Frequencies StatisticsStatistics4.1 统计描述分类变量分类变量 计算统计指标计算统计指标率率 构成比构成比 AnalyzeAnalyze Descriptive statistics FrequenciesFrequencies4.1 统计图 GraphsLegacy Dialog
11、s箱式图箱式图Boxplot散点图散点图Scatter/Dot直方图直方图Histogram人口金字塔人口金字塔Population pyramid4.1 统计图 GraphsLegacy Dialogs 人口金字塔人口金字塔Population pyramid4.1 统计图 GraphsLegacy Dialogs 人口金字塔人口金字塔Population pyramid4.2 统计推断方法t t检验检验 卡方检验卡方检验秩和检验秩和检验方差分析方差分析相关与回归相关与回归生存分析生存分析配对t检验 用两批不同的结核菌素,分别是标准结核菌素和新制结核菌素,分别注用两批不同的结核菌素,分别是标
12、准结核菌素和新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径(mm)(mm)如下表所示,如下表所示,问两种结核菌素的反应性有无差别。问两种结核菌素的反应性有无差别。编号编号标准品标准品新制品新制品1 112.012.010.010.02 214.514.510.010.03 315.515.512.512.54 412.012.013.013.05 513.013.010.010.06 612.012.05.55.57 710.510.58.58.58 87.57.56.56.59 99.09.05.55.5101015.
13、015.08.08.0111113.013.06.56.5121210.510.59.59.5配对t检验Analyze-Compare means-Paired samples T tests配对t检验Paired Samples StatisticsPaired Samples Statistics12.0417122.39752.692108.7917122.50870.72420新制品标准品Pair1MeanNStd.DeviationStd. ErrorMeanPaired Samples TestPaired Samples Test3.250002.49089.719061.667
14、364.832644.52011.001新制品 - 标准品Pair 1MeanStd.DeviationStd. ErrorMeanLowerUpper95% ConfidenceInterval of theDifferencePaired DifferencestdfSig.(2-tailed)编号编号甲组血糖值甲组血糖值( (X X2 2) )编号编号乙组血糖值乙组血糖值( (X X2 2) )1 18.48.41 15.45.42 210.510.52 26.46.43 312.012.03 36.46.44 412.012.04 47.57.55 513.913.95 57.67.6
15、6 615.315.36 68.18.17 716.716.77 711.611.68 818.018.08 812.012.09 918.718.79 913.413.4101020.720.7101013.513.5111121.121.1111114.814.8121215.215.2121215.615.6131318.718.7 25 25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,合并饮食疗法, 二个月后测空腹血糖如下表,问两种疗法治疗后患者血糖值是二个月后测空腹血糖如下表,问两种疗法治疗
16、后患者血糖值是否相同?否相同?两组独立样本的两组独立样本的 t 检验检验 Analyze-Compare means-Independent samples T testsGroup StatisticsGroup Statistics1215.2084.02161.16091310.8464.22151.1708group甲组乙组valueNMeanStd.DeviationStd. ErrorMeanIndependent Samples TestIndependent Samples Test.283.6002.64023.0154.36221.6522.94447.78002.6462
17、2.972.0144.36221.6488.95117.7733Equal variances assumedEqual variances notassumedvalueFSig.Levenes Test forEquality of VariancestdfSig.(2-tailed)MeanDifferenceStd. ErrorDifferenceLowerUpper95% ConfidenceInterval of theDifferencet-test for Equality of Means卡方检验 crosstab 为了解铅中毒病为了解铅中毒病人是否有尿棕色素增人是否有尿棕色
18、素增加现象,分别对病人加现象,分别对病人组和对照组的尿液作组和对照组的尿液作尿棕色素定性检查,尿棕色素定性检查,结果见表。请对数据结果见表。请对数据进行分析。进行分析。铅中毒病例铅中毒病例1 12 23 34 45 56 67 78 89 91010- -+ +- -+ +- -+ +- -+ +- -+ +1111121213131414151516161717181819192020+ + + + + + + + + + +2121222223232424252526262727282829293030+ + + + + + + + + + +31313232333334343535363
19、6+ +- -+ + +- -+ +对照组对照组1 12 23 34 45 56 67 78 89 91010- - -+ +- -+ + + +- - - -1111121213131414151516161717181819192020- - - - - -+ + +- - - -2121222223232424252526262727282829293030- -+ + +- -+ +- - - - - -3131323233333434353536363737- - - - - - -建立数据文件建立数据文件 设两个变量:设两个变量: group group 表示分组表示分组 1 1
20、表示铅中毒病人表示铅中毒病人 2 2 表示对照组表示对照组 outcome outcome 表示结果表示结果 0 0 表示表示 “ “-”-” 1 1 表示表示 “ “+”+” 统计分析统计分析 检验检验2频数表数据需要用频数表数据需要用Weight casesWeight cases如果是原始数据不要用如果是原始数据不要用Weight cases Weight cases !SPSS实现实现2 2检验检验Analyze Descriptive Crosstab 结结 果果当当n40且所有且所有T5时时当当n40但有但有1T5时时当当n40或有或有TNonparametric Tests 2
21、Independent Samples K Independent Samples 2 Related Samples K Related Samples 某实验室观察某种抗癌新药治疗小鼠移植性某实验室观察某种抗癌新药治疗小鼠移植性肿瘤的疗效,两组各肿瘤的疗效,两组各1010只小鼠,以只小鼠,以生存日数生存日数为观为观察指标,试验结果如下,试检验两组小鼠生存日察指标,试验结果如下,试检验两组小鼠生存日数有无差别?数有无差别?试验组:试验组:24 26 27 27 30 32 36 6024 26 27 27 30 32 36 60对照组:对照组:4 6 7 9 10 10 12 13 16 1
22、64 6 7 9 10 10 12 13 16 16vAnalyzeNonparametric TestsAnalyzeNonparametric Tests -2 Independent Samples -2 Independent Samples 对正常人、单纯性肥胖人及皮质醇增多症三组人的对正常人、单纯性肥胖人及皮质醇增多症三组人的血浆皮质醇含量进行测定,其结果见下表,问三组血浆皮质醇含量进行测定,其结果见下表,问三组人的血浆皮质醇含量有无差别人的血浆皮质醇含量有无差别?多组秩和检验多组秩和检验操作步骤操作步骤vAnalyzeNonparametric TestsAnalyzeNonpa
23、rametric Tests -K Independent Samples -K Independent Samples 结结 果果 2 Independent Samples K Independent Samples 2 Related Samples K Related Samples秩和检验秩和检验 8名健康成年男子服用肠溶醋酸棉酚片前后名健康成年男子服用肠溶醋酸棉酚片前后的精液中精子浓度检查结果见下表,问服的精液中精子浓度检查结果见下表,问服用肠溶醋酸棉酚片前后精液中精子浓度有用肠溶醋酸棉酚片前后精液中精子浓度有无下降?无下降? 配对秩和检验配对秩和检验操作步骤操作步骤vAnalyz
24、eNonparametric TestsAnalyzeNonparametric Tests - 2 Related Samples - 2 Related Samples结结 果果Wilcoxon Signed Ranks TestWilcoxon Signed Ranks Test方差分析方差分析-spssOne-way ANOVA optionsResultsANOVAANOVAproportion2.0283.67610.242.001.79212.0662.81915Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareF
25、Sig.DescriptivesDescriptivesproportion42.4025.16215.081072.14452.66052.232.6242.6850.17407.087032.40802.96202.432.8243.0975.16460.082302.83563.35942.913.2843.3200.42458.212292.64443.99563.003.92162.8763.43354.108392.64523.10732.233.92ABCDTotalNMeanStd.DeviationStd. ErrorLower BoundUpper Bound95% Con
26、fidence Intervalfor MeanMinimumMaximum窝别窝别 T1 T1 T2 T2 T3 T3 1 140.640.678.378.3116.3116.32 244.844.886.086.0124.6124.63 336.736.772.172.1149.0149.04 449.949.995.495.4128.8128.85 559.859.899.299.2134.1134.16 654.554.595.995.9133.0133.07 738.438.476.476.4115.6115.68 841.641.679.979.9117.0117.09 946.8
27、46.886.586.5128.4128.4101044.744.785.385.3124.3124.3表表 三组大鼠三组大鼠MTMT含量值(含量值(g/gg/g) 为探讨为探讨RglRgl对镉诱导大鼠睾丸损伤的保护作用,将同一窝别的对镉诱导大鼠睾丸损伤的保护作用,将同一窝别的3 3只大只大鼠随机地分到三组,进行不同处理(对照组、氯化镉组、鼠随机地分到三组,进行不同处理(对照组、氯化镉组、Rgl+Rgl+氯化镉氯化镉组)组), , 共观察了共观察了1010个窝别大鼠的睾丸个窝别大鼠的睾丸MTMT含量(含量(g/gg/g),数据如下表所),数据如下表所示,试问不同处理对大鼠示,试问不同处理对大鼠
28、MTMT含量有无影响?含量有无影响? Two way ANOVAAnalyzeGeneral Linear Model UnivariateANOVA结结 果果Tests of Between-Subjects EffectsTests of Between-Subjects EffectsDependent Variable: mt222551.3071222551.3071568.535.0001276.9639141.885a33078.798216539.399341.919.000870.7021848.372b1276.9639141.8852.933.025870.7021848
29、.372bSourceHypothesisErrorInterceptHypothesisErrorgroupHypothesisErrorblockType III Sumof SquaresdfMean SquareFSig. MS(block)a. MS(Error)b. Spss 线性相关与等级相关线性相关与等级相关 Analyzecorrelate BivariateOutput CorrelationsCorrelations1.801*.0031111.801*1.0031111Pearson CorrelationSig. (2-tailed)NPearson Correlat
30、ionSig. (2-tailed)NhighlengthhighlengthCorrelation is significant at the 0.01level (2-tailed).*. CorrelationsCorrelations1.000.747*.0081111.747*1.000.008.1111Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)NhighlengthSpearmans rhohighlengthCorrelation is significant at t
31、he 0.01 level (2-tailed).*. 散点图 Graphslegacy dialogsScatter/dotScatter plotsScatter plots ANALYZE-REGRESSION-CURVE ESTIMATESPSS 线性回归 建立数据库 Analyze Regression LinearSPSS 建立数据库 Analyze Regression LinearOUTPUTANOVAANOVAb b1020.22711020.227103.966.000a88.31899.8131108.54510RegressionResidualTotalModel1S
32、um ofSquaresdfMean SquareFSig.Predictors: (Constant), 温度a. Dependent Variable: 心率b. CoefficientsCoefficientsa a4.0912.0262.019.0741.523.149.95910.196.000(Constant)温度Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: 心率a. 非条件logistic回归的SPSS实现AnalyzeRegress
33、ionBinary logistic应变量应变量自变量自变量非条件logistic回归的SPSS实现AnalyzeRegressionBinary logistic非条件logistic回归的SPSS实现AnalyzeRegressionBinary logisticSpss logistic 回归分析主要结果 某医师收集某医师收集2020例脑瘤患者甲、乙两疗法例脑瘤患者甲、乙两疗法治疗的生存时间(周)如下:治疗的生存时间(周)如下:甲疗法组甲疗法组 1 3 3 7 10 15 15 23 301 3 3 7 10 15 15 23 30乙疗法组乙疗法组 5 75 7+ + 13 13 23
34、30 30 13 13 23 30 30+ + 38 42 42 45 38 42 42 45+ + 生存分析 Survival analysis随访资料的数据库 Time Status生存曲线的比较 AnalyzeSurvivalKaplan-Meier生存曲线的比较-Status(1)1Options -plots-survival生存曲线的比较 AnalyzeSurvivalKaplan-MeierLog-rank and survival curve生存分析-多因素案例:为探讨某恶性肿瘤的预后,收集案例:为探讨某恶性肿瘤的预后,收集了了6363例病人的生存时间、结局及影响因素。例病人的
35、生存时间、结局及影响因素。影响因素包括病人的治疗方式、肿瘤的浸润影响因素包括病人的治疗方式、肿瘤的浸润程度、组织学类型、是否有淋巴结转移及病程度、组织学类型、是否有淋巴结转移及病人的性别、年龄,生存时间以月计算,收集人的性别、年龄,生存时间以月计算,收集的原始资料及变量的意义如见表的原始资料及变量的意义如见表1 1。生存分析-多因素数据文件生存分析-多因素Cox 比例风险回归AnalyzesurvivalCox-RegressionCox status(0)-HRCox -Covariates单因素的结果HR Hazard Ratio 风险比:反映具有该特风险比:反映具有该特征的人群死亡的风险是参照组的倍数。征的人群死亡的风险是参照组的倍数。因素筛选Y(0)结果分析小结小结- -数据管理数据管理 DATA TRANSFORM小结小结- -数据分析数据分析数据管理数据管理统计描统计描述述统计推统计推断断
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。