1、2022-8-91SPSS统计分析方法及应用授课教师:李慧丽2022-8-92 SPSS统计分析软件概述统计分析软件概述 SPSS数据文件的建立和管理数据文件的建立和管理 SPSS数据的预处理数据的预处理 描述性统计分析描述性统计分析 统计图统计图 相关分析与回归分析相关分析与回归分析 参数检验参数检验 方差分析方差分析 聚类分析聚类分析 因子分析因子分析 对应分析和信度分析对应分析和信度分析 时间序列分析时间序列分析课程体系设置课程体系设置:2022-8-93第一章SPSS统计分析软件概述2022-8-941.1 SPSS的发展及特点 1.1.1 SPSS的产生与发展 SPSS是Statis
2、tical Package for Social Sciences 的简称,即社会科学统计软件包社会科学统计软件包;SPSS也也是Statistical Product and Service Solutions 的缩写,即统计产品与服务解决方案统计产品与服务解决方案。由美国SPSS公司1970年代推出,迄今已有近40年的历史。是国际著名三大社会科学统计软件包之一(SAS、SPSS、Stat)。我们这里使用的是SPSS for Windows 13.0版。2022-8-95 1.1.2 SPSS的特点与功能 (1)使用简单,便于学习。(2)统计功能强大,使用方便。(3)灵活方便。(4)开放性好
3、。(5)绘图能力强。(6)便捷的数据输入。2022-8-961.2 SPSS使用基础 1.2.1 SPSS软件的安装和启动 安装:SPSS for Windows安装的基本步骤 与其他常用软件是基本相同的。启动:开始开始 程序程序 SPSS for Windows2022-8-97 1.2.2 SPSS的基本操作环境 1、SPSS数据编辑窗口(窗口标题为Data Editor)是SPSS的主程序窗口。它在软件启动时自动打开,并一直保持在打开状态直到退出SPSS。在SPSS运行时只能打开一个数据编辑窗口,关闭数据编辑窗口意味着退出SPSS。数据编辑窗口中的数据通常以SPSS数据文件的形式保存在计
4、算机磁盘上,其文件扩展名为.sav。数据编辑窗口由窗口主菜单、工具栏、数据编辑区、系统状态显示区组成。2022-8-98工具栏菜单栏菜单栏标题栏输输入入数数据据栏栏数据显示区数据显示区:变量名变量名观察序号观察序号数据编辑器的构成数据编辑器的构成状态栏2022-8-99主窗口菜单及功能主窗口菜单及功能菜单表菜单表功能功能解解 释释File文件操作文件操作对对SPSS相关文件进行基本管理相关文件进行基本管理Edit数据编辑数据编辑对数据编辑窗口中的数据进行基本编辑,并实对数据编辑窗口中的数据进行基本编辑,并实现数据查找、软件参数设置等功能现数据查找、软件参数设置等功能View窗口外观状态窗口外观
5、状态对对SPSS窗口外观等进行设置(如状态栏、表窗口外观等进行设置(如状态栏、表格线、变量值标签等是否显示、字体设置等)格线、变量值标签等是否显示、字体设置等)Data数据的操作和数据的操作和管理管理对数据编辑窗口中的数据进行加工整理(如数对数据编辑窗口中的数据进行加工整理(如数据的排序、转置、分类汇总、加权等)据的排序、转置、分类汇总、加权等)Transform数据基本处理数据基本处理对数据编辑窗口的数据进行基本处理(如生成对数据编辑窗口的数据进行基本处理(如生成新变量、计数、分组等)新变量、计数、分组等)Analyze数据分析数据分析对数据编辑窗口的数据进行统计分析和建模对数据编辑窗口的数
6、据进行统计分析和建模Graphs制作统计图制作统计图对数据编辑窗口的数据生成各种统计图形对数据编辑窗口的数据生成各种统计图形Utilities实用程序实用程序SPSS其他辅助管理(如显示变量信息、定义其他辅助管理(如显示变量信息、定义变量集、菜单编辑器等)变量集、菜单编辑器等)Windows窗口管理窗口管理对对SPSS中的多个窗口进行管理中的多个窗口进行管理Help帮助帮助实现实现SPSS的联机帮助的联机帮助2022-8-910 2、SPSS的输出窗口(窗口标题为Viewer)是SPSS的另一个主要窗口,是显示管理SPSS统计分析、报表及图形的窗口。SPSS统计分析的所有输出结果都显示在该窗口
7、中,通常以SPSS输出文件的形式保存在计算机磁盘上,其文件扩展名为.spo。与数据编辑窗口不同,SPSS允许同时创建或打开多个输出窗口。2022-8-911 创建或打开窗口的时机:输出窗口通常在以下两种时机打开:第一,在进行第一次统计分析时,由SPSS自动创建并打开;第二,在SPSS运行过程中由用户手工创建或打开,菜单为File New/Open Output。输出窗口由主菜单、工具栏、分析结果显示区、状态显示区组成。2022-8-912 窗口主菜单工具栏目录区内容区状态栏2022-8-913 1.2.3 SPSS软件的退出 退出SPSS的方法与退出一般常用软件的方法基本相同。1.2.4 SP
8、SS软件的三种基本使用方式 1、完全窗口菜单方式 2、程序运行方式 3、混合运行方式2022-8-914SPSS基本运行方式 完全窗口菜单方式:所有分析操作过程都是通过菜单和按钮及对话框方式进行的.是经常使用的一种运行方式,适用于一般分析和SPSS的初学者.2022-8-915SPSS基本运行方式 程序运行方式:手工编写SPSS命令程序一次性提交计算机运行适用于大规模的分析工作和熟练的SPSS程序员.实现方法:(1)打开SYNTAX语句窗口并编写和修改SPSS程序(2)点击语句窗口中的RUN菜单项,选择运行方式运行2022-8-916Syntax语句窗口 窗口标题:syntax editer
9、功能:编写和修改SPSS程序的窗口.特点:打开:FILE-NEW-SYNTAX或FILE-OPEN-.SPS扩展名窗口中的程序以.SPS存于磁盘上菜单项RUN中提供四种程序执行方式:All、Selection、Current、To end2022-8-917SPSS 基本运行方式 菜单程序混合运行方式:先通过菜单选择分析过程和参数,不立即提交(OK)执行,而是按动PASTE按钮.计算机自动将用户刚定义的分析过程和参数转换成SPSS的命令,并显示到SYNTAX语句窗口中.用户可对其进行必要的修改后再提交给计算机执行.一般适用于熟练的SPSS程序员.2022-8-9181.3 利用SPSS进行数据
10、分析的基本步骤建立SPSS数据文件数据的加工整理统计分析解释分析结果定义SPSS数据文件的结构录入修改保存SPSS数据2022-8-919第二章SPSS数据文件的建立和管理2022-8-9202.1 SPSS数据文件 2.1.1 SPSS数据文件的特点 因此,建立SPSS数据文件时应完成两项任务,即:(1)描述SPSS数据的结构 (2)录入编辑SPSS数据数据结构数据内容2022-8-921 2.1.2 SPSS数据的组织方式(1)原始数据的组织方式 数据编辑窗口中的一行称为一个一个个个案(案(Case),一列称为一个变量变量,每个变量都有一个名字,称为变量名变量名。(2)频数数据的组织方式
11、例:职称年龄段35岁以下(1)3649岁(2)50岁以上(3)教授(1)0158副教授(2)10202讲师(3)20101助教(4)35202022-8-922频数数据的组织方式职称年龄段人数1101215138211022202323120321033141354224302022-8-9232.2 SPSS数据的结构和定义方法 SPSS数据的结构包括变量名、类型、宽度、列宽度、变量名标签、变量值标签、缺失值、度量尺度等信息。2.2.1 变量名(变量名(Name)(1)变量名的字符个数不多于8个(2)首字符以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最
12、后一个字符(3)变量名不区分大小写。允许汉字作为变量名,汉字总数不能超过4个。(4)SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。2022-8-924 2.2.2 数据类型(数据类型(Type)、宽度()、宽度(Width)、)、列宽度(列宽度(Columns)SPSS有三种基本数据类型数值型数值型 (1)标准型(Numeric)(2)科学记数法型(Scientific Notation)(3)逗号型(Comma)(4)圆点型(Dot)(5)
13、美元符号型(Dollar)(6)用户自定义型(Custom Currency)字符型(字符型(String)日期型(日期型(Date)2022-8-925变量的类型表变量的类型表SPSS变量变量类型类型系统默系统默认长度认长度小数小数位数位数输入方式输入方式显示方式显示方式范例范例输入输入显示显示Numeric82标准格式或科标准格式或科学记数法学记数法标准格式数值变量圆点标准格式数值变量圆点表示小数点的数值表示小数点的数值38.4238.42Comma82带逗点的数值带逗点的数值或科学记数法或科学记数法圆点做小数点,逗点做圆点做小数点,逗点做三位分割符的数值三位分割符的数值1,343,438
14、.11,343,438.1Dot82带圆点的数值带圆点的数值或科学记数法或科学记数法逗点做小数点,圆点做逗点做小数点,圆点做三位分割符的数值三位分割符的数值34,3434E23.434,34Scientific notation82科学记数法科学记数法标准格式或标准格式或科学记数法科学记数法4578000457.8E4Date日期格式非常日期格式非常多多显示格式非常多显示格式非常多Dollar82可带可带$或不带或不带$输入或科学记输入或科学记数法数法有效数值前带有效数值前带$以逗点以逗点为分割符为分割符$12343$12343Custom CurrencyString8无无一串字符串一串字符
15、串一串字符串(区分大小一串字符串(区分大小写字母)写字母)believebelieve2022-8-926 2.2.3 变量名标签(变量名标签(Label)变量名标签是进一步描述变量所表示的意义,特别是当变量名不能充分描述变量所表述的意义时。变量名标签可用中文,总长度可达120个字符。变量名标签这个属性是可以省略的,但建议最好给出变量名的标签。2022-8-927 2.2.4 变量值标签(变量值标签(Value Labels)为进一步说明变量的可能取值,它可以定义,也可不定义。通常变量值标签对于顺序水准(如收入的高、中、低)和名义水准(如民族、性别)的品质型变量来说是必不可少的。例:对于性别变
16、量,定义变量值标签为1“男”,2“女”,则变量值只输入1和2这样的符号人们就可以明确的清楚数据的含义了。2022-8-928 2.2.5 度量尺度(度量尺度(Measure)统计学依据数据的尺度将数据划分为三大类,即定距型数据(定距型数据(Scale)、定序型数据)、定序型数据(Ordinal)和定类型数据()和定类型数据(Nominal)。定距型数据通常是指诸如身高、体重等的连续型变量和诸如人数、商品件数等离散型变量;定序型数据具有内在固有的大小或高低顺序,一般可以用数值或字符表示;定类型数据没有内在固有的大小或高低顺序,一般以数值或字符表示的分类数据。2022-8-929 2.2.6 变量
17、结构定义的基本操作单击单击Variable View 进入;进入;单击单击定义定义变量变量名名单击,定义单击,定义变量类型变量类型定义变量标签定义变量标签变量标变量标签值签值定义测度层次定义测度层次定义变定义变量宽度量宽度定义定义对齐对齐方式方式 定义变量类定义变量类型对话框型对话框 定义变量标签定义变量标签值对话框值对话框定义变量定义缺定义变量定义缺省值对话框省值对话框2022-8-930 2.2.7 缺失值(缺失值(Missing)的处理 当数据中存在明显错误或明显不合理的数据以及存在漏填数据项时,统计上通称为数据为不完全数据或缺失数据。SPSS中说明缺失数据的基本方法是指定用户缺失值。用
18、户缺失值可以是:o对字符型或数值型变量,用户缺失值可以是1至3个特定的离散值(Discrete missing values);o对一个数值型变量,用户缺失值可以在一个连续的闭区间内并同时再附加一个区间以外的离散值(Range plus one optional discrete)。2022-8-931SPSS用户缺失值定义窗口2022-8-9322.3 SPSS数据的录入与编辑 2.3.1 SPSS数据的录入 SPSS数据的录入操作在数据编辑窗口中的Data View卡片中实现。数据编辑窗口中的黑框框住的单元格为当前数据单元 数据录入可以逐行进行,录入完一个数据后按Tab键,于是当前单元格的
19、右边一个单元便自动称为当前单元;数据录入也可逐列进行,录入完一个数据后按Enter键,于是当前单元格的下边一个单元便自动成为当前单元。录入带有变量值标签的数据可以通过下拉按钮完成。2022-8-933 2.3.2 SPSS数据的编辑 1、SPSS数据的定位 人工定位:适用于数据量较少的情况。自动定位:适用于数据量较大的情况。(1)按个案号码自动定位 将当前单元格定位在任何单元格中,选择菜单Data-Go to Case,出现如下对话框,输入欲定位的个案号码并确认。输入要寻找观输入要寻找观测量序号测量序号2022-8-934 (2)按变量值自动定位 将当前单元定位在某变量列的任何一个个案上 选择
20、菜单 Edit-Find,出现如下对话框 输入定位变量值并确认 Find Data in Variable SALARY对话框对话框2022-8-935 2、插入和删除一个个案 (1)插入一个个案,即在数据编辑窗口的某个个案前插入一个新个案。将当前数据单元确定在一个个案上选择菜单DataInsert Case (2)删除一个个案,即删除数据编辑窗口中的某个个案在欲删除的个案号码上单击鼠标左键,于是待删除的个案数据全部反向显示单击鼠标右键,从弹出菜单中选择Cut选项 2022-8-936 3、插入和删除一个变量 (1)插入一个新变量,即在数据编辑窗口的某个变量前插入一个新变量。将当前数据单元确定
21、在某变量上选择菜单DataInsert Variable (2)删除一个变量,即删除数据编辑窗口中的某列变量。在欲删除列的变量名上单击鼠标左键,于是待删除列的数据全部反向显示单击鼠标右键,从弹出菜单中选择Cut选项 2022-8-937 4、数据的移动、复制和删除 实现这些功能有以下三步:(1)定义源数据块 (2)单击鼠标右键,在弹出菜单中选择 Cut/Copy/Clear (3)指定目标单元格,单击鼠标右键,在弹出菜单中选择Paste选项2022-8-938插入变量与删插入变量与删 除除变量变量插入与删除观插入与删除观测量测量数据的剪数据的剪切、粘贴切、粘贴与复制与复制 1.插入变量插入变量
22、在添加处单击Var,单击右鼠标键出现右侧对话框,单击Insert Variables2.删除变量删除变量1.插入观测量插入观测量在添加处单击观测量,单击右鼠标键出现右侧对话框,单击Insert Case2.删除观测量删除观测量剪切剪切复制复制粘贴粘贴若想恢复,打开若想恢复,打开Edit-Undo2022-8-9392.4 SPSS数据文件的保存 2.4.1 SPSS支持的数据格式 1、SPSS文件格式,扩展名为.sav 2、Excel格式文件,扩展名为.xls 3、dbf格式文件,扩展名为.dbf 4、文本格式文件,扩展名为.dat2022-8-940 2.4.2 保存SPSS数据的基本操作
23、(1)选择菜单File-Save/Save as (2)给出存放数据文件的目录路径和数据文件的文件名,并根据实际需要选择数据文件的格式。数据文件的格式通过“保存类型”的下拉框选择,将数据保存为SPSS数据文件格式时,Variables按钮呈可用状态。它的作用是允许用户指定保存哪些变量,不保存哪些变量。将数据保存为Excel文件格式时,Write variables names to spreadsheet选项呈可用状态,它的作用是指定是否将SPSS变量名写入Excel工作表的第一行上。2022-8-9412.5 读取其他格式的数据文件 2.5.1 直接读入其他格式的数据文件 (1)选择菜单Fi
24、leOpenData (2)选择数据文件的类型,并输入数据文件名。2022-8-942 注:读入Excel文件时,SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口,但也可以指定仅读取工作表中某个区域内的数据(如A5:B10)工作表上的一行数据为SPSS中的一个个案。如果Excel工作表文件第一行或指定读取区域内的第一行存储了变量名信息,则应选择Read variable names项,即以第一行的文字信息作为SPSS的变量名,否则不选。2022-8-943 2.5.2 使用文本向导读入文本文件 选择菜单FileRead Text Data,出现如下对话框:2022-8-944
25、2.6 SPSS数据的合并 SPSS中合并数据文件是指将一个(或多个)已存储在磁盘上的SPSS数据文件分别依次合并到SPSS数据编辑窗口中的数据文件中。SPSS提供了两种合并数据文件的方式,分别是纵向合并和横向合并。2022-8-945 2.6.1 纵向合并数据文件 从外部数据文件增加观测量(个案)到当前数据文件中。纵向合并或称追加观测量。纵向合并SPSS文件时,通常要注意以下两个问题:第一,两个待合并的SPSS数据文件的内容合并起来应是有实际意义的。第二,为方便SPSS数据文件的纵向合并,不同数据文件中数据含义相同的数据项最好起相同的变量名,且数据类型也最好相同。2022-8-946 纵向合
26、并数据文件的步骤如下:(1)在数据编辑窗口打开一个需合并的SPSS数据文件。(2)选择菜单DataMerge FileAdd Cases。然后输入一个已存于磁盘上的需进行纵向合并处理的SPSS数据文件名。随后进入如下对话框:2022-8-947同名变量不同名变量2022-8-948 2.6.2 横向合并数据文件 从外部数据文件增加变量到当前数据文件中。横向合并。横向合并文件时,通常要注意以下三个问题:第一,两个数据文件必须至少有一个名称相同的变量,该变量是两个数据文件横向拼接的依据,称为关键变量。第二,两个数据文件必须事先按关键变量进行升序排序。第三,为方便SPSS数据文件的横向合并,不同数据
27、文件中数据含义不相同的数据项,变量名不应相同。2022-8-949 横向合并SPSS数据文件的基本步骤:(1)在数据编辑窗口中打开一个需合并的SPSS数据文件(2)选择菜单DataMerge FileAdd Variable,然后输入一个已存在于磁盘上的需进行横向合并处理的SPSS数据文件名,随后将显示如下图窗口:2022-8-9502022-8-951选项说明选项说明:math cases on key variables in sorted files:以关键字作为合并标志。Both files provide cases:合并后的文件的数据由两个文件共同提供。External file is keyed table:以data editor的数据为基础。Working data file is keyed table:以磁盘文件的数据为基础。