1、4/22/2022SpssSpss广泛的应用领域广泛的应用领域SPSSSPSS软件的特点软件的特点SPSSSPSS的基本操作环境的基本操作环境利用利用SPSSSPSS进行数据分析的基本步骤进行数据分析的基本步骤Spss广泛的应用领域 Statistical Package for Social Science (社(社会科学统计软件)会科学统计软件) 全球约有全球约有25万家产品用户,广泛分布于通讯、万家产品用户,广泛分布于通讯、医疗、银行、证券、保险、制造、商业、市场医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个领域和行业。研究、科研、教育等多个领域和行业。 SPSS是世界上
2、公认的三大数据分析软件之一:是世界上公认的三大数据分析软件之一:(SAS、SPSS和和SYSTAT)。)。 SPSS软件的特点 使用简单,便于学习,特别是初学者; 统计功能强大; 便捷的数据输入; 开放性好; 绘图能力强。4/22/2022SPSS的基本操作环境 数据编辑窗口Data Editor,用于对SPSS的数据进行定义、录入、修改、管理等基本操作的窗口;SPSS运行过程中自动打开;且只能打开一个窗口;运行过程中无法关闭;SPSS中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据以.sav存于磁盘上。 输出窗口-Viewer,用于显示SPSS处理的结果或错误信息。 语句窗口Syn
3、tax Editor ,用于显示和编辑SPSS程序。 数据编辑窗口(.SAV) 数据编辑窗口由窗口主菜单、工具栏、数据编辑区、系统状态显示区组成。图解1、窗口主菜单:窗口主菜单将SPSS常用的数据编辑、加工和分析的功能列了出来,用户可以通过单击菜单完成相应的操作。工具栏菜单栏菜单栏标题栏数数据据编编辑辑区区数据显示区数据显示区: :变量名变量名观察序号观察序号数据编辑窗口的构成数据编辑窗口的构成状态栏主窗口菜单及功能工具栏2、同其他软件一样,SPSS也将一些常用的功能以图形按钮的形式组织在工具栏中。图形按钮的功能都能在窗口主菜单中找到,用户可以直接单击工具栏上的某个按钮完成其相应功能,使操作更
4、加快捷和方便。当鼠标停留在工具栏按钮上时,计算机会自动显示相应按钮的功能。 如果当前窗口中没有这些工具图标按钮,可以用View-Toolbar使其出现。数据编辑区3、数据编辑区是显示和管理SPSS数据结构和数据内容的区域。在数据编辑区的左下角有两张卡片:data view和variable view ,前者用来录入和编辑管理SPSS的数据,后者用来定义和修改SPSS数据的结构。每条数据都有一个顺序编号显示在编辑区的最左边。数据编辑区中的表格可以通过view菜单下的grid lines选项设置成显示或不显示状态。系统状态显示区4、系统状态显示区用来显示系统的当前运行状态。当系统等待用户操作时,会
5、出现“SPSS processor is ready”的提示信息,该信息可以作为检察SPSS是否成功安装和正常启动的手段。通过view菜单下的status bar 可以设置系统状态显示或不显示。 SPSS结果输出窗口(.SPO) SPSS结果输出窗口(窗口标题为Viewer)是SPSS的另一个主要窗口。 输出窗口是显示和管理SPSS统计分析结果的窗口。SPSS统计分析的所有输出结果都显示在该窗口中。 输出窗口由窗口主菜单、工具栏、分析结果显示主菜单、工具栏、分析结果显示区、状态显示区区、状态显示区组组成。其中主菜单和工具栏和数据编辑窗口类似;分析结果显示区分成两个区域:左边的区域类似于wind
6、ows资源管理器的树形形式显示已有的分析结果的目录,称为目录区 右边的区域是各分析结果的详细报告,称为内容区;状态显示区比数据编辑窗口的状态区只是多了一个标志是否为主输出窗口的标志(惊叹号!)。如果该惊叹号为红色,则表示当前的输出窗口为主输出窗口,同时其他输出窗口上的惊叹号为虚。(数据编辑窗口只能打开一个,而结果输出窗口可以同时创建或打开多个) 窗口内容以.spo存于磁盘上SPSS结果输出窗口(.SPO)输出窗口通常在以下两种时机打开: 第一,在进行第一次统计分析时,由SPSS自动创建并打开;第二,在SPSS运行过程中由用户手工创建或打开,菜单为File New/Open Output。 输出
7、窗口由主菜单、工具栏、分析结果显示区、状态显示区组成。创建或打开窗口的时机: 窗口主菜单工具栏目录区内容区状态栏 1 数据分析的一般步骤 明确数据分析目标;明确数据分析目标; 正确收集能够说明分析目的的数据;正确收集能够说明分析目的的数据; 数据的加工整理;数据的加工整理; 弄清统计概念和统计含义,弄清统计概念和统计含义,知道各种统计方知道各种统计方 法的法的统计思想和使用范围,统计思想和使用范围,无需记忆公式;无需记忆公式; 选择一种或几种统计分析方法探索性的分析统计数选择一种或几种统计分析方法探索性的分析统计数据;据; 读懂统计分析结果,发现规律,得出结论读懂统计分析结果,发现规律,得出结
8、论。利用利用SPSSSPSS进行数据分析的基本步骤进行数据分析的基本步骤2 利用SPSS进行数据分析的步骤建立建立SPSS数据文件。数据文件。SPSS数据的加工整理阶段。数据的加工整理阶段。SPSS数据的分析阶段。数据的分析阶段。SPSS分析结果的说明和解释。分析结果的说明和解释。数据和分析结果的保存。数据和分析结果的保存。二、度量与二、度量与spss数据文件的建立数据文件的建立 度量度量 编码表编码表 数据文件的建立数据文件的建立 其他格式数据文件的应用其他格式数据文件的应用度度 量量度量分为三类:o 间隔尺度(Scale):变量取值为连续的区间。如温度,长度等。o 定序尺度(Ordinal
9、):数字代表个体的相对位置,但没有指明差距大小。如学历,等级等。1. 名义尺度(Nominal):数字用于对个体的识别和分类。如性别分类,学号等。(定量变量)(定量变量)(定性变量)(定性变量)(定性变量)(定性变量)编码表 编码表包括:变量名、变量标签、取值范围、变量值标签、度量水平、缺失值等编码表的主要作用:n 提供标准化的操作流程。n 便于沟通1. 作为工作档案,对特殊记录进行记载数据文件的建立 定义变量 数据录入与编辑 其他格式文件应用 应用举例定义变量定义变量 SPSS数据的结构是对SPSS每列变量及其相关属性的描述,定义变量主要包括变量名、数据类型、变量宽度、变量名标签、变量值标签
10、、显示宽度、缺失值、对齐方式、度量尺度等信息。 变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下:1.首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。3. SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。4.变量名最好与其代表的数据含义相对应,
11、每个变量名必须具有唯一性。变量名(Variable name)数据类型(Type) 数据类型是指每个变量取值的类型。SPSS中有三种基本数据类型:数值型、字符型和日期型。数值型数值型 (1)标准型(Numeric) (2)科学记数法型(Scientific Notation) (3)逗号型(Comma) (4)圆点型(Dot) (5)美元符号型(Dollar) (6)用户自定义型(Custom Currency)字符型(字符型(String)日期型(日期型(Date)数值型 数值型是数值型是SPSS最常用的数据类型,通最常用的数据类型,通常由阿拉伯数字和其它特殊符号等组成。其常由阿拉伯数字和其
12、它特殊符号等组成。其中的标准型(中的标准型(numeric)是)是SPSS默认的数默认的数据类型,默认的显示宽度为据类型,默认的显示宽度为8位,包括正负位,包括正负符号位、小数点和小数位在内,小数位默认符号位、小数点和小数位在内,小数位默认为为2位。如果数据的实际宽度大于位。如果数据的实际宽度大于8位,位,spss将自动按照科学计数法显示,将自动按照科学计数法显示,数据的数据的显示并不影响数据的存储,也不影响数据的显示并不影响数据的存储,也不影响数据的计算计算。字符型(String) 字符型也是字符型也是SPSS较常用的数据类型,较常用的数据类型,由一个字符串组成。如职工号码、姓名、地由一个字
13、符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。字符型址等变量都可以定义为字符型数据。字符型数据的默认显示宽度为数据的默认显示宽度为8个字符,不能够进个字符,不能够进行算术运算,并区分大小写字母。字符型数行算术运算,并区分大小写字母。字符型数据在据在SPSS命令处理过程中应用一对双引号命令处理过程中应用一对双引号括起来,但在输入数据时不应输入双引号,括起来,但在输入数据时不应输入双引号,否则双引号将会作为字符型数据的一部分。否则双引号将会作为字符型数据的一部分。日期型(Data) 日期型数据用来表示日期或者时间,如生日、成立日期等变量可以定义为日期型数据。显示格式:dd-mmm-
14、yyyy;mm/dd/yyyy。 每种类型的变量都有自己的变量宽度、小数位和显示宽度,其中变量宽度是变量允许的最大字符位数,列宽度是数据编辑窗口中显示每列的字符位数。通常这两个宽度是一致的。变量宽度(Width)、显示宽度(Columns)变量名标签(Variable label) 变量名标签是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计分析结果的可读性。变量名标签可用中文,总长度可达120个字符,但在统计分析结果的显示中一般不能显示如此长的变量名标签信息。变量值标签(Value label) 变量值标签是对变量取值含义的解释说明信息,对于品质型数据尤为重要,比如1代表男性,2
15、代表女性,它不但明确了数据的含义,也增强了最后统计分析结果的可读性,变量值标签可以用中文。缺失数据(Missing values) 数据中存在明显错误或明显不合理的数据或漏填数据项时统计学上称为不完全数据或缺失数据。数据中如果存在缺失数据,分析时通常不能直接采用,要进行说明。SPSS中说明缺失数据的方法是指定用户缺失值。这样,spss在分析时,就能够将这些缺失值与正常的数据区分开来,并依据用户指定的缺失值处理策略对其进行处理或分析。Spss还有一类默认的缺失值,称为系统缺失值,数值型变量用圆点表示,字符型用空格表示。 SPSS中说明缺失数据的基本方法是指定用户缺失值。用户缺失值可以是:o对字符
16、型或数值型变量,用户缺失值可以是1至3个特定的离散值(Discrete missing values);o对一个数值型变量,用户缺失值可以在一个连续的闭区间内并同时再附加一个区间以外的离散值(Range plus one optional discrete)。 变量对齐格式(Align) 定义显示对齐方式,对齐方式分为右对齐、左对齐和中间对齐,系统中,数值型变量默认为右对齐,字符型变量默认为左对齐。 数据录入数据录入 定义好SPSS数据结构后,可将具体的数据输入到SPSS中,最终形成SPSS数据文件。 SPSS数据的录入操作在数据编辑窗口中的Data View卡片中实现。其操作方法与EXCEL
17、基本类似,也是以电子表格的方式进行录入。录入带有变量值标签的数据时,可以在下拉按钮中的值标签列表中选择一个作为输入。数据编辑数据编辑 数据必须输入正确才能保证正确的分析结果。但很难一次输入正确,所以就需要进行修改,一般包括数据的定位、插入、删除、修改、复制等。 SPSS支持的数据格式 1、SPSS文件格式,扩展名为.sav 2、Excel格式文件,扩展名为.xls 3、dbf格式文件,扩展名为.dbf 4、文本格式文件,扩展名为.datSPSS数据的保存其他格式文件应用其他格式文件应用 SPSS能够直接读取其他格式的数据文件,并将其保存为SPSS格式的数据。 1.直接读取其他格式的数据文件:(
18、1)选择菜单File+Open+Data;(2)选择数据文件的类型,并输入数据文件名。 2.使用数据库查询打开 利用通用数据库ODBC接口读取数据文件 在9.0及以前版本中非常重要 3.使用文本向导读入文本文件:选择菜单 File+Read Text Data 直接打开直接打开SPSS现在可以直接读入许多格式的数据文件,其中就包括EXCEL各个版本的数据文件。选择菜单File=Open=Data或直接单击快捷工具栏上的Open File按钮,系统就会弹出Open File对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是: 注:读入Excel文件时,SPSS默认将Exc
19、el工作表中的全部数据读到SPSS数据编辑窗口,但也可以指定仅读取工作表中某个区域内的数据(如A5:B10)。工作表上的一行数据为SPSS中的一个个案。 如果Excel工作表文件第一行或指定读取区域内的第一行存储了变量名信息,则应选择Read variable names项,即以第一行的文字信息作为SPSS的变量名,否则不选。 使用文本导入向导读入文本文件选择菜单File=Read Text Data,系统就会弹出Open File对话框,和前面的情况完全一样,只是文件类型自动跳到了Text (*.txt)。实际上,该功能在SPSS中已被整合到了Open File对话框中之所以在菜单上保留该条目的原因是读入纯文本的情况非常普遍,放在这里更加醒目。例 :现有一数据文件以纯文本的形式保存,且第一行为变量名,请将其读入SPSS。在 File =Read Text Data对话框选中相应的文件名并单击“确定”,系统会自动启动文本导入向导对话框如下: