1、 SPSS简介简介 相关概念相关概念 数据录入和数据获取数据录入和数据获取 菜单补充说明菜单补充说明 1968年:斯坦福大学三位学生创建了年:斯坦福大学三位学生创建了SPSS 1968年:诞生第一个用于大型机的统计软件年:诞生第一个用于大型机的统计软件 1975年:在芝加哥成立年:在芝加哥成立SPSS总部总部 1984年:推出用于个人电脑的年:推出用于个人电脑的SPSS/PC+1992年:推出年:推出Windows版本,同时开始全球化发展版本,同时开始全球化发展 自自SPSS 11.0起,起,SPSS全称为全称为“Statistical Product and Service Solution
2、s”,即,即“统计产品和服务解决方案统计产品和服务解决方案”目前最高版本是目前最高版本是SPSS15.0版,较普遍使用的是版,较普遍使用的是13.0版版产品概述产品概述安装安装SPSS从开始菜单运行从开始菜单运行使用桌面快捷方式来运行使用桌面快捷方式来运行运行运行SPSSv 启动启动SPSS,首先看到的是数据编辑窗口,首先看到的是数据编辑窗口菜单栏菜单栏工具栏工具栏SPSS启动界面启动界面 File:对对SPSS文件的管理,包括新建、打开、保存文件等文件的管理,包括新建、打开、保存文件等 Edit:与与windows类似的编辑功能,如复制、剪切、粘贴、类似的编辑功能,如复制、剪切、粘贴、撤消等
3、,以及系统参数设置撤消等,以及系统参数设置 View:选择显示状态条、工具栏、网格线、变量标签、变量:选择显示状态条、工具栏、网格线、变量标签、变量 视图及字体设置等视图及字体设置等 Data:实现文件级别的数据管理,如记录排序、记录拆分、实现文件级别的数据管理,如记录排序、记录拆分、记录筛选、合并文件等记录筛选、合并文件等 Transform:实现变量级别的数据管理,如计算新变量、变:实现变量级别的数据管理,如计算新变量、变 量值的分组合并、连续变量的可视化分段等量值的分组合并、连续变量的可视化分段等SPSS菜单栏菜单栏 Analyze:SPSSSPSS的重点菜单项,涵盖各种主要统计分析功能
4、的重点菜单项,涵盖各种主要统计分析功能 Graphs:绘制各种普通统计图及交互式统计图,如直方图、绘制各种普通统计图及交互式统计图,如直方图、茎叶图、箱图、残差图等茎叶图、箱图、残差图等 Utilities:提供各种实用性管理设置,如变量信息管理,输出:提供各种实用性管理设置,如变量信息管理,输出 结果文件设置、菜单管理等结果文件设置、菜单管理等 Windows:窗口拆分、最小化、当前窗口显示等:窗口拆分、最小化、当前窗口显示等 Help:帮助系统:帮助系统SPSS菜单栏菜单栏打开文件打开文件保存文件保存文件打印打印召回前次菜单操作召回前次菜单操作撤消撤消查找记录查找记录查看变量信息查看变量信
5、息查找变量值查找变量值插入记录插入记录插入变量插入变量拆分文件拆分文件设置权重设置权重选择记录选择记录显示变量标签显示变量标签使用数据集使用数据集SPSS工具栏工具栏 SPSS的常用窗口:的常用窗口:Data、Syntax、Output、Draft Output、Script 几个术语几个术语:Case、Variable、Expression SPSS的的运算符运算符:基本运算:数学运算、关系运算、逻辑运算基本运算:数学运算、关系运算、逻辑运算 算术运算的优先顺序:括号、函数、乘方(冥)、乘算术运算的优先顺序:括号、函数、乘方(冥)、乘 或除、加或减。同一优先级的按从左到右的顺序。或除、加或减
6、。同一优先级的按从左到右的顺序。SPSS的表达式:算术表达式、比较表达式、逻辑表达式的表达式:算术表达式、比较表达式、逻辑表达式相关概念(相关概念(1)SPSS的函数:十大类一百多个函数,包括算术函数、累的函数:十大类一百多个函数,包括算术函数、累计概率函数、概率密度函数、时间函数、逆分布函数、缺失计概率函数、概率密度函数、时间函数、逆分布函数、缺失值函数、随机函数、统计函数、字符串函数和其他函数。值函数、随机函数、统计函数、字符串函数和其他函数。SPSS的文件类型:数据文件的文件类型:数据文件*.sav *.sys *.dat(.dbf .xls 等等)、工作日志文件、工作日志文件(.jnl
7、)、结果文件、结果文件(.spo)、命令文件或语法、命令文件或语法文件文件(.sps)、脚本文件、脚本文件(.sbs)、图形模板文件、图形模板文件(.sct)。相关概念(相关概念(2)SPSS的数据格式:一般以行乘列的排列方式构造,行代表的数据格式:一般以行乘列的排列方式构造,行代表 case(或记录),列表示(或记录),列表示variable(或变量)。(或变量)。“一个观测占一行,一个变量占一列一个观测占一行,一个变量占一列”例例1:观察了:观察了10名学生的体重名学生的体重,其中男性其中男性5人人,女性女性5人应具有人应具有 2 10的数据结构的数据结构(2个变量个变量,10个观察对象个
8、观察对象)例例2:一个:一个2 2的四格表的四格表,应具有应具有n 2的数据结构(的数据结构(2个变量个变量,n 个观察对象)个观察对象)例例3:一个:一个2 2析因设计析因设计,应具有应具有n 3的数据结构(的数据结构(3变量变量,n次次 实验)实验)相关概念(相关概念(3)数据录入和数据获取数据录入和数据获取v 数据可以直接输入数据可以直接输入SPSS,或者从其他形式:或者从其他形式:SPSS数据文件、电子表应数据文件、电子表应用软件(例如用软件(例如Microsoft Excel)、数据库软件(例如)、数据库软件(例如Microsoft Access)以及文本文件等导入以及文本文件等导入
9、(1)直接输入)直接输入 数据录入三部曲:数据录入三部曲:定义变量名定义变量名指定变量的属性指定变量的属性录入数据录入数据(2)外部数据的获取(集中在)外部数据的获取(集中在File菜单下):菜单下):对于对于SPSS格式和其他大多数常用格式的数据文件,均可通过的格式和其他大多数常用格式的数据文件,均可通过的 FileOpenData或单击工具栏上的或单击工具栏上的 打开,以打开,以excel格式格式数据的数据的 读入为例作介绍。读入为例作介绍。也可利用利用也可利用利用数据库数据库ODBC接口接口读入数据及读入数据及文本向导文本向导读入读入文本数据。文本数据。数据编辑窗口数据编辑窗口语法编辑窗
10、口语法编辑窗口结果管理窗口结果管理窗口目录区目录区内容区内容区草稿结果窗口草稿结果窗口v 结果的一种简化文本格式,即被结果的一种简化文本格式,即被word兼容的兼容的rtf 超文本格式,可在未安装超文本格式,可在未安装SPSS的机子上使用的机子上使用 word等字处理软件将该结果打开等字处理软件将该结果打开脚本窗口脚本窗口v 用用Sax Basic语言写的程序,用于使语言写的程序,用于使SPSS内部内部 操作自动化,也适用于高级分析人员操作自动化,也适用于高级分析人员 Case:组成数据文件的基本单位,组成数据文件的基本单位,即观测即观测记录记录 Variable:SPSS对变量有如下的约定对
11、变量有如下的约定 (1)变量名最多有)变量名最多有8个字符,第一个字符必须是字母个字符,第一个字符必须是字母 或或,数字、,数字、$和下划线均可用在变量名中和下划线均可用在变量名中 (2)以)以$开头的变量名为系统变量(不可命名)开头的变量名为系统变量(不可命名)(3)变量类型:数值型、字符型()变量类型:数值型、字符型(A)、日期型等)、日期型等 数字数字 Expression:(表达式):(表达式)逻辑逻辑SPSS的几个术语的几个术语的运算符的运算符数学运算符关系运算符逻辑运算符+(GT)|(OR)*=(GE)*=(EQ)()=(NT)v 以以cases(行行)和和variables(列列
12、)的格式进行组织的格式进行组织v 一行是指调查中一个观测对象所有问题的回答一行是指调查中一个观测对象所有问题的回答 v 一列指调查中对于一个问题所有观测对象的回答一列指调查中对于一个问题所有观测对象的回答表表1 10名学生的体重名学生的体重性别体重(kg)男56男60男62男64男65女46女48女50女52女53表表 2 穿新旧两种防护服工人的皮肤炎症患病率比较穿新旧两种防护服工人的皮肤炎症患病率比较防护服种类皮肤炎症阳性阴性新814旧1018表表3 两种药物治疗缺铁性贫血后红细胞增加数两种药物治疗缺铁性贫血后红细胞增加数(百万百万/mm3)乙药(B)甲药(A)用(1)不用(2)用(1)2.
13、10.92.21.12.01.0不用(2)1.30.81.20.91.10.7v 定义变量名前,首先新建一个数据文件定义变量名前,首先新建一个数据文件v 使用该菜单还可新建语法文件、结果文件、草稿结果使用该菜单还可新建语法文件、结果文件、草稿结果 文件和脚本文件文件和脚本文件单击切换至单击切换至变量视图变量视图变量名变量名v数据录入:数据录入:例例1Type:变量类型:变量类型 Width:字符宽度:字符宽度 Decimals:小数位数:小数位数 Label:变量标签:变量标签 Values:变量值:变量值 Missing:缺失值:缺失值 Columns:单元格宽度:单元格宽度 Align:变
14、量值对齐方式:变量值对齐方式Measure:变量的测量尺度:变量的测量尺度v 注:不同变量间各属性可直接进行复制粘贴注:不同变量间各属性可直接进行复制粘贴v 点击单元格,即出现如右图所示小方格,点击单元格,即出现如右图所示小方格,点击小方格进行变量类型设定点击小方格进行变量类型设定标准数值型标准数值型字符型字符型日期型日期型逗号数值型逗号数值型圆点数值型圆点数值型科学计数法型科学计数法型美元数值型美元数值型用户自定义型用户自定义型v 如:如:美元数值型美元数值型设定三个特定的缺失值设定三个特定的缺失值也可设定缺失值区间也可设定缺失值区间 定类尺度(定类尺度(Nominal Measuremen
15、t):无序分类变量,如性别可取):无序分类变量,如性别可取“男男”、“女女”。只能计算频数和频率。只能计算频数和频率 定序尺度(定序尺度(Ordinal Measurement):有序分类变量,如对游泳的喜):有序分类变量,如对游泳的喜欢程度欢程度1非常喜欢,非常喜欢,2喜欢,喜欢,3无所谓,无所谓,4不喜欢,不喜欢,5非常不喜非常不喜欢,可计算频数、频率、累计频数、累计频率欢,可计算频数、频率、累计频数、累计频率 定距尺度(定距尺度(Interval Measurement):对事物类别或次序之间间距的):对事物类别或次序之间间距的测度,如温度。无绝对测度,如温度。无绝对“零点零点”,如,如
16、0并不表示并不表示“没有没有”,仅仅是个测,仅仅是个测量值量值 定比尺度(定比尺度(Scale Measurement):能够计算两个测度值之间比值的):能够计算两个测度值之间比值的一种计量尺度,如职工月收入。有绝对一种计量尺度,如职工月收入。有绝对“零点零点”,0就表示就表示“没有没有”v SPSS中将定比尺度和定距尺度合并为一类,统称中将定比尺度和定距尺度合并为一类,统称“Scale”,且作为默认值且作为默认值表表1 10名学生的体重名学生的体重性别体重(kg)男56男60男62男64男65女46女48女50女52女53数据录入三种形式数据录入三种形式:1.开放题的录入开放题的录入 例:年
17、龄(例:年龄(age):):_岁岁2.单选题的录入单选题的录入 例:性别(例:性别(gender):):1 男男 2 女女3.多选题的录入多选题的录入 例:你在选择健康体检的医院时关注哪些因素:例:你在选择健康体检的医院时关注哪些因素:a.交通方便交通方便 b.检查项目检查项目 c.检查价格检查价格 d.服务质量服务质量 e.其他其他v 完成变量定义后,点击完成变量定义后,点击Data View即可切换即可切换 回数据视图,进行数据录入回数据视图,进行数据录入v 直接输入,每输入一个值后,按键盘上的向下方向键直接输入,每输入一个值后,按键盘上的向下方向键 或或 按回车键,输入下一个值按回车键,
18、输入下一个值v与开放题不同的是单选题中可以定义变量值标签,可与开放题不同的是单选题中可以定义变量值标签,可 以减少数据录入的工作量,且方便数据分析。以减少数据录入的工作量,且方便数据分析。字符直接录入字符直接录入 字符代码字符代码+值标签值标签 数值代码数值代码+值标签(值标签(推荐推荐,便于录入及分析),便于录入及分析)v单选题录入的三种方式单选题录入的三种方式 多重二分法:每个选项定义一个变量多重二分法:每个选项定义一个变量 适用于适用于:选项不太多:选项不太多 多重分类法:每个答案定义一个变量,该用几个变量由多重分类法:每个答案定义一个变量,该用几个变量由 实际可能给出的最多答案数而定实
19、际可能给出的最多答案数而定 适用于适用于:选项较多:选项较多例:你对健康知识的了解主要来自哪些渠道(限选例:你对健康知识的了解主要来自哪些渠道(限选3项):项):a.刊物刊物 c.电视电视 d.收音机收音机 e.网络网络 f.朋友介绍朋友介绍 g.其他其他SPSS中的文件类型中的文件类型v 可以从电子表格式文件读入数据,第一行默认作为可以从电子表格式文件读入数据,第一行默认作为 变量名读入变量名读入SPSSv 打开数据文件打开数据文件v 使用该菜单还可打开语法文件、结果文件、草稿结果使用该菜单还可打开语法文件、结果文件、草稿结果 文件和脚本文件文件和脚本文件确认是否要读入变量名确认是否要读入变
20、量名确认导入的单元格区域确认导入的单元格区域也可进行自定义也可进行自定义v Excel数据导入后数据显示如图,其中变量名行就是数据导入后数据显示如图,其中变量名行就是原来原来Excel文件中的第一行文件中的第一行v 关于关于ODBS(Open Database)不进行详述,感兴趣)不进行详述,感兴趣的可参考有关书籍。的可参考有关书籍。文本文件是另一种常见的数据文件,许多电子表和数据库文本文件是另一种常见的数据文件,许多电子表和数据库 可以将内容存成文本格式可以将内容存成文本格式逗号和制表位用以区分每个变量,上图中以制表位来区分逗号和制表位用以区分每个变量,上图中以制表位来区分v 用以指导对文本
21、进行定义,确定不同变量的区分用以指导对文本进行定义,确定不同变量的区分 选择定义好的格式或创建新格式。选择选择定义好的格式或创建新格式。选择No创建新格式创建新格式从文本导入数据从文本导入数据Step 1 如前所述,文件使用制表位格式,变量名位于文件顶行如前所述,文件使用制表位格式,变量名位于文件顶行选择选择Yes表明变量名从文件顶行读入表明变量名从文件顶行读入变量以特定界限区分,如逗号、制表位变量以特定界限区分,如逗号、制表位从文本导入数据从文本导入数据Step 2键入键入2表明从文本文件的第表明从文本文件的第2行开始读入数据行开始读入数据从文本导入数据从文本导入数据Step 3v 用直观的
22、界面快速确定是否从用直观的界面快速确定是否从SPSS正确读入你所正确读入你所 要求读入的数据要求读入的数据选中选中Tab从文本导入数据从文本导入数据Step 4v 为适合为适合SPSS的格式,某些变量名可能被缩减,该对话框的格式,某些变量名可能被缩减,该对话框用以编辑不适当的变量,使之达到你的要求。同样可以更用以编辑不适当的变量,使之达到你的要求。同样可以更改变量类型,如将改变量类型,如将INCOME设为设为Dollar格式。格式。选中选中Dollar选中选中INCOME从文本导入数据从文本导入数据Step 5从文本导入数据从文本导入数据Step 6v 从文本文件导入数据完成,其中从文本文件导
23、入数据完成,其中step5设置的设置的 INCOME为为Dollar形式形式v 前面就前面就File菜单下的菜单下的New、Open、Open Database、Read Text Date已作了介绍,下面就已作了介绍,下面就File、Edit和和View菜菜 单下的其他子菜单作补充介绍单下的其他子菜单作补充介绍 Save:保存,覆盖当前文件:保存,覆盖当前文件 Mark File Read Only:使数据文件使数据文件标记为只读,原文件不能被覆盖。点标记为只读,原文件不能被覆盖。点击该菜单项后,若对原数据文件进行击该菜单项后,若对原数据文件进行改变后,对其进行保存时跳出改变后,对其进行保存
24、时跳出下图下图,提示保存为另一个文件名或至另一个提示保存为另一个文件名或至另一个目录,表明原文件不会被改动目录,表明原文件不会被改动 Save As:另存文件,可以另:另存文件,可以另存为存为SPSS格式或其他数据格式格式或其他数据格式 v 点击点击Mark File Read Only后,菜单变为后,菜单变为Mark File Read Write,点击之可以恢复到可改写的状态,点击之可以恢复到可改写的状态 Display Date File Information:在结果窗口中显示变量信息、变量在结果窗口中显示变量信息、变量值等值等Working File(显示当前文件(显示当前文件信息)
25、信息)External File(显示外部文(显示外部文件信息),件信息),查看详情查看详情 Cache Data:查看详情查看详情 Stop Processor:停止程序处理:停止程序处理 Switch Server:用以转化、增加、:用以转化、增加、编辑所登录的服务器,编辑所登录的服务器,查看详情查看详情 Print Preview:打印预览:打印预览 Recently Used Date:最近使用数据最近使用数据 Print:打印:打印 Recently Used File:最近使用文件最近使用文件 Exit:退出:退出 Undo:撤消:撤消 Cut:剪切剪切 Redo:重复:重复 Co
26、py:复制复制 Paste:粘贴:粘贴 Paste Variables:粘贴变量:粘贴变量 Clear:清除:清除 Options:设置系统参数设置系统参数 Find:查找:查找 状态条状态条 Status Bar:选中,则在右下角:选中,则在右下角显示状态条显示状态条 Fonts:字体设置:字体设置 Toolbars:用以对工具栏进行设置:用以对工具栏进行设置 Grid Lines:选中显示网格线:选中显示网格线 Value Labels:默认情况下,数据:默认情况下,数据视图中视图中显示数值显示数值,选中该项,则数据,选中该项,则数据视图中视图中显示数值标签显示数值标签 Varibles:
27、选中切换至变量视图选中切换至变量视图v Ok:在下次读取该文件时(如下次运行一个统计程序时)产生缓存:在下次读取该文件时(如下次运行一个统计程序时)产生缓存文件,多数情况下直接点文件,多数情况下直接点ok即可即可 cache data(数据缓存):是指将当前数据文件的一份拷贝放入缓(数据缓存):是指将当前数据文件的一份拷贝放入缓存,使多次处理程序时当前文件不必被重复读取,从而有效减少程序存,使多次处理程序时当前文件不必被重复读取,从而有效减少程序处理的时间。默认情况下,数据库自动产生一份数据缓存,但当使用处理的时间。默认情况下,数据库自动产生一份数据缓存,但当使用 GET DATA语法命令读取
28、数据库时,数据缓存不能自动产生,应该使语法命令读取数据库时,数据缓存不能自动产生,应该使用用FileCache Data菜单使之产生。菜单使之产生。v Cache Now:立刻产生一个缓存文件,若当前文件被锁住:立刻产生一个缓存文件,若当前文件被锁住“locked”而无法修改时使用之,或者数据文件很大,它能加快处理时数据视图内而无法修改时使用之,或者数据文件很大,它能加快处理时数据视图内容的滚动速度。容的滚动速度。v 默认情况下,单元格内显示的是具体变量值,默认情况下,单元格内显示的是具体变量值,鼠标鼠标放在该变量名上(列的开头),出现关于该变量详细放在该变量名上(列的开头),出现关于该变量详细描述的标签定义描述的标签定义.v 当前,变量当前,变量marital的单元格中显示的是变量标签:的单元格中显示的是变量标签:Married和和Unmarried