1、第1讲 SPSS基本用法1、SPSS是什么?是什么?o SPSS是一个软件,是公认的最优秀的统计是一个软件,是公认的最优秀的统计分析软件之一。分析软件之一。o SPSS的全称是:的全称是:Statistical Program for the Social Sciences,即社会科学,即社会科学统计软件包。统计软件包。2000年后来改名为年后来改名为Statistical Product&Service Solutions,即统计产品和服务解决方案。,即统计产品和服务解决方案。2、SPSS应用领域应用领域o 销售分析o 市场调查o 社会调查o 农业生产中产量与因素的分析o 产品质量控制3、S
2、PSS的运行的运行o 点击桌面的点击桌面的SPSS的图标,运行的图标,运行SPSS,弹,弹出如下窗体。出如下窗体。SPSS的运行:初始画面4、SPSS数据管理的特点数据管理的特点o SPSS数据管理器与Excel电子表格十分相似,所见即所得。o SPSS数据文件的默认格式为*.sav。SPSS 16以及更高版本输出的结果文件的默认格式为*.spv。SPSS统计分析的结果可以用文件的形式保存下来。5、SPSS的数据形式的数据形式o SPSS数据编辑器的每一行数据称为一个个案(Case),对应一个对象的记录。o 每一列数据代表个体的属性,即变量(Variable)SPSSSPSS数据文件是一种有结
3、构的数据文件数据文件是一种有结构的数据文件:年级年级 性别性别问题问题1 1 问题问题n n1 1 1 1 .4 42 2 2 2 2 2.3 3 1 1 1 1文件结构文件结构数据数据个案个案casecase变量名变量名6、SPSS数据编辑器简介数据编辑器简介8数据编辑器(1)-数据视图数据编辑器o 用户可以直接在数据视图中对数据进行修改。o 可以直接在数据视图中进行复制、粘贴,也可以直接修改某个个案的属性值o 删除某一行或者某一列,添加一列(插入变量),添加一行(插入个案);o 可以进行查找、(批量)查找替换等。数据编辑器(2)-变量视图7、SPSS的窗口的窗口o 数据编辑窗口数据编辑窗口
4、o 资料输出窗口资料输出窗口o 句法编辑窗口句法编辑窗口o 图形编辑窗口图形编辑窗口o 手稿编辑窗口手稿编辑窗口资料编辑窗口资料编辑窗口(常用常用)资料输出窗口资料输出窗口(常用常用)图形编辑窗口图形编辑窗口o 可对图形进行可对图形进行相应的操作相应的操作8、SPSS的主要功能的主要功能o 数据编辑功能数据编辑功能o 表格的生成和编辑表格的生成和编辑o 图形的生成和编辑图形的生成和编辑o 统计功能统计功能o 与其它软件的连接与其它软件的连接数据编辑功能数据编辑功能o 可对变量进行增加、删除、复制、剪切和粘可对变量进行增加、删除、复制、剪切和粘贴等常规操作贴等常规操作o 还可以对数据进行排序、转
5、置、拆分、集合还可以对数据进行排序、转置、拆分、集合和加权等操作和加权等操作o 合并操作合并操作表格的生成和编辑表格的生成和编辑o 可生成十种不同风格的表格可生成十种不同风格的表格o 依照功能分为:依照功能分为:n 一般表一般表n 多响应表多响应表n 频数表频数表图形的生成和编辑图形的生成和编辑o 条形图:简单,分组,分段,阴影,垂悬条形图:简单,分组,分段,阴影,垂悬 o 线形图:单线,多线,垂线,投影线形图:单线,多线,垂线,投影 o 面积图:简单,分段面积图:简单,分段 o 饼状图:简单,爆炸饼状图:简单,爆炸 o 高低图:高高低图:高-低低-收盘收盘 o 距限图距限图 o 箱图:简单,
6、分组箱图:简单,分组 o 范围条形图:简单,分组范围条形图:简单,分组 o 误差条形图:简单,分组误差条形图:简单,分组 o 混合:任意面积图、条形图和线形图的组合混合:任意面积图、条形图和线形图的组合 图形的生成和编辑图形的生成和编辑o 直方图直方图o 散点图散点图o 诊断和探测图诊断和探测图 o 观测量绘图和时间序列绘图观测量绘图和时间序列绘图 o 概率图概率图 o 自动相关和部分自动相关函数绘图自动相关和部分自动相关函数绘图 o 交叉相关函数绘图交叉相关函数绘图 统计功能统计功能o 描述性分析o 统计检验o 方差分析o 列联表o 相关分析o 回归分析o 聚类分析o 判别分析o 因子分析与
7、其它软件的连接与其它软件的连接o 能直接打开能直接打开Excel、dBase、Lotus1-2-3、Access等文件等文件o 文本编辑器生成的数据文件文本编辑器生成的数据文件9、SPSS常用工具按钮常用工具按钮10、新建数据文件、新建数据文件 o 刚刚完成一项调查或者试验,可以把数据直接输入到SPSS软件中,建立SPSS数据文件。o 把数据输入SPSS以前,先定义数据文件的结构。数据的定义数据的定义数据文件的建立25SPSS的数据变量的数据变量何 帆变量o 变量的类型变量的类型SPSS变量有三种基本类型:数值型、字符型、变量有三种基本类型:数值型、字符型、日期型。数值型变量又按不同要求分为六
8、种,因日期型。数值型变量又按不同要求分为六种,因此共可定义八种类型的变量。变量的系统默认长此共可定义八种类型的变量。变量的系统默认长度一般为度一般为F8.2,其中,其中8是显示宽度,是显示宽度,2是小数点是小数点后面的位数,但可通过主菜单后面的位数,但可通过主菜单Edit中的中的“Options”重新设置。重新设置。变量类型o 数值型:数值型:同时定义数值的宽度(同时定义数值的宽度(Width),即),即整数部分整数部分+小数点小数点+小数部分的位数,默认为小数部分的位数,默认为8位;定义小数位数(位;定义小数位数(Decimal Places),默),默认为认为2位。位。例如例如-36452
9、.72、5.6467E5显示出来的显示出来的都是标准数值格式都是标准数值格式o 加显逗号的数值型:加显逗号的数值型:即整数部分每即整数部分每3位数加一逗位数加一逗号,其余定义方式同数值型。号,其余定义方式同数值型。变量类型o 3位加点数值型位加点数值型:无论数值大小,均以整数形式显:无论数值大小,均以整数形式显示,每示,每3位加一小点(但不是小数点),可定义小位加一小点(但不是小数点),可定义小数位置,但都显示数位置,但都显示0,且小数点用逗号表示。如,且小数点用逗号表示。如1.2345显示为显示为 12.345,00(实际是(实际是12345E-4).o 科学记数型:科学记数型:同时定义数值
10、宽度(同时定义数值宽度(Width)和小数)和小数位数(位数(Decimal Places),在数据管理窗口中以),在数据管理窗口中以指数形式显示。如定义数值宽度为指数形式显示。如定义数值宽度为9,小数位数为,小数位数为2,则,则345.678 显示为显示为3.46E+02。变量类型o 日期型日期型:用户可从系统提供的日期显示形式中选:用户可从系统提供的日期显示形式中选择自己需要的。如选择择自己需要的。如选择mm/dd/yy形式,则形式,则1995年年6月月25日显示为日显示为06/25/95。o 货币型货币型:用户可从系统提供的日期显示形式中选:用户可从系统提供的日期显示形式中选择自己需要的
11、,并定义数值宽度和小数位数,显择自己需要的,并定义数值宽度和小数位数,显示形式为数值前有。示形式为数值前有。变量类型o 字符型:字符型:用户可定义字符长度(用户可定义字符长度(Characters)以便输入字符。以便输入字符。变量标签和值标签的定义变量标签和值标签的定义o 变量标签的定义变量标签的定义 变量标签(变量标签(Variable LabelsVariable Labels)变量标签变量标签Label是对变量名的附加的进一步说是对变量名的附加的进一步说明。在统计输出中会在与变量名相对应的位置明。在统计输出中会在与变量名相对应的位置显示该变量的标签,这样有助于分析、输出易显示该变量的标签
12、,这样有助于分析、输出易读的结果。读的结果。变量标签和值标签的定义变量标签和值标签的定义o 变量标签的定义变量标签的定义(变量)值标签(变量)值标签(Value Labels)变量值标签是对变量的可能取值所附加的进一步说明变量值标签是对变量的可能取值所附加的进一步说明和注释,对分类变量往往要定义其取值的标签。因此和注释,对分类变量往往要定义其取值的标签。因此,在贴标签之前,要弄清变量或变量值代表的意义。,在贴标签之前,要弄清变量或变量值代表的意义。变量标签和值标签的定义变量标签和值标签的定义o 变量标签和值标签示例变量标签和值标签示例 变量变量变量标签变量标签变量值变量值值标签值标签SexSe
13、x性别性别f fFemaleFemalem mMaleMaleageage年龄年龄1 1=14=14岁岁2 215-6415-64岁岁3 36565岁岁HorHor夫妻和睦程度夫妻和睦程度1 1不和睦不和睦2 2一般一般3 3和睦和睦变量标签和值标签的定义变量标签和值标签的定义o变量标签和值标签的定义方法变量标签和值标签的定义方法n变量标签(变量标签(Label)定义在)定义在Variable View屏幕屏幕下,可在下,可在Label列下直接输入。列下直接输入。n变量值标签(变量值标签(Values Label)定义比较麻烦,先)定义比较麻烦,先用打开值标签的对话框,再进行编辑。用打开值标签
14、的对话框,再进行编辑。用户缺失值定义定义缺失值:定义缺失值:SPSS提供缺失值处理技术。在提供缺失值处理技术。在“定义定义变量变量”对话框中点击对话框中点击“缺失值缺失值”按钮,弹出按钮,弹出“定义定义缺失值缺失值”对话框,用户有对话框,用户有3个可选项:个可选项:用户缺失值定义o 1、没有缺失值;、没有缺失值;o 2、离散缺失值:可定义、离散缺失值:可定义1-3个。如测量身高(个。如测量身高(厘米)的资料,可定义厘米)的资料,可定义999为缺失值;性别的资为缺失值;性别的资料(男为料(男为1、女为、女为2),可定义),可定义1为缺失值;为缺失值;o 3、范围加上一个可选离散缺失值、范围加上一
15、个可选离散缺失值:可定义缺:可定义缺失值的范围,同时定义另外失值的范围,同时定义另外1个不是这一范围的个不是这一范围的缺失值。如定义缺失值。如定义09为脉搏的缺失值,同时定为脉搏的缺失值,同时定义义999为缺失值。为缺失值。数据的输入操作(1)o 对12个参加减肥活动的人做了一项调查。每个被调查者有一个ID,然后调查他们的身高、参加活动以前的体重、参加活动以后的体重、性别、政治派别以及8个有关性格的问题。我们把这些收集到的调查问卷结果输入SPSS中。数据的输入操作(2)o ID号(id)o 性别(sex):1:男;2:女n1,2,1,2,2,1,2,1,1,1,2,2 o 身高(height)
16、n76,59,67,65,63,72,70,68,69,74,68,63 o 参加活动以前的体重(before)185 113 145 156 109 191 155 165 175 180 135 118o 参加活动以后的体重(after)176 90 140 135 100 184 130 158 165 172 120 102数据的输入操作(3)o 政治派别(party)n 2 1 1 1 1 2 2 2 1 1 2 2o 8个有关性格的问题(分别记为e1到e8)输入数据时候应该注意问题 o 字符型数据n在SPSS中,字符型数据值是区分大小写的,小写的m和大写的M是不一样的。n字符型数据
17、也可以设置值标签。例如,“sex”变量的两个取值为M,F,他们的值标签分别为Female,Male。n如果值标签为英语,可以单击“拼写”进行拼写检查,以检查值标签的英文拼写。o 缺失值处理n如果有数据缺失,SPSS对于字符型数据和数值型数据有不同的处理方式。n对于数值型数据,缺失值默认为“.”;对于字符串型数据,系统默认值为空。11、保、保 存存 文文 件件o 在数据输入过程中,要经常注意保存数据,而不要等到所有数据输入完成之后再进行保存。这样可以避免例如计算机故障或者突然断电造成的不必要的的数据丢失。o SPSS可以对变量有选择地进行保存。可以选择你需要的变量进行保存。o 可以选择不同的格式
18、对SPSS数据文件进行保存设置文件保存的路径12、SPSS读入数据读入数据SPSS支持的数据文件格式o SPSS固有的数据文件格式.spv,.sav,便携式文件*.por,*.syso SAS格式文件o Excel文件o 文本文件(有分隔符的文件或者固定宽度的文件)o 数据库文件(Acess,Oracle,MySql,Sql Server等)读入Excel类型的数据(1)o 选择【文件】【打开】【数据】,文件类型选择Excelo 打开数据文件:我国1998-2003年国内生产总值.xls 读入Excel数据:注意问题o 从第一行数据读入变量名?o 在SPSS读入Excel文件时,必须先关闭要读入的Excel数据文件。o 建议在读入Excel文件以前,先仔细检查Excel文件中的数据,确保格式正确,并删除和数据无关的部分以及空行和空列,然后再运行SPSS读入该文件。读入文本数据(1)o【文件】【打开】,文件类型选择“文本文件(*.txt,*.dat)”o 选择“我国1998-2003年国内生产总值.txt”读入文本数据(2):注意问题o 一定要正确设定变量间的分隔符才能够保证导入数据的正确性。o 在点击【下一步】之前,要仔细检查数据预览部分,如发现不正确的部分需要找到出错的原因,及并时返回相应的步骤进行修改。