1、SPSS软件的应用软件的应用1SPSS:Statistical Package for Social ScienceStatistical Product and Service Solutions2SPSS主要窗口:数据编辑窗口主要窗口:数据编辑窗口n窗口标题窗口标题:data editorn功能功能:定义数据结构、录入编缉、管理待分析的:定义数据结构、录入编缉、管理待分析的数据。数据。n组成组成:窗口主菜单、工具栏、数据编辑区、状态:窗口主菜单、工具栏、数据编辑区、状态显示区显示区n特点特点:SPSS中各统计分析功能都是针对该窗口中的中各统计分析功能都是针对该窗口中的数据进行数据进行窗口中
2、的数据文件以窗口中的数据文件以.sav存于磁盘上存于磁盘上两个视图:数据视图和变量视图两个视图:数据视图和变量视图3菜单名菜单名功能功能File (文件文件)对文件的操作(如新建、打开、保存等)对文件的操作(如新建、打开、保存等)Edit (编缉编缉)对数据进行基本编缉对数据进行基本编缉View (视图视图)窗口外观状态管理,(如状态栏、表格线、窗口外观状态管理,(如状态栏、表格线、变量值标签等是否显示、字体设置等)变量值标签等是否显示、字体设置等)Data (数据数据)数据的操作数据的操作,(如排序、抽样、分类汇总)(如排序、抽样、分类汇总)Transform(转换转换)数据基本处理(如生成
3、新变量、计数、分数据基本处理(如生成新变量、计数、分组)组)Analyze(分析分析)对数据时行统计分析和建模对数据时行统计分析和建模Graphs(图形图形)制作统计图形制作统计图形Utilities(实用程序实用程序)其他辅助管理其他辅助管理(显示变量信息、定义变量集显示变量信息、定义变量集)4SPSS主要窗口:数据输出窗口主要窗口:数据输出窗口n窗口标题窗口标题:viewern功能:功能:SPSS统计分析报表及图形统计分析报表及图形的输出的窗口的输出的窗口。n特点特点:在进行第一次分析时自动打开,也可手工打开在进行第一次分析时自动打开,也可手工打开输出窗口可以关闭,窗口内容以输出窗口可以关
4、闭,窗口内容以.SPV存于磁盘存于磁盘两个视图:目录视图和内容视图两个视图:目录视图和内容视图5SPSS数据文件的建立和管理数据文件的建立和管理6nSPSSSPSS数据文件是一种有结构的数据文件。数据文件是一种有结构的数据文件。建立建立SPSS数据文件应完成两项任务:数据文件应完成两项任务: 第一,描述第一,描述SPSS数据的结构数据的结构 第二,录入编缉第二,录入编缉SPSS的数据内容的数据内容一行称为一个一行称为一个“个案个案”(casecase)一列称为一个一列称为一个“变量变量”(varvar)变量视图变量视图数据视图数据视图7在调查问卷中在调查问卷中n有多少份问卷,意味着有多少个有多
5、少份问卷,意味着有多少个“个案个案”n问卷中的每个问题对应于每一个问卷中的每个问题对应于每一个“变量变量”8(一)(一) 变量名(变量名(Name)n变量名的字符个数一般不多于变量名的字符个数一般不多于8 8个;个;n变量名可以用英文,也可以用汉字,汉字变量名可以用英文,也可以用汉字,汉字一般不超过一般不超过4 4个。个。n变量名不区分大小写字变量名不区分大小写字n变量名不能与变量名不能与SPSSSPSS内部特有的具有特定含内部特有的具有特定含义的保留字相同,如义的保留字相同,如ALLALL,BYBY,ANDAND,NOTNOT,OROR等。等。9(二)(二) Type、Width、Decim
6、alsn 数值型数值型 (1)标准型()标准型(Numeric)默认)默认8 . 2 如:如: 12345678、12345.67、-1234.56 (2)科学记数法型()科学记数法型(Scientific Notation) 表示很大或很小的数据表示很大或很小的数据 如:如:1.2E+05 (3)逗号型()逗号型(Comma) 整数部分从个位开始每三位一个逗号整数部分从个位开始每三位一个逗号 如:如:1,234.5610 (4)圆点型()圆点型(Dot) 整数部分从个位开始每三位一个圆点整数部分从个位开始每三位一个圆点 如:如:1.234,56 (5)美元符号型()美元符号型(Dollar)
7、 主要表示货币数据主要表示货币数据 如:如:$12.30n字符型(字符型(String) 默认列宽默认列宽8个字符,不能进行算术运算,区分大小写字母个字符,不能进行算术运算,区分大小写字母n日期型(日期型(Date) dd-mmm-yyyy mm/dd/yyyy11(三)(三)变量名标签变量名标签 (label) :对变量名的一些解释说明,增强分析结果的可视对变量名的一些解释说明,增强分析结果的可视性。可以省略。性。可以省略。(四)(四)变量值标签变量值标签 (Value)对变量所取值的一些解释说明,对变量所取值的一些解释说明,增强分析结果的增强分析结果的可视性。可以省略。可视性。可以省略。一
8、般用于品质数据一般用于品质数据 如:如:1-男男 2-女、女、1-高高 2-中中 3-低低12(五)(五)变量列格式变量列格式(Column Format)n列宽度列宽度(Column Width)默认值为变量的总长度。默认值为变量的总长度。n对齐方式对齐方式(Text Alignment)左对齐左对齐(Left):字符型默认。字符型默认。右对齐右对齐(Right):数值型默认。数值型默认。居中对齐居中对齐(Center)n计量尺度计量尺度 Scale(度量)(度量) Ordinal(有序)(有序) Nominal(名义)(名义)13(六)(六)缺失值缺失值(Missing Values)1、
9、什么是缺失值?、什么是缺失值?漏填数据漏填数据明显错误的数据明显错误的数据2、对缺失值的一般处理、对缺失值的一般处理(1)指定某个特定值为缺失值(用户缺失值)指定某个特定值为缺失值(用户缺失值) 如如999999(2)系统缺失值:点)系统缺失值:点 ()14SPSS数据的录入与编缉数据的录入与编缉n录入时应注意:录入时应注意:黑框确定当前数据单元。黑框确定当前数据单元。可以逐行录入,按可以逐行录入,按Tab键;可以逐列录入,按键;可以逐列录入,按Entern数据定位数据定位 按值定位按值定位 光标定位到某列变量上光标定位到某列变量上 - Edit - Find.15SPSS数据的编辑数据的编辑
10、n插入和删除一个个案插入和删除一个个案 插入:编缉插入:编缉-插入个案插入个案 删除:选定待删行,鼠标右键找到删除:选定待删行,鼠标右键找到Cutn插入和删除一个变量插入和删除一个变量 插入:光标定位到某列变量上插入:光标定位到某列变量上 - 编缉编缉-插入变量插入变量 (插到某列前插到某列前) 删除:选定列,鼠标右键删除:选定列,鼠标右键Cut项项16多项选择题的处理方法多项选择题的处理方法 将一个问题定义成几个变量,用这几个变量来描述该问将一个问题定义成几个变量,用这几个变量来描述该问题的几个可能被选择的答案。题的几个可能被选择的答案。编码方式:编码方式:多选项二分法多选项二分法(mult
11、iple dichotomize method) 将每个答案作为一个变量,每个变量只有两个取值将每个答案作为一个变量,每个变量只有两个取值(0或或1)多选项分类法多选项分类法(multiple category method) 首先估计多选项问题可能被选择的最多答案数,然后为每首先估计多选项问题可能被选择的最多答案数,然后为每个答案建立一个变量,变量取值为多选项问题的可选答案个答案建立一个变量,变量取值为多选项问题的可选答案17SPSSSPSS变量名变量名变量名标签变量名标签变量值变量值V1是使晚年生活有保障吗是使晚年生活有保障吗0/1V2是一种安全的投资保值是一种安全的投资保值方式吗方式吗0
12、/1V3是抱着试试看的态度购是抱着试试看的态度购买吗买吗0/1V4是亲戚朋友推荐吗是亲戚朋友推荐吗0/1V5是单位统一组织购买吗是单位统一组织购买吗0/1V6是保险公司的宣传吗是保险公司的宣传吗0/1V7是其他吗是其他吗0/1多选项二分法举例多选项二分法举例18SPSSSPSS变量名变量名变量名标签变量名标签变量值变量值V1第一原因第一原因1/2/3/4/5/6/7V2第二原因第二原因1/2/3/4/5/6/7V3第三原因第三原因1/2/3/4/5/6/7多选项分类法举例多选项分类法举例19SPSS数据文件的基本加工和处理20SPSS数据文件的基本加工和处理数据文件的基本加工和处理n数据文件的
13、整理数据文件的整理 个案排序、个案选取个案排序、个案选取n数据加工数据加工 变量计算、计数变量计算、计数n数据分组数据分组 自动分组、手工分组自动分组、手工分组n数据文件的其他处理功能数据文件的其他处理功能 指定加权变量指定加权变量21n目的:目的: 将所有个案按照用户指定的某一个或多个变量将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列。的变量值的升序或降序重新排列。n菜单选项菜单选项:data - sort casesn注意注意:(1)Ascending:升序、升序、Descending:降序。降序。(2)多重排序多重排序,选择变量名的次序很关键。选择变量名的次序很关键
14、。个案排序个案排序22变量计算变量计算(1)含义含义:变量计算是在原有数据的基础上,:变量计算是在原有数据的基础上,根据用户给出的根据用户给出的SPSS算术表达式以及函算术表达式以及函数,对所有个案或满足条件的部分个案,数,对所有个案或满足条件的部分个案,计算产生一系列新变量。计算产生一系列新变量。 23(2)SPSS算术表达式算术表达式(Numeric Expression): 由常量、变量、算术运算符、圆括号、函数等组由常量、变量、算术运算符、圆括号、函数等组成的式子。成的式子。注意:注意:n字符型常量应用引号引起来;字符型常量应用引号引起来;n算术运算符主要包括:算术运算符主要包括:+
15、+、- -、* *、/ /、* * *n在同一算术表达式中的常量及变量,数据类型应在同一算术表达式中的常量及变量,数据类型应该一致该一致24(3)SPSS条件表达式条件表达式:n由由SPSS关系运算符、逻辑运算符、关系运算符、逻辑运算符、SPSS函数以函数以及及SPSS变量名组成的式子。变量名组成的式子。 关系运算符关系运算符: : (大于大于)、 =(大于等于大于等于)、 32、sr AND OR25n算术函数算术函数n统计函数统计函数n分布函数分布函数n逻辑函数逻辑函数n字符串函数字符串函数n缺失值函数缺失值函数n日期时间函数日期时间函数n其他函数其他函数nAbs() sqrt() rnd
16、() trunc() mod()nmean() sd() sum() cfvar() max() min()nnormal() uniform() RV.分布名分布名() Probit.()nrange() any()nindex() length() lower() lpad() ltrim() substr()nmissing() sysmis()(4) SPSS函数函数函数是事先编好并存储在函数是事先编好并存储在SPSS软件中,能够实现某些软件中,能够实现某些特定计算任务的一段计算机程序。特定计算任务的一段计算机程序。26(5)菜单选项:菜单选项: transform-compute (
17、转换)(转换)-(计算变量)(计算变量) if 按钮按钮 例例 计算职工实发工资计算职工实发工资27计数计数(1)含义含义: 对所有或部分个案,计算若干个变量中有几个变对所有或部分个案,计算若干个变量中有几个变量的值落在指定的区域内,并将结果存入新变量量的值落在指定的区域内,并将结果存入新变量中。中。 (2)菜单选项菜单选项: transform - count28 数据文件的分类汇总(1)含义:含义:按指定的分类变量的变量值对个案分组;按指定的分类变量的变量值对个案分组;计算每组个案的汇总变量的基本统计量;计算每组个案的汇总变量的基本统计量;将计算结果生成到一新文件中,即:在新文将计算结果生
18、成到一新文件中,即:在新文件中对应分类变量的每一个分类值产生一个件中对应分类变量的每一个分类值产生一个个案。个案。(2)菜单选项菜单选项: data - aggregate29(3)注意注意: 按照哪个变量进行分类按照哪个变量进行分类 对哪个变量进行汇总对哪个变量进行汇总 指定对汇总变量计算哪些统计量指定对汇总变量计算哪些统计量 利用住房状况调查数据,分析本市户口家庭利用住房状况调查数据,分析本市户口家庭和外地户口家庭目前人均住房面积的平均值是否和外地户口家庭目前人均住房面积的平均值是否有较大差距,未来打算购买住房的平均面积是否有较大差距,未来打算购买住房的平均面积是否有较大差距。有较大差距。
19、应用举例应用举例30 数据分组数据分组n目的:了解数据的总体分布状况目的:了解数据的总体分布状况n思路:思路:指定按哪个变量分组,即:指定分组变量指定按哪个变量分组,即:指定分组变量定义分组变量的分组区间(不重、不漏)定义分组变量的分组区间(不重、不漏)指定一个存放分组结果的标志变量指定一个存放分组结果的标志变量n分组方法:分组方法:自动分组自动分组手工分组手工分组31 数据分组(一一)自动分组(自动分组(单变量值分组)单变量值分组)(1)含义含义: 分组变量值相同的个案分在同一组,同组分组变量值相同的个案分在同一组,同组中的标志变量相同。标志变量依照分组变量值的中的标志变量相同。标志变量依照
20、分组变量值的大小次序给定。(单变量分组,通常只适合于离大小次序给定。(单变量分组,通常只适合于离散变量且变量值较少的情况)散变量且变量值较少的情况)(2)菜单选项菜单选项: transform - automatic recode32 数据分组(二二)手工分组(组距分组)手工分组(组距分组)(1)含义含义: 人工定义分组区域,对所有个案或符合一定条件人工定义分组区域,对所有个案或符合一定条件的个案进行等距或非等距分组。的个案进行等距或非等距分组。n菜单选项菜单选项:transform - recode - into different variables33指定加权变量(1)含义: 指定某一变
21、量为加权变量。如:平均蔬菜价格、男足打分(2)菜单选项:data - weight case(3)说明 如果取消加权变量应重新定义:data-weight casedo not weight cases34频数分析频数分析n目的目的粗略把握变量值的分布状况。粗略把握变量值的分布状况。n采用的方法采用的方法计算频分布表:包括计算计算频分布表:包括计算 频数、累计频数、百频数、累计频数、百分比、累计百分比分比、累计百分比绘制统计图形:条形图、饼图绘制统计图形:条形图、饼图35频数分析频数分析n基本操作步骤基本操作步骤(1)菜单选项菜单选项:analyze-descriptive statistic
22、s -frequencies(2)选择几个待分析的变量到选择几个待分析的变量到variables框框.(3)chart选项,选择所需要的图形选项,选择所需要的图形36频数分析 频数分析中的其他分析 计算分位数:适用于定距数据 数据按升序排序后,找到若干个分位点上的变量值 quartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU) cut points for n equal groups:n等份 percentile:自定义百分位点 分位数的应用 在排除极端值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度 例: ( QL=50,QU=80) 和 (QL=70,
23、QU=75) 的比较37计算描述统计量n目的精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭程度。n基本方法计算基本描述统计量38计算描述统计量n描述集中趋势的统计量均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。n适用于定距数据。n特点:利用了全部数据,易受极端值的影响。n描述离散程度的统计量标准差(standard deviation-Std Dev):表示某变量的所有变量值离散程度的统计量。nSPSS中计算的是样本标准差。方差(variance):标准差的平方。nSPSS中计算的是样本方差。极差 (range):最大值(maximum)最小值(m
24、inimum)39计算描述统计量n描述对称程度的统计量 偏度(skewness):描述某变量分布形态的偏斜程度和方向的统计量.n偏度为0表示对称;n大于0表示正偏差大(右偏),频数最大的值比均值小,极值大于均值;n小于0表示负偏差大(左偏)。40计算描述统计量n描述陡峭程度的统计量峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。n峭度为0表示与标准正态分布峭度相同。n大于0表示比标准正态分布陡,尖峰。n小于0表示比标准正态分布缓;平峰。41计算描述统计量 其他统计量 标准误差(standard error S.E):抽样分布中的标准差,反映样本误差。 均值标准误差(me
25、ans of S.E) 中心极限定理认为:样本均值N(u,2/n) 反映样本均值与总体真值间的平均离散程度 样本数越大,样本均值的离散程度越小,对真值的估计越准确42计算描述统计量n基本操作步骤(1)菜单选项:analyze-descriptive statistics-descripive(2)选择将参加计算的数值型数值型变量名到variables框。43n其他功能数据标准化处理n新变量的均值为0,标准差为1;n小于0表示在平均水平下,大于0反之.n正态分布的数据标准化后呈标准正态分布(68.2%,95.4%,99.7%)nsave standardized values as variables选项n将变量作标准化后,结果存入名为“Z+原变量名”的新变量中.计算描述统计量44