1、SPSS数据分析技术变量级别的数据管理文件级别的数据管理 变量级别的数据管理 Transform 第一类:计算新变量 Compute 该菜单中最常用和最重要的功能项 第二类:变量转换 Recode Visual Bander Count Rank Cases Automatic Recode 第三类:专用选项(可忽略)Date/time,Create Time Series Replace Missing Values Random Number Generator 第四类:控制命令(可忽略)Run Pending Transforms 用于执行编程中被挂起的数据整理操作1、Compute 在
2、原有变量的基础之上,根据用户的要求,使用相应的算术表达式或函数,对所有案例或满足一定要求的案例,计算出一个新变量。实例 利用1991GSS数据,将受访者受教育年数“educ”变量和受访者配偶受教育年数“speduc”相加,得到夫妻受教育总年数“hweduc”这个新变量步骤一:打开Transform菜单,选择Compute步骤二:点击“Compute”,弹出对话框步骤三:在“target variable”框内填入新变量名步骤四:通过黑色箭头将左侧变量框中的“educ”和“speduc”两个变量拖入右上侧“Numeric Expression”变量框,中间以“+”号间隔步骤五:点击“ok”,生成
3、新变量“hweduc”步骤六:查看新变量的频数表注意 当两个变量相加得到一个新变量时,直接使用“AB”计算格式的缺陷:如果一个案例在某一变量上缺失,那么在新变量上也会缺失。为了避免这种情况,可以使用sum公式,这样spss自动把缺失值视为0。但这一做法同样存在问题:比如将夫妻收入相加,如果把缺失的收入视为零,就会低估新收入的值,因为缺失并不意味着没有收入。另一种解决方法是用recode命令将变量平均值代替其缺失值。(用简单数据进行说明)输入公式时一定要在英文拼写状态下进行习题 利用1996年数据中的“出身年份”变量,生成一个“年龄”变量(为什么直接用1996减去出生年会出错,因为原始问卷中填写
4、的出生年是后两位而不是四位)利用1996年数据中的十个“教育经历”变量,生成一个“最终受教育程度变量”(要先对十个教育经历变量设定缺失值,最后对新变量取值贴标签)根据平时成绩(40%)和期末成绩(60),生成一个总成绩(举例时选择特殊的数字以显示效果2、Recode 将已有的定距变量,按照某种一一对应的关系转化为定类或定序变量,或对已有定类或定序变量的不同类型和等级进行简化合并。实例一 1991GSS数据,将定距的受访者受教育年数“educ”变量转化为五分类的定序变量“educ1”,用来表示受访者的受教育程度(无教育、小学、初中、高中、大学及以上)。步骤一:打开Transform菜单,选择Re
5、code步骤二:点击 Into Different Variable,弹出对话框步骤三:从左侧变量框选择“educ”变量步骤四:在右侧“output variable”框和“label”框内填写新变量名和标签步骤五:点击“change”按钮步骤六:点击Old and New Values,弹出对话框步骤七:对新旧变量取值进行一一对应步骤八:点击“continue”,回到原对话框步骤九:点击“OK”,生成新变量“educ1”步骤十:对新生成的变量取值贴标签频数分析结果 实例二 1991GSS数据,将新生成的变量“educ1”简化为“educ2”,表示受访者是否受过高等教育。步骤一:打开Trans
6、form菜单,选择Recode步骤二:点击 Into Different Variable,弹出对话框步骤三:从左侧变量框选择“educ1”变量步骤四:在右侧“output variable”框和“label”框内填写新变量名和标签步骤五:点击“change”按钮步骤六:点击Old and New Values,弹出对话框步骤七:对新旧变量取值进行一一对应步骤八:点击“continue”,回到原对话框步骤九:点击“OK”,生成新变量“educ2”步骤十:对新生成的变量取值贴标签频数分析结果习题 利用1991GSS年数据,将受访者的职业声望“prestg80”这一定距变量转化成一个三分类的定序变
7、量低职业声望、中职业声望和高职业声望(转换前需要查看原始变量的频数表以确定分类范围)。利用recode命令,将某一变量的缺失值用其平均值代替,从而解决当几个变量相加时所产生的缺失案例过多这一问题。3、Visual Bander 通过百分位数、标准差范围或等间距方式将定距变量划分为若干组段,并采用图形化操作的方式,非常直观好用。实例 1996数据,将受访者的收入按照等间距的方式分为四组步骤一:在Transform菜单中选择Visual Bander步骤二:点击Visual Bander,弹出对话框步骤三:将“月收入”变量拖入右侧分段变量框步骤四:点击“Continue”,弹出对话框步骤五:在分段
8、变量框内填入新变量名步骤六:点击“Make Cutpoints”,弹出对话框步骤七:在分组对话框内进行分组定义步骤八:点击“Apply”,回到原对话框步骤九:点击“Make Label”,自动填充值标签步骤十:点击“OK”,生成新变量频数分析结果习题 利用1996年数据,根据等案例法,将“受访者的月收入”这一定距变量转化成一个五分类的定序变量低收入、中低收入、中等收入、中高收入和高收入(等案例法之所以无法完美的将案例均等的划分,是因为有可能出现一定数量的案例集中在一个变量取值上)。4、Count 用于标示某个值或某些值在某个变量的取值中是否出现。实例 1991GSS数据,生成一个新变量,用来表
9、示受访者是否受过高等教育(用count和recode分别生成同一个新变量,以说明它们之间的细微差别)步骤一:打开Transform菜单,选择Count步骤二:点击“Count”,弹出对话框步骤三:在目标变量框内填写新变量名步骤四:对目标变量作进一步的说明步骤五:从已有变量中选择“月收入”变量步骤六:点击“Define Values”,弹出对话框步骤七:对取值范围进行界定步骤八:点击“Add”,将取值范围拖入右侧空白框步骤九:点击“Continue”,回到原对话框步骤十:点击“OK”,自动生成“higheduc”新变量频数分析结果5、Rank Cases根据某个变量的大小对案例进行排序,然后将排序结果存储到一个新变量中。实例 1991GSS数据,根据性别分组计算受访者职业声望的秩序步骤一:打开Transform菜单,选择Rank Cases步骤二:点击“Rank Cases”,弹出对话框步骤三:将“prestg80”从左侧变量框拖入右侧变量框步骤四:将性别变量从左侧变量框拖入“By”对话框步骤五:点击“Rank Types”,弹出对话框步骤六:选择“Rank”之后点击“Continue”回到原对话框步骤七:点击“Ties”,弹出对话框,设定出现并列情况时的处理方案步骤八:做完设定点击“Continue”,回到原对话框步骤九:点击“OK”,自动生成“Rprestg80”变量