数据管理一[课件].pptx_163文库

资源描述

1、SPSS数据分析技术变量级别的数据管理文件级别的数据管理变量级别的数据管理 Transform 第一类：计算新变量 Compute 该菜单中最常用和最重要的功能项第二类：变量转换 Recode Visual Bander Count Rank Cases Automatic Recode 第三类：专用选项(可忽略)Date/time,Create Time Series Replace Missing Values Random Number Generator 第四类：控制命令（可忽略）Run Pending Transforms 用于执行编程中被挂起的数据整理操作1、Compute 在

2、原有变量的基础之上，根据用户的要求，使用相应的算术表达式或函数，对所有案例或满足一定要求的案例，计算出一个新变量。实例利用1991GSS数据，将受访者受教育年数“educ”变量和受访者配偶受教育年数“speduc”相加，得到夫妻受教育总年数“hweduc”这个新变量步骤一:打开Transform菜单,选择Compute步骤二：点击“Compute”，弹出对话框步骤三：在“target variable”框内填入新变量名步骤四：通过黑色箭头将左侧变量框中的“educ”和“speduc”两个变量拖入右上侧“Numeric Expression”变量框，中间以“+”号间隔步骤五：点击“ok”，生成

3、新变量“hweduc”步骤六：查看新变量的频数表注意当两个变量相加得到一个新变量时，直接使用“AB”计算格式的缺陷：如果一个案例在某一变量上缺失，那么在新变量上也会缺失。为了避免这种情况，可以使用sum公式，这样spss自动把缺失值视为0。但这一做法同样存在问题：比如将夫妻收入相加，如果把缺失的收入视为零，就会低估新收入的值，因为缺失并不意味着没有收入。另一种解决方法是用recode命令将变量平均值代替其缺失值。（用简单数据进行说明）输入公式时一定要在英文拼写状态下进行习题利用1996年数据中的“出身年份”变量，生成一个“年龄”变量(为什么直接用1996减去出生年会出错，因为原始问卷中填写

4、的出生年是后两位而不是四位)利用1996年数据中的十个“教育经历”变量，生成一个“最终受教育程度变量”（要先对十个教育经历变量设定缺失值，最后对新变量取值贴标签）根据平时成绩（40%）和期末成绩（60），生成一个总成绩（举例时选择特殊的数字以显示效果2、Recode 将已有的定距变量，按照某种一一对应的关系转化为定类或定序变量，或对已有定类或定序变量的不同类型和等级进行简化合并。实例一 1991GSS数据，将定距的受访者受教育年数“educ”变量转化为五分类的定序变量“educ1”，用来表示受访者的受教育程度（无教育、小学、初中、高中、大学及以上）。步骤一：打开Transform菜单，选择Re

5、code步骤二:点击 Into Different Variable,弹出对话框步骤三：从左侧变量框选择“educ”变量步骤四：在右侧“output variable”框和“label”框内填写新变量名和标签步骤五：点击“change”按钮步骤六：点击Old and New Values，弹出对话框步骤七：对新旧变量取值进行一一对应步骤八：点击“continue”，回到原对话框步骤九：点击“OK”，生成新变量“educ1”步骤十：对新生成的变量取值贴标签频数分析结果实例二 1991GSS数据，将新生成的变量“educ1”简化为“educ2”，表示受访者是否受过高等教育。步骤一：打开Trans

6、form菜单，选择Recode步骤二:点击 Into Different Variable,弹出对话框步骤三：从左侧变量框选择“educ1”变量步骤四：在右侧“output variable”框和“label”框内填写新变量名和标签步骤五：点击“change”按钮步骤六：点击Old and New Values，弹出对话框步骤七：对新旧变量取值进行一一对应步骤八：点击“continue”，回到原对话框步骤九：点击“OK”，生成新变量“educ2”步骤十：对新生成的变量取值贴标签频数分析结果习题利用1991GSS年数据，将受访者的职业声望“prestg80”这一定距变量转化成一个三分类的定序变

7、量低职业声望、中职业声望和高职业声望（转换前需要查看原始变量的频数表以确定分类范围）。利用recode命令，将某一变量的缺失值用其平均值代替，从而解决当几个变量相加时所产生的缺失案例过多这一问题。3、Visual Bander 通过百分位数、标准差范围或等间距方式将定距变量划分为若干组段，并采用图形化操作的方式，非常直观好用。实例 1996数据，将受访者的收入按照等间距的方式分为四组步骤一：在Transform菜单中选择Visual Bander步骤二：点击Visual Bander，弹出对话框步骤三：将“月收入”变量拖入右侧分段变量框步骤四：点击“Continue”，弹出对话框步骤五：在分段

8、变量框内填入新变量名步骤六：点击“Make Cutpoints”，弹出对话框步骤七：在分组对话框内进行分组定义步骤八：点击“Apply”，回到原对话框步骤九：点击“Make Label”，自动填充值标签步骤十：点击“OK”，生成新变量频数分析结果习题利用1996年数据，根据等案例法，将“受访者的月收入”这一定距变量转化成一个五分类的定序变量低收入、中低收入、中等收入、中高收入和高收入（等案例法之所以无法完美的将案例均等的划分，是因为有可能出现一定数量的案例集中在一个变量取值上）。4、Count 用于标示某个值或某些值在某个变量的取值中是否出现。实例 1991GSS数据，生成一个新变量，用来表

9、示受访者是否受过高等教育（用count和recode分别生成同一个新变量，以说明它们之间的细微差别）步骤一：打开Transform菜单，选择Count步骤二：点击“Count”，弹出对话框步骤三：在目标变量框内填写新变量名步骤四：对目标变量作进一步的说明步骤五：从已有变量中选择“月收入”变量步骤六：点击“Define Values”，弹出对话框步骤七：对取值范围进行界定步骤八：点击“Add”，将取值范围拖入右侧空白框步骤九：点击“Continue”，回到原对话框步骤十：点击“OK”，自动生成“higheduc”新变量频数分析结果5、Rank Cases根据某个变量的大小对案例进行排序，然后将排序结果存储到一个新变量中。实例 1991GSS数据，根据性别分组计算受访者职业声望的秩序步骤一：打开Transform菜单，选择Rank Cases步骤二：点击“Rank Cases”，弹出对话框步骤三：将“prestg80”从左侧变量框拖入右侧变量框步骤四：将性别变量从左侧变量框拖入“By”对话框步骤五：点击“Rank Types”，弹出对话框步骤六：选择“Rank”之后点击“Continue”回到原对话框步骤七：点击“Ties”，弹出对话框，设定出现并列情况时的处理方案步骤八:做完设定点击“Continue”,回到原对话框步骤九：点击“OK”，自动生成“Rprestg80”变量

展开阅读全文