数据管理一[课件].pptx

上传人(卖家):晟晟文业 文档编号:3687303 上传时间:2022-10-04 格式:PPTX 页数:87 大小:2.06MB
下载 相关 举报
数据管理一[课件].pptx_第1页
第1页 / 共87页
数据管理一[课件].pptx_第2页
第2页 / 共87页
数据管理一[课件].pptx_第3页
第3页 / 共87页
数据管理一[课件].pptx_第4页
第4页 / 共87页
数据管理一[课件].pptx_第5页
第5页 / 共87页
点击查看更多>>
资源描述

1、SPSS数据分析技术变量级别的数据管理文件级别的数据管理 变量级别的数据管理 Transform 第一类:计算新变量 Compute 该菜单中最常用和最重要的功能项 第二类:变量转换 Recode Visual Bander Count Rank Cases Automatic Recode 第三类:专用选项(可忽略)Date/time,Create Time Series Replace Missing Values Random Number Generator 第四类:控制命令(可忽略)Run Pending Transforms 用于执行编程中被挂起的数据整理操作1、Compute 在

2、原有变量的基础之上,根据用户的要求,使用相应的算术表达式或函数,对所有案例或满足一定要求的案例,计算出一个新变量。实例 利用1991GSS数据,将受访者受教育年数“educ”变量和受访者配偶受教育年数“speduc”相加,得到夫妻受教育总年数“hweduc”这个新变量步骤一:打开Transform菜单,选择Compute步骤二:点击“Compute”,弹出对话框步骤三:在“target variable”框内填入新变量名步骤四:通过黑色箭头将左侧变量框中的“educ”和“speduc”两个变量拖入右上侧“Numeric Expression”变量框,中间以“+”号间隔步骤五:点击“ok”,生成

3、新变量“hweduc”步骤六:查看新变量的频数表注意 当两个变量相加得到一个新变量时,直接使用“AB”计算格式的缺陷:如果一个案例在某一变量上缺失,那么在新变量上也会缺失。为了避免这种情况,可以使用sum公式,这样spss自动把缺失值视为0。但这一做法同样存在问题:比如将夫妻收入相加,如果把缺失的收入视为零,就会低估新收入的值,因为缺失并不意味着没有收入。另一种解决方法是用recode命令将变量平均值代替其缺失值。(用简单数据进行说明)输入公式时一定要在英文拼写状态下进行习题 利用1996年数据中的“出身年份”变量,生成一个“年龄”变量(为什么直接用1996减去出生年会出错,因为原始问卷中填写

4、的出生年是后两位而不是四位)利用1996年数据中的十个“教育经历”变量,生成一个“最终受教育程度变量”(要先对十个教育经历变量设定缺失值,最后对新变量取值贴标签)根据平时成绩(40%)和期末成绩(60),生成一个总成绩(举例时选择特殊的数字以显示效果2、Recode 将已有的定距变量,按照某种一一对应的关系转化为定类或定序变量,或对已有定类或定序变量的不同类型和等级进行简化合并。实例一 1991GSS数据,将定距的受访者受教育年数“educ”变量转化为五分类的定序变量“educ1”,用来表示受访者的受教育程度(无教育、小学、初中、高中、大学及以上)。步骤一:打开Transform菜单,选择Re

5、code步骤二:点击 Into Different Variable,弹出对话框步骤三:从左侧变量框选择“educ”变量步骤四:在右侧“output variable”框和“label”框内填写新变量名和标签步骤五:点击“change”按钮步骤六:点击Old and New Values,弹出对话框步骤七:对新旧变量取值进行一一对应步骤八:点击“continue”,回到原对话框步骤九:点击“OK”,生成新变量“educ1”步骤十:对新生成的变量取值贴标签频数分析结果 实例二 1991GSS数据,将新生成的变量“educ1”简化为“educ2”,表示受访者是否受过高等教育。步骤一:打开Trans

6、form菜单,选择Recode步骤二:点击 Into Different Variable,弹出对话框步骤三:从左侧变量框选择“educ1”变量步骤四:在右侧“output variable”框和“label”框内填写新变量名和标签步骤五:点击“change”按钮步骤六:点击Old and New Values,弹出对话框步骤七:对新旧变量取值进行一一对应步骤八:点击“continue”,回到原对话框步骤九:点击“OK”,生成新变量“educ2”步骤十:对新生成的变量取值贴标签频数分析结果习题 利用1991GSS年数据,将受访者的职业声望“prestg80”这一定距变量转化成一个三分类的定序变

7、量低职业声望、中职业声望和高职业声望(转换前需要查看原始变量的频数表以确定分类范围)。利用recode命令,将某一变量的缺失值用其平均值代替,从而解决当几个变量相加时所产生的缺失案例过多这一问题。3、Visual Bander 通过百分位数、标准差范围或等间距方式将定距变量划分为若干组段,并采用图形化操作的方式,非常直观好用。实例 1996数据,将受访者的收入按照等间距的方式分为四组步骤一:在Transform菜单中选择Visual Bander步骤二:点击Visual Bander,弹出对话框步骤三:将“月收入”变量拖入右侧分段变量框步骤四:点击“Continue”,弹出对话框步骤五:在分段

8、变量框内填入新变量名步骤六:点击“Make Cutpoints”,弹出对话框步骤七:在分组对话框内进行分组定义步骤八:点击“Apply”,回到原对话框步骤九:点击“Make Label”,自动填充值标签步骤十:点击“OK”,生成新变量频数分析结果习题 利用1996年数据,根据等案例法,将“受访者的月收入”这一定距变量转化成一个五分类的定序变量低收入、中低收入、中等收入、中高收入和高收入(等案例法之所以无法完美的将案例均等的划分,是因为有可能出现一定数量的案例集中在一个变量取值上)。4、Count 用于标示某个值或某些值在某个变量的取值中是否出现。实例 1991GSS数据,生成一个新变量,用来表

9、示受访者是否受过高等教育(用count和recode分别生成同一个新变量,以说明它们之间的细微差别)步骤一:打开Transform菜单,选择Count步骤二:点击“Count”,弹出对话框步骤三:在目标变量框内填写新变量名步骤四:对目标变量作进一步的说明步骤五:从已有变量中选择“月收入”变量步骤六:点击“Define Values”,弹出对话框步骤七:对取值范围进行界定步骤八:点击“Add”,将取值范围拖入右侧空白框步骤九:点击“Continue”,回到原对话框步骤十:点击“OK”,自动生成“higheduc”新变量频数分析结果5、Rank Cases根据某个变量的大小对案例进行排序,然后将排序结果存储到一个新变量中。实例 1991GSS数据,根据性别分组计算受访者职业声望的秩序步骤一:打开Transform菜单,选择Rank Cases步骤二:点击“Rank Cases”,弹出对话框步骤三:将“prestg80”从左侧变量框拖入右侧变量框步骤四:将性别变量从左侧变量框拖入“By”对话框步骤五:点击“Rank Types”,弹出对话框步骤六:选择“Rank”之后点击“Continue”回到原对话框步骤七:点击“Ties”,弹出对话框,设定出现并列情况时的处理方案步骤八:做完设定点击“Continue”,回到原对话框步骤九:点击“OK”,自动生成“Rprestg80”变量

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 商业、管理、HR类
版权提示 | 免责声明

1,本文(数据管理一[课件].pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|