SPS数据管理(二)课件.ppt_163文库

资源描述

1、1.多重二分法（Multiple Dichotomy Method）所谓多重二分法，是在编码的时候，对应每一个选项都要定义一个变量，有几个选项就有几个变量，这些变量均为二分类，他们各自代表对一个选项的选择结果。P16 H3b2.多重分类法（Multiple Category Method）多重分类法，也是利用多个变量对一个多选题的答案进行定义，应该用多少个变量，由被访者实际可能给出的最多答案数而定。P16 H4(二)多选题的录入完成多响应问题分析的菜单完成多响应问题分析的菜单返回返回定义多响应变量集的对话框定义多响应变量集的对话框返回返回练习练习以江苏女性工作状况数据库为例以江苏女性工

2、作状况数据库为例返回返回F10F10“您是否有自己名下的下列财产您是否有自己名下的下列财产”？G3B G3B 您有病不看医生的原因？您有病不看医生的原因？多响应变量集的频数分布分析对话框多响应变量集的频数分布分析对话框返回返回多响应二分变量集的频数分布实例输多响应二分变量集的频数分布实例输1 返回返回v 在数据文件建立好之后，还需要对数据进行必要的加工处理。对同在数据文件建立好之后，还需要对数据进行必要的加工处理。对同一个数据往往需要从各种不同的侧面进行研究，采取多种统计方法进行一个数据往往需要从各种不同的侧面进行研究，采取多种统计方法进行分析，而不同的统计方法对数据文件结构的要求不尽相

3、同，这就需要对分析，而不同的统计方法对数据文件结构的要求不尽相同，这就需要对数据文件的结构进行重新调整或转换，以便适合于相同的统计方法。数据文件的结构进行重新调整或转换，以便适合于相同的统计方法。数据管理数据管理文件级别的数据管理文件级别的数据管理变量级别的数据管理变量级别的数据管理第一节第一节文件级别的数据管理文件级别的数据管理v SPSS中的中的Data菜单提供了文件级别的数据管理，菜单提供了文件级别的数据管理，可以对整个数据文件进行加工整理。可以对整个数据文件进行加工整理。 Insert Variable：插入变量：插入变量 Insert Cases：插入记录：插入记录v简单命令简

4、单命令一、一、Sort Cases：记录排序：记录排序二、二、Split File：记录拆分：记录拆分三、三、Select Cases：记录筛选：记录筛选四、四、文件合并过程（文件合并过程（Merge Files）v常用的简单过程常用的简单过程（使用频繁，必须掌握）（使用频繁，必须掌握） Add Cases：纵向合并：纵向合并 Add Variable ：横向合并：横向合并v五、五、Identify Duplicate Cases：查找重复记录：查找重复记录单变量排序单变量排序：SPSS提供了一种简易操作方法，提供了一种简易操作方法，即在数据表格的变量名处单击右键，弹出右图即在数据表格的

5、变量名处单击右键，弹出右图多变量排序：多变量排序：使用使用Sort Cases过程来进行，过程来进行，查看详情查看详情一、记录排序一、记录排序记录排序记录排序选中选中District ，选择升序选钮（默认），将，选择升序选钮（默认），将District选入选入Sort by 框框选中选中Region，选择降序选钮，将，选择降序选钮，将Region选入选入Sort by 框框记录排序记录排序注意：注意：v 在多重排序中，指定排序变量名的次序很关键，首先按照在多重排序中，指定排序变量名的次序很关键，首先按照第一个变量排序，对于与第一个变量取值相同的记录考虑第一个变量排序，对于与第一个变量取值相同的

6、记录考虑按第二个变量排序按第二个变量排序v 排序后，原来记录数据的排序将被打乱，对于时间序列数排序后，原来记录数据的排序将被打乱，对于时间序列数据，若未存放有记录标志的变量，应注意保存原数据的排据，若未存放有记录标志的变量，应注意保存原数据的排列顺序，以免数据混乱列顺序，以免数据混乱记录排序记录排序练习：一、以妇女地位数据库为例按照性别为第一排序变量，降序 id为第二排序变量，升序二、记录拆分二、记录拆分1.1.选中此框不拆分文件选中此框不拆分文件2.2.按所选变量拆分文件，各组分析结果放在一起便于比较按所选变量拆分文件，各组分析结果放在一起便于比较3.3.按所选变量拆分文件，各组分析结果

7、单独放置按所选变量拆分文件，各组分析结果单独放置4.4.用于选择拆分数据文件的变量用于选择拆分数据文件的变量5.5.要求将数据按所用拆分变量排序要求将数据按所用拆分变量排序6.6.数据集很大，且拆分变量已排序，选此可节省运行时间数据集很大，且拆分变量已排序，选此可节省运行时间123456记录拆分记录拆分练习2 以女性生活方式库为例: 1.把库拆分为女性和男性。 2.把库拆分为城镇和农村。三、记录筛选三、记录筛选123451.1.分析所有记录分析所有记录2.2.分析满足条件的记录，分析满足条件的记录，按按IfIf按钮按钮设定筛选条件设定筛选条件3.3.从原数据中按某种条件从原数据中按某种条件抽

8、样，按抽样，按SampleSample进行设定进行设定4.4.基于时间或记录序号选择基于时间或记录序号选择记录，按记录，按RangeRange进行设定进行设定5.5.使用筛选指示变量选择记录，非使用筛选指示变量选择记录，非0 0值的记录被选中值的记录被选中6.6.未选中的记录被隔离未选中的记录被隔离7.7.未选中的记录被删除未选中的记录被删除67三、记录筛选三、记录筛选记录筛选记录筛选练习3 以妇女地位库为例， 1.分别筛选出农村女、农村男样本。 2.筛选出文盲或半文盲。四、文件纵向合并四、文件纵向合并 *：当前数据集中的变量：当前数据集中的变量 +：新添加数据集中的变量：新添加数据集中的变量

9、v 左框：新、老数据文件中不匹配的变量名左框：新、老数据文件中不匹配的变量名v 右框：已匹配的变量名，选择完成后单击右框：已匹配的变量名，选择完成后单击OK即可即可 Add Cases：纵向合并，从外部数据文件中增加记录到当前数：纵向合并，从外部数据文件中增加记录到当前数据文件中，相互合并的数据文件中应该有相同的变量。据文件中，相互合并的数据文件中应该有相同的变量。文件纵向合并文件纵向合并文件横向合并文件横向合并1. 未被纳入的变量列未被纳入的变量列2. 被纳入合并后新数据集的变量列表被纳入合并后新数据集的变量列表3. 记录匹配使用的关键变量记录匹配使用的关键变量 Add Variables

10、：横向合并，：横向合并，从外部数据文件增加变量到当从外部数据文件增加变量到当前数据文件，两个数据集要有一个一一对应的关键变量进前数据文件，两个数据集要有一个一一对应的关键变量进行匹配合并，且记录应按关键变量升序后再合并。行匹配合并，且记录应按关键变量升序后再合并。123文件横向合并文件横向合并练习4 1.先把生命观数据库复制2份 2.把其中一个数据库删除所有C变量 3.把另一个数据库删除得只剩下C变量 4.把两库合并五、查找重复记录五、查找重复记录希望查找重复值的变量希望查找重复值的变量重复记录按该变量的取值排序重复记录按该变量的取值排序设定第一个还是最后一设定第一个还是最后一个重复记录为

11、主记录个重复记录为主记录查找重复记录查找重复记录v PrimaryLast0表示相应的记录为重复记录表示相应的记录为重复记录查找重复记录查找重复记录练习5 1.把记录复制 2.随机插入数据库中 3.运行查找重复记录第二节第二节变量级别的数据管理（变量级别的数据管理（1）v SPSS中的中的Transform菜单提供了变量级别的菜单提供了变量级别的数据管理，可以对变量进行操作。数据管理，可以对变量进行操作。v 一、一、计算新变量计算新变量（Compute）：最常用）：最常用 Recode：对变量值进行分组合并：对变量值进行分组合并Count：表示某个变量的取值中是否出现某个值，或：表示某个变量

12、的取值中是否出现某个值，或某个区间某个区间v 二、二、变量转换变量转换第二节第二节变量级别的数据管理变量级别的数据管理例例1 以生活方式数据库为例，计算以生活方式数据库为例，计算女性女性的休闲活动时间。的休闲活动时间。计算新变量计算新变量筛选变量变量筛选变量变量输入条件表达式输入条件表达式女性为女性为A1=2筛选变量筛选变量计算新变量计算新变量也可输入函数表达式也可输入函数表达式选选择择函函数数练习6 1.计算总库中女性的总收入。 2.将所取得的收入取对数1.分组功能分组功能Recode功能的运用功能的运用新变量名新变量名age1选入原变量选入原变量totaltotalv 三种三种Rang

13、e的设置，所有的范围均包含了端点，而前面的设置，所有的范围均包含了端点，而前面设定的变换会优于后面的变换，因此应该将大于等于设定的变换会优于后面的变换，因此应该将大于等于10000元最先设定，而将小于元最先设定，而将小于5000元最后设定。元最后设定。如城镇的转换 1.把城镇、县城和市合并为一类变量值分组变量值分组例例对学历的分组：良好教育与非良好教育对学历的分组：良好教育与非良好教育务必选上务必选上该项该项变量值分组合并变量值分组合并例例4 仍以数据仍以数据fee.sav为例，查看变量为例，查看变量total中是否出现值中是否出现值6890。三、查看特定变量值三、查看特定变量值查看特定变量

14、值查看特定变量值查看特定变量值查看特定变量值查看特定变量值查看特定变量值查看特定变量值查看特定变量值例例5 仍以数据仍以数据fee.sav为例，根据城市分组计算住院总费用的为例，根据城市分组计算住院总费用的秩次。秩次。变量编秩变量编秩变量编秩变量编秩v 用于定义秩次类型，默认为用于定义秩次类型，默认为rankrank（秩分数）（秩分数）变量编秩变量编秩v 用于定义对相同值观测量的处理方式用于定义对相同值观测量的处理方式默认值为取平均秩次。默认值为取平均秩次。变量编秩变量编秩变量编秩变量编秩将字符变量转换为数值变量将字符变量转换为数值变量例例6 仍以数据仍以数据fee.sav为例，将字符型变量为例，将字符型变量city转化成数值变量转化成数值变量newcity。将字符变量转换为数值变量将字符变量转换为数值变量新变量名新变量名将字符变量转换为数值变量将字符变量转换为数值变量将字符变量转换为数值变量将字符变量转换为数值变量

展开阅读全文