SPSS统计分析数据转换与整理课件.ppt_163文库

资源描述

1、SPSS统计分析数据转换与整理22022-7-19本章主要内容本章主要内容第一节第一节数据的排序数据的排序第二节第二节变量计算变量计算第三节第三节数据选取数据选取第四节第四节计数计数第五节第五节分类汇总分类汇总第六节第六节数据分组数据分组第七节第七节数据处理的其他功能数据处理的其他功能第八节第八节统计图统计图52022-7-19 SPSS数据排序的基本操作步骤（1）选择菜单DataSort Cases （2）将主排序变量从左边的列表中选到Sort by框中，并在Sort Order框中选择按该变量的升序还是降序排序。（3）如果是多重排序，还要一次指定第二、第三排序变量及相应的

2、排序规则。2.数据排序的基本操作62022-7-19在左边的源变量框源变量框中选择排序变量进入Sort by框。如果选择2个以上的变量，观测量的排序结果与排序变量在Sort by框中的顺序有关。列于首位的为第一排序变量。在Sort Order 栏栏内选择排序方式升序与降序72022-7-19 1、数据排序是整行数据排序，而不是只对某列变量排序；2、多重排序中指定排序变量的次序很关键。先指定的变量优先于后指定的变量。多重排序可以在按某个变量值升序（或降序）排序的同时再按其他变量值降序（或升序）排序；3、数据排序后，原有数据的排序次序必然被打乱。说明82022-7-19031 数据排序应用举例n利

3、用居民存款调查数据，通过数据排序功能分别找到城镇户口和农村户口储户一次存款金额的最大值和最小值。92022-7-19第二节变量计算n数据的转换处理是在原有数据的基础上，计算产生一些含有更丰富信息的新数据。例如根据职工的基本工资、失业保险、奖金等数据，计算实际月收入，这些新变量具有更直观更有效的特点。102022-7-191.变量计算的目的nSPSS变量计算是在原有数据的基础上，根据用户给出的SPSS算术表达式以及函数，对所有个案或满足条件的部分个案，计算产生一系列新变量。（1）变量计算是针对所有个案或指定的部分个案的，每个个案都有自己的计算结果。（2）变量计算的结果应保存到一个指定变量中，该

4、变量的数据类型应与计算结果的数据类型相一致。在变量计算过程中涉及到几个概念：SPSS算术表达式、SPSS条件表达式和SPSS函数。112022-7-19n指出按照什么方法计算变量；nSPSS算术表达式算术表达式（Numeric Expression）是由常量、变量、算术运算符、圆括号、函数等组成的式子。字符型常量应当用引号括起来变量是指那些已存在于数据编辑窗口中的原有变量算术运算符主要包括、*、/、*（乘方）在同一算术表达式中的常量及变量，数据类型应该一致，否则无法计算 2.SPSS算术表达式122022-7-19n在变量计算中通常要求对不同的个案分别按照不同的方法进行计算，于是就需要通过一定

5、的方式来指定个案；nSPSS条件表达式条件表达式是一个对条件进行判断的式子。其结果有两种取值：如果判断条件成立，则结果为真；如果判断条件不成立，则结果为假。条件表达式包括简单条件表达式简单条件表达式和复合条件表达式复合条件表达式。3.SPSS条件表达式132022-7-19（1）简单条件表达式由关系运算符、常量、变量以及算术表达式等组成的式子。其中关系运算符包括、。（nl35）（2）复合条件表达式又称逻辑表达式，是由逻辑运算符号、圆括号和简单条件表达式等组成的式子。其中，逻辑运算符号包括&或或AND（并且）、（并且）、|或或OR（或者）、或（或者）、或NOT（非）（非）。NOT的运算优先级

6、最高，其次是AND，最低是OR。可以通过圆括号改变运算的优先级。（nl=35）and not（zc3）142022-7-19nSPSS函数函数是事先编好并存储在SPSS软件中，能够实现某些特定计算任务的一段计算机程序。这些程序都有各自的名字称为函数名函数名。执行这些程序段得到的计算结果称为函数值函数值。函数书写的具体形式为：函数名（参数）函数名（参数）4.SPSS函数152022-7-19 其中，函数名是SPSS已经规定好的，参数可以是常量（字符型常量应用引号括起来），也可以是变量或算术表达式。参数可能是一个，也可能是多个，各参数之间用逗号逗号分隔。SPSS函数大致可以分成八大类：算术函数、算

7、术函数、统计函数、分布函数、逻辑函数、字符串函数、统计函数、分布函数、逻辑函数、字符串函数、缺失值函数、日期函数和其他函数缺失值函数、日期函数和其他函数。162022-7-19n（1）选择菜单TransformCompute，弹出Compute Variable对话框如下：5.变量计算的基本操作172022-7-19（2）在Target框中输入存放计算结果的变量名。该变量可以是一个新变量，也可以是已经存在的变量。如果指定存放计算结果的变量为新变量，SPSS会自动创建它；如果指定产生的变量已经存在，SPSS会提问是否以计算结果覆盖原有值。新的变量默认为数值型，用户可以根据需要单击Type&Lab

8、el按钮修改，还可以对新变量加变量名标签。（3）在Numeric Expression框给出SPSS算术表达式。可以手工输入，也可以按窗口的按钮以及函数下拉菜单输入。182022-7-19（4）如果希望对符合一定条件的个案进行变量计算，则单击If按钮，出现下面的窗口，选择Include if case satisfies condition选项，然后输入条件表达式。对不满足条件的个案，将不进行变量值计算，对新变量取值为系统缺失值。192022-7-19 利用职工基本情况数据，依据职称级别计算实发工资，再按职称1至4将实发工资分别上调50，30，20，10。03-2 变量计算的应用举例20202

9、2-7-19第三节数据选取n数据选取就是根据分析的需要，从已收集到的大批量数据（总体）中按照一定的规则抽取部分数据（样本）参与分析的过程，通常也称为抽样抽样。SPSS可根据指定的抽样方法从数据编辑窗口中选出部分样本以实现数据选取，这样后面的分析操作就只针对选出的数据，直到用户取消这种选取为止。212022-7-19（1）选取全部数据（All cases）（2）按指定条件选取（If condition is satisfied）SPSS要求用户以条件表达式给出数据选取的条件，SPSS将自动对数据编辑窗口中的所有个案进行条件判断。那些满足条件的个案，即条件判断为真的个案将被自动选取出来，而那些条

10、件判断为假的个案则不被选中。1.数据选取的基本方式222022-7-19（3）随机抽样（Random sample of cases），即对数据编辑窗口中的所有个案进行随机筛选，包括如下两种方式：第一，近似抽样（Approximately）近似抽样要求用户给出一个百分比数值，SPSS将按照这个比例自动从数据编辑窗口中随机抽取相应百分比数目的个案。注：由于SPSS在样本抽样方面的技术特点，抽取出的个案总数不一定恰好精确地等于用户指定的百分比数目，会有小的偏差，因而称为近似抽样。232022-7-19 第二，精确抽样（Exactly）精确抽样要求用户给出两个参数。第一个参数是希望选取的个案数，第二

11、个参数是指定在前几个个案中选取。SPSS自动在数据编辑窗口的前若干个个案中随机精确地抽出相应个数的个案来。242022-7-19（4）选取某一区域内的样本（Based on time or case range），即选取数据编辑窗口中样本号在指定范围内的所有个案，要求给出这个范围的上、下界个案号码。这种抽样方法适用这种抽样方法适用于时间序列数据。于时间序列数据。（5）通过过滤变量选取样本（Use filter variable），即依据过滤变量的取值进行样本选取。要求指定一个变量作为过滤变量，变量值为非0或非系统缺失值的个案将被选中。这种方法通常用于排除包含系统缺失值的个案。这种方法通常用于排

12、除包含系统缺失值的个案。252022-7-19说明：说明：（1）完成数据选取后，SPSS以后的分析操作仅针对那些被选中的个案，直到用户再次改变数据的选取为止。（2）采用指定条件选取和随机抽样方法进行数据选取后，SPSS将在数据编辑窗口中自动生成一个名为filter_$的新变量，取值为1或0。1表示本个案被选中，0表示未被选中。该变量是SPSS产生的中间变量，如果删除它则自动取消样本抽样。262022-7-19（1）选择菜单DataSelect cases（2）根据分析需要选择数据选取方法（3）Unselected cases are指定对未选中个案的处理方式Filtered表示在未被选中的个案

13、号码上打一个“/”标记；Deleted表示将未被选中的个案从数据编辑窗口中删除。2.数据选取的基本操作272022-7-19Select Cases对话框282022-7-19 利用021居民储蓄调查数据，根据不同的分析要求采用不同的数据选取方法抽样：（1）如果只希望分析城镇储户的情况，可以通过数据选择功能采用指定条件的抽样方法进行抽样；（2）如果只希望对其中的70的数据进行分析，可通过数据选择功能采用随机抽样中的近似抽样方法进行抽样。数据选取的应用举例292022-7-19第四节计数n1.计数目的 SPSS实现的计数是对所有个案或满足某条件的部分个案，计算若干变量中有几个变量的值落在指定的

14、区间内，并将计数结果存入一个新变量中的过程。例如对大学毕业班学生的成绩进行综合测评时，可以依次计算每个学生的若干门课程中有几门课程得了优，有几门课程得了良，有几门课程不及格。SPSS实现计数的关键步骤是：指定哪些变量参与计数，计数的结果存入哪个新变量中指定计数区间（尤为关键）302022-7-19 SPSS中的计数区间可以有以下几种描述形式：v单个变量值（单个变量值（Value）v系统缺失值（系统缺失值（System-missing）v系统缺失值或用户缺失值（系统缺失值或用户缺失值（System or user-missing）v给定最大值和最小值的区间（给定最大值和最小值的区间（n thro

15、ugh m）v小于等于某指定值的区间（小于等于某指定值的区间（Lowest through n）v大于等于某指定值的区间（大于等于某指定值的区间（n through highest）2.计数区间312022-7-19 上述后三个计数区间很容易理解。例如例如评价学生成绩，成绩为优的计数区间可以指定为90 through highest，成绩为良的计数区间指定为80 through 89，不及格的计数区间指定为Lowest through 59。前三个计数区间实际上是一些离散的数据点，严格讲并不是区间，但SPSS仍将其归在广义区间的范畴内，目的是方便一些其他的应用。322022-7-19（1）选择

16、菜单TransformCount，出现如下窗口：3.计数的基本操作332022-7-19（2）将参与计数的变量选到Variables框中（3）在Target Variable框中输入存放计数结果的变量名，并在Target Label框中输入相应的变量名标签（4）单击Define Values按钮定义计数区间，出现如下图窗口：342022-7-19 通过单击Add、Change、Remove按钮完成计数区间的增加、修改和删除。352022-7-19（5）如果仅希望对满足某条件的个案进行计数，则单击If按钮并输入相应的SPSS条件表达式。否则，本步可略去。362022-7-19n利用02-1居民储

17、蓄调查数据分析储户收入的总体状况。我们认为如果储户收入今年比去年增加了，且认为今后收入仍会增加，则认为收入状况较好。试分析有多少个储户的收入状况较好。计数的应用举例372022-7-19第五节分类汇总n1.分类汇总的目的分类汇总分类汇总是按照某分类变量进行分类汇总计算。例如：某企业希望了解本企业不同学历职工的基本工资上是否存在较大差距。最简单的做法就是分类汇总，即将职工按学历进行分类，分别计算不同学历职工的平均工资，然后可对平均工资进行比较。382022-7-19 再例如，某商厦希望分析假日周内不同职业和不同年龄段的顾客对某商品的“打折促销”反应是否存在较大差异，用以分析不同消费群体的消费

18、心理。最初步的分析可以是分别计算不同职业中不同年龄段顾客的平均消费金额和平均消费金额差异程度（标准差），并对它们进行比较。这个过程也可以通过分类汇总过程完成。392022-7-19 SPSS实现分类汇总涉及两个主要方面：v按照哪个变量（如上例中的学历、职业和年龄段）进行分类v对哪个变量（如上例中的基本工资、消费金额）进行汇总，并指定对汇总变量计算哪些统计量（如上例中的平均工资、平均消费金额和标准差）402022-7-19（1）选择菜单DataAggregate，出现如下所示的窗口：2.分类汇总的基本操作412022-7-19（2）将分类变量选到Break Variable(s)框中（3）将汇总

19、变量选到Summaries of Variable(s)框中（4）单击Function按钮，指定对汇总变量计算哪些统计量。SPSS默认计算均值。422022-7-19（5）指定将分类汇总结果保存到何处。有三种选择：第一，Add Aggregated Variables to working data file，表示将结果存放到当前数据编辑窗口中。第二，Create new data file，表示将结果存放到一个新建立的SPSS数据文件中，可以单击File按钮，重新指定文件名；第三，Replace working data file，表示用分类汇总结果覆盖数据编辑窗口中的数据。一般选择第二种方

20、式，结果比较清晰。432022-7-19（6）单击Name&Label按钮，重新指定结果文件中的变量名或添加变量名标签。SPSS默认的变量名为原变量名后加_统计量统计量名称（如名称（如a_mean）。（7）如果希望在结果文件中保存各分类组的个案数，则选择Number of case选项。于是，SPSS会在结果文件中自动生成一个默认名为N_Break的变量，可以修改该变量名。442022-7-19说明：说明：分类汇总中的分类变量可以是多个，此时的分类汇总称为多重分类汇总多重分类汇总。如上述不同职业和不同年龄段顾客消费的例子即是多重分类汇总的应用。类似于数据的排序，在多重分类汇总中，指定多个分类变

21、量的前后次序是很关键的。第一个指定的分类变量为主分类变量主分类变量（如职业），其他的依次为第二（如年龄段）、第三分类变量等，它们决定了分类汇总的先后次序。452022-7-19 例：利用02-1居民储蓄调查数据，分析城镇储户和农村储户的一次平均存（取）款金额是否有显著的差异。可进行的最初步的分析是按照户口类型对存（取）款金额进行分类汇总。其中分类变量是户口，汇总变量是存（取）款金额，且计算其均值。分类汇总的应用举例462022-7-19第六节数据分组n1.数据分组的方法数据分组就是根据统计研究的需要，将数据按照某种标准重新划分为不同的组别。在数据分组的基础上进行的频数分析更能够概括和体现数

22、据的分布特征。为适用于不同的统计分析需要，SPSS提供了以下几种数据分组方法：单项式分组（单变量值分组）单项式分组（单变量值分组）组距分组组距分组472022-7-19 居民家庭按人口数单项式分组居民家庭按人口数单项式分组按家庭人口数分组按家庭人口数分组（人）（人）居民户数居民户数（户）（户）12345人及以上人及以上合计合计离散型变量如果离散型变量如果变量值的变动范围不变量值的变动范围不大，可以将一个变量大，可以将一个变量值作为一组，称值作为一组，称单项单项式分组式分组或单变量值分或单变量值分组。如右表：组。如右表：单项式分组482022-7-19 在连续型变量或离散在连续型变量或离散型

23、变量值较多的情况型变量值较多的情况下，可采用组距式分下，可采用组距式分组形式。组形式。n 组距式分组组距式分组就是把全就是把全部变量值划分为几个部变量值划分为几个区间，每一区间的变区间，每一区间的变量值作为一组。如右量值作为一组。如右表：表：按日产零件数分组按日产零件数分组（个）（个）工人数工人数（人）（人）506060707080809090以上以上合计合计组距式分组492022-7-19na.组距组距：区间的距离即为组距。：区间的距离即为组距。nb.组数组数：组数的多少以分组后能恰当反映总体内部的分：组数的多少以分组后能恰当反映总体内部的分布特征和规律为好。布特征和规律为好。nc.确定组距

24、的方法确定组距的方法：（最大值：（最大值-最小值）最小值）组数。组数。nd.根据组距各组的组距是否相等，又可以分为等距分组根据组距各组的组距是否相等，又可以分为等距分组和不等距分组两种方式。和不等距分组两种方式。ne.组限组限：组距两端的数值称为组限，每组的最大值称为：组距两端的数值称为组限，每组的最大值称为上限，用上限，用U（Upper limit）表示，每组的最小值称为下）表示，每组的最小值称为下限，用限，用L（Lower limit）表示。）表示。统计数据时，注意统计数据时，注意“上上组限不在内组限不在内”法则。另外，极端组可采用开放式组距。法则。另外，极端组可采用开放式组距。nf.组中

25、值组中值：每组上、下限之间的中点数值。即：组中值：每组上、下限之间的中点数值。即：组中值=（上限十下限）（上限十下限）2。在组距式分组中涉及到了几个在组距式分组中涉及到了几个关键点关键点：502022-7-19SPSS单项式分组的基本操作步骤：（1）选择菜单TransformAutomatic Recode（2）将分组变量选择到VariableNew Name框中（3）在New Name框后输入存放分组结果的变量名，并单击Add New Name按钮（4）在Recode Starting from框中选择单变量值分组按升序还是按降序进行。Lowest value表示升序；Highest val

26、ue表示降序。2.SPSS的单项式分组512022-7-19522022-7-19单项式分组应用举例：1、利用03-2职工数据按职工的基本工资升序进行分组。2、按职工的职称升序进行分组。532022-7-19 组数和组距确定后，便可实施分组操作了，在分组操作时应：v指定分组变量v定义分组区间（注意遵循“不重不漏不重不漏”原则）v指定存放结果的变量 SPSS对分组结果有两种存放策略，一种是用分组变量值覆盖原变量（Into Same Variables），另一种是将分组结果存到一个新变量中（Into Different Variables）。相应的操作也略有差异。通常采用第二种策略。3.SPSS的

27、组距式分组542022-7-191、Into Same Variables分组操作（1）选择菜单TransformRecode Into Same Variables。（2）在出现的窗口中将分组变量选择到Variables框中。（3）单击Old and New Values按钮进行分组区间定义。（4）在分组区间定义窗口中指定分组区间的下限和上限，并在New Value框中给出该区间对应的分组值。单击Add按钮确认分组区间并加到Old New框中。单击Change和Remove按钮来修改和删除分组区间。（5）如果仅对符合一定条件的个案分组，则单击If按钮并输入SPSS条件表达式。否则，本步可略去

28、。552022-7-192、Into Different Variables分组操作（1）选择菜单TransformRecode Into Different Variables。（2）在出现的窗口中将分组变量选择到Input Variable Output Variable框中。（3）在Output Variable后输入存放分组结果的变量名，并单击Change按钮确认。可以在Label后输入相应的变量名标签。（4）单击Old and New Values按钮进行分组区间定义（方法与前面相似）。（5）如果仅对符合一定条件的个案分组，则单击If按钮并输入SPSS条件表达式。否则，本步可略去。5

29、62022-7-19572022-7-19582022-7-19n 利用03-2职工数据按职工基本工资分别采用Into Same Variables和Into Different Variables两种方式进行如下分组：按工资分组（元）频数（人）频率（）850以下531.3850900531.390095016.39501000212.51000以上318.6组距式分组的应用举例592022-7-19第七节数据处理的其他功能n1.数据转置 SPSS的数据转置转置就是将数据编辑窗口中数据的行列互换行列互换。基本操作步骤如下：（1）选择菜单DataTranspose。（2）指定数据转置后应保留哪

30、些变量，将它们选入Variables框中，未被选中的变量将在新文件中缺失。（3）指定转置后数据文件中各变量如何取名。602022-7-19 应选择一个取值唯一的变量（如职工号）作为标记变量并放到Name Variable框中。转置后数据各变量取名为K_标记变量值标记变量值（如K_001、K_002、K_003等）。如果略去本步，则转置后数据各变量名默认为VAR001，VAR002，VAR003等。同时，SPSS还会自动产生一个名为CASE_LBL的新变量，用来存放原数据文件中的各变量名。612022-7-19例：对03-2职工数据进行转置操作。622022-7-192.加权处理n 统计分析中的

31、加权处理是极为常见的，如计算加权平均数等。例如，希望掌握菜市场某天蔬菜销售的平均价格。如果仅用各种蔬菜销售单价的平均数作为平均价格就很不合理，还应考虑到销售量对平均价格的影响。因此，以蔬菜的销售量为权数计算各种蔬菜销售单价的加权平均数，就能够较准确地反映平均价格水平。fxfx632022-7-19 （1）选择菜单DataWeight Cases。（2）选择Weight Cases by选项，并将某变量作为加权变量选到Weight Cases by框中。注意的是一旦指定了加权变量，那么以后的分析处理中加权是一直有效的，直到取消加权为止。取消加权应选择Do not weight cases选项。S

32、PSS中指定加权变量的操作步骤是：642022-7-19例：根据03-3蔬菜数据对各蔬菜价格进行加权计算。652022-7-19 SPSS的数据拆分与数据排序很相似，但有一个重要的不同点，即数据拆分不仅是按指定变量进行简单排序，更重要的是根据变量对数据进行分组，为以后的分组统计分析提供便利。3.数据拆分662022-7-19uSPSS数据拆分的基本操作步骤：1）选择菜单DataSplit File，出现窗口672022-7-192）将拆分变量选到Groups Based on框中3）拆分会使后面的分组统计产生两种不同格式的结果。其中，Compare groups表示将分组统计结果输出在同一表格

33、中，以便于不同组之间的比较；Organize output by groups表示将分组统计结果分别输出在不同的表格中。通常选择第一种输出方式。4）如果数据编辑窗口中的数据已经事先按所指定的拆分变量进行了排序，则可以选择File is already sorted项，可以提高拆分执行的速度；否则，选择Sort the file by grouping variables项。682022-7-19u说明：1）数据拆分将对后面的分析一直起作用，即无论进行哪种统计分析，都将按拆分变量的不同组别分别分析计算。如果希望对所有数据进行整体分析，则需要重新执行数据拆分，在数据拆分窗口中选择Analyze a

34、ll cases项。2）对数据可以进行多重拆分，类似于数据的多重排序。多重拆分的次序决定于选择拆分变量的前后次序。692022-7-19数据拆分应用举例：利用03-2职工数据选择职称和（或）性别变量进行数据拆分并计算各组的基本工资。702022-7-19n 大量的缺失值会给数据分析带来极大的影响，这就需要采用科学的方法对缺失值进行插补。操作步骤如下：（1）选择菜单Transformreplace missing values （2）将需要插补的变量单击按钮送到New Variables框中，该变量自动会生成一个新的变量，变量名为原变量名_1 （3）在Method中选择插补方法。4.SPSS缺失

35、值处理712022-7-19 Series mean:该变量所有非缺失值的均值 Mean of nearby points：该变量相邻非缺失值的均值 Median of nearby points：该变量相邻非缺失值的中位数 Linear interpolation：线性内插法（用缺失值前后两点的中点值做替代，如果前后值有一个是缺失值，则得不到替换值）Linear trend at point：用线性拟合方式确定替代值，自变量为1-n的数值。722022-7-19n 数据排秩是根据某变量观测值的大小，按一定的顺序排秩，生成一个代表其秩次的新变量，但原始观测值本身顺序不发生改变。操作步骤如下：（

36、1）选择菜单Transformrank cases （2）将需要排秩的变量单击按钮送到 Variables框中，该变量自动会生成一个新的变量，变量名为R+原变量名；可选择分类变量到By框中，如果选择，系统将按照此变量的不同组别分别进行排秩。（3）选择Assign Rank 1 to下面的复选框选择排秩的顺序。（4）在Rank Types 对话框中选择排秩方式；在Ties对话框中选择相同观测值排秩方式。5.数据排秩732022-7-19求变量的秩求变量的秩742022-7-19SPSS变量集是存放许多SPSS变量名的集合。SPSS变量集包括：系统变量集系统变量集和用户变量集用户变量集两大类。q系

37、统变量集系统变量集 SPSS事先定义好的变量集，它包括两个集合：ALLVARIABLES和NEWVARIABLES。其中ALLVARIABLES变量集中存放数据编辑窗口中的所有变量名，NEWVARIABLES变量集中存放数据编辑窗口中所有尚未存盘的新定义的变量名。这两个系统变量集有时包含的变量名是完全相同的。6.SPSS变量集752022-7-19q用户变量集用户变量集是用户根据实际需要自己定义的变量集，可以有若干个。如果用户仅希望对SPSS众多变量中的某几个变量进行相同的处理及分析，则可以先将这几个变量定义到一个用户变量集中，然后再指定使用这个变量集。于是，在数据处理或分析时，SPSS仅显

38、示指定变量集中的变量名，进而大大减少了显示变量的个数，加快了变量选择的操作速度。762022-7-19（1）定义用户变量集定义用户变量集 SPSS定义用户变量集的操作步骤如下：1）选择菜单UtilitiesDefine Variable Sets 2）在Set Name框中输入用户变量集的名称。3）选择若干变量单击小箭头按钮将它们送到Variables in Set框中，表示用户变量集将包含这些变量。4）单击Add Set按钮将定义的用户变量集加到SPSS变量集中。Change Set按钮可对已定义的用户变量集做修改。Remove Set按钮可从SPSS变量集中删去某个用户变量集。772022

39、-7-19（2）变量集的使用变量集的使用 SPSS有许多变量集，用户应告知将使用哪个变量集。系统默认使用的变量集是系统变量集。使用SPSS变量集的基本操作步骤如下：1）选择菜单UtilitiesUse Variable Sets 2）单击小箭头按钮将需使用的变量集选到Set in Use框中。还可将不需使用的变量集从Set in Use框中剔出。需要说明的是，在SPSS运行过程中应至少有一个变量集正在被使用，因此在Set in Use框中应至少有一个变量集。782022-7-19 我们往往很难从一大堆离散数据中体会到它们的含义，而用数据画出图形却能使我们用视觉器官直接感受到数据的许多内在本质。

40、SPSS可以绘制一般的科技绘图软件所能绘制的几乎所有图形。在SPSS中，各种统计图既可由相应的统计过程产生，也可直接用“Graphs”菜单项绘制。第八节统计图792022-7-191.条形图条形图的绘制步骤1）单击Graphs Bar菜单，打开条形图窗口。对话框的上半部分用于选择条形图类型，下半部分用于定义条形图中数据的类型。802022-7-19 Simple：简单条形图，用于表现单个指标的大小；Clustered：分组条形图，用于表现两个或多个指标，比如同时比较男、女生身高和体重；Stacked：分段条形图，用于表现每个指标各取值的构成情况。在以上三种样式中，用鼠标单击相应的图标，则选

41、中了相应的样式。“Data in Chart Are”框用于选择条形图中数据的类型：oSummaries for groups of cases按同一变量取值不同做分组汇总，条形图中每一直条代表变量的一个分类；oSummaries of separate variables按不同变量汇总，条形图中每一直条代表一个变量，至少需要两个或两个以上变量生成相应的条形图；oValues of individual cases 反映个体观测值，条形图中每一直条代表一个观测值。812022-7-192）通过选择三个图标和条形图中数据的类型，可以生成9种条形图，选中Simple和Summaries for g

42、roups of cases项时，单击“Define”按钮，将打开如下页所示窗口，该窗口用于定义图形参数。822022-7-19832022-7-19该窗口的设置可以分为以下几步：第1步，“Bars Represent”框用于选择条形图中的条代表的统计量：oN of cases：按照分类变量分类后各类的观测量数（频数）o of cases：按照分类变量分类后各类的观测量数占总观测量数的比例（频率）oCum.N of cases：累计频数oCum.of cases：累计百分比842022-7-19oOther summary function：当要绘制的统计量不在前面四项中时，选择该项。从左边的

43、源变量框中选择分析变量进入该页下边的“Variable”框中，单击“Change Statistics”按钮，打开如下窗口，该窗口用于选择统计量：852022-7-19 在“Change Statistics”框中共有17个选项，各项的意义分别为：Mean of values：均值Median of values：中位数Mode of values：众数Number of cases：不含缺失值的观测量数Sum of values：变量值的和Standard deviation：标准差Variance：方差Minimum value：最小值Maximum value：最大值Cumulative

44、 sum：累积变量值的和862022-7-19Percentage above：观测量中大于设定值的百分比Percentage below：观测量中小于设定值的百分比Percentile：百分位数Number above：大于设定值的观测量数Number below：小于设定值的观测量数Percentage inside：变量值在设置区间内的观测量的比例，High和Low框分别用于输入设置区间的上下限Number inside：变量值在设置区间内的观测量数 872022-7-19 第2步，“Category Axis”框用于选择分类变量。绘制条形图以前会按照分类变量的值把所有观测量分组，条形图

45、中条形的长度代表各组统计量的值。第3步，“Template”框用于选择特定的图形模板文件。该项为可选项，利用该项选定某图形模板文件后，绘制的条形图将按照模板文件的格式形成。882022-7-19 第4步，单击“Titles”按钮，打开如下窗口，该窗口用于输入图形的标题和脚注。892022-7-19 第5步，单击“Option”按钮，出现如下窗口，该窗口用于定义与缺失值有关的选项。902022-7-19 1.missing value单选框组：定义对缺失值的处理方法，只有在要汇总的变量有两个或两个以上时才可用，提供了两种处理缺失值的方法：vExclude cases listwise：如果汇总变

46、量中任何一个含有缺失值则排除整个纪录。vExclude cases variable by variable：对哪个变量计算统计量则排除该变量有缺失值得记录。2.Display groups defined by missing values：是否把分组变量的缺失值作为一个组显示出来，只有分组变量是分类变量时才可用。3.Display chart with case labels：显示有观测值标签的图，只有主对话框中为变量指定了标签时才可用。912022-7-193）当选择simple和Summaries of separate variables 时，单击Define按钮，打开如下窗口：92

47、2022-7-19 Bars Represent框用于选择要绘制的变量，默认状态是对各变量求均值，单击该对话框下面的change statistics按钮，可以改变其统计函数。Bars Represent框中至少应选入两个以上的变量，所选的变量可以是不同变量，也可以是同一变量的不同统计函数。932022-7-194）选中simple和Values of individual cases选项，单击Define按钮，出现如下窗口：942022-7-19 Bars Represent框用于选择要绘制的变量。Category Labels框用于选择分类轴显示的内容。其中各项分别为：Case numbe

48、r：显示观测量序号来标注观测量；Variable：指定相应的变量标注观测量。952022-7-19分组条形图和分段条形图n分组条形图是指两条或两条以上小直条组成条组的条形图，各条组之间有间隙，组内小条之间无间隙。n分段条形图是以条形的全长代表某个变量的整体，各分段的长短代表各组成部分在整体中所占比例的统计图，每一段之间没有间隙，并用不同线条或颜色表示。n与简单条形图相比，这两种条图多了一个分组因素或分段因素，定义对话框中就相应多了一个变量选项框。962022-7-192.线图线图是采用曲线的升降说明现象的变动情况。n线图绘制的步骤打开数据文件，选择菜单GraphsLine，出现绘制线图的窗

49、口：oSimple：单线图oMultiple：多线图oDrop-line：垂线图972022-7-19 用鼠标单击相应的图标，则选中了相应的样式。Data in Chart Are框用于选择统计量描述模式oSummaries for groups of cases：线图中每个数据点代表观测量的一个分类（观测量分类模式）o Summaries of separate variables：线图中每个数据点代表一个变量（变量模式）oValues of individual cases：线图中每个数据点代表一个观测值（观测值模式）982022-7-19 通过选择三个图标和统计量的描述模式，可以生成9种

50、线图。绘制线图的其他步骤和条形图类似，在此不再赘述。下面举例说明。992022-7-193.面积图面积图用线段下面的阴影表示现象的变化。n面积图绘制的步骤面积图的绘制步骤和线图、条形图相似。单击GraphsArea项，出现窗口：1002022-7-19 用鼠标单击相应的图标，则选中了相应的样式。oSimple：简单面积图oStacked：累积面积图Data in Chart Are框用于选择统计量描述模式：oSummaries for groups of cases：每一个面积图代表观测量的一个分类oSummaries of separate variables：每一个面积图代表一个变量o

展开阅读全文