1、第二讲:第二讲:SPSS数据模板建立与录入数据模板建立与录入本讲内容本讲内容o统计分析要求的数据格式;o编码:填空题、单选题、多选题的编码方式o变量定义:变量名、变量标签、值标签、变量类型、缺失值;oSpss数据录入与保存ospss格式与其他格式数据库的转换与读取;第一节:统计分析要求的数据格式第一节:统计分析要求的数据格式oSPSS软件要求的数据格式为data.sav;o其他数据格式如data.xls;data.txt,data.dbf,data.sas,data.sta等多种数据格式文件都可以通过直接或间接的方式转为data.sav文件。第二节:编码第二节:编码问卷到数据的转换过程问卷到数
2、据的转换过程o在一份调查问卷中,所有问题可以归结为三大类型:填空,单选,多选。o1.填空题:包括数字填空和文字填空例如:例1:您的出生年份是:年;类似填空题所填数字就是编码;不需重新编码;例2:您对未来社会发展的趋势怎样看待?()文字填空一般需要在调查后,把有代表性的意见归纳为若干编码。2.单选题单选题o例1:您的婚姻状况是:(单选)(1)未婚 (2)已婚 (3)离婚未再婚(4)离婚后再婚 (5)丧偶 (6)其他对于单选题而言,一般根据问卷设计中的项目编号作为编码即可。并与问卷尽量保持一致,以后根据分析需要可重新编码;3.1 多选题(固定多选题)多选题(固定多选题)o多选题有两种类型,一种是固
3、定选项数,另一种是不固定选项数,理论上所有选项都可以同时被选。o在spss数据中,每个变量只能代表一个问题,而多选题实际上包含了多个问题。所以需要转换成多个独立的问题。o此题中可转换为3个独立问题/变量,v1,v2和v3,分别表示第一位,第二位和第三位问题。每个变量的编码相同。3.2 多选题(不固定选项)多选题(不固定选项)o此类问题由于不确定选项,最大可能的情况下,被访者可以选中所有选项即14个;因此,我们需要设置14个独立问题/变量来分别表示被访者是否选中第1-14个节日。每个变量的编码为1和0,1表示选中,0表示未选。o例如:第一个变量表示被访者是否过春节(变量名可以自己定义),1表示过
4、,0表示不过;其它类比。第三节:变量定义第三节:变量定义o1.在spss数据录入前,要建立统一的录入模板,也就是变量集合,首先要将问卷包含的变量全部录入到spss数据库中。o2.定义变量即要定义变量名,变量类型,变量宽度和小数位数,变量标签,值(即编码过程),缺失值定义,显示宽度,对齐方式,度量标准和角色。o3.操作:打开空白数据库点击“变量视图”变量定义窗口3.1 定义变量名定义变量名oSPSS默认的变量为Var00001、Var00002等,用户也可以根据自己的需要来命名变量。SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下。o变量名必须以字母、汉字或字符开头,其他字
5、符可以是任何字母、数字或_、#、$等符号。o变量最后一个字符不能是句号。o变量名总长度不能超过64个字符(即32个汉字)。o不能使用空白字符或其他特殊字符(如“!”、“?”等)。3.1 定义变量名(续)定义变量名(续)o变量命名必须惟一,不能有两个相同的变量名。o在SPSS中不区分大小写。例如,HXH、hxh或Hxh对SPSS而言,均为同一变量名称。图2-3 定义变量类型对话框oSPSS的保留字(Reserved Keywords)不能作为变量的名称,如ALL、AND、WITH、OR等。3.2 定义变量类型定义变量类型o点击类型,弹出下图所示的对话框,在对话框中选择合适的变量类型并单击“OK”
6、按钮,即可。一般对于填写数字的变量默认数值型,且默认宽度为8,小数为2;对于填写文字的变量选择字符串。3.3 定义变量标签定义变量标签o标签:表示该变量所表示的实际含义。o在标签栏中,输入相应含义即可,应与调查问卷中的问题保持一致。3.4 定义值标签(编码,定义值标签(编码,value)o值:变量取值所代表的实际含义。也就是把编码结果告诉数据库的使用者。o操作:点击“值”对应单元格,在弹出的对话框中填写相应编码和含义,完成后点击“添加”,输入下一个编码,直到定义好所有编码,“确定”退出。3.5 定义缺失值定义缺失值o在建立数据模板时不需要定义,在数据预处理时才定义。表示某些不进入分析的变量取值
7、。3.6 定义列宽度、对齐和测量方式定义列宽度、对齐和测量方式o一般保持默认即可。第三节:第三节:spss数据录入与保存数据录入与保存o定义好变量之后,返回data view窗口,开始逐份(行)录入问卷数据;o录入过程中注意及时保存数据库文件,防止丢失;o文件一般保存为sav格式文件,少数情况下保存为其他格式如xls格式文件;o如果发现数据输入错误,可及时修改。o也有专门的数据录入软件,如epidata。第四节:第四节:spss打开其它类型数据库打开其它类型数据库o方式一:文件打开数据o方式二:文件打开数据库新建查询o根据弹出对话框提示操作,不需要修改设置。直接打开直接打开新建查询新建查询小结小结oSPSS数据录入是从纸质数据到电子数据的转换过程,两端要尽量保持一致。o编码是数据录入之前要做的重要工作,事实上很多编码在问卷确立时也就随之确定了。o变量定义也要简单明了。变量名,变量名标签和值标签是三个必不可少的环节。o各种数据库之间的格式可相互转换,但在大规模数据互转的情况下可能会有信息损失。练习练习o根据自己收集的调研问卷,建立数据库模板并输入数据。