1、调查数据录入技术(调查数据输入软件EpiData)成都信息工程学院成都信息工程学院统计学院统计学院刘刘 全全 第一节、第一节、EpiData软件简介软件简介nEpiData是丹麦的一个非盈利组织编写的用以数据输入的免费是丹麦的一个非盈利组织编写的用以数据输入的免费软件,要获得该软件,需要通过软件,要获得该软件,需要通过Internet网登录网登录http:/www.epidata.dk主页,根据相应的提示可下载。主页,根据相应的提示可下载。nEpiData最早的版本最早的版本Version 1.01发布于发布于2000年年10月,目前运用月,目前运用得较多的是得较多的是EpiData vers
2、ion 3.0版,发布于版,发布于2003年年8月。下面简月。下面简单介绍如何用单介绍如何用EpiData3.0输入数据,并转换成输入数据,并转换成SPSS能够分析能够分析的数据。的数据。n简单、方便、功能强大、适用面广,非常适合于基层调查队和简单、方便、功能强大、适用面广,非常适合于基层调查队和各类调查咨询公司使用。各类调查咨询公司使用。1、EpiData的用途的用途 EpiData是一个用于各种调查问卷数据输入及相关信息处理的是一个用于各种调查问卷数据输入及相关信息处理的计算机程序。计算机程序。EpiData既适合单一问卷的数据处理,也可应用于既适合单一问卷的数据处理,也可应用于多问卷的数
3、据处理工作。多问卷的数据处理工作。2、EpiData的使用方法的使用方法 它的基本使用方法是基于文本编辑窗口下,先书写一些简单的它的基本使用方法是基于文本编辑窗口下,先书写一些简单的文本行,并使它自动转换成数据输入格式命令,然后再添加数据文本行,并使它自动转换成数据输入格式命令,然后再添加数据输入控制功能即可实现问卷输入界面的编程。输入控制功能即可实现问卷输入界面的编程。3、EpiData的安装的安装 EpiData系统的安装可按照系统安装文件的提示很方便地进行。系统的安装可按照系统安装文件的提示很方便地进行。4、EpiData的系统组成的系统组成 EpiData系统有一个主文件和一个帮助文件
4、组成。用户文件则系统有一个主文件和一个帮助文件组成。用户文件则有存在于同一目录下的几个主名相同的独立文件所组成。有存在于同一目录下的几个主名相同的独立文件所组成。一、一、EpiData界面界面n打开打开EpiData程序文件,可以见到其最基本的窗口程序文件,可以见到其最基本的窗口(见下图见下图)。从从EpiData的基本窗口来看,数据输入主要有的基本窗口来看,数据输入主要有6个步骤。个步骤。n(1)制作调查表描述文件制作调查表描述文件(Define Data);建立数据录入源程序(建立数据录入源程序(.qes),主要包括:确定变量、内容提),主要包括:确定变量、内容提示、确定录入格式等;示、确
5、定录入格式等;n(2)生成数据文件生成数据文件(Make Data);由数据描述文件自动生成数据文件,从而可使用本文件进行数由数据描述文件自动生成数据文件,从而可使用本文件进行数据录入(据录入(.rec););n(3)建立数据质量控制文件建立数据质量控制文件(Checks);编写检验程序,从而可以实现:自动审核、过程控制等功能;编写检验程序,从而可以实现:自动审核、过程控制等功能;n(4)数据输入数据输入(Enter Data);利用上面自动生成的数据文件进行数据录入;利用上面自动生成的数据文件进行数据录入;n(5)浏览数据及统计资料浏览数据及统计资料(Document);n(6)输出及转换数
6、据输出及转换数据(Export Data)。可将录入的数据转换成各种软件(如可将录入的数据转换成各种软件(如SPSS、SAS、EXCEL等)等)能够使用的数据文件。能够使用的数据文件。制作调查表描述文件制作调查表描述文件.qes自动生产数据记录文件自动生产数据记录文件.rec建立录入数据质量控制文件建立录入数据质量控制文件.chk录入数据到数据记录文件录入数据到数据记录文件.rec中去中去浏览数据及统计浏览数据及统计对数据记录文件对数据记录文件.rec中的数据输出及转换中的数据输出及转换 从从EpiData的操作过程:的操作过程:6个步骤。个步骤。第二节、基本操作说明第二节、基本操作说明 第一
7、步、制作调查表描述文件第一步、制作调查表描述文件 (1)新建一个调查表描述文件新建一个调查表描述文件 n单击单击“文件文件”、“生成调查表文件生成调查表文件(QES文件文件)”,则自动建立一个名字为,则自动建立一个名字为“EpiData文件文件1”的空的数据描述文件的空的数据描述文件(见下图见下图),数据描述文件的扩展名,数据描述文件的扩展名为为QES,QES是是question的缩写的缩写。(2)把空白的把空白的“EpiData文件文件1”文件存储成想要的文件名文件存储成想要的文件名(如民意调查如民意调查.qes)n方法是:单击方法是:单击“文件文件”、“另存为另存为”命令,弹出一个对话框后
8、,指定新的命令,弹出一个对话框后,指定新的文件名(如民意调查文件名(如民意调查.qes),然后选),然后选“保存保存”即可。即可。(3)输入语句格式输入语句格式 变量名变量名 变量提示符变量提示符 变量域变量域 注释注释 或或 变量提示符变量提示符变量名变量名 变量域变量域 注释注释其中,方括号项目为可选项。其中,方括号项目为可选项。命令举例:命令举例:name 姓名姓名 _ sex 性别性别#(1)男男 (2)女女 year 年龄年龄#edu 文化程度文化程度#(1)大学及以上大学及以上 (2)大专大专 (3)高中高中 (4)初中初中 (5)小学及以下小学及以下注意:第一必须有一个变量的名字
9、,如注意:第一必须有一个变量的名字,如id,v1等;等;第二要对变量进行描述,如第二要对变量进行描述,如id“个案号个案号”,v1“您的性别您的性别”等;等;第三要用第三要用#号键定义输入的变量。变量有几个码,就打几个号键定义输入的变量。变量有几个码,就打几个#键。键。(4)EpiData中变量的类型中变量的类型 n(5)预览输入变量的格式预览输入变量的格式n单击单击“REC文件文件”、“数据表预览数据表预览”或用或用Ctrl+T键,则可预览所设计的数键,则可预览所设计的数据表录入界面。据表录入界面。“数据表预览数据表预览”的最大优点是:在不必建立数据文件的情况下,提前对数据输的最大优点是:在
10、不必建立数据文件的情况下,提前对数据输入格式进行检查,可以输入数据,看是否有问题,一旦发现问题,可以及时修入格式进行检查,可以输入数据,看是否有问题,一旦发现问题,可以及时修正。正。(6)输入完毕要存盘。输入完毕要存盘。n方法:单击方法:单击“文件文件”、“存盘存盘”命令存盘,或用命令存盘,或用Ctrl+S键也一样键也一样可以存盘。可以存盘。案例1、“中国股民投资状况抽样调查”设计表2.2.2 股民投资状况问卷调查表程序如下:provin 省市编码#id 调查表编号#sex 性别#男 女age 年龄#周岁result 目前为止您做股票的结果是#赚钱 不赔不赚 赔钱method1 依据方法:基本
11、因素#method2 技术#method3 跟风#method4 凭感觉#risk 您对投资股票风险有无充分认识#有 无invester 您是专职还是业余投资者#专职 业余对应的调查项目编码如下录入界面录入界面 (7)自动建立数据记录文件)自动建立数据记录文件n待数据表录入格式文件符合要求后,应生成数据记录文件。数据记录文件待数据表录入格式文件符合要求后,应生成数据记录文件。数据记录文件的扩展名是的扩展名是rec(recoder的缩写的缩写),建立的方法如下。,建立的方法如下。n单击单击“生成生成REC文件文件”图标命令,弹出图标命令,弹出“根据根据QES文件生成文件生成REC文件文件”对对话
12、框,其中有两个选项,一个是话框,其中有两个选项,一个是“根据根据QES文件文件”(说明调查表描述文件的说明调查表描述文件的路径与名字路径与名字),另一个是,另一个是“生成生成REC文件文件”(说明数据文件的路径与名字说明数据文件的路径与名字),然后单击然后单击“确定确定”,即可自动生成数据文件,即可自动生成数据文件(如如“股票投资股票投资.REC”)。至此,问卷输入编程基本完成,打开自动生成的数据文件即至此,问卷输入编程基本完成,打开自动生成的数据文件即可进行数据录入工作!可进行数据录入工作!*调查表 项目编码no#姓名name _ 性别sex#1男 2女 出生年月日birth 年龄age#1
13、.婚姻状况marriage#未婚 在婚,与配偶共同生活了year#年 离婚或分居 丧偶2.是否在业occup:#在业,就业性质是occup1:#国有经济单位 城镇集体经济类型单位 其他经济类型单位 城镇个体或私营业主 城镇个体或私营企业被雇佣者 离退休再就业人员 其它other1:_ 不在业occup2:#1)离退修,离退修前最长职业是occup3:#工人 专业技术 行政管理 商业服务 机关干部 军人或警察 其它other2:_ 2)失业人员 3)家务劳动者 4)丧失劳动力者 5)待就业者 6)其它other3:_案例案例2、“XX调查调查”设计设计n录入界面第三节、数据核查文件nEpiDat
14、a软件的强大功能是在数据输入过程中可以限软件的强大功能是在数据输入过程中可以限制输入范围、控制问项的输入顺序、进行计算、给出制输入范围、控制问项的输入顺序、进行计算、给出输入提示、维持上一记录的数据,还可为输入的数字输入提示、维持上一记录的数据,还可为输入的数字给出文本描述等。给出文本描述等。n数据核查文件数据核查文件(.chk)就是实现以上目的的专门文件。就是实现以上目的的专门文件。一、建立数据核查文件一、建立数据核查文件 在关闭所有文件情况下,选择在关闭所有文件情况下,选择“建立建立CHK文件文件”图标命令,打开前已建立图标命令,打开前已建立的数据文件(如的数据文件(如“股票投资股票投资.
15、rec”),从而将为所选择的数据文件建立数据核),从而将为所选择的数据文件建立数据核查控制文件。查控制文件。二、控制界面说明:二、控制界面说明:n在其话框中,可以对变量标签、范围、是否跳答、数据标签等进行设定。对话框中在其话框中,可以对变量标签、范围、是否跳答、数据标签等进行设定。对话框中某些选择项的意义如下:某些选择项的意义如下:nRange/legal规定变量值的范围规定变量值的范围(如如10-80,99)nJumps跳答跳答 如输入如输入1S2,则如果输入,则如果输入1 则跳到变量则跳到变量S2nMust enter是否必须输入某个值是否必须输入某个值(yes、no)nRepeat 一般
16、选择一般选择NO,若选,若选“YES”则对上次输入的值进行复制(即内定值的则对上次输入的值进行复制(即内定值的设置)。设置)。nValue label添加数值标签添加数值标签(注:数据录入时可以用注:数据录入时可以用F9或或+查看合法值。查看合法值。)如选如选Value label,则可,则可对其变量设置标识。对其变量设置标识。nJumps跳转举例跳转举例:如下调查表中,在输入如下调查表中,在输入“1婚姻状况婚姻状况”栏目,可输入如下内容:栏目,可输入如下内容:1education,2education,4education 则可实现有关跳转操作。则可实现有关跳转操作。三、常用控制命令三、常用
17、控制命令1、变量录入后执行命令、变量录入后执行命令AFTER ENTRY 设置一个命令块,其中的命令是在当前变量录入完毕后/或光标移到另一个变量时执行。AFTER ENTRY是一个块命令,必须以END结束。格式如下:AFTER ENTRYEND2、变量录入前执行命令、变量录入前执行命令BEFORE ENTRY 设置一个命令块,其中的命令是在当前变量激活,但尚未录入时执行。BEFORE ENTRY是一个命令块,必须以END结束。格式如下:BEFORE ENTRYENDn3、新记录开始时的执行命令(常用于赋初值)、新记录开始时的执行命令(常用于赋初值)4、录入限制及提示命令、录入限制及提示命令n5
18、、移动光标命令、移动光标命令n6、条件命令、条件命令条件命令的结构是:IF THEN ENDIF或者是:IF THEN ELSE ENDIF例如1:IF field1o then GOTO field10ENDIF例如2:IF (Cos(field1)*Sin(field1)0.3 AND(field20)THEN IF field2field3 THEN HELP Something is wrong.GOTO ENDIFELSE Field4=Tan(field1)GOTO field23ENDIF例如3:IF field10=.THEN Field11=.Field12=0 Date1=
19、”12/03/2001”ENDIFn7、赋值命令、赋值命令n8、函数 利用出生日期变量数值计算个体年龄命令。LET AGE=ROUND(TODAY-D1)/365.25)其中TODAY和ROUND()分别是日期和取整函数,D1为出生日期变量。n9、终止命令、终止命令四、核查文件应用举例四、核查文件应用举例n如本例,对股民的如本例,对股民的“性别性别”进行控制。进行控制。操作:操作:1、“建立建立CHK文件文件”,则弹出对话框,指定相应的,则弹出对话框,指定相应的REC文件(如文件(如“股民投资。股民投资。REC”)2、光标制定在、光标制定在“性别性别”位置,选择位置,选择“Value labe
20、l”出的出的“+”,输入相应,输入相应标记,选标记,选“确定并关闭确定并关闭”即可。即可。核查文件其它例子核查文件其它例子VAR1 ;指定对VAR1的检验 RANGE 1 5 ;指定var1的输入范围15 MUSTENTER ;要求本变量必须输入 JUMPS 1 VAR4 ;若输入的是1,则转VAR4变量域去输入 2 VAR5 ;若输入的是2,则转VAR5变量域去输入 3 VAR10 ;若输入的是3,则转VAR10变量域去输入 END ;JUMPS结束 BEFORE ENTRY ;在对VAR1输入前,执行VAR1=F1+2 VAR1=F1+2 END AFTER ENTRY IF(VAR1=2
21、)AND(F2=1)THEN HELP“如果F2有值1,则VAR1 不能有值 2。请检验您的输入!GOTO VAR1 ENDIF ENDEND ;整体检验程序以END结束 注:本程序在CHK程序中产生。要求在质量控制编程界面下,光标对应要求在质量控制编程界面下,光标对应VAR1,然后选择,然后选择“编辑编辑”,则可输入如,则可输入如右质量控制程序。右质量控制程序。又例:又例:BEFORE ENTRY IF k1=.THEN&如果变量K1的值缺失,则显示 TYPE k1值缺失!HIDE K2-K10&隐含变量K2-K10,UNHIDE K2 可恢复K2 GOTO name&转name 变量处输入
22、 ENDIF END案例案例1:“XX调查表调查表”中中“年龄年龄”的处理的处理技术技术“XX调查表调查表”中中“婚姻状况婚姻状况”的处理技术的处理技术“XX调查表调查表”中中“是否在业是否在业”的处理技术的处理技术“XX调查表调查表”中中“就业性质就业性质”的处理技术的处理技术“XX调查表调查表”中中“其它其它”的处理技术的处理技术“XX调查表调查表”中中“不在业不在业”的处理技的处理技术术“XX调查表调查表”中中“不在业,其它不在业,其它”的处理技术的处理技术n案例2:变量设计变量设计问卷描述文件程序设计问卷描述文件程序设计*-龙泉驿区机关事业单位非在编后勤人员统计表龙泉驿区机关事业单位非
23、在编后勤人员统计表id*-注意:您正在录入第注意:您正在录入第 张表!张表!*类别类别 1、总数、总数 2、本区城镇户籍人数、本区城镇户籍人数 3、本区农村户籍人数、本区农村户籍人数 4、区外城镇户籍人数、区外城镇户籍人数 5、区外农村户籍人数、区外农村户籍人数*-total1 合计总数合计总数#total2 本区城镇户本区城镇户#total3 本区农村户本区农村户#total4 区外城镇户区外城镇户#total5 区外农村户区外农村户#manage1 管理总数管理总数#manage2 本区城镇户本区城镇户#manage3 本区农村户本区农村户#manage4 区外城镇户区外城镇户#manag
24、e5 区外农村户区外农村户#busine1 业务总数业务总数#busine2 本区城镇户本区城镇户#busine3 本区农村户本区农村户#busine4 区外城镇户区外城镇户#busine5 区外农村户区外农村户#supply1 工勤总数工勤总数#supply2 本区城镇户本区城镇户#supply3 本区农村户本区农村户#supply4 区外城镇户区外城镇户#supply5 区外农村户区外农村户#*-空岗情况及岗位要求空岗情况及岗位要求 工种为工种为0则退出!则退出!-work1 工种工种 _ sex1 性别性别#age1 年龄年龄#skill1 技能技能#time1 时间(月数)时间(月数)
25、#need1 人数人数#othe1 备注备注 _work2 工种工种 _ sex2 性别性别#age2 年龄年龄#skill2 技能技能#time2 时间(月数)时间(月数)#need2 人数人数#othe2 备注备注 _work3 工种工种 _ sex3 性别性别#age3 年龄年龄#skill3 技能技能#time3 时间(月数)时间(月数)#need3 人数人数#othe3 备注备注 _work4 工种工种 _ sex4 性别性别#age4 年龄年龄#skill4 技能技能#time4 时间(月数)时间(月数)#need4 人数人数#othe4 备注备注 _work5 工种工种 _ se
26、x5 性别性别#age5 年龄年龄#skill5 技能技能#time5 时间(月数)时间(月数)#need5 人数人数#othe5 备注备注 _核查文件核查文件1、在supply1supply4处,分别设置:2、在supply5处设置:录入界面录入界面数据内容数据内容第四节、数据输入第四节、数据输入(在核查文件(在核查文件.chk的控制下,用数据文件的控制下,用数据文件.rec实现数据录入。)实现数据录入。)n方法:单击图中的方法:单击图中的“数据录入数据录入”图标命令,出现对话框后,选图标命令,出现对话框后,选择欲录入的数据文件名择欲录入的数据文件名.rec,从而可以进行数据录入。,从而可以
27、进行数据录入。应用案例应用案例n“成都市龙泉驿区企业用工情况调查成都市龙泉驿区企业用工情况调查”编写的录入程序编写的录入程序输入界面输入界面生成的生成的SPSS数据文件数据文件第五节、其它操作第五节、其它操作一、浏览数据文件的信息一、浏览数据文件的信息n单击图中的单击图中的Document,可以对,可以对数据文件资料的相关信息进行浏览,这些信数据文件资料的相关信息进行浏览,这些信息包括了数据文件的相关信息、数据输入注意事项、数据文件标记、数据息包括了数据文件的相关信息、数据输入注意事项、数据文件标记、数据清单、编码表、逻辑检查等。清单、编码表、逻辑检查等。二、数据转换二、数据转换n单击图中的单
28、击图中的“数据导入数据导入/导出导出”、“数据导出数据导出”图标命令,出现对话框后,图标命令,出现对话框后,选择欲导出的数据文件格式,再选择欲导出的数据记录文件选择欲导出的数据文件格式,再选择欲导出的数据记录文件.rec,从而可,从而可以进行数据导出。以进行数据导出。n1、输出数据操作输出数据操作 单击图中的导出为单击图中的导出为SPSS文件,打开对话框,在图中寻找需导出的数据记录文件文件,打开对话框,在图中寻找需导出的数据记录文件.rec,然后单击然后单击“打开打开”按钮,出现对话框按钮,出现对话框(见左下图见左下图)后单击后单击OK按钮,出现对话框按钮,出现对话框(见右下见右下图图)后单击
29、后单击OK按钮,输出的数据以指定的文件为名。按钮,输出的数据以指定的文件为名。三、继续录入数据或修改数据三、继续录入数据或修改数据n选择选择“数据录入数据录入/导出导出”、“数据录入数据录入/编辑编辑”,指定欲追加记录,指定欲追加记录的文件名,即可进行追加记录或修改记录。的文件名,即可进行追加记录或修改记录。出现追加界面如左所示。出现追加界面如左所示。最后存盘即可。最后存盘即可。四、记录文件(四、记录文件(REC)的合并)的合并n选择选择“数据导入数据导入/导出导出”,“纵向追加记录纵向追加记录/横向合并记录横向合并记录”,则出现界面:,则出现界面:选择欲合并的两个记录(选择欲合并的两个记录(
30、REC)文件名,确定即可实现多人录入操作。)文件名,确定即可实现多人录入操作。指定目标文件名,再选指定目标文件名,再选“追追加:即可。加:即可。用用“数据处理数据处理”,“数据一数据一览表览表”,再指定文件名即可查,再指定文件名即可查看追加后的结果文件。看追加后的结果文件。1、纵向追加、纵向追加2、横向合并、横向合并在进行调查表描述文件设计中,当调查项目很多时,一般可采用分段设计的在进行调查表描述文件设计中,当调查项目很多时,一般可采用分段设计的方式。即第一部分调查项目由第一录入程序承担,第二部分调查项目由第方式。即第一部分调查项目由第一录入程序承担,第二部分调查项目由第二录入程序承担,依此类
31、推。这样一来,数据录入完成后就需要将字段横二录入程序承担,依此类推。这样一来,数据录入完成后就需要将字段横向合并,以得到完整的向合并,以得到完整的REC文件。文件。合并操作:选择合并操作:选择“数据导入数据导入/导出导出”,“纵向追加记录纵向追加记录/横向合并记录横向合并记录”,则出,则出现如下界面:(横向添加字段)选择文件对话框现如下界面:(横向添加字段)选择文件对话框五、数据检验五、数据检验1、静态数据检验、静态数据检验数据录入后的检验数据录入后的检验“数据处理数据处理”、“一致性检验(对调查表双录入后的差异对比)一致性检验(对调查表双录入后的差异对比)”操作如下:选择菜单操作如下:选择菜
32、单“数据处理数据处理”、“一致性检验(对调查表双一致性检验(对调查表双录入后的差异对比)录入后的差异对比)”,则出现如下窗口:,则出现如下窗口:2、动态数据检验、动态数据检验实时检验。实时检验。“工具工具”、“准备双录入实时准备双录入实时检验检验”动态数据检验可以在数据双录入过程中及时对录入数据进行检验,这样可动态数据检验可以在数据双录入过程中及时对录入数据进行检验,这样可以对错误进行及时改正。为了进行双录入实时检验,在第一遍录入数据完成以对错误进行及时改正。为了进行双录入实时检验,在第一遍录入数据完成后,要在其后,要在其REC文件基础上建立双工备份文件。其操作如下:文件基础上建立双工备份文件
33、。其操作如下:选择菜单选择菜单“工具工具”、“准备双录入实时检验准备双录入实时检验”,则出现如下界面(图,则出现如下界面(图2.6.3):):指定第一遍录入数据所产生的指定第一遍录入数据所产生的REC文件文件名(如:人口调查名(如:人口调查.rec),系统将自动产),系统将自动产生其主名相同,但扩展名为生其主名相同,但扩展名为“_dbl.rec”的的供双录入的新供双录入的新REC文件(图文件(图2.6.4):):六、参数设置六、参数设置n“文件文件”、“选项选项”,可实现对各种文件的参数设置。,可实现对各种文件的参数设置。n1、改变、改变QES、REC等文件的界面等文件的界面n2、生成变量的选
34、择、生成变量的选择n在新在新REC文件中设置文件中设置ID启始号:启始号:n注意:此功能是在新的注意:此功能是在新的REC文件中设置文件中设置ID号,一旦号,一旦REC文件文件建立,以后再设置建立,以后再设置ID起始号则在此文件中不会起作用了。起始号则在此文件中不会起作用了。七、相关操作七、相关操作n1、修改、修改QES文件,并保留原文件,并保留原REC文件已有的记录:文件已有的记录:n“工具工具”、“根据修改的根据修改的QES文件更新文件更新REC文件文件”n2、文件记录过滤、文件记录过滤n 在在CHK文件中设置文件中设置KEY变量,如变量,如n 光标定位在相应关键字变量位置,光标定位在相应
35、关键字变量位置,n 选择选择“过滤器过滤器”、“定义过滤器定义过滤器”,输入数据即可。,输入数据即可。八、文件记录排序显示及修改记录八、文件记录排序显示及修改记录n 选择选择“数据处理数据处理”、“数据一栏表数据一栏表”,输入,输入REC记录文件记录文件名,则进入相应记录文件的名,则进入相应记录文件的“数据编辑数据编辑”显示窗口。显示窗口。n选择选择“编辑编辑”(或显示值或显示标签)、(或显示值或显示标签)、“根据记录号排序根据记录号排序”即可。即可。基本基本CHECK的设置的设置忽略缺失值忽略缺失值跳转跳转在记录之间转换在记录之间转换录入过程不能用鼠标录入过程不能用鼠标录入过程中的翻页录入过程中的翻页