1、选择合适的数据管理软件是保证数选择合适的数据管理软件是保证数据质量的重要方面据质量的重要方面 主要内容主要内容 EpiDataEpiData基本情况简介基本情况简介 EpiDataEpiData使用流程使用流程 建立调查表及数据文件生成建立调查表及数据文件生成 添加字段控制添加字段控制 录入数据和数据转出录入数据和数据转出EpiData 是一个免费的数据录入和数据管理软件。直观方便直观方便简单易学简单易学实用性强实用性强对计算机要求不高对计算机要求不高数据录入功能强(有良好的逻辑检错功能)数据录入功能强(有良好的逻辑检错功能)www.epidata.dkwww.epidata.dk 搜索其它下
2、载网站搜索其它下载网站 当前最高版本当前最高版本3.13.1 可不必安装,直接可不必安装,直接copycopy并运行安装目并运行安装目 录下录下epidata.exeepidata.exe 规则简单规则简单 数据文件生成与录入界面设计方便数据文件生成与录入界面设计方便 具备双份录入核查功能具备双份录入核查功能 具有多种常用数据库的输出接口具有多种常用数据库的输出接口 FreeFree 变量名不能为中文变量名不能为中文 记录数最好不超过记录数最好不超过300000300000条条 录入界面不超过录入界面不超过999999行行(五)(五)EpiDataEpiData的的三种文件类型三种文件类型 Q
3、ESQES文件文件(调查表文件调查表文件):定义调查表(问卷):定义调查表(问卷)的结构的结构 ;RECREC文件文件(数据文件数据文件):存放数据以及已经定义:存放数据以及已经定义好的编码;好的编码;CHKCHK文件文件(核查文件核查文件):定义了数据输入时字段:定义了数据输入时字段的有效性规则。的有效性规则。直观方便直观方便 EpiDataEpiData 的屏幕具有标准的视窗形式,包括一行的屏幕具有标准的视窗形式,包括一行菜单和两行工具条;菜单和两行工具条;“工作过程工具条工作过程工具条”可以指导用户从可以指导用户从“1.1.定义数据定义数据”到到“6.6.数据导出数据导出”工作过程工具条
4、最简单的使用流程是:最简单的使用流程是:1)1)创建调查表文件(创建调查表文件(*.qesqes););2)2)在调查表文件的基础上建立数据库(在调查表文件的基础上建立数据库(*.recrec););3)3)在数据库(在数据库(*.recrec)中录入数据。)中录入数据。数据定义是基础性工作,也是关键性的工作;数据定义是基础性工作,也是关键性的工作;在在EpiDataEpiData中表现为建成中表现为建成QESQES文件文件2.直接复制、粘贴word调查表1.建立途径按shift键+#字段编辑器:字段编辑器:方便实现对变量类型和长度的定义方便实现对变量类型和长度的定义 使用制表符使用制表符,只
5、会改变变量录入框在表格中的位置,只会改变变量录入框在表格中的位置,而不会对变量或而不会对变量或REC数据库产生其它不良影响。数据库产生其它不良影响。在变量编码前插入在变量编码前插入,可以将这个变量对齐到下一个,可以将这个变量对齐到下一个制表位置。制表位置。注意:注意:插入的插入的与变量编码间不能有空格与变量编码间不能有空格文件文件 选择项选择项Show data formTabs/IndentsTab stop in data form every pixels 中进行设置,默认值为中进行设置,默认值为40家庭住址shi_地市xian_县区xiang_乡(镇、街办)cun_村(小区)hao_组
6、(楼、号)默认值默认值200与与40的差别的差别编辑编辑字段清单(字段清单(ctrl+q)字段选取清单字段选取清单 日期日期存在存在bug(程序缺陷)(程序缺陷)早期版本:不能计算早期版本:不能计算当前版本:当前版本:记录存在缺失时,记录存在缺失时,导出数据导出数据 库会出问题(错位)库会出问题(错位)建议:暂时不要用此种格式建议:暂时不要用此种格式本次采用的格式。本次采用的格式。由于问卷中只设计了年月,由于问卷中只设计了年月,调查者应将调查者应将日日调查清楚并填写调查清楚并填写数值型变量:数值型变量:#,最长允许,最长允许14个字符个字符字符型变量:字符型变量:_,最长允许最长允许80个字符
7、,一个中文个字符,一个中文字占字占2个字符个字符日期型变量:日期型变量:注意其他变量:自动生成注意其他变量:自动生成ID号号逻辑是否逻辑是否数值型变量允许录入数字、减号和小数点。在QES 文件中和数据录入过程中,你可以用圆点(.)或逗号(,)来表示小数点。一个变量中只允许输入一个小数点,这意味着不能用逗号作为千位的分隔符(例如:1,000,000)。字符“#”的数目表示变量的长度,小数点占一位字符。变量最长允许18 个字符。在在EpiDataEpiData表现为生成表现为生成.REC.REC文件文件 本文件基于本文件基于QESQES文件而生成文件而生成 产生产生RECREC文件前可输入文件标记
8、文件前可输入文件标记 警惕:覆盖文件操作一定要警惕:覆盖文件操作一定要慎重!慎重!注意:注意:.qes和和.rec可同名、可不同名可同名、可不同名建议:同名建议:同名创建数据库创建数据库修改数据库修改数据库非常非常重要重要CHECK 的文件建立:必须与数据库的文件名相同,唯一不同的就是扩展名;打开需要检查的数据库常用语法常用语法Range:允许范围,允许值:允许范围,允许值例:例:4-5,1,2,-inf-5(=0)Jump:跳转功能:跳转功能例:例:age变量变量1v23,2v40,3end,4write Must Enter:必须录入:必须录入 Repeat:重复输入:重复输入Value
9、label:添加数值标签:添加数值标签例:例:label sex1 male2 female忽略缺失值(IGNOREMISSING)V4BEFORE ENTRYIGNOREMISSINGV4=V1+V2+V3END使用运算符号和函数使用运算符号和函数Let 命令:命令:例例1:V1let field5=field2/field3end例例2:birth today let age=round(today-birth)/365.25)添加字段控制添加字段控制 可以使数据输入过程按给定的一些规则和可以使数据输入过程按给定的一些规则和 算法完成,是算法完成,是EpiDataEpiData功能强大的体
10、现功能强大的体现 添加输入控制的指令以文件形式单独保添加输入控制的指令以文件形式单独保 存,该文件后缀为存,该文件后缀为CHKCHK 程序运行时,自动寻找与扩展名程序运行时,自动寻找与扩展名RECREC相相 同文件的同文件的CHKCHK文件文件 限定特定值(数值范围,合法值)限定特定值(数值范围,合法值)指定输入的顺序(跳转)指定输入的顺序(跳转)某些字段不得缺项,必须输入某些字段不得缺项,必须输入 重复上一条记录的某字段值重复上一条记录的某字段值 标签:给出各数字对应的描述性文本标签:给出各数字对应的描述性文本 相当于在相当于在CHKCHK文件中进行编程文件中进行编程 需掌握各种需掌握各种c
11、heck commandscheck commands:-ifthen-ifthenendifendif、mustentermustenter、relaterelate 需熟悉各种需熟悉各种operatorsoperators和和functionsfunctions:-arithmetic-arithmetic、stringstring、datedate、timetime 点击点击“数据录入数据录入”,给定数据文件,给定数据文件,即显示数据录入界面即显示数据录入界面注意事项注意事项 无键入内容,仅按回车,以缺失值论无键入内容,仅按回车,以缺失值论 字段填满,光标自动跳到下一个字段字段填满,光标
12、自动跳到下一个字段 任何时候要退出录入,按任何时候要退出录入,按F10F10键即可键即可 查找查找定位记录:用于已知记录号时定位记录:用于已知记录号时 查找查找查找记录:用于不知记录号时查找记录:用于不知记录号时1、修改数据库:、修改数据库:增加、删除变量;增加、删除变量;改变变量类型,变量名字改变变量类型,变量名字2、数据库的追加、合并、数据库的追加、合并3、双录入和核查、双录入和核查4、数据的输出和输入、数据的输出和输入对已输入的数据库进行系列操作对已输入的数据库进行系列操作在不丢失数据的前提下,修改一个已经录入了的数在不丢失数据的前提下,修改一个已经录入了的数据库的结构。已经录入的数据会
13、被拷贝到新数据库据库的结构。已经录入的数据会被拷贝到新数据库中相同名字的变量下,这个变量的格式有可能是修中相同名字的变量下,这个变量的格式有可能是修改了的格式。改了的格式。也可以增加变量、修改变量的定义、或者删除变量。也可以增加变量、修改变量的定义、或者删除变量。然后,先关闭所有的文件,点击菜单然后,先关闭所有的文件,点击菜单ToolsRevise Data File,完成数据库的修改。,完成数据库的修改。修改步骤1打开调查表文件(打开调查表文件(*.qes)进行修改;如果没有现成的)进行修改;如果没有现成的调查表文件,可以用已有的数据库(调查表文件,可以用已有的数据库(*.rec)反过来创)
14、反过来创建一个新的调查表文件,即选择菜单建一个新的调查表文件,即选择菜单ToolsQES File from REC File(根据数据文件产生调查表)(根据数据文件产生调查表);编辑、修改调查表文件(编辑、修改调查表文件(*.qes),例如增加新变量、),例如增加新变量、删除变量、改变变量类型等;删除变量、改变变量类型等;保存修改后的调查表文件,然后关闭该文件;保存修改后的调查表文件,然后关闭该文件;选择选择 ToolsRevise Data File(更新数据文件);(更新数据文件);选择修改好的调查表文件(选择修改好的调查表文件(*.qes)和准备修改的数据)和准备修改的数据库(库(*.
15、rec)。)。如果删除或者修改了变量名,会丢失一些数据。请认真检查修改了的数如果删除或者修改了变量名,会丢失一些数据。请认真检查修改了的数据库,避免错误操作。据库,避免错误操作。即使操作失误,原来的数据库还是可以恢复的,它现在已被存为另外一个数即使操作失误,原来的数据库还是可以恢复的,它现在已被存为另外一个数据库(仍在相同的文件夹里),文件名为据库(仍在相同的文件夹里),文件名为FILENAME.OLD.RECEpiData 中有两种方式生成变量名中有两种方式生成变量名改变命名方式,有可能会修改变量名,进而丢失数据。在修改数据库时,程改变命名方式,有可能会修改变量名,进而丢失数据。在修改数据库
16、时,程序会先检查原始数据库创建时使用变量名定义方法,如果不同于现在的序会先检查原始数据库创建时使用变量名定义方法,如果不同于现在的Options 中的设置,程序会自动弹出一个警告框,建议你使用相同的变量名中的设置,程序会自动弹出一个警告框,建议你使用相同的变量名定义方法。定义方法。修改原始数据库中的变量类型。所有变量类型都可以修改为字符型变量或大修改原始数据库中的变量类型。所有变量类型都可以修改为字符型变量或大写字母的字符型变量。数值型变量可以修改为有相同或更多小数位数的数值写字母的字符型变量。数值型变量可以修改为有相同或更多小数位数的数值型变量。如果修改后的小数位数变少了,程序会弹出警告框,
17、提醒这样修改型变量。如果修改后的小数位数变少了,程序会弹出警告框,提醒这样修改可能会丢失数据。可能会丢失数据。慎重!慎重!工具字段更名选择文件名出现文件名在弹出的窗口中,第一列在弹出的窗口中,第一列是原有的变量名,第二列是原有的变量名,第二列是标签。如果要修改变量是标签。如果要修改变量名,请将光标放在第三列名,请将光标放在第三列相应的变量行上,键入新相应的变量行上,键入新的变量名。修改完毕后,的变量名。修改完毕后,点击点击Save and close,保存,保存并关闭窗口。并关闭窗口。旧的数据库会被另存为旧的数据库会被另存为Filename.old.rec,以备需,以备需要的时候恢复。要的时候
18、恢复。保存路径保存路径Append/Merge追加(append)是将两个数据结构完全一样或基本上一样的数据库纵向连起来。如:几个不同人分录数据的合并横向连接(Merge)可使两个数据库结构不同的文件横向连接,前提是两个文件中有相同的关键变量如:基本情况库,实验室信息库,流调数据库的合并以A库结构为准,B库中多余的变量将被忽略两库中相同名称的变量,则新创建数据库对应的变量类型将以数据库A为准新库中包括A库和B库中的所有变量以A库结构为准,只合并标识变量在两个数据库中完全匹配的记录两库共有标识变量,唯一不重复可同时选择13个变量不一定要设置KEY或key unique合并两个数据库中的所有记录注
19、意!数据库的输出数据库的输出/输入输入输出选项:可选择部分变量和记录输出选项:可选择部分变量和记录变量个数的限制变量个数的限制输出到输出到dBaseIII,最多,最多128个变量,且变个变量,且变量标签、数值标签无法同时转出量标签、数值标签无法同时转出Excel不同版本的行、列数均有限制,且不同版本的行、列数均有限制,且变量标签、数值标签无法同时转出变量标签、数值标签无法同时转出Spss文件文件syntax语句要删除注释部分语句要删除注释部分输出到输出到epidata:可创建一个新库,含部分可创建一个新库,含部分记录或部分变量记录或部分变量Qes中要尽量与原始问卷结构相同,以减少数据录入中的失中要尽量与原始问卷结构相同,以减少数据录入中的失误误Chk中多设置数值标签,导出时中多设置数值标签,导出时Chk文件要在同一文件夹中文件要在同一文件夹中在进行大量录入前,数据库建立者要自己录入在进行大量录入前,数据库建立者要自己录入1020份左右,份左右,以发现存在的问题以发现存在的问题数据转出时,特别是较大数据库转出时,可试用几种格式数据转出时,特别是较大数据库转出时,可试用几种格式(如(如.xls,.sps,.txt),注意每种转出格式局限性),注意每种转出格式局限性关联数据库:能不用就不用关联数据库:能不用就不用配套文件:数据录入说明配套文件:数据录入说明 谢谢谢谢