1、调查研究设计调查研究设计例 Doll与Hill的吸烟与肺癌关系研究 1951年开始 对象:在英国登记注册的医生 方式:信函 调查内容:主要围绕吸烟可致肺癌的假设,如 是否吸烟、吸烟年限、种类、方式等回收 到40701份合格的调查表 结果:表明吸烟者比不吸烟者患肺癌的风险性增大, 每日吸烟量越大患肺癌的风险性越大。例 反应停事件 20世纪50年代末和60年代初,在西欧一些国家发现新生儿中海豹畸形的发生率较以前明显增高。 在探索原因的过程中首先采取病例-对照研究来寻找可疑的危险因素 做法:寻找条件相似但未生畸形儿的母亲作为 对照,调查母亲早期暴露于哪些因素。 研究方法:调查研究(观察性研究)研究方
2、法:调查研究(观察性研究) 实验实验(试验试验)性研究性研究 观察性研究是一种客观地观察、记录和观察性研究是一种客观地观察、记录和描述事物或现象的认识活动。是观察者不对描述事物或现象的认识活动。是观察者不对被观察事物或现象进行任何干预的情况下所被观察事物或现象进行任何干预的情况下所作的观察。作的观察。 调查 (survery)一词来源于拉丁字(supervidere) 意为观察观察性研究:观察性研究: 横断面研究横断面研究 回顾性研究回顾性研究 前瞻性研究前瞻性研究 这里所讨论的调查研究是指观察性研究这里所讨论的调查研究是指观察性研究中的横断面研究,或称横断面调查,或称现中的横断面研究,或称横
3、断面调查,或称现况研究或现况调查。况研究或现况调查。 一、调查研究的特点 1 . 没有人为施加的干预措施没有人为施加的干预措施 2 . 不能随机化分配不能随机化分配 3 . 仅反映时间断面上的情况仅反映时间断面上的情况 可以了解某一特定时间断面上特定人群可以了解某一特定时间断面上特定人群中疾病或卫生事件的现状及其与之相联系的中疾病或卫生事件的现状及其与之相联系的各种因素的分布情况。各种因素的分布情况。 它通常是在对研究事物或现象不太了解它通常是在对研究事物或现象不太了解或在研究工作的初始阶段进行的,可为发现或在研究工作的初始阶段进行的,可为发现问题、分析问题并进而为解决问题打下初步问题、分析问
4、题并进而为解决问题打下初步基础和提供初步线索。基础和提供初步线索。 调查研究的应用调查研究的应用 广泛应用于医学、社会学、教育学等领域 从数千年前古代中国和古埃及的课税、征兵和纳粮的人口统计调查,到现代的人口普查、生活状况调查、市场调查、民意测验等。 探索行为目的(如为什么吸毒) 了解观念、态度、信念和行(如了解对婚前同居、未婚先孕的看法) 了解期望(如健康保险期望) 状况特点(高血压的患病现状) 认识程度二、调查设计的基本原则与内容 调查设计包括资料收集、整理和分析各个环节和整调查设计包括资料收集、整理和分析各个环节和整个过程的统计设想和科学安排。个过程的统计设想和科学安排。调查设计就是根据
5、研究目的,确定调查对象和调查设计就是根据研究目的,确定调查对象和观察单位,进而确定调观察单位,进而确定调 查方法和样本含量;查方法和样本含量;将观察指标转化为调查项目,进而设计成调查将观察指标转化为调查项目,进而设计成调查表或问卷;表或问卷;确定资料收集方法和资料整理分析计划;确定资料收集方法和资料整理分析计划;最后制定调查组织计划以及调查质量控制措施最后制定调查组织计划以及调查质量控制措施等。等。 1. 确定调查对象和观察单位确定调查对象和观察单位 确定调查对象即明确调查总体。按调查目的所确定的总体称为目标总体(target population)。 目标总体中组成调查对象的每个“个体”即为
6、观察单位。 普查就是全面调查普查就是全面调查(complete survey),即调查目,即调查目标总体中全部观察对象。理论上只有普查没有抽样标总体中全部观察对象。理论上只有普查没有抽样误差,可以直接得到总体参数。但如普查规模太大,误差,可以直接得到总体参数。但如普查规模太大,往往非抽样误差较大。往往非抽样误差较大。 普查可以了解总体在某一特定普查可以了解总体在某一特定“时点时点”上的情上的情况,如了解特定人群的健康水平或疾病分布,有利况,如了解特定人群的健康水平或疾病分布,有利于早期发现和早期治疗疾病。但因普查成本较高,于早期发现和早期治疗疾病。但因普查成本较高,应用时应注意其成本效益和社会
7、影响。应用时应注意其成本效益和社会影响。 1疾病患病率较高;2灵敏度和特异度较高的检查或诊断方 法;3便于普查人员操作、易于群众接受;4具有实施以及治疗条件。一般在疾病普查时,应考虑以下条件:一般在疾病普查时,应考虑以下条件:抽样调查是一种非全面调查,即从总体中抽取一定抽样调查是一种非全面调查,即从总体中抽取一定 数量的观察单位组成样本,对样本所进行的调数量的观察单位组成样本,对样本所进行的调 查。查。 抽样方法:单阶段抽样和多阶段抽样抽样方法:单阶段抽样和多阶段抽样抽样调查:抽样调查:概率抽样概率抽样(probability sampling)非概率抽样非概率抽样(non-probabili
8、ty sampling)之分。之分。 概率抽样:概率抽样:是指总体中观察单位被抽中的概是指总体中观察单位被抽中的概率是已知的或可以计算的。概率抽样的样本对总率是已知的或可以计算的。概率抽样的样本对总体代表性较好,可以计算抽样误差,可以对总体体代表性较好,可以计算抽样误差,可以对总体进行统计推论。应用概率抽样的前提是目标总体进行统计推论。应用概率抽样的前提是目标总体和抽样框架和抽样框架(sampling frame)明确。明确。 非概率抽样非概率抽样:指总体中每个观察单位被:指总体中每个观察单位被抽中的概率是未知的或不能计算的。非概率抽中的概率是未知的或不能计算的。非概率抽样的样本对总体代表性较
9、差,不能按常规抽样的样本对总体代表性较差,不能按常规理论计算抽样误差,也不能对总体进行统计理论计算抽样误差,也不能对总体进行统计推论。推论。 在许多实际工作中,尤其是在目标总体在许多实际工作中,尤其是在目标总体和抽样框架不明确的情况下,非概率抽样仍和抽样框架不明确的情况下,非概率抽样仍然是实用的。然是实用的。1.偶遇抽样(accidental sampling) 又称为便利抽样(convenience sampling) 2. 立意抽样(purposive sampling) 又称判断抽样(judgmental sampling) 3. 定额抽样(quota sampling) 也称配额抽样
10、4. 雪球抽样(snowball sampling) 抽样调查不仅节省调查成本,还有助于获得较为抽样调查不仅节省调查成本,还有助于获得较为 深入细致和准确的资料。因此,它在医疗卫生工深入细致和准确的资料。因此,它在医疗卫生工 作中应用最多。作中应用最多。 许多医疗卫生问题只能作抽样调查,如临床试验许多医疗卫生问题只能作抽样调查,如临床试验 中药物的不良反应观察、大气或水污染的调查、中药物的不良反应观察、大气或水污染的调查、 食品卫生质量的检查等。此外,抽样调查还可用食品卫生质量的检查等。此外,抽样调查还可用 于评价普查质量。于评价普查质量。 典型调查典型调查(typical survey)也属
11、一种非概也属一种非概率抽样方法。它是根据调查目的,在对事物率抽样方法。它是根据调查目的,在对事物进行全面分析的基础上,选择有代表性的典进行全面分析的基础上,选择有代表性的典型观察单位进行调查。观察单位可以是人、型观察单位进行调查。观察单位可以是人、家庭、组织或社区等。家庭、组织或社区等。 典型常常是同类事物特征的集中表现,典型常常是同类事物特征的集中表现,有利于对事物特征进行深入细致的研究,若有利于对事物特征进行深入细致的研究,若与普查相结合,则可分别从深度和广度说明与普查相结合,则可分别从深度和广度说明问题。问题。3. 确定样本含量确定样本含量 抽样误差大小直接与样本含量有关,因此确定一个恰
12、当的样本含量可将抽样误差控制在一定范围内。 样本含量过少,所得指标不稳定,推断总体精度差,检验效能低;样本含量过多,不仅增加调查成本,而且可能增大各种非抽样误差。 样本含量估计的目的是在保证一定精度和检验效能的前提下,确定最少的观察单位数。 调查设计时,应将调查目的转化为具体的观察调查设计时,应将调查目的转化为具体的观察指标,通过指标来达到目的。指标,通过指标来达到目的。 例如,拟对某肺癌高发区进行现场调查,调查例如,拟对某肺癌高发区进行现场调查,调查目的是了解当地肺癌死亡现状及其相关因素,为病目的是了解当地肺癌死亡现状及其相关因素,为病因研究提供线索,为防治工作提供依据。则可确定因研究提供线
13、索,为防治工作提供依据。则可确定以下观察指标:以下观察指标: 该地某年不同性别、年龄别肺癌死亡率;该地某年不同性别、年龄别肺癌死亡率; 特殊暴露如氡子体、砷等有害物质浓度的测特殊暴露如氡子体、砷等有害物质浓度的测定指标以及个体是否吸烟等。定指标以及个体是否吸烟等。 应紧扣研究目的,做到少而精;应紧扣研究目的,做到少而精;应尽量采用客观指标;应尽量采用客观指标;应注意其灵敏性和特异性。应注意其灵敏性和特异性。指标选择指标选择5. 设计调查工具设计调查工具 调查工具是获取科学事实的基本手段。这调查工具是获取科学事实的基本手段。这里讨论的调查工具即调查表或问卷里讨论的调查工具即调查表或问卷(ques
14、tionnaire)(questionnaire)。如果调查表是以设置许多。如果调查表是以设置许多问题为主和要求调查对象回答的,一般称之为问题为主和要求调查对象回答的,一般称之为问卷。采用问卷进行调查的方法一般称之为问问卷。采用问卷进行调查的方法一般称之为问卷调查卷调查(questionnaire survey(questionnaire survey)。 随着经济和社会的发展以及医学模式的转变,医学研究的领域已不单纯局限于生物医学,也涉及到许多社会、经济、文化、心理和行为等因素对人体健康或疾病的影响。在精神病学、医学心理学、流行病学、社会医学、健康教育和卫生服务调查等研究中,问卷调查的应用已
15、越来越多。6. 确定调查方式确定调查方式调查方式:面对面调查与非面对面调查调查方式:面对面调查与非面对面调查 面对面调查面对面调查: :调查员到现场对调查对象直接调查员到现场对调查对象直接进行观察或采访。进行观察或采访。优点:优点:有利于调查对象对问题的理解,有助于保有利于调查对象对问题的理解,有助于保证资料的准确性和可靠性;证资料的准确性和可靠性;应答率较高,填写应答率较高,填写“不详不详”或空项的比例或空项的比例较低。较低。缺点:调查成本较高。缺点:调查成本较高。 非面对面调查非面对面调查:通过信访或电话等方式对调查通过信访或电话等方式对调查对象进行间接调查,一般由调查对象本人填对象进行间
16、接调查,一般由调查对象本人填写问卷或回答调查员的提问。写问卷或回答调查员的提问。 优点主要是调查成本低、保密性较好。优点主要是调查成本低、保密性较好。缺点主要是调查对象对问题的理解常与设计缺点主要是调查对象对问题的理解常与设计要求不一致,从而影响调查质量,且应答率要求不一致,从而影响调查质量,且应答率较低。较低。7. 制定资料整理分析计划制定资料整理分析计划(1) 数据的计算机录入与清理数据的计算机录入与清理 数据录入时,可用两个录入员分别录入数据录入时,可用两个录入员分别录入同一资料,并对两人录入结果进行比较;同一资料,并对两人录入结果进行比较; 数据录入时,还可设置某些变量的有效数据录入时
17、,还可设置某些变量的有效取值范围以及某些变量间的跳过功能,保证取值范围以及某些变量间的跳过功能,保证录入质量;录入质量; 数据录入后,也可根据调查项目间的逻数据录入后,也可根据调查项目间的逻辑关系进行逻辑查错,也可对某些变量作简辑关系进行逻辑查错,也可对某些变量作简单的统计描述如编制频数表,或作两相关变单的统计描述如编制频数表,或作两相关变量的散点图,发现异常值。量的散点图,发现异常值。 (二二) 资料的分组资料的分组 资料分组资料分组(classification)(classification)是资料整理分析时是资料整理分析时另一个重要问题。另一个重要问题。 资料分组的目的是将性质相同的观
18、察单位合在资料分组的目的是将性质相同的观察单位合在一起,将性质不同的观察单位分开,把组内的共性一起,将性质不同的观察单位分开,把组内的共性和组间的差异性充分显示出来。因此,只有抓住影和组间的差异性充分显示出来。因此,只有抓住影响被研究事物或现象最主要的、本质的特征进行分响被研究事物或现象最主要的、本质的特征进行分组,才能揭示出事物的规律性。组,才能揭示出事物的规律性。 调查研究中没有人为施加的干预措施,对研究调查研究中没有人为施加的干预措施,对研究对象的分组是根据人群中客观存在的特征进行的,对象的分组是根据人群中客观存在的特征进行的,这是调查资料整理和分析时的重要特点。这是调查资料整理和分析时
19、的重要特点。 一般结构一般结构 说明部分:说明部分: 说明调查目的,取得合作。包括目的与重要性,说明调查目的,取得合作。包括目的与重要性,回答问题的必要性和保密等。回答问题的必要性和保密等。 填写说明 保证调查员和调查对象均能对调查项目和填写方法正确理解,统一认识。 在适当位置统一给出,或穿插在相应问题后面。 核查项目: 与调查目的无关,不向调查对象询问的质控项目。亦不用分析,如调查员姓名、调查日期、复核结果、未调查原因等。 A. 背景资料:调查对象姓名、住址、单位、背景资料:调查对象姓名、住址、单位、电话等。电话等。 B. 人口学项目:年龄、性别、民族、婚姻人口学项目:年龄、性别、民族、婚姻
20、状况、文化程度、职业等。状况、文化程度、职业等。 C. 调查项目:这是调查的核心内容,它是调查项目:这是调查的核心内容,它是根据目的和指标确定的必须调查的项目。分析根据目的和指标确定的必须调查的项目。分析时据此计算指标以及调整混杂因素的影响。时据此计算指标以及调整混杂因素的影响。 问题的形式 提问:直接提出问题并由调查对 象回答。 陈述:陈述某一观点,由调查对 象表达对这一陈述的态度。 :对问题不加任何限制,自由回答。:对问题不加任何限制,自由回答。 适用范围:调查者不能确定回答的范围,答案很适用范围:调查者不能确定回答的范围,答案很多,预调查。多,预调查。 优点:调动主观能动性,获得较丰富的
21、信息。优点:调动主观能动性,获得较丰富的信息。 缺点:容易离题、被拒绝、费时;缺点:容易离题、被拒绝、费时;不易整理分析,难以达到相互比较。不易整理分析,难以达到相互比较。问题的形式问题的形式 封闭式问题:提出固定答案选择,“是与否”或 多项选择。 优点:答案标准化,易于回答,拒答率低, 记录汇总方便,可定量分析。 缺点:容易随意选答,难以得到其它信息。 答案应包括所有可能情况,“其它”。 答案不能重叠 一般只能选择一个答案或一个最佳答案。 开放式问题有时可得到数值变量资料;封闭式问题只能得到分类资料或等级资料。“您的年龄是 岁?” 1. 小于10岁 2. 10 19岁 3. 20 39岁 4
22、. 大于40岁 避免术语:避免术语:“就低不就高就低不就高” 避免混淆:对语义模糊的词语给出定义或标准避免混淆:对语义模糊的词语给出定义或标准 避免双重问题避免双重问题 避免诱导或强制避免诱导或强制 否定形式的提问容易误解,有诱导之嫌。否定形式的提问容易误解,有诱导之嫌。 “社会期望偏性社会期望偏性” 问题应适合全部调查对象问题应适合全部调查对象 敏感问题敏感问题(sensitive question)包括对国家政策、包括对国家政策、社会规范、伦理道德的态度、经济收入、生活行社会规范、伦理道德的态度、经济收入、生活行为和个人隐私等。为和个人隐私等。 对象转移法对象转移法 假定法假定法 随机应答
23、技术随机应答技术 计算机计算机 调查项目的安排顺序 符合逻辑 一般问题在前,特殊问题在后 易答问题在前,难答问题在后 敏感问题放最后,如较多,亦可散在问卷 中。 指标性文字指导问题或填写 直接观察法:直接观察法: 直接检查、测量或计数。资料真实可靠,但成直接检查、测量或计数。资料真实可靠,但成本较高。本较高。 采访法:根据调查对象的问答来收集资料。采访法:根据调查对象的问答来收集资料。 A. “访问调查”:由调查员填写调查表 优点:有助于调查对象对问题的理解 应答率较高,填写完整。 缺点:成本较高B. “自填调查” 包括领导、宣传发动、时间进度、地包括领导、宣传发动、时间进度、地域划分、调查员
24、培训、分工协调、经费预域划分、调查员培训、分工协调、经费预算、调查表格准备、调查资料的检查制度算、调查表格准备、调查资料的检查制度和资料的汇总要求等。和资料的汇总要求等。 计算机录入与整理计算机录入与整理A. 两人录入并比较两人录入并比较B. 编程设置变量取值范围与跳过功能编程设置变量取值范围与跳过功能C. 逻辑查错逻辑查错D. 简单的统计描述:频数表与散点图简单的统计描述:频数表与散点图 分组分组(classification):将性质相同的观:将性质相同的观察单位合在一起,将性质不同的观察单位察单位合在一起,将性质不同的观察单位分开,把组内的共性和组间的差异性显示分开,把组内的共性和组间的
25、差异性显示出来。出来。 调查资料是根据人群中客观存在的特征进行分组,这是调查资料整理分析的主要特点。A.按类型分组:按分组因素的类别分 组;B.按数量分组:按分组因素的数量大小 分组; 也可两种分组结合使用,如性别分组和 年龄分组。分组时应注意:分组时应注意: 分组数的多少:分组数的多少:分组过少,可掩盖不同特征人群的本质差异分组过少,可掩盖不同特征人群的本质差异分组过多,可掩盖事物的规律性分组过多,可掩盖事物的规律性 数量分组界限:不重叠、不间断数量分组界限:不重叠、不间断 注意习惯的分组方法:注意习惯的分组方法: 年龄别死亡率:年龄别死亡率:0 ,1 ,5 ,10 , 每每 5 岁或岁或
26、10 岁一组。岁一组。说明指标的内涵和计算方法,说明指标的内涵和计算方法,预期作哪些统计描述和推断,预期作哪些统计描述和推断,采用什么方法控制混杂因素,采用什么方法控制混杂因素,列出统计分析表。列出统计分析表。三、常用的抽样方法 不同的抽样方法,样本均数(或率)及其不同的抽样方法,样本均数(或率)及其抽样误差的算法不同。抽样误差的算法不同。 1.单纯随机抽样单纯随机抽样(simple random sampling) 对调查总体全部观察单位编号,用随机数对调查总体全部观察单位编号,用随机数字表或抽签等方法随机抽取部分观察单位组成字表或抽签等方法随机抽取部分观察单位组成样本。最基本的抽样方法,也
27、是其他抽样方法样本。最基本的抽样方法,也是其他抽样方法的基础。的基础。 优点:均数或率及其标准误计算简便。 缺点:总体观察单位较多时,不易操作。1)1 ()1 (nppNnSp均数的标准误:均数的标准误:nSNnSx2)1(率的标准误:率的标准误: n / N 为抽样比为抽样比(sampling fraction):总体中每个:总体中每个观察单位被抽取入样本的概率。观察单位被抽取入样本的概率。 1 n / N 为有限总体校正数为有限总体校正数(finite population correction) 又称机械抽样或等距抽样。即将总体的观察又称机械抽样或等距抽样。即将总体的观察单位按某一顺序号
28、分成单位按某一顺序号分成 n 个部分,再从第一部分个部分,再从第一部分随机抽取第随机抽取第 k 号号观察单位,依次用相等间隔,机观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本。械地从每一部分各抽取一个观察单位组成样本。 易于理解,简便易行;容易得到按比例分配的样本;样本观察单位在总体中分布均匀,抽样误差一般小于单纯随机抽样。优点:优点: 当总体的观察单位按顺序有周期趋势当总体的观察单位按顺序有周期趋势或单调增(减)趋势时,易产生系统误差。或单调增(减)趋势时,易产生系统误差。 但一旦确定了抽样间隔,不得随意更改,否但一旦确定了抽样间隔,不得随意更改,否则可能造成另外的系统
29、误差。则可能造成另外的系统误差。 一般按单纯随机抽样估计其抽样误差,一般按单纯随机抽样估计其抽样误差,但抽取的观察单位不是独立的,故该估计是但抽取的观察单位不是独立的,故该估计是近似的。近似的。 将总体按某种与研究指标无关的特征分为将总体按某种与研究指标无关的特征分为 K 个个“群群”组,每个群包括若干观察单位,然后随机抽组,每个群包括若干观察单位,然后随机抽取取 k个个“群群”,将抽取的各个群的全部观察单位组成,将抽取的各个群的全部观察单位组成样本。样本。 以以“群群”为基本抽样单位,故为基本抽样单位,故“群群”间差异越间差异越小,抽取的小,抽取的“群群”越多,抽样误差越小。故增加抽越多,抽
30、样误差越小。故增加抽取的取的“群群”数,减少数,减少“群群”内观察单位数,可降低内观察单位数,可降低抽样误差。抽样误差。 优点:便于组织,节约成本,容易控制 质量。缺点:因样本观察单位并非广泛散布在 总体中,抽样误差一般大于单纯 随机抽样。 先按对研究指标变异影响较大的某种特先按对研究指标变异影响较大的某种特征,将总体分为若干类别征,将总体分为若干类别(“层层” strata),再从,再从每层中随机抽取一定数量的观察单位,合起每层中随机抽取一定数量的观察单位,合起来组成样本。来组成样本。 优点: 样本含量相同时,抽样误差小于前三种抽样方 法。 便于对不同层采用不同的抽样方法。 如:城镇 系统抽
31、样;农村 整群抽样。 便于对各层独立进行分析。按比例分配:NNnniiNNnnii1000人的抽样在各层的分配层人口数(Ni )抽样比例(Ni /N)样本含量(ni )1350000.2922922250000.2082083500000.4174174100000.08383合计120000(N)1000(n) 5. 多阶段抽样多阶段抽样(multi-stage sampling) 前述的四种基本抽样方法都是通过一次抽样产生一个完整的样本,称为单阶段抽样。 但在现场调查中,往往面临的总体较为庞大,情况复杂,观察单位很多,而且分布面广,很难通过一次抽样产生完整的样本,而是根据实际情况将整个抽样
32、过程分为若干阶段来进行,称为多阶段抽样。 样本含量估计一、意义1. 研究单位间的变异性:研究单位间的变异性: 用总体或样本标准差反映变异大小。用总体或样本标准差反映变异大小。2. 调查人群中具有欲调查特征的个体所占的比例。调查人群中具有欲调查特征的个体所占的比例。3. 容许误差容许误差。4. 第一类错误第一类错误 ,一般取,一般取0.05。5. 第二类错误第二类错误 ,一般小于,一般小于0.20。三、样本含量估计(单纯随机抽样)1. 估计总体均数的样本含量估计总体均数的样本含量2)(un 例:抽样调查了解某地正常成人例:抽样调查了解某地正常成人WBC的平均水的平均水平,希望误差不超过平,希望误
33、差不超过100个个/mm。正常成人。正常成人WBC数数的标准差约为的标准差约为1000个个/mm。 取取0.05。问需调查多少。问需调查多少人?人?2. 估计总体率的样本含量估计总体率的样本含量22)1(un 在总体率未知的条件下,在总体率未知的条件下, 取取50% 例:现欲抽样调查了解某地小学生的蛔虫感例:现欲抽样调查了解某地小学生的蛔虫感染率,要求误差不超过染率,要求误差不超过 3 %, 取取 0.05。问需调查。问需调查多少人?多少人?1. 抽样方法的抽样误差越大,所需样本越多。一般而言,抽样误差:整群抽样 单纯随机抽样 系统抽样 分层抽样。几个问题几个问题2. 调查中,绝大多数的总体为
34、有限总体,故需校正。调查中,绝大多数的总体为有限总体,故需校正。 总体均数:总体均数: 总体率:总体率:Nnnnc1NnnNnnnc1) 1(13. 多项指标样本含量的估计多项指标样本含量的估计 分别估计样本含量,取得最大的样本含量分别估计样本含量,取得最大的样本含量值,为共同的样本含量。值,为共同的样本含量。 若最大样本含量值不能满足,可降低精度若最大样本含量值不能满足,可降低精度( ),或者放弃次要指标,保证重点指标。,或者放弃次要指标,保证重点指标。调查的质量控制调查的质量控制1. 全面调查全面调查 不存在抽样误差,但可能存在非抽样误差。不存在抽样误差,但可能存在非抽样误差。2. 抽样调
35、查抽样调查 除抽样误差外,也可能存在非抽样误差除抽样误差外,也可能存在非抽样误差 抽样误差不可避免,但有一定规律,易于控制,可估计其大小。主要在设计阶段与设计人员有关。 非抽样误差在调查过程中,由于各种人为因素或偶然因素造成的,如设计方案不周密、测量仪器不精确、询问方法不恰当等造成收集资料不准,计算汇总有误等。 它涉及设计人员、调查人员和调查对象,贯穿于设计、资料收集、整理和分析的全过程。 正确划分调查范围:如正确划分调查范围:如“常住人口常住人口”的定义的定义 正确选择调查指标:正确选择调查指标: 明确定义调查项目:如人口生育状况的调查明确定义调查项目:如人口生育状况的调查 正确设置调查问题
36、:相反问题和测谎问题正确设置调查问题:相反问题和测谎问题 选择恰当的调查方式:选择恰当的调查方式: 预调查:调查表设计中不可能缺少的重要环预调查:调查表设计中不可能缺少的重要环 节,也是培训调查员、统一提问方式的重要措节,也是培训调查员、统一提问方式的重要措 施。施。2. 资料收集、整理与分析阶段资料收集、整理与分析阶段 收集阶段收集阶段调查员的选择与训练调查员的选择与训练调查对象的宣传发动,提高应答率调查对象的宣传发动,提高应答率 整理分析阶段整理分析阶段调查质量的评价调查质量的评价效度:效度:指调查工具对所调查对象测量的有效指调查工具对所调查对象测量的有效 程度或准确程度(真实性)。程度或
37、准确程度(真实性)。信度:信度:指调查工具对所调查对所调查对象测指调查工具对所调查对所调查对象测 量的可靠程度(可靠性),及调查工量的可靠程度(可靠性),及调查工 具对同一调查对象多次调查的稳定性具对同一调查对象多次调查的稳定性 或一致性。或一致性。 信度是效度的必要条件(无信度就无效度),但非充分条件(信度好不一定效度好)。 调查研究应尽量做到效度与信度的统一。常采用抽样复查评价调查信度,可根据不同的问题(资料类型)采用不同的统计方法和指标评价调查信度。根据研究目的明确调查范围研究总体 估计样本含量确定调查表和问卷制定统计分析计划估计并分析混杂性偏倚统计和专业结论总体根据研究目的规定研究指标 调查项目防止偏倚的措施预调查修改调查表