1、2022-8-111目 录 第一节第一节 调查研究的特点和类型调查研究的特点和类型 第二节第二节 常用抽样方法常用抽样方法 第三节第三节 调查设计的基本内容和步骤调查设计的基本内容和步骤 第四节第四节 调查研究的质量控制调查研究的质量控制2022-8-112 第一节第一节 调查研究的特点和类型调查研究的特点和类型【例【例2-1】苏州大学公共卫生学院卫生统计学教研室苏州大学公共卫生学院卫生统计学教研室于于20062008年主持了国家自然科学基金项目年主持了国家自然科学基金项目“敏感敏感问题的调查设计研究。问题的调查设计研究。该项目于2007年每月随机抽取1周,抽中周每日9点至次日3点,调查上海市
2、区随机抽取的10个男同性恋活动场所的全部(各对象该周内只调查一次)同性恋者的年龄,学历,职业,经济状况,户籍地,性行为的方式、频繁程度、安全套使用率,每月更换性对象的人数,性病、艾滋病知识的知晓程度,是否从事同性性服务及收费情况等,并对调查对象免费检测艾滋病病毒。2022-8-113【问题【问题2-1】(1)例2-1中采用的是什么研究方法?(2)例2-1中采用的研究方法有何特点?(3)例2-1中采用了何种抽样方法?2022-8-114 一、调查研究的特点一、调查研究的特点 没有人为施加干预措施没有人为施加干预措施 不做随机分组不做随机分组 较难控制干扰因素较难控制干扰因素 一般不能下因果结论一
3、般不能下因果结论第一节第一节 调查研究的特点和类型调查研究的特点和类型2022-8-115 二、调查研究的类型二、调查研究的类型 根据抽样比例划分根据抽样比例划分 全面调查(全面调查(complete survey)抽样调查(抽样调查(sampling survey)根据调查时间划分根据调查时间划分 横断面(现况横断面(现况)调查()调查(cross-sectional survey)病例对照研究(病例对照研究(case-control study)队列研究(队列研究(cohort study)2022-8-116 全面调查全面调查 即对研究总体全部(抽样比例为即对研究总体全部(抽样比例为10
4、0%)进行)进行调查,如某病患病率调查,如某病患病率普查普查、全国人口普查。、全国人口普查。优缺点优缺点 能得到总体的参数,不存在抽样误差。能得到总体的参数,不存在抽样误差。由于总体数量庞大,操作时可能会引入系统误由于总体数量庞大,操作时可能会引入系统误差和过失误差差和过失误差 消耗较多的人力、物力和财力。消耗较多的人力、物力和财力。2022-8-117 抽样调查抽样调查 从总体中抽取一定数量的观察单位组成样本,然后用样从总体中抽取一定数量的观察单位组成样本,然后用样本资料的信息对总体进行研究。本资料的信息对总体进行研究。优缺点优缺点 观察例数较少,可节省人力、物力和时间观察例数较少,可节省人
5、力、物力和时间 可获得较为深入细致和准确的资料,减少系统误差和过失可获得较为深入细致和准确的资料,减少系统误差和过失误差产生的机会误差产生的机会 但存在抽样误差,如果过大就会偏离真实值但存在抽样误差,如果过大就会偏离真实值 分类分类 概率抽样调查概率抽样调查 非概率抽样调查非概率抽样调查2022-8-118 横断面调查又称现况调查横断面调查又称现况调查 调查总体某时点断面上的情况,通常是针对一个人群调查总体某时点断面上的情况,通常是针对一个人群的描述性调查,的描述性调查,目的是估计该人群一组变量的代表性目的是估计该人群一组变量的代表性水平,了解该人群的现状水平,了解该人群的现状。病例对照研究病
6、例对照研究 以患所研究疾病的病例和未患该病的合适对象为对照,以患所研究疾病的病例和未患该病的合适对象为对照,分别调查其既往暴露于某个(或某些)危险因子的情分别调查其既往暴露于某个(或某些)危险因子的情况及程度,以判断暴露危险因子与某病有无关联及其况及程度,以判断暴露危险因子与某病有无关联及其关联程度大小的一种观察研究方法。关联程度大小的一种观察研究方法。2022-8-119 队列研究队列研究 选定暴露及未暴露于某个(或某些)因素的两选定暴露及未暴露于某个(或某些)因素的两组人群,追踪其各自的结局,并比较两组人群组人群,追踪其各自的结局,并比较两组人群发病的差异,从而判定暴露因子与发病有无因发病
7、的差异,从而判定暴露因子与发病有无因果关联及关联大小的一种观察性研究方法。果关联及关联大小的一种观察性研究方法。2022-8-1110【例【例2-1】苏州大学国家自然科学基金项目苏州大学国家自然科学基金项目“敏感问题的敏感问题的调查设计研究调查设计研究。该项目于2007年每月随机抽取每月随机抽取1周周,抽中周每日每日9点至次日点至次日3点点,调查上海市区随机抽取的10个男同个男同性恋活动场所性恋活动场所的全部(各对象该周内只调查一次)同性恋者的年龄,学历,职业,经济状况,户籍地,性行为的方式、频繁程度、安全套使用率,每月更换性对象的人数,性病、艾滋病知识的知晓程度,是否从事同性性服务及收费情况
8、等,并对调查对象免费检测艾滋病病毒。2022-8-1111【问题【问题2-1】(1)例2-1中采用的是什么研究方法?(2)例2-1中采用的研究方法有何特点?(3)例2-1中采用了何种抽样方法?2022-8-1112第二节第二节 常用抽样方法常用抽样方法【例【例2-2】苏州大学公共卫生学院卫生统计学教研室苏州大学公共卫生学院卫生统计学教研室于于20052007年主持了国家社会科学基金项目年主持了国家社会科学基金项目“连续连续调查的抽样设计研究调查的抽样设计研究。该项目分别采用几种基本的常用抽样方法,随机抽取苏州大学新校区的部分本科生与硕士研究生,于2006年9月2007年7月连续3次(前后两次调
9、查时间间隔100天),调查分析他们的身体健康状况、学习成绩、考试作弊、生活消费、婚前性行为等指标。2022-8-1113【问题【问题2-2】(1)例2-2采用了哪几种抽样方法?(2)基本的常用抽样方法的概念、特点是什么?(3)对各种基本的常用抽样方法,如何具体操作?2022-8-1114 常用的基本抽样方法常用的基本抽样方法 单纯随机抽样单纯随机抽样(simple random sampling)系统抽样系统抽样(systematic sampling)分层抽样分层抽样(stratified sampling)整群抽样整群抽样(cluster sampling)多多阶段阶段抽样抽样(multi
10、stage sampling)2022-8-1115 单纯随机抽样单纯随机抽样 先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签等方法之一随机抽取n(样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本。2022-8-1116 操作操作 在例2-2的项目中,苏州大学新校区共有硕士研究生5200名,采用单纯随机抽样从中抽取800名调查其婚前性行为。采用常用的随机数字表法,具体操作如下:统一编号统一编号 将5200名研究生统一编号:1,2,5200 确定随机数确定随机数 从附表1随机数字表中任一行、任一列开始向任何方向抄录800多个4位数(因最大编号为4位数),例如
11、从第36行第一列开始向右抄录:0526、9370、6022、3585、1513、9203、;确定样本确定样本 将重复数字、首数大于6的数弃之,得符合要求的800个数2022-8-1117 特点特点 最基本的抽样方法,是其它抽样方法的基础。优点是操作简单,统计量的计算较简便 缺点是当总体观察单位数量庞大时,给观察单位逐一编号甚为繁复,有时难以做到。2022-8-1118 系统抽样系统抽样 又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等距分隔成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第二部分、第三部分直
12、至第n部分内各抽出一个观察单位组成研究样本。2022-8-1119 操作操作 在例2-2的项目中,苏州大学新校区共有本科生15000名,采用系统抽样,从中抽取1500名,调查其学习成绩。具体操作如下:统一编号统一编号 对15000名本科生统一编号:1,2,3,5000;抽一数字抽一数字 本例抽样比例为十分之一,故在110(号)内随机抽得一数字为6;确定样本确定样本 则对应编号为6,16,26,14986,14996的学生被抽中2022-8-1120 特点特点 优点是易于理解、操作简便;被抽到的观察单位在总体中分布均匀,抽样误差一般比单纯随机抽样小。缺点是在某些特殊情形下,会出现偏性或周期性变化
13、;无计算抽样误差的专用公式,一般用单纯随机抽样的公式来代替。2022-8-1121 分层抽样分层抽样 先按对观察指标影响较大的某项或某几项特征,将总体分成若干层(strata),该特征的测定值在层内变异较小、层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。2022-8-1122 操作操作 例2-2的项目中,将苏州大学新校区的学生划分为本科生、研究生2层,每层均采用单纯随机抽样抽取二十分之一的学生调查其身体健康状况 具体操作如下:分层分层 本科生与研究生两层 抽本科生抽本科生 在15000名本科生中采用单纯随机抽样抽取学生750人,具体操作同单纯随机抽样。抽研究生抽研
14、究生 在5200名研究生中采用单纯随机抽样抽取学生260人,具体操作同单纯随机抽样。2022-8-1123 特点特点 优点是抽样误差小;各层可以独立进行统计分析;尤其适合大规模的调查。缺点是事先要对总体进行分层,操作麻烦。根据研究目的,通常按人群的某种特征(性别、年龄、居住条件、文化水平、疾病严重程度等)进行分层。2022-8-1124 整群抽样整群抽样 将总体划分为群(初级观察单位),各群由次级观察单位组成。随机抽取一部分群,调查抽中群的全部次级观察单位。2022-8-1125 操作操作 例2-2的项目中,将苏州大学新校区的学生以班为群,采用整群抽样从中随机抽取38个班,对这38个班的全体学
15、生进行考试作弊情况的调查。具体操作如下:编号编号 苏州大学新校区共有448个班,进行统一编号:1,2,448;随机抽号随机抽号 采用随机数字表法,从448个编号中随机抽取38个编号,操作同单纯随机抽样。确定样本确定样本 这38个编号所对应的38个班构成调查样本。对抽中的38个班的全体学生进行考试作弊情况的调查。2022-8-1126 特点特点 优点是对大规模的抽样调查易于组织和操作,可节省人力财力 缺点是抽样误差较大2022-8-1127抽样误差比较抽样误差比较 分层抽样分层抽样系统抽样系统抽样单纯随机抽样单纯随机抽样整群抽样整群抽样 四种抽样方法各有优缺点,在实际中常常是将四种基本的常用抽样
16、方法综合运用于多阶段抽样中。2022-8-1128 在例在例2-2的项目中,采用分层三阶段随机抽样方法调查的项目中,采用分层三阶段随机抽样方法调查学生的月生活消费,抽样步骤如下:学生的月生活消费,抽样步骤如下:分层分层 将苏州大学新校区的全体学生划分为本科生、研究生2层;第一阶段第一阶段 分别在本科生、研究生层内采用单纯随机抽样各抽取4个学院(一级观察单位,或称大群)第二阶段第二阶段 分别在各层各抽中学院采用单纯随机抽样共抽取80个班(二级观察单位小群);第三阶段第三阶段 分别在各层各抽中学院各抽中班采用系统抽样共抽取2000名学生(三级观察单位),调查他们的月生活消费。多阶段抽样多阶段抽样2
17、022-8-1129 例题分析例题分析 例2-1项目中,首先在上海市区全部男同性恋活动场所随机抽取随机抽取10个场所个场所;再在随机抽取的调查时间调查时间里里调查10个场所的全部对象全部对象。调查对象分布在场所-时间两维空间里,属于从场所-时间两维空间里整整群随机抽样群随机抽样。(该项目于2007年每月随机抽取1周,抽中周每日9点至次日3点进行调查)2022-8-1130第三节第三节 调查设计的基本内容和步骤调查设计的基本内容和步骤【例【例2-3】安徽省疾病预防与控制中心、安徽医科大学卫生管理学院,于2005年联合开展了安徽省农民心血管疾病相关行为因素的调查研究。本研究采用5阶段随机抽样调阶段
18、随机抽样调查查,寻找出了安徽省农民心血管疾病的相关行为影响因素,研究结果发表在中国农村卫生事业管理杂志2006年第三期。【问题【问题2-3】(1)例2-3研究项目中,调查设计应包括哪几个基本步骤?(2)调查设计有哪些基本内容?2022-8-1131 调查设计的基本步骤调查设计的基本步骤 调查准备阶段的设计调查准备阶段的设计 调查实施阶段的设计调查实施阶段的设计 调查总结阶段的设计调查总结阶段的设计2022-8-1132 调查准备阶段的设计调查准备阶段的设计 明确调查目的和指标 确定调查对象和观察单位 选择调查方法与技术 估计样本大小 编制调查表 评价问卷的信度和效度2022-8-1133 调查
19、实施阶段的设计调查实施阶段的设计(制定资料的收集计划)制定调查人员培训方案 确定资料的收集方式 调查总结阶段的设计调查总结阶段的设计(制定资料的整理与分析计划)问卷的接受与核查计划 调查资料的计算机录入计划 资料的分组计划 统计分析计划2022-8-1134 明确调查目的明确调查目的 了解参数(总体的指标),用以说明总体特征 比较事物,用以优化方案或探索影响因素 研究变量之间的关系,用于预测或控制一、明确调查目的和指标一、明确调查目的和指标2022-8-1135选定调查指标选定调查指标 指标要具体指标要具体 指标要精选指标要精选 指标要客观,指标要客观,尽量不用或少用主观指标 指标的精确性指标
20、的精确性(包含准确度与精密度)要高要高 准确度反映了观察值与真值的接近程度,主要由系统误差引起 精密度反映了观察值与其均值的接近程度,主要由随机误差引起 指标的特异度、灵敏度要高指标的特异度、灵敏度要高2022-8-1136二、确定调查对象和观察单位二、确定调查对象和观察单位 确定调查对象确定调查对象 根据调查目的确定调查对象根据调查目的确定调查对象,即明确调查总体的同质范围。确定观察单位确定观察单位 调查总体或样本由观察单位组成。观察单位也称个体,可以是一个人、一个病例、一个家庭、一个群体。例2-3的调查项目采用五阶段随机抽样,观察单位明确如下:县为一级观察单位;乡为二级观察单位;村为三级观
21、察单位;农户为四级观察单位;农民为最基本的观察单位。2022-8-1137三、选择调查方法与技术三、选择调查方法与技术 选择合适的调查方法选择合适的调查方法 根据调查目的确定根据调查目的确定 现况调查方法 病例对照研究或队列研究方法 根据调查对象的范围确定根据调查对象的范围确定 全面调查、一阶段单纯随机抽样调查和系统抽样调查(总体不大)整群抽样调查或多阶段抽样调查(总体较大)根据具备的调查条件及总体的特征来确定根据具备的调查条件及总体的特征来确定 分层抽样调查(总体观察单位间变异程度很大)2022-8-1138 敏感性问题的调查敏感性问题的调查 所谓敏感性问题是指高度私人机密性或大多数所谓敏感
22、性问题是指高度私人机密性或大多数人认为不便在公开场合表态及陈述的问题。人认为不便在公开场合表态及陈述的问题。例如吸毒、卖淫、酒后驾驶、逃税、灰色收入、例如吸毒、卖淫、酒后驾驶、逃税、灰色收入、婚前性行为、性病、艾滋病、考试作弊、同性婚前性行为、性病、艾滋病、考试作弊、同性恋等等恋等等。采用通常的调查方法来调查敏感性问题,会产采用通常的调查方法来调查敏感性问题,会产生无应答偏倚或故意说谎偏倚,得不到真实的生无应答偏倚或故意说谎偏倚,得不到真实的结果!结果!2022-8-1139 对象转移法对象转移法 如将如将“您一周过几次性生活?您一周过几次性生活?”,改为,改为“有人认为有人认为正常成年男子一
23、周适宜过正常成年男子一周适宜过3 3次性生活,也有人认为每天适次性生活,也有人认为每天适宜过宜过1 1次性生活,您同意那种观点?次性生活,您同意那种观点?”假定法假定法 如将如将“您同意我国计划生育政策吗?您同意我国计划生育政策吗?”,改为,改为“假假定我国人口政策不限制生育,您愿意有几个孩子?定我国人口政策不限制生育,您愿意有几个孩子?”随机应答技术(随机应答技术(randomized response technique)2022-8-1140二项选择敏感问题二项选择敏感问题Simmons随机应答技术随机应答技术1 12 21 11 11 12 21 12 21 12 21 12 2是否有
24、同性恋倾向?是否有同性恋倾向?是否上过大学?是否上过大学?否回答敏感问题的回答敏感问题的1号小球所占号小球所占比例为比例为P,具有无关非敏感问具有无关非敏感问题题B的个体所占的比例的个体所占的比例R已知已知或通过专门调查获得或通过专门调查获得.是2022-8-1141 计数资料计数资料 计量资料计量资料22dpqun p:某病现患率 q=1p d:容许误差:总体现患率P-样本现患率p222dsun s:样本预期标准差 d:容许误差:总体均数与样本均数之差四、确定样本大小四、确定样本大小2022-8-1142五、编制调查表五、编制调查表 确定调查项目确定调查项目 分析项目分析项目 是直接用于整理
25、计算调查指标所必须的内容 备查项目备查项目 为了保证分析项目填写得完整、准确,便于对其进行核对、更正或补充而设置备查项目,通常不直接用于分析 其他项目其他项目 大型调查表的前言:说明调查目的,希望取得被调查者的合作,对调查内容保密的承诺,以消除被调查者的思想顾虑等等 表底附注:标明某些易曲解或有歧义的项目的涵义和统一填写的标准。2022-8-1143 问卷的提问方式问卷的提问方式 封闭式封闭式 注意 不要使调查对象找不到适合自己的答案;以调查对象只能选到一种答案为宜 优点 答案标准化,易于回答,节约时间,拒答率低,记录、汇总、分析方便。缺点 调查对象容易随意选答而失真,不能获得封闭答案以外的信
26、息。2022-8-1144 开放式开放式 适用于答案太多无法一一列出;或者研究设计者对答案知晓较少的情况,如在预调查时可采取开放式提问。优点 能够调动被调查者的主观能动性,使调查者获取丰富的和事先未知的信息。缺点 健谈者容易离题,懒惰者怕动脑筋而拒答。花费的调查时间长,答案不统一,不易归纳、整理和分析,也不便相互比较。2022-8-1145 问卷的提问原则问卷的提问原则 简单明了简单明了 避免混淆和模糊词语避免混淆和模糊词语 避免模棱两可或可能误解的问题避免模棱两可或可能误解的问题 避免诱导或强制避免诱导或强制 尽量使用短句尽量使用短句2022-8-1146 医学伦理学、敏感问题的处理医学伦理
27、学、敏感问题的处理 医学伦理学问题医学伦理学问题 要高度关注医疗公正问题,要有维护调查对象权益、尤其是调查知情权的意识 要尊重调查对象的自主权,不能通过行政命令强迫接受调查 要有保护调查对象隐私的措施和纪律,要有因调查泄密致使调查对象遭受损失的责任追究和赔偿制度。2022-8-1147 敏感性问题敏感性问题 主要面临两方面的问题:主要面临两方面的问题:调查对象回答不真实的问题调查对象回答不真实的问题 传统的处理方法包括委婉询问法、改良问卷调查法、启迪教育式询问法等。科学调查方法是采用随机应答技术 保护调查对象隐私的问题保护调查对象隐私的问题 按医学伦理学问题处理2022-8-1148 调查项目
28、在调查表上的安排顺序调查项目在调查表上的安排顺序 首先要符合逻辑顺序首先要符合逻辑顺序 一般问题在前,特殊问题在后一般问题在前,特殊问题在后 易答问题在前,难题在后易答问题在前,难题在后 敏感问题放在最后敏感问题放在最后 调查表调查表 把调查项目按提问的逻辑顺序列成表格,供调把调查项目按提问的逻辑顺序列成表格,供调查时使用就是调查表查时使用就是调查表 2022-8-11492022-8-1150六、问卷的信度和效度评价六、问卷的信度和效度评价 信度(信度(reliability)即测量工具的可靠性,即测量工具的可靠性,它是指采用相同测量工具(如问卷)对同一对象进行重复测量时,各次测量值与其均值
29、接近的程度。常用的信度指标常用的信度指标 重复测量信度、复本测量信度、折半测量信度、重复测量信度、复本测量信度、折半测量信度、内部连续性测量信度等内部连续性测量信度等2022-8-1151 效度(效度(validity)是指测量工具、指标或观测结果在多大程度上是指测量工具、指标或观测结果在多大程度上反映了事物的客观真实性反映了事物的客观真实性,即指观测结果与试图达到的目标之间的接近程度,是对测量工具(如问卷)有效性的检验。效度的评价指标效度的评价指标 表面效度,内容效度,结构效度,标准关联效表面效度,内容效度,结构效度,标准关联效度等度等2022-8-1152七、制定资料的收集计划七、制定资料
30、的收集计划 制定调查人员培训方案制定调查人员培训方案 培训内容包括培训内容包括 宣讲调查的目的、意义及培训与调查的作用,以提高科研认识和增强责任心 认真学习和详细解释调查表的项目与问题,使每一名调查员完全熟悉和充分理解每项调查内容、每个调查问题 统一每个项目的解释标准、调查时间,特殊项目需统一询问语气及技巧等,提高调查员的现场调查技能2022-8-1153 确定资料的收集方式确定资料的收集方式 直接检测 访谈 电话调查 信访 集中调查法2022-8-1154 八、制定资料的整理与分析计划八、制定资料的整理与分析计划 问卷的接受与核查问卷的接受与核查 问卷核查 完整性核查 逻辑核查 数据的计算机
31、录入数据的计算机录入 资料的分组资料的分组 统计学分析统计学分析 医学专业分析医学专业分析2022-8-1155九、制定调查的组织措施九、制定调查的组织措施 组织领导 宣传发动 时间进度 培训管理 分工协调 经费预算 现场安排2022-8-1156第四节第四节 调查研究的质量控制调查研究的质量控制 调查的数据会存在误差,包括随机误差和非随机调查的数据会存在误差,包括随机误差和非随机误差误差 随机误差主要有随机误差主要有抽样误差抽样误差(虽不可避免,但可控制)(虽不可避免,但可控制)非随机误差非随机误差 过失误差(错误,不允许出现)过失误差(错误,不允许出现)系统误差(偏倚)系统误差(偏倚)是调
32、查研究中影响质量的一个突出问题,是调查过程中由是调查研究中影响质量的一个突出问题,是调查过程中由于各种人为的或偶然的因素造成的于各种人为的或偶然的因素造成的 它涉及到设计人员、调查人员和调查对象,贯穿于调查设它涉及到设计人员、调查人员和调查对象,贯穿于调查设计、资料搜集、整理和分析的全过程计、资料搜集、整理和分析的全过程 2022-8-1157 调查设计阶段调查设计阶段 严格的设计 随机化和盲法 齐同可比 匹配设计 预调查 广泛听取专家的意见。2022-8-1158 资料收集、整理、分析阶段资料收集、整理、分析阶段 1.严格选择和培训调查员。2.加强项目管理者的抽查监督。3.对调查问卷的登记与
33、编码,做到不重不漏,防止差错。4.及时检查资料的完整性。5.及时检查填报的正确性。6.杜绝调查员弄虚作假、伪造填表现象,一经发现,严肃处理。2022-8-1159 7.数据“双机录入”,控制录入质量。8.设计计算机程序,对录入数据作逻辑检查 9.分层分析 10.采用率的标准化方法 11.采用多变量分析 Logistic回归分析 Cox比例风险模型分析2022-8-1160知识点回顾知识点回顾调查设计的基本内容:1.明确调查目的和指标;2.确定调查对象和观察单位;3.选择调查方法与技术;4.估计样本大小;5.编制调查表;6.评价问卷的信度和效度;7.制定资料的收集计划;8.制定资料的整理与分析计划;9.制定调查的组织措施。2022-8-1161