1、第二章 现场调查技术第二章第二章 现场调查技术现场调查技术 现场调查设计现场调查设计 现场调查质量控制现场调查质量控制 敏感问题调查技术敏感问题调查技术调查研究概况调查研究概况医学科学研究:实验研究实验研究(experimental research)调查研究调查研究(survey research)实地观察研究(field study)文献研究(document study)调查研究(调查研究(survey researchsurvey research)是指在没有任何干预措施的条件下,客观的观察和记录研究对象的现状及其相关特征,也称观观察性研究(察性研究(observation study
2、observation study)。特点:研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的;不能用随机化分组来平衡混杂因素对 调查结果的影响。实验性研究:因素人为设置因素人为设置,研究 者能主动设置处理因 素,在其它因素控制 下观察因素的效应。调查性研究:因素客观存在因素客观存在,研究者 不能主动设置研究因素,“被动”观察研究因素的 效应。两者的区别是否施加干预两者的联系两者的联系 调查研究可为实验研究提供线索,实验研究还需要通过调查研究加以证实。调查研究 实验研究证实提供线索一、调查研究分类一、调查研究分类 1、全面调查 2、抽样调查 3、典型调查(一)按调查对象的范围分 1
3、、全面调查 也叫普查,是对总体中所有观察单位进行调查,如:我国的人口普查。(一)按调查对象的范围划分 普查没有抽样误差,但其它误差较大,因此,普查需要有严密的组织计划,特别要统一调查时点、统一标准和方法。(一)按调查对象的范围划分2、抽样调查 从总体中随机抽取一定数量的有代表性的观察单位组成样本进行调查,然后用样本资料来推断总体特征。可根据调查目的和调查对象的特点,采用适当的抽样方法。(一)按调查对象的范围划分3、典型调查 又称案例调查。即在对事物作全面分析的基础上,有目的地选择典型的人或单位进行调查。如:调查某个计划生育先进县,总结其计划生育经验教训,以便推广。(二)按调查涉及的时间分按时间
4、顺序分:1、回顾性调查(病例-对照研究)2、现况研究 3、前瞻性调查(队列研究)4、历史前瞻调查按时间长短分:1、横断面调查 2、纵向调查(二)按调查涉及的时间分1、病例-对照研究 是一种通过回顾性调查实现“从果到因”的研究。先选定病例组和对照组,然后分别回顾两组暴露情况,比较其差异,探索可能导致其发病的原因。(二)按调查涉及的时间分2、队列调查 是一种通过前瞻性调查实现“从因到果”的研究。先选定暴露组和对照组,然后在其它条件相同的情况下观察比较其差异,探索疾病发生可能归因与某种暴露因素。(三)按抽取样本的方式分1、概率抽样 (1)简单随机抽样 (2)系统抽样 (3)分层随机抽样 (4)整群抽
5、样2、非概率抽样 (1)偶遇抽样 (2)判断抽样 (3)定额抽样 (3)雪球抽样1.调查目的 尽量节省人力、物力、财力和时间,获得符合专业和统计要求的资料,得出预期结论。调查设计是对调查研究所作的周密计划,是调查结果准确可靠的基础。包括资料收集、整理与分析全过程的设想和科学安排。包括调查计划、组织计划、整理计划和分析计划。2.设计要点:研究目的 拟分析指标 调查项目 二、调查设计二、调查设计 例 某大学欲在本科大学生中开设有关艾滋病的健康教育课程,为更好地设计课程内容,首先对在校大学生进行一次艾滋病知识水平的调查。(一)调查计划(一)调查计划调查内容包括:1、确定调查目的和指标 2、确定调查对
6、象和观察单位 3、确定调查方法 4、确定资料的收集方式 5、拟定调查项目和调查表 6、估计样本含量(一)调查计划(一)调查计划1、确定调查目的和指标 (一)调查计划(一)调查计划明确调查目的参数估计:了解总体参数,说明总体特征推断联系:研究事物之间的关系确定调查指标调查目的通过具体调查指标来体现指标要客观、灵敏度高、精确性好本例:知识知晓率 2、确定调查对象和观察单位 (1)确定总体,划清同质范围 (2)对象要具体,明确时间、地点、人物。(3)明确观察单位,组成总体或样本的个体。(4)本例:在校大学生(一)调查计划(一)调查计划3、确定调查方法 根据调查目的、对象和具备的调查条件来确定调查方法
7、。了解总体特征现况调查 研究相互关系病例-对照研究、队列研究 有限总体(小)全面调查 有限总体(大)抽样调查 无限总体抽样调查(一)调查计划(一)调查计划目的目的描述性研究、分析性研究描述性研究、分析性研究性质性质定性调查、定量调查定性调查、定量调查 来源来源现场调查、利用现有资料现场调查、利用现有资料涉及面涉及面普查、抽样调查普查、抽样调查时间时间横断面调查、纵向调查横断面调查、纵向调查方式方式面对面调查、非面对面调查面对面调查、非面对面调查(一)调查计划(一)调查计划4、确定资料的收集方式 (1)观察法:客观指标的测量、临床检查等均属于观察法。(2)访问法:多为主观指标,通过一定形式的访问
8、获得结果。如直接访问(问卷、访谈、开会等)和间接访问(信访、电话访问、网络访问等)。如:本例可采用问卷式调查法(一)调查计划(一)调查计划5、拟定调查项目和调查表 (1)根据调查指标确定调查项目,包括分析项目和备查项目。分析项目一个也不能少,备查项目不宜多 (2)拟定调查表,将调查项目按逻辑顺序排列成表格,供调查时使用。(一)调查计划(一)调查计划6、估计样本含量 在保证抽样调查结果具有一定可靠性的前提下,确定最少的样本例数。经验法(文献检索)查表法 公式估算法(一)调查计划(一)调查计划组织计划包括:1、组织领导 2、任务分工与联系 3、调查员挑选与培训 4、宣传动员(对象)5、进度设计 6
9、、经费预算 7、调查表和宣传资料的准备和检查(二)组织计划(二)组织计划1、调查员挑选2、调查员的培训 (1)概况 (2)调查的具体内容和任务 (3)介绍一些基本和关键的调查访问技术 (4)模拟调查或访问实习 (5)建立相互联系、监督和管理的方法 (6)预调查,供正式调查和修改调查表参考(二)组织计划(二)组织计划整理计划包括:1、调查表的接收 2、调查表的核查(完整性、逻辑性核查)3、数据编码 4、数据录入 5、拟定整理表(质量分组、数量分组)6、归纳汇总 (三)整理计划(三)整理计划 1.有限总体但总体太大或为无限总体,不可能进行全面调查。调查研究多采用抽样调查 2.抽样调查省时、省力,能
10、迅速获得所需信息。前提:方法科学、得当。3.抽样方法有单纯随机抽样、系统抽样、分层抽样和整群抽样三、常用抽样方法三、常用抽样方法 单纯随机抽样(simple random sampling)也叫简单随机抽样,要求每个观察单位有同等概率被选入样本。用随机数字表法或抽签法。优点:简单直观,指标(均数或概率、标准误)计算简便。缺点:但当总体较大时,实施困难;总体变异大时,代表性不好;样本分散,难以组织调查。适用范围:其它抽样的基础,小型调查。(一)单纯随机抽样 系统抽样(systematic sampling)也叫机械抽样。按照一定顺序机械地每隔若干个观察单位抽取一个观察单位组成样本。优点:简便易行
11、;容易得到按比例分配的样本;样本在总体中分布较均匀。缺点:观察单位按顺序有周期趋势或单调递增(减)时,易产生偏性;样本分散,不易组织。适用范围:个体随机分布个体随机分布。(二)系统抽样 分层抽样(stratified sampling)又称分类抽样。一般先按某种特征将总体分为若干个层(stratum),再在层内随机抽样。优点:抽样误差较小;不同层可采用不同抽样方法;不同层可独立分析。缺点:分层选择不当、层内变异较大、层间均数接近,分层抽样失去意义。适用范围:层间差异较大的对象层间差异较大的对象。(三)分层抽样 分层方式有等比例分配等比例分配和非等比例分配非等比例分配两种。等比例分配等比例分配:
12、大层多抽,小层少抽,各层抽取的比例与该层在总体中所占比例相同。非等比例分配非等比例分配:分层后,各层抽取相同个体组成样本。最优分配分层随机抽样最优分配分层随机抽样:抽样时,除考虑各层在总体中的比例外,还应考虑其变异情况,变异大的层多抽,变异小的层少抽,这样可以减少抽样误差。(三)分层抽样 整群抽样(cluster sampling):将总体划分为若干个群体,再从中随机抽取几个群体组成样本;对抽中群体的全部个体进行调查。优点:便于组织调查,节省人力、物力、时间,容易控制调查质量。缺点:若群间差异较大,抽样误差也较大;样本量一定时,其误差一般大于单纯随机抽样。适用范围:主要用于群间差异小的情形。(
13、四)整群抽样(五)非概率抽样(五)非概率抽样 1、立意抽样(判断抽样)2、偶遇抽样 3、雪球抽样(五)非概率抽样(五)非概率抽样1 1、立意抽样、立意抽样 也叫目的抽样或判断抽样。是研究者根据研究目的和对情况的主观判断来选择和确定调查对象的方法。如:吸毒者吸毒的过程与原因调查 同性恋调查(五)非概率抽样(五)非概率抽样2 2、偶遇抽样、偶遇抽样 又称便利抽样或自然抽样。指调查者根据实际情况采用对自己最为便利的方式来选取样本,可以是抽取偶然遇到的人或选择最容易找到的人作为调查对象。如:医生调查病人对医疗收费的看法 教师调查大学生对艾滋病的知晓程度 记者街头调查等(五)非概率抽样(五)非概率抽样3
14、 3、雪球抽样、雪球抽样 当我们无法了解总体情况时,可以从能找到的少数对象入手,对他们进行调查,并请他们介绍其它符合条件的人,扩大调查面,如此重复下去,直至达到所需样本含量。如:吸毒者、同性恋、性服务者的调查等均可以采取雪球抽样的方法。(一)问卷调查法四、常用调查方法四、常用调查方法问卷调查法邮寄调查法他填问卷调查个别发送法集中填答法自填问卷调查网上调查法 当面访问法电话询问法(二)敏感问题调查法 1 1、释疑法:问题前加消除顾虑文字,调查、释疑法:问题前加消除顾虑文字,调查表注明严格保密及保密措施。表注明严格保密及保密措施。2 2、假定法:用一个假定条件作前提,然后、假定法:用一个假定条件作
15、前提,然后在询问被调查者的看法。在询问被调查者的看法。3 3、转移法:将被调查者回答的问题,转移、转移法:将被调查者回答的问题,转移到由被调查者根据他人情况来阐述自己的想法。到由被调查者根据他人情况来阐述自己的想法。4 4、随机应答技术:常用于估计某种行为、随机应答技术:常用于估计某种行为(如考试舞弊、非婚性行为等)的概率(如考试舞弊、非婚性行为等)的概率第二节第二节 现场调查质量控制现场调查质量控制 调查误差的种类调查误差的种类1.非抽样误差非抽样误差 在全面调查的情况下,可能产生此类在全面调查的情况下,可能产生此类误差。主要包括:误差。主要包括:(1)登记性误差登记性误差 原因主要有记录错
16、误、计算错误、原因主要有记录错误、计算错误、汇总错误、理解误差、调查员与被调查者有意虚汇总错误、理解误差、调查员与被调查者有意虚报瞒报以及调查方案的规定不明确等。报瞒报以及调查方案的规定不明确等。(2)系统误差系统误差 又称偏倚,原因主要有设计方案不又称偏倚,原因主要有设计方案不周密、测量仪器不准确、回答问题的偏倚等。周密、测量仪器不准确、回答问题的偏倚等。2抽样误差抽样误差 误差、偏倚的概念误差、偏倚的概念误差(误差(error):实际值与真值之差;:实际值与真值之差;样本指标与总体指标之差样本指标与总体指标之差非抽样误差(系统误差):非抽样误差(系统误差):仪器未校正、测量者偏差、仪器未校
17、正、测量者偏差、标准不统一(偏高或偏低)引起的误差。标准不统一(偏高或偏低)引起的误差。偏倚:偏倚:观察性研究组间不可比引起的系统误差。观察性研究组间不可比引起的系统误差。抽样误差(随机误差):抽样误差(随机误差):排除系统误差后存在的、由抽排除系统误差后存在的、由抽样引起的误差。样引起的误差。误差的特点误差的特点 系统误差:系统误差:有方向性、系统性、周期性有方向性、系统性、周期性 是错误与不足,应避免是错误与不足,应避免 随机误差:随机误差:随机性、无方向性和系统性随机性、无方向性和系统性 无法消除的机会,应减少无法消除的机会,应减少。系统误差的来源之一系统误差的来源之一 1)来自被观察者
18、(研究对象)来自被观察者(研究对象)2)来自研究者)来自研究者 3)来自实验条件)来自实验条件 系统误差的来源之二系统误差的来源之二 1)设计阶段)设计阶段:研究对象的总体范围界定不清楚研究对象的总体范围界定不清楚 研究项目定义不明确研究项目定义不明确 研究指标选择不恰当研究指标选择不恰当 研究过程中的具体环节考虑不周研究过程中的具体环节考虑不周 系统误差的来源之二系统误差的来源之二2)调查阶段)调查阶段 调查者的工作态度与素质;调查者的工作态度与素质;调查对象是否配合;调查对象是否配合;调查过程中的质量控制调查过程中的质量控制;3)整理与分析阶段)整理与分析阶段 编码过录错误;编码过录错误;
19、汇总、计算中的重复与遗漏汇总、计算中的重复与遗漏;常见偏倚(常见偏倚(bias)偏倚是歪曲研究结果真实性和可靠性的主要原因偏倚是歪曲研究结果真实性和可靠性的主要原因(一)选择偏倚(一)选择偏倚 因选择研究对象的方法存在问题而使研究结果因选择研究对象的方法存在问题而使研究结果偏离真实的情况。偏离真实的情况。1、入院率偏倚、入院率偏倚 2、现患、现患-新发病例偏倚新发病例偏倚 3、无应答偏倚、无应答偏倚(二)信息偏倚(错误分类偏倚)(二)信息偏倚(错误分类偏倚)收集研究对象的(暴露、结局)资料时引起的收集研究对象的(暴露、结局)资料时引起的系统误差。系统误差。1、诊断怀疑偏倚、诊断怀疑偏倚2、暴露
20、怀疑偏倚、暴露怀疑偏倚3、回忆偏倚、回忆偏倚(三)混杂偏倚(三)混杂偏倚 某因素既与所研究的疾病有联系,又与所研究某因素既与所研究的疾病有联系,又与所研究的因素有关,由于该因素的存在掩盖或夸大所研的因素有关,由于该因素的存在掩盖或夸大所研究的因素与疾病之间的联系的现象。究的因素与疾病之间的联系的现象。发生在分析阶段发生在分析阶段。暴露因素暴露因素 疾病疾病 混杂因素混杂因素条件:条件:1)是疾病的危险因素;)是疾病的危险因素;2)与所研究的暴露因素有联系;)与所研究的暴露因素有联系;3)不是暴露与疾病因果链中的中间环节)不是暴露与疾病因果链中的中间环节 常见偏倚的控制措施常见偏倚的控制措施(一
21、)选择偏倚的控制(一)选择偏倚的控制1、了解偏倚的来源,在设计中加以避免;、了解偏倚的来源,在设计中加以避免;2、设立多组对照,多来源选择对象;、设立多组对照,多来源选择对象;3、尽量选择新病例;、尽量选择新病例;4、设法提高研究对象的应答率、设法提高研究对象的应答率(二)信息偏倚的控制(二)信息偏倚的控制1、盲法收集资料;、盲法收集资料;2、尽量收集客观指标的资料;、尽量收集客观指标的资料;3、收集资料的范围可适当放宽;、收集资料的范围可适当放宽;4、严格调查设计、树立良好的科学态度、严格调查设计、树立良好的科学态度(三)混杂偏倚的控制(三)混杂偏倚的控制1、匹配设计、匹配设计2、标准化、标
22、准化3、分层分析、分层分析4、多因素分析、多因素分析 调查的质量控制调查的质量控制1.设计阶段设计阶段(1)必须围绕调查的任务,从实际出发,严密设)必须围绕调查的任务,从实际出发,严密设计调查的总体方案。计调查的总体方案。(2)正确划分调查范围。)正确划分调查范围。(3)正确选择调查指标,明确定义调查项目和调)正确选择调查指标,明确定义调查项目和调查问题。查问题。(4)选择恰当的调查方式,保证调查质量。)选择恰当的调查方式,保证调查质量。(5)广泛听取各方面专家的意见,找出方案中存)广泛听取各方面专家的意见,找出方案中存在的问题,及时修改。在的问题,及时修改。(6)预调查)预调查2资料收集、整
23、理与分析阶段资料收集、整理与分析阶段(1)调查问卷的登记与编码。做到不重不漏,尽)调查问卷的登记与编码。做到不重不漏,尽量减少差错。量减少差错。(2)检查资料的完整性。)检查资料的完整性。(3)检查填报的正确性。检查调查问卷的指标填)检查填报的正确性。检查调查问卷的指标填写有无遗漏,是否符合要求。写有无遗漏,是否符合要求。(4)在数据的计算机录入时,要严格控制录入质)在数据的计算机录入时,要严格控制录入质量。条件许可的话,要由两名工作人员分头作两量。条件许可的话,要由两名工作人员分头作两份输入,称为份输入,称为“双机输入双机输入”。(5)设计一定的计算机程序,对已录入的数据作)设计一定的计算机
24、程序,对已录入的数据作逻辑检查逻辑检查 在医学研究中,经常会遇到一些不受在医学研究中,经常会遇到一些不受被调查者欢迎、或感到尴尬的所谓敏感问被调查者欢迎、或感到尴尬的所谓敏感问题,如一群人中参加赌博的比率,吸毒人题,如一群人中参加赌博的比率,吸毒人的比率,经营中偷税漏税人的比率,学生的比率,经营中偷税漏税人的比率,学生中考试作弊的人的比率?婚前有无性行为中考试作弊的人的比率?婚前有无性行为?推销药品是否给回扣?各种类型的额外?推销药品是否给回扣?各种类型的额外消费、公款吃喝;同性恋及类似的为社会消费、公款吃喝;同性恋及类似的为社会所不赞成的各种事件等问题。所不赞成的各种事件等问题。第三节第三节
25、 敏感问题调查技术敏感问题调查技术敏感问题的概念及分类敏感问题的概念及分类 敏感问题(敏感问题(sensitive problem)是指涉及)是指涉及个人(或单位)的隐私或利益的问题、以个人(或单位)的隐私或利益的问题、以及大多数人认为不便在公开场合表态或陈及大多数人认为不便在公开场合表态或陈述的问题,在某些情况下,还包括一些违述的问题,在某些情况下,还包括一些违法或犯罪的行为。法或犯罪的行为。敏感问题的分类敏感问题的分类 按答案特征可分两大类按答案特征可分两大类 属性特征敏感问题属性特征敏感问题 数量特征敏感问题数量特征敏感问题也称分类特征敏感问题,它被用于了解被调查也称分类特征敏感问题,它
26、被用于了解被调查者是否具有敏感问题的特征,并估计具有敏感者是否具有敏感问题的特征,并估计具有敏感问题特征的人在总体中所占比重,例如是否有问题特征的人在总体中所占比重,例如是否有吸毒行为?是否有婚外性行为?吸毒行为?是否有婚外性行为?数量敏感问题是指被调查者具有敏感问题数额数量敏感问题是指被调查者具有敏感问题数额大小的特征,一般是估计敏感问题数值的均数,大小的特征,一般是估计敏感问题数值的均数,也可称为敏感性均值问题,例如也可称为敏感性均值问题,例如“你有几个婚你有几个婚外性伴侣?外性伴侣?”“”“你每月的工资外收入有多少?你每月的工资外收入有多少?”这类问题,如果直接调查,被调查者这类问题,如
27、果直接调查,被调查者可能拒绝回答,应答率很低,即使问卷上可能拒绝回答,应答率很低,即使问卷上有答案,但答案是否真实,值得怀疑。所有答案,但答案是否真实,值得怀疑。所以,对于敏感性问题,若采用直接调查的以,对于敏感性问题,若采用直接调查的方法,调查者将难以控制样本信息,得不方法,调查者将难以控制样本信息,得不到可靠的样本数据。为了得到敏感性问题到可靠的样本数据。为了得到敏感性问题的可靠的样本数据,必须采取特殊的科学的可靠的样本数据,必须采取特殊的科学可行的方法来提高应答率、降低不真实回可行的方法来提高应答率、降低不真实回答率,以使调查结果真实可靠。答率,以使调查结果真实可靠。u首先是将保密措施坦
28、诚告诉调查对象,取首先是将保密措施坦诚告诉调查对象,取得理解和信任,调查场所要保证没有他人在得理解和信任,调查场所要保证没有他人在场,一般由调查对象自己在调查表上填写;场,一般由调查对象自己在调查表上填写;u其次需要采取一定的其次需要采取一定的技术技术。敏感问题的调查敏感问题的调查调查者一定要态度端庄、和蔼。调查者一定要态度端庄、和蔼。纠正社会上对某此敏感问题的不正确看法或非纠正社会上对某此敏感问题的不正确看法或非议。议。承诺对被调查者的个人隐私进行保密。承诺对被调查者的个人隐私进行保密。涉及敏感问题的调查表,需要严密设计、精心涉及敏感问题的调查表,需要严密设计、精心安排。安排。可用对象转移法
29、或假定法来间接询问敏感问题。可用对象转移法或假定法来间接询问敏感问题。采用匿名自填式问卷进行敏感问题调查。采用匿名自填式问卷进行敏感问题调查。真诚的感谢和适当的奖励。真诚的感谢和适当的奖励。敏感问题的问卷调查法敏感问题的问卷调查法 对敏感性问题的调查方案,关键要使被调对敏感性问题的调查方案,关键要使被调查者愿意做出真实回答,又能保守个人秘密。查者愿意做出真实回答,又能保守个人秘密。一旦调查方案设计有误,被调查者就会拒绝配一旦调查方案设计有误,被调查者就会拒绝配合,所得调查数据将会失去真实性。心理学家合,所得调查数据将会失去真实性。心理学家与统计学家为此设计了一种调查方法,一些统与统计学家为此设
30、计了一种调查方法,一些统计分析方法计分析方法随机化回答技术,也应运而生。随机化回答技术,也应运而生。随机应答技术随机应答技术(Randomized Response Technique,RRT)随机化回答是指在调查中使用特定的随机化装置,使得被调查者以预定的概率来回答敏感性问题。这一技术的宗旨就是最大限度地为被调查者保守秘密,从而取得被调查者的信任。RRT技术的基本原理在于当被调查者确信调查者及其他人无法从被调查者的回答中获知他们的真实行为时,能更加真实地对敏感问题进行回答。并且RRT技术保护调查对象的个人隐私,能充分得到调查对象的配合,最终可显著降低无应答率和误答率,得到高质量的调查结果。随
31、机应答技术随机应答技术 是指在调查中使用特定的随机化装置,是指在调查中使用特定的随机化装置,使得被调查者以预定的概率使得被调查者以预定的概率P来回答敏感性来回答敏感性问题。问题。这一技术的宗旨就是最大限度地为被调这一技术的宗旨就是最大限度地为被调查者保守秘密,从而取得被调查者的信任。查者保守秘密,从而取得被调查者的信任。随机应答技术随机应答技术比如在调查学生考试作弊的问题中,设计外形完全比如在调查学生考试作弊的问题中,设计外形完全一样的卡片一样的卡片n n张,其中张,其中n n1 1张卡片上写上张卡片上写上“你考试是你考试是否作过弊否作过弊?”,n-nn-n1 1张卡片上写上另外的问题。然后张
32、卡片上写上另外的问题。然后放在一盒子里。调查时,由被调查者从盒子里任抽放在一盒子里。调查时,由被调查者从盒子里任抽一卡片,根据卡片上的问题做出回答,至于卡片上一卡片,根据卡片上的问题做出回答,至于卡片上具体是什么问题,调查者无权过问。这样就起到了具体是什么问题,调查者无权过问。这样就起到了为被调查者保密的作用。因而相对于直接问答调查,为被调查者保密的作用。因而相对于直接问答调查,易于得到被调查者的合作。易于得到被调查者的合作。n沃纳模型沃纳模型(Warner model)1965年由Warner提出的,其设计思想是向被调查者显示两个与敏感性问题(具有特征A)有关,但完全对立的问题,让调查者按预
33、定的概率从中选一个回答,调查者无权过问被调查者回答的是哪一个问题,从而起到了为被调查者保密的效果。n西蒙斯模型(西蒙斯模型(Simmons model)1967年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,但有一些改进,它将沃纳模型中与敏感性问题相对的具有特征A的问题改为一个与敏感性问题不相关的其它问题。随机随机化应答模型化应答模型1.向应答者提出一对问题向应答者提出一对问题设计一对问题,使两个问题的答案种数和编码完全一致,应答者随机选取一个问题,将答案编码选出,在答案上做出相应的记号。由于答卷上没有问题的编号,只有一套答案编码,人们无从知晓应答者回答的是哪一个问题,因而起到保密作用。一、随
34、机应答技术的步骤一、随机应答技术的步骤1.向应答者提出一对问题向应答者提出一对问题(1)两个相关联问题模式两个相关联问题模式设计两个相对立的陈述。例如 问题1:你曾经吸过毒吗?是否 问题2:你从未吸过毒吗?是否(2)两个不相关联问题模式两个不相关联问题模式第一陈述为敏感性问题,第二陈述是与第一陈述无关的非敏感性问题,可以得到确切的答案。例如 问题1:你曾经吸过毒吗?是否 问题2:你是工人吗?是否一、随机应答技术的步骤一、随机应答技术的步骤2.设置一个随机装置进行调查设置一个随机装置进行调查使用一个内装许多黑、白两色小球的匣子,黑白球的比例接近1:1,但不等于1:1,例如可以是60%和40%。混
35、合均匀后,被调查者从匣子中随机摸取一球,摸取的是黑球还是白球只有被调查者知道。若摸取的是黑球,则回答第一个问题,否则,回答第二个问题。答卷上只有答案选择,没有题号,可按如下格式设计:“请将你的回答在相应的编号处做上记号:是否”。一、随机应答技术的步骤一、随机应答技术的步骤3.根据概率理论进行计算根据概率理论进行计算(1)问题1:你曾经吸过毒吗?是否 问题2:你从未吸过毒吗?是否假设黑球所占的比例为P,白球所占的比例为1-P,应答者中回答“是”的总比例为r,那么对第一个问题回答“是”的比例RA可以由下式推算:r=PRA+(1-P)(1-RA)RA=r-(1-P)/(2P-1)(1P0.50)一、
36、随机应答技术的步骤一、随机应答技术的步骤3.根据概率理论进行计算根据概率理论进行计算(2)问题1:你曾经吸过毒吗?是否 问题2:你是工人吗?是否假设回答者中工人占的比例为RU,则r与RA的关系为:r=PRA+(1-P)RURA=r (1-P)RU/P一、随机应答技术的步骤一、随机应答技术的步骤(1)先把这项技术的意义、性质和方法,特别是其保密功能,坦诚地告诉调查对象,以取得理解、信任和合作。(2)问卷中设A、B两个问题。(3)备有一个口袋,里面装有黑白两种颜色的球(也可用围棋的黑子和白子),两种球的比例不是1:1,例如可以是60%和40%。(4)调查对象在填写答案前,先随机抽取一个球(球的颜色
37、对调查员保密),据球的颜色决定回答两个问题中的哪一个。例例:欲调查某地已婚育龄妇女有无婚前性行为的比例。欲调查某地已婚育龄妇女有无婚前性行为的比例。(5)由于调查员不知道某一对象抽取的球是什么颜色的,所以无法知道某一对象回答的是问题A还是问题B,也无法知道调查对象的“秘密”。(6)设立两个问题:问题A:婚前有过性行为?回答:是否问题B:婚前没有性行为?回答:是否(7)如果调查对象抽取的球是黑色的,则回答问题A,如果调查对象抽取的球是白色的,则回答问题B。(8)计算调查对象中婚前有性行为者的比例。例例:欲调查某地已婚育龄妇女有无婚前性行为的比例。欲调查某地已婚育龄妇女有无婚前性行为的比例。例例:
38、欲调查某地已婚育龄妇女有无婚前性行为的比例。欲调查某地已婚育龄妇女有无婚前性行为的比例。例例:欲调查某地已婚育龄妇女有无婚前性行为的比例。欲调查某地已婚育龄妇女有无婚前性行为的比例。例例:欲调查某地已婚育龄妇女有无婚前性行为的比例。欲调查某地已婚育龄妇女有无婚前性行为的比例。沃纳的方法虽然比直接提出敏感性问题要好,沃纳的方法虽然比直接提出敏感性问题要好,但所提的两个问题都还具有敏感性。而且,该方法但所提的两个问题都还具有敏感性。而且,该方法中回答中回答A的人数比例不能为的人数比例不能为1/2。1967年西蒙斯对沃年西蒙斯对沃纳模型进行了改进。纳模型进行了改进。西蒙斯模型(西蒙斯模型(Simmo
39、ns model)他所建立的模型与沃纳模型最大的他所建立的模型与沃纳模型最大的不同点:不同点:在于调查人员提出的随机化问题是两个在于调查人员提出的随机化问题是两个不相关的不相关的问题,其中一个为敏感性问题,另一个为非敏感问题,其中一个为敏感性问题,另一个为非敏感性问题性问题B,这样的处理使被调查者的合作态度进一,这样的处理使被调查者的合作态度进一步提高。步提高。设样本中对问题设样本中对问题B(无关问题)回答(无关问题)回答“是是”的人数比例为的人数比例为BA和的含义仍同上。的含义仍同上。西蒙斯模型(西蒙斯模型(Simmons model)对问题对问题A回答回答“是是”的人数比的人数比例例统计结
40、果中回答统计结果中回答“是是”的人的比例,的人的比例,也就是对问题也就是对问题A或或B回答回答“是是”的人的人数比例数比例B1.已知的情况已知的情况 设抽样方式是简单随机有放回的设抽样方式是简单随机有放回的是具有敏感性特征是具有敏感性特征A的人所占的比例。的人所占的比例。Ann 1设总体为设总体为n n的简单随机样本中,有的简单随机样本中,有n n1 1人回答人回答“是是”,则,则,从而得到从而得到则则PPBA)1(的极大似然估计为:的极大似然估计为:(1.2)A其方差为:其方差为:2)1()(nPVarA西蒙斯模型(西蒙斯模型(Simmons model)实践中,实践中,并不总是已知的,例如
41、对于无关问题并不总是已知的,例如对于无关问题“你你是四月份出生的吗是四月份出生的吗?”我们可以通过查有关资料来获得我们可以通过查有关资料来获得 的值,而对于无关问题的值,而对于无关问题“你喜欢蓝色吗你喜欢蓝色吗?”我们就我们就无法预知无法预知 的值,此时的值,此时 就是未知的。因此有必要就是未知的。因此有必要对对 未知的情况进行讨论。未知的情况进行讨论。BBBBBB1n2n1P2P1P12.未知的情况未知的情况敏感性问题占的比例分别为敏感性问题占的比例分别为 和和假设假设总体总体1中回答敏感性问题的人占的比例为中回答敏感性问题的人占的比例为 时时对问题对问题A或或B作出作出“是是”的答复者所占
42、的比例为的答复者所占的比例为假设假设总体总体2中中回答敏感性问题的人占的比例为回答敏感性问题的人占的比例为 对这两个问题作出对这两个问题作出“是是”的答复者的比例为的答复者的比例为2 2P这时需要抽取这时需要抽取两个两个随机样本进行调查。设这两随机样本进行调查。设这两个样本的容量分别为个样本的容量分别为 和和从而得到该敏感问题的估计回答:从而得到该敏感问题的估计回答:211221)1()1(PPPPA其方差为:其方差为:2212212211221)1)(1()1)(1()(1)(nPnPPPVarA敏感性问题调查方法的应用敏感性问题调查方法的应用 某高校在开展关于普及性知识的活动中,某高校在开
43、展关于普及性知识的活动中,要求对学校的学生是否有过性行为这一问题要求对学校的学生是否有过性行为这一问题进行抽样调查。该调查问题具有敏感性,运进行抽样调查。该调查问题具有敏感性,运用通常采取的调查方式,调查根本无法进行,用通常采取的调查方式,调查根本无法进行,因此运用了敏感性问题抽样调查方法,该高因此运用了敏感性问题抽样调查方法,该高校在校生人数为校在校生人数为6000人,随机抽取人,随机抽取1500名学名学生进行抽样调查,且分别运用了以上的两种生进行抽样调查,且分别运用了以上的两种方法,比较统计结果。方法,比较统计结果。采用随机化的回答技术设计了两种用信采用随机化的回答技术设计了两种用信封封装
44、比例一定的问卷,一种问题为:封封装比例一定的问卷,一种问题为:“你你有有过性行为吗?过性行为吗?”;另一种问题为:;另一种问题为:“你你没没有有过性行为吗?过性行为吗?”。在调查时,让同学任意。在调查时,让同学任意选取一个信封并回答上面的问题,当然调查选取一个信封并回答上面的问题,当然调查人员是不知道该同学回答的是哪一个问题。人员是不知道该同学回答的是哪一个问题。第一种方法:第一种方法:提出两个都具有敏感性相关问题提出两个都具有敏感性相关问题 这样同学们根据他们的实际情况回答抽这样同学们根据他们的实际情况回答抽到的问题,与自己的情况一致的则回答到的问题,与自己的情况一致的则回答“是是”;否则回
45、答;否则回答“不是不是”。研究者在设计。研究者在设计问卷时,设计第一种问题占问卷时,设计第一种问题占60%,这样两个,这样两个问题所占的比例比较接近,有助于让被调查问题所占的比例比较接近,有助于让被调查者消除顾虑,我们对收回的问卷进行统计,者消除顾虑,我们对收回的问卷进行统计,结果对两种问题回答结果对两种问题回答“是是”的有的有638人,占人,占样本的比例为:样本的比例为:=638/1500=0.4253第一种方法:第一种方法:提出两个都具有敏感性相关问题提出两个都具有敏感性相关问题已知已知 =638/1500=0.4253,P=60%将它代将它代入入12)1(PPA)21(P1265.016
46、.0 x2)6.01(4253.0A其方差为:其方差为:0041.0)16.02(1500)4253.01(4253.0)12()1()(22PnVarA得到回答第一种问题为得到回答第一种问题为“是是”的人数估计比例:的人数估计比例:这样应用第一种方法估计统计对问题一回答这样应用第一种方法估计统计对问题一回答“是是”的比例为:的比例为:12.65%。标准差的估计值。标准差的估计值为:为:0041.0即即 0.064。我们同样采用随机化的回答技术设计了两种用我们同样采用随机化的回答技术设计了两种用信封封装比例一定的问卷,然而一种问题为:信封封装比例一定的问卷,然而一种问题为:“你有你有过作弊行为
47、吗?过作弊行为吗?”;为了统计的方便我们选择了;为了统计的方便我们选择了 已知已知的情况的情况,即另一种问题设即另一种问题设计为:计为:“你是四月份出你是四月份出生的吗?生的吗?”。显然,第二个问题与我们所要调查的问题无关,显然,第二个问题与我们所要调查的问题无关,而且被调查同学当中是四月份出生的比例我们可以很而且被调查同学当中是四月份出生的比例我们可以很容易从学校教务处学生信息中心收集到,经统计该校容易从学校教务处学生信息中心收集到,经统计该校学生中四月份出生者所占的比例为学生中四月份出生者所占的比例为15.38%。其中设。其中设计的问卷中第一种问题同样占计的问卷中第一种问题同样占60%,统
48、计结果为对两,统计结果为对两种问题回答种问题回答“是是”的有的有206人,占样本的比例为:人,占样本的比例为:BBp第二种方法:第二种方法:提出的两个问题,一个为敏感性问提出的两个问题,一个为敏感性问题,另一个为与调查内容无关的非敏感性问题。题,另一个为与调查内容无关的非敏感性问题。得到回答第一种问题为得到回答第一种问题为“是是”的人数估计比例:的人数估计比例:=206/1500=0.1373,将它代入,将它代入PPBA)1(1263.06.0)6.01(1538.01373.0A0002.0)6.0(1500)1373.01(1373.0)1()(22nPVarA其方差为:其方差为:采用第二种方法得出的对问题一回答为采用第二种方法得出的对问题一回答为“是是”的估计的估计比例为:比例为:12.63%。标准差的估计值为。标准差的估计值为0002.0即即0.014可以看出采用两种调查技术,最终得出的结果是接近的可以看出采用两种调查技术,最终得出的结果是接近的