1、社会调查研究方法第一章 导论 调查研究是当前普遍使用的一种社会研究方法,主要包括抽样、问卷设计、访谈(邮寄问卷)和数据处理等几个步骤。本书将深入探讨这些步骤的操作规则与技巧,旨在为那些希望搜集、分析或使用调查资料的读者提供一个工作手册。第一节 调查研究概述一、调查研究方法的界定 首先,询问作为调查研究的基本要素,是一个科学测量过程。其次,选取有代表性的被访者,是调查研究成功的关键。最后,资料的统计分析是完成调查研究的必要环节。二、调查研究发展简史 按时间顺序,调查研究的发展大体可以划分为近代和现代两个阶段。近代调查研究主要包括行政统计和社会问题调查,而现代调查研究则主要包括民意测验、市场调查和
2、研究性调查。虽然存在着多种调查形式,但从内在发展脉络看,无论是在近代还是现代,始终贯穿着实地观测和统计量化两条线索。(一)近代调查研究 调查研究肇始于近代的行政统计调查。在调查中,研究者大量采用参与观察、访谈和问卷调查等实地观测方法,搜集第一手经验资料,给调查研究打上了鲜明的经验性社会研究的烙印。但这些调查大多没有明确的理论框架,因此调查结果很难形成一般的社会理论。另外,在获取调查对象时,这些调查也缺少科学的抽样方法。(二)现代调查研究 研究性调查模式的确立 抽样方法的完善 问卷与多变量分析技术的提高三、调查研究的局限性 首先,缺少弹性。其次,无法了解被访者具体的生活情境。再次,容易受到人为因
3、素的影响。作为一种测量过程,标准化测量和概率抽样使调查研究具有较高的信度,但标准化测量、情境缺失和人为因素的影响,却使其效度较低。采用调查研究方法,始终要对它固有的或可能的局限性有清醒的认识,注意在每一个具体的研究项目中努力克服它们。克服调查研究局限性的一个有效方法,就是将它与其他研究方法的结合使用,特别是与实地观察研究的结合,这样就能取长补短,大大提升研究结果的效度。第二节 调查研究的分类一、按调查对象的范围分类 按调查对象涉及的范围分类,可以将量化调查研究分为普查和抽样调查两种形式 普查指的是对构成总体的所有个体无一例外地逐个进行调查。抽样调查即是从所研究的总体中,按一定规则抽取部分元素进
4、行调查,并根据调查结果,对总体情况进行推断。二、按调查目的分类 问卷调查主要用于描述性和解释性研究 描述性调查就是对总体特征的分布情况进行详细的描述,它关注的焦点集中在事情是如何发生的,有谁牵涉在里面。解释性调查就是希望找出事情发生的原因,它关注的是事情为什么会以现在这个样子呈现出来。三、按执行方式分类 自填问卷(self administered questionnaires)当面访问(face to face interview)电话访问(telephone interview四、按时间维度分类 按进行调查的时点,量化调查研究可以分为两大类:单一时点的横剖调查(cross sectiona
5、l study)多重时点的纵贯调查(longitudinal study)五、按应用领域分类 民意调查(poll或public opinion poll)市场调查(marketing research)社会问题调查 居民家计调查 学术性专业调查第三节 调查研究的一般过程 调查研究是一种标准化程度较高的研究方法,其实施过程有一套相对固定的程序。如果按调查工作的性质来划分,大体上可以将调查过程分为设计和执行两大阶段。在调查设计阶段,主要的工作包括明确调查目的、内容和调查总体,决定搜集资料的方法,设计抽样方案和调查问卷等。而在执行阶段,则主要是实际抽取访问对象、资料搜集、进行资料处理和报告调查结果等
6、。一、调查设计调查设计主要包括三方面内容:调查工作的总体规划 抽样设计 资料搜集和处理方案二、实地抽样 首先是训练抽样人员。其次,与抽样方案中的各级抽样单位取得联系。第三,具体执行抽样工作。第四,检查样本的正确性三、资料搜集(一)调查访问 首先,招募访问员。其次,培训已录用的访问员。第三,与被访者取得联系。第四,进行实地访问。最后,对访问过程和问卷进行复查。(二)自填问卷 自填问卷采用的是通过邮局或派专人将问卷发送给被访者的形式来搜集资料的方法。这种方法所面临的最大挑战是回收率偏低,相比之下,邮寄问卷的回收率更低。因此,采用邮寄问卷方法时,一般应保证有较大的样本量。四、资料处理 资料搜集完成后
7、,还必须对资料进行处理,由于调查对象的数目巨大,因此资料处理都是通过计算机完成的。利用计算机处理问卷资料,先得给每个变量的每个相关类别一个独一无二的编码;然后用计算机软件录入数据,五、撰写报告 调查研究的最后一步是撰写调查报告。一种形式的调查报告是对调查数据的说明,包括对调查抽样、问卷、资料搜集过程、数据编码的说明,以及对数据信度和效度的分析结果、调查局限性的分析。第二章 基本抽样方法 基本抽样技术是指调查研究中,设计抽样方案所依赖的一些基本设计要素。具体说来,这些基本抽样技术包括抽样框的制定、一阶段抽样、多阶段抽样、估计抽样误差和确定样本规模。第一节 调查总体与抽样框抽样一般包括以下几个步骤
8、:确定总体(population)抽样框(sampling frame)制定抽样方案 实际抽取样本 评估样本质量。第二节 一阶段抽样 在抽样中,如果样本是一次直接从抽样框中抽出的,则称之为一阶段抽样。它是最基本的抽样方法,其他形式的抽样方法都是在此基础上发展出来的。一、简单随机抽样 简单随机抽样(simple random sampling)也称纯随机抽样,是严格按照随机原则从含有N个单位的总体中抽取n个单位组成样本(Nn),在抽样过程中总体的每个单位都有同等的机会入选样本,而且每个单位的抽取都是相互独立的。主要方法:抽签法 随机数法二、系统抽样 实际抽样中经常采用的是系统抽样(systema
9、tic sampling),又称机械抽样,即将N个总体单位按一定顺序排列,然后先随机抽取一个单位作为起始单位,再按某种确定的规则抽取其他n-1个样本单位。(一)整数抽样间距(二)非整数抽样间距(三)总体单位的排列三、分层抽样 分层抽样(stratified sampling)也称类型抽样,是先将总体N个单位,按某种特征划分成若干个子总体,称为层,然后在每个层中分别独立地进行抽样,最后,将抽出的子样本合起来构成总体的样本。(一)样本量在各层的分配 最常见的样本量分配方式是按比例分配(proportional allocation),即各层的子样本单位在总样本中所占的比例,与各层单位在总体中所占的
10、比例完全相同。(二)层的划分 理论上,按调查目标变量进行分层是最好的,但在调查之前目标变量的值是不知道的,因此只能是根据与目标变量最相关的辅助变量进行分层,常用的辅助变量包括性别、年龄、职业、教育程度、收入、地域、民族和宗教等。(三)分层抽取样本的方法在分层抽样中,有两种常见的样本抽取方法。一种方法是先将所有总体元素按分层变量进行分层,并计算各层在总体中的比例。接着如果采用等比例分层抽样,则直接将总体比例视为样本比例;如果采用不等比例分层抽样,则需要对样本比例做一定的调整。最后,再按确定的样本比例,用简单随机或系统抽样方法,抽出适量的样本元素。另一种方法适用于等比例分层抽样。先将所有总体元素按
11、分层变量进行分层,然后将各层的总体元素一层一层连续排列,最后对连续排列的总体元素进行等距抽样。四、整群抽样 整群抽样(c1uster sampling)是先将总体划分成若干个群(视为初级单位),每个群包含若干个次级单位,然后以一定方式从总体中抽取一部分群,并由中选群中的所有次级单位构成总体的样本。(一)群的性质 群的划分可以遵循以下原则:群内方差尽可能大,群间方差尽可能小,即群内各单位的差异尽可能大,群与群之间的差异尽可能小。这个原则与分层原则恰好相反,简言之,异质的群,同质的层。(二)规模不等的群 为了保证样本单位满足等概率原则,可以采取相应措施来控制样本规模的变动。一方面可以按群的大小进行
12、分层,然后对各个层使用相同的抽样比。第三节 多阶段抽样一、按规模分层抽样 在多阶段抽样中,最初从总体中抽出的群被称为初级抽样单位(primary sampling unit,PSU),如果PSU的规模相等,用简单随机抽样或等距抽样方法,直接进行第二阶段的抽样,这时第二级单位是等概率入样的,而且样本规模是常数。这个原则也适用于更多阶段的抽样。二、PPS抽样 在PPS抽样中,第一阶段抽样即抽取PSU的阶段,要先放弃等概率抽样条件,采用“概率与规模成比例”(probability proportional to size,PPS)的方法,即赋予规模不等的群与其规模(或辅助变量)成比例的入样概率。这样
13、一来,规模大的群以大概率入样,规模小的群以小概率入样。由于抽取PSU的过程是不等概率抽样,因此如果要保证总抽样比不变,就需要以一个固定的样本规模从抽中的PSU内抽取样本单位。因为如果抽取的单位规模对每个PSU都一样,那单位入样的概率就会与群的规模成反比。这样大概率抽取群,小概率抽取样本单位,一大一小相互抵消,就保证了总体单位抽取的等概率性。与此同时,由于不论PSU大小,都抽取固定规模的样本单位,于是也控制了样本规模的变动。三、规模测量值 进行PPS抽样的一个前提条件是要在具体抽样前,知道各级抽样单位的规模。可是在抽样前一般无法确切知道抽样单位的实际规模,为了能使用PPS方法,只能代之以各级抽样
14、单位规模的估计值M,称为规模测量值(measure of size)。估计值可以从离调查时点最近的一次普查资料或其他统计资料中查找到。第四节 抽样误差与样本规模 实际抽样中,影响样本代表性的有两类误差:抽样误差和非抽样误差。其中抽样误差是一种随机误差。抽样中的随机误差并非都是抽样误差,有些可能是由于调查人员的失误引起的非抽样误差。它是由于样本范围与总体范围的差异而引起的误差,无论抽样设计多么精致,都会产生抽样误差。不过在概率抽样中,抽样误差是可以估算出来的。一、简单随机抽样的抽样误差 放回简单随机抽样 不放回简单随机抽样 标准误差的意义二、简单随机抽样的样本规模 样本规模又称样本容量,是指样本
15、中所包含元素的数量。样本规模一方面会影响到样本的代表性,另一方面,则直接影响到调查成本的大小。太小的样本其代表性可能较差,但太大的样本又会增加不必要的成本。因此,在实际抽样中,选择合适的样本规模是非常重要的。(一)影响样本规模的因素 首先,抽样精度是指抽样中希望达到的精确度,其实就是能够容忍的抽样误差e。其次,总体标准差是反映总体元素间异质性程度的指标,一般说来,在给定抽样精度后,总体异质性程度越小,所需样本规模也越小,反之亦然。第三章 抽样实务及问题 基本抽样方法是一种理想设计,实际抽样通常会与理想设计有一定的偏离。根据实际环境来设计抽样方案,正是抽样实务要解决的问题。第一节 区域抽样 区域
16、抽样是一种实用的抽样方法,它能为抽选居民住户提供很好的抽样方法。以往的常用区域抽样方法,通常是按户籍资料进行PPS抽样。而按居民居住地的地图进行的抽样,则是近年流行起来的一种区域抽样方法。一、按户籍资料PPS抽样 计算总的抽样比 确定各级抽样单位和计划样本规模 对PSU分层和确定层内计划样本规模 在层内抽取PSU 在PSU内抽次级抽样单位 对PPS抽样过程的说明二、从住户中抽取被访者一般说来,多阶段抽样设计的最后一级抽样单位往往是居民住户,但所抽到的居民住户大多是由多名成员构成的。填写住户成员情况 根据抽样表抽取被访者三、按居住地地图法抽样(一)对抽样区域分层(二)选定进行抽样的地图(三)选出
17、地图上的坐标点(四)训练访问员(五)访问员实地确定坐标点(六)抽取居民住户第二节 随机数字拨号抽样 随机数字拨号是一组几率抽样的技术,它最大的优点就是在抽样时,并不一定要具备一个描述完整的抽样框;而它最大的缺点是会遗漏未装电话的家户单位。随机数字拨号可以使用人工或电脑的方式来完成。一、搜集相关信息(一)搜集电话局编码(二)确定电话局编码的线路数量(三)确认无效号码的范围二、随机数字拨号的技术(一)随机数表(二)数字添加技术(三)电脑辅助电话访谈(四)二阶段随机数字拨号第三节 非抽样误差一、抽样框误差 抽样设计中,由于不完备的抽样框引起的非抽样误差,通常被称之为抽样框误差。在实际抽样中,造成抽样
18、框误差的原因是多方面的,包括目标总体单元的丢失或增添、抽样框与目标总体存在复合连接等。(一)误差类型及消除办法 首先,抽样框丢失了本该列入的目标总体单元,即在编制抽样框时,没有将所有总体单元都编进抽样框。其次,抽样框包含了不应该列入的目标总体单元,即在编制抽样框时,将一些本来不符合调查条件的单元编进了抽样框。最后,抽样框与目标总体存在着复合连接,即抽样框中的单元与调查总体中的单元不是一一对应关系,一个抽样框中的单元可能与多个总体单元相连接,或反过来一个总体单元连接多个抽样框中的单元。(二)流动人口的抽样 从目前国内开展的调查实例看,流动人口引起的抽样框误差问题比较突出。流动人口引起的抽样框误差
19、是指抽样框丢失了本该列入的调查对象所引起的误差。解决流动人口抽样中的问题除了采用按集体户和门牌号码抽样外,分层调查并加权抽样和区域抽样也是可行的解决方案。(三)追踪调查中的样本轮换 追踪调查通常需要确定一个相对固定的样本,然后,根据研究需要连续追踪调查这个样本中的个体,这些个体至少被调查两次。通过固定样本对个体进行常规的追踪,不仅可以连续地获得信息,而且还不要求个体对过去的事情进行回忆,这无疑可以减少观察误差。不过固定样本存在着个体消失或“出生”问题,而样本规模的减少或增加会降低估计量的精度。除了样本中个体的消失外,追踪调查中的个体“出生”的情况也是很普遍二、无回答误差 无回答误差是抽样设计中
20、,由于各种原因没能够对被抽出的样本单位访问成功,从而没有获得有关这些单位的信息,进而由于数据缺失产生的估计偏差。无回答可按其性质分为无意无回答和有意无回答,前者为随机误差,后者则为系统误差,比较起来后者产生的偏差更为严重。(一)地址不准确及解决办法 解决“找不到”式无回答误差的一个有效办法是按门牌号码抽样。也就是说,在PPS抽样中,当抽样进入到居委会这一级时,不按户籍资料抽取住户,而是按照门牌号码抽取住户。(二)访问时不在家及解决办法 解决“访问时不在家”问题的办法是加大入户抽样的监控力度,首先,入户抽样与入户调查相分离。其次,保证20%的回访率。(三)拒访及解决办法“拒访”的发生一方面可能是
21、由于调查对象生病或太忙没时间等客观原因,另一方面也可能是由于调查对象对调查不感兴趣或出于安全考虑等主观原因。从当前各种拒访类型的发生情况看,拒绝访问员入户是比较突出的。解决此类“拒访”的有效解决办法就是动员政府资源。第四章 题目设计方法 正如导论中对研究过程的介绍那样,社会研究的量化测量涉及概念的操作化、题目设计和实地测量等几项内容。本章讨论的内容是题目设计,即将测量指标设计成题目的过程。需要强调的是,测量指标并不等于就是题目,设计题目不仅需要遵循一定的原则,也还需要掌握一定的技巧。第一节 题目的类型一、开放式题目 开放式题目没有提供给被访者固定的答案类型,被访者要完全自主地回答询问,访问员或
22、被访问者自己详细记录的答案,在资料处理时将被整理成特定的类型。封闭式题目则不仅提出询问,而且还尽可能地将全部有意义的答案选项提供给被访者,被访者只要从这些答案中选出代表其目前状况的答案即可。复选题 排序题 是否选择 评定尺度 语义差异第二节 事实和行为题目一、明确测量目标二、澄清概念和术语 通过定义澄清题目用词含混不清的地方 用多个题目来分解复杂的概念定义 生僻术语的处理方法三、帮助被访者确定信息 不确切知道相关事件的信息 忘记了回答题目的信息 无法确认题目的时间框架四、减少社会遵从效应 给敏感题目提供背景信息 设计辅助题目 调整答案详略程度 随机回答法第三节 主观状态题目 一、主观测量与标准
23、化 所谓主观题是指对人们主观状态的测量,即测量人们的态度、情感、意见、判断、意向等。在上面有关客观事实题目的讨论中提到,即使题目涉及的事件很复杂,如果能通过对概念或术语的界定,说清楚题目是什么意思,并将有关定义以一致的方式加以传达,而所设计的题目可以让人有能力也愿意回答,这样得到的答案,就可以通过与实际记录的对比,知道答案正确与否。二、对人或事物的评价 界定评价对象 连续量表的设计原则 连续量表的特征三、对某种观点的看法 明确比较的观点“同意不同意”四、知识状况的调查 对被访者知识状况的调查,是另一种形式的主观测量。知识状况调查的一个直接目标,是甄别出那些认为自己对某项议题比较熟悉的被访者。然
24、后通过分析比较,看看这些自认为熟悉议题的被访者,与其他被访者在想法或行为上有何差异。第四节 指数与量表 在调查访问中,事实和行为题目比较具体直观,单一测量指标往往就能涵盖全部意义。相比之下,主观状态题目要复杂一些,人们对其含义的理解经常会产生歧义。这时如果能采用多个指标进行测量,通常能收到比较好的效果。而指数与量表则是实施多个指标测量的有效工具。一、多个指标测量 在调查访问中,与单一指标测量相比,多个指标测量具有两个显著的优点。首先,多个指标所涉及范围要比单个指标大了许多,因此能实现更加详细的测量目标。而在测量目标不变的情况下,多个指标测量能大大减轻被访者的负担。其次,在多个指标测量中,由于最
25、终测量 结果反映的是多个指标的特点,因此减少了结果的变异性,进而提高测量质量。二、指数 指标的选取 指标的加权 处理缺失值三、总加量表(一)总加量表的含义 总加量表由一组陈述项目以及相应的答案选项构成,用它测出的某个人的态度得分,是该被访者对每个项目发表意见后在每个项目上得分的总和。(二)利克特量表的设计 编写量表项目 确定答案的形式 项目测试四、语义差异量表 语义差异量表的研究的焦点是测量某一客体(观念、事物或他人)对人们的意义,具体来说,这一客体可能导致人们产生某些联想或印象,而某一特定群体联想的图像具有一定的意义,它反映出了这一特定群体对这一客体的态度或立场。(二)语义差异量表的设计 首
26、先,需要注意防止出现“光晕效应”,即被访者在对测试客体的组成要素不十分了解时,简单凭借对该客体的总体印象,会夸大对客体组成要素的正面或负面的评价,产生明显的偏差。其次,需要注意评分点数问题。第五章 问卷设计与评估 在调查研究中,问卷是一份精心准备的题目表格,是用来搜集资料的测量工具,可以采用书面印刷和电脑程序两种形式。具体说来,问卷设计过程包括编写题目、评估题目、编排与格式化问卷等几个步骤第一节 编写题目一、陈述调查目标 首先,通过检索和阅读文献,可以从一些公开发表的与调查主题相关的研究论文或调查报告中,发现许多有价值的研究问题。其次,与他人讨论也是提炼研究问题的一种常用方法,这里的“他人”主
27、要是指对调查主题知之甚详的专家、问卷设计委托方的决策者。最后,无论是与专家研讨,还是与委托方的决策人员座谈,都可以采用焦点小组的形式进行。二、分析框架与变量清单 建立分析框架,研究者首先要考虑从研究问题出发,究竟需要测量哪些变量?其次,要弄清楚变量之间的因果关系如何?一般情况下,分析框架需要有一份详细的变量及其指标的清单;对于那些解释性分析,最好能做出变量关系的逻辑框图。建立分析框架时,就要尽可能地考虑服务于多个研究目的。特别是比较大型的研究项目,在建立分析框架时,要尽可能详尽地开列出研究问题可能涉及的变量及其指标的清单。三、问卷题目设计原则 内容合适 措辞用字清楚 一次问一件事情 客观公正第
28、二节 评估题目一、焦点小组讨论(一)基本概念 焦点小组讨论就是采用小型座谈会的形式,在一名主持人的引导下,对某一主题进行深入讨论,从而获得对有关问题的深入了解。如果说当面访问是访问员与被访者之间的一对一互动,则焦点小组讨论就是焦点团体成员之间的一种群体互动,前者是“群体访谈”(group interviewing),后者是“群体动力”(group dynamics)。群体动力所提供的群体互动作用是焦点小组讨论成功的关键。首先,在调查研究中,焦点小组讨论可以帮助研究者确定调查目标、形成题目,以及在形成问卷草稿后对题目进行评估。其次,讨论可以明确找工作的途径或方式含义。最后,讨论能弄清楚被访者对某
29、些关键字或词的了解程度。(二)讨论的准备 编写讨论指南 选择主持人 招募参与者 准备讨论场地及其他设备。(三)讨论的实施 实施焦点小组讨论的另一个关键环节是对讨论过程的记录。由于主持人的任务是维持讨论的持续运作,因此要安排一个或多个专职人员进行记录。(四)结果分析 在分析讨论结果时,要注意焦点小组讨论的目的是要得到不同的经验和认识,而不是得到一个具有代表性的样本。二、深度访谈(一)深度访谈概述 深度访谈是一种无结构的一对一的面谈,但与普通面谈不同,它是借助于一些访谈技术,来探查被访者在理解和回答问卷题目时的思考过程。(二)访谈技术 深度访谈实际上是观察被访者答题的认知过程,或者说“阅读”被访者
30、回答题目的思考逻辑。由于观察对象是被访者回答背后隐含的内容,因此一般访问过程是无法实现的,必须借助于一些专门的访谈技术,如有声思考法和阶梯前进法。三、实地试调查(一)试调查概述(二)行为编码技术(三)题目评级表第三节 问卷的编排与格式化 一份结构分明、编排整齐的问卷,特别有利于提高访问效率。不仅如此,由于题目的排列可能会产生顺序效应,因此合理地安排题目在问卷中的相对位置,便能够有效降低访问结果出现偏差的可能性。一、问卷结构 虽然按调查的执行方式,可以将问卷分为自填式和访问式两种类型,但两者的结构基本相同,只是在一些具体细节上略有差异。一份完整的问卷通常采取以下结构:问卷标题 问卷说明 题目与答
31、案 编码 调查执行记录二、题目的排列顺序 在问卷编排与格式化过程中,决定题目的顺序是一项重要的内容,因为被访者对前面题目的回答,可能会影响到他对后面题目的回答。给题目排序会面临两个问题:一是题目在问卷中的总体布局,即哪些题目应该放在问卷的哪一个部分;另一个是问卷的顺序效应(order effect)问题,即哪个题目应该放在哪个题目的前面。(一)总体布局 关于问卷的总体布局,一个基本原则是按照访问时被访者可能遇到的不舒适和混淆最少,来安排题目出现的先后顺序(二)顺序效应 问卷的顺序效应(order effect)是指由于前面题目的存在,使被访者改变了对后面题目的回答。三、问卷的排版与印刷 在问卷
32、设计中,问卷的版面设计也是一项很重要的工作,特别是在邮寄调查中更是如此。在给问卷排版时,要注意不要让卷面过于拥挤。另外,由于一般要求访问员在初次没有访问成功时,要在不同日期不同时段再访问两次,因此,应该为每一次访问单独准备一张访问记录页,由访问员在上面记录下访问不成功的原因,访问日期、时间,访问员和被访者的识别编号,以及访问员对访问过程、访问情景的观察体验和个人意见。第六章 资料搜集方法 在调查研究中,资料搜集可以通过自填问卷、当面访问和电话访问等几种形式来完成。这些方法具有不同的特点,分别适合不同条件下的资料搜集过程。在选择具体资料搜集方法时,需要综合考虑多方面的因素,包括调查成本、总体类型
33、、样本的代表性、调查周期、调查内容、问卷回收率和资料质量等。第一节 自填问卷一、邮寄问卷 首先,向被访者寄送通知函。其次,向被访者寄送调查问卷。第三,记录回收问卷的数据。第四,向被访者寄送后续邮件。二、其他自填问卷方法 留置问卷也是自填问卷调查经常采用的操作方法,它不是通过邮局来寄问卷给被访者,而是将问卷以某种方式发送到被访者手中。集中填答是另一种自填问卷调查的操作方法,它是将被调查者召集到同一地点,然后发给每人一份问卷,在集中讲解填答要求后,由被访者同时填答问卷。三、优缺点分析自填问卷的优点:首先,调查成本低。其次,可以避免发生访问员误差。第三,适合处理敏感议题。第四,不太受调查地域的限制。
34、自填问卷的缺点:首先,问卷回收率低,并可能导致样本出现偏差。其次,调查周期较长。第三,很难控制问卷填答质量。第四,问卷内容和形式受到限制。第二节 当面访问一、普通当面访问 比较正规的当面访问通常是采用入户访问的形式,即访问员根据样本提供的名单或地址,找到被抽中的家庭,征得住户同意后进入到户内,然后按户内抽样方法选取符合条件的被访者,最后,按照问卷问题向被访者进行口头提问,并根据被访者的回答圈出答案。二、电脑辅助个人当面访问 电脑辅助个人当面访问(Computer Assisted Personal Interviewing,CAPI)是近年随着计算机技术不断普及而出现的一种面访形式。三、优缺点
35、分析当面访问的优点:首先,样本代表性较好。其次,取得的资料质量较高。第三,能获得内容比较复杂的资料。当面访问的缺点:首先,成本较高。其次,很难控制访问员误差。第三,访问成功率逐渐下降。第三节 电话访问 电话访问由于是借助于电话这种通讯工具进行的问卷访问,因此,能否顺利进行电话访问要看电话的普及情况。一般说来,只有在电话普及率达到90%以上的地区,电话访问才不至于产生严重的样本误差。一、普通电话访问 普通电话访问除了要准备好电话外,也要像当面访问那样,准备好问卷和供记录用的纸笔。除此之外,在有条件时,最好将访问员统一安排在专用的电话室中,进行电话问卷访谈。因为,这样比较便于督导员管理,出现问题时
36、,也能及时统一处理。二、电脑辅助电话访问 电脑辅助电话访问(Computer Assisted Telephone Interviewing,CATI)是一项新兴的电话访问技术。与普通电话访问不同,这项技术是借助于CATI系统实施的。在CATI中,数据编码和录入等烦琐过程都是由计算机自动完成的。这无疑会大大缩短整个调查的时间。不仅如此,计算机还能自动检查答案的适当性和一致性,三、优缺点分析电话访问的优点:首先,调查周期非常短。其次,比较容易控制访问员误差。第三,抽样快捷方便。第四,访问成功率较高。电话访问的缺点:首先,样本的代表性问题。其次,访问内容难于深入。第四节 方法选择的考虑因素 选择资
37、料搜集方法时,需要综合考虑多方面的因素,首先是调查成本,这是一项硬约束条件,没有足够的资金支持,就没有选择的空间。另外,总体类型、样本的代表性、调查周期、调查内容、问卷回收率和资料质量等因素,也都对资料搜集方法的选择有着关键性的制约作用。一、成本 一般情况下,在这三种资料搜集方法中,邮寄问卷调查的成本最低,其次是电话访问,当面访问的成本最高。二、总体与抽样 选择资料收集方法,除了要受到经费的限制外,很大程度上还要受到调查总体的制约。这方面主要有两点考虑,一是调查总体的教育水平,另一个是调查总体参与调查的兴趣和动机。如果调查总体的教育水平很低,阅读和写作能力很差,在没有访问员帮助的情况下,很难独
38、立填写完整问卷;这些调查对象即使邮寄回问卷,问卷质量也是很低的。三、调查周期 不同的资料搜集方式,所耗费的时间也有所不同。一般说来,自填问卷的调查时间最长,其次是当面访问,电话访问的时间最短。四、调查内容 调查内容对选择资料搜集方式的影响有两点,一是敏感性程度,二是复杂性程度。首先,对于敏感性话题,许多研究者都认为采用自填问卷的方式比较合适。其次,虽然自填问卷被认为能有效处理敏感性问题,但却不太适合处理复杂问题。五、回收率 在搜集资料的过程中,问卷回收率是一个需要慎重对待的因素,因为它对样本代表性有着决定性的影响。前面已经提到回收率低是邮寄问卷的致命伤,虽然可以通过留置问卷的方式提升回收率,但
39、前提是加大了调查成本。具体来说,随机拨号电话访问成功率低,并非是由于电话访问之故,而是由于采用了随机拨号方法。因为这种方法的特点之一就是事先不通知被访者,而这恰恰是造成拒访的重要原因。六、资料质量 资料搜集方式不同,影响资料质量的因素也不同。在自填问卷中,被访者由于不认真、嫌麻烦,或没弄懂问题的含义,或不愿意回答某些问题,造成错答或漏答问题,是影响资料质量的最主要因素。访问员及电脑辅助电话访问程序,能及时纠正被访者的错答或漏答问题;而在专门的电话调查机房集中访问,可以使督导员及时纠正访问员的偏差行为,因此这两种因素的负面影响,在电话访问中都不那么显著。考虑到电话访问成本较低,周期较短,因此在问
40、卷难度不大、长度适当的情况下,可以考虑进行电话访问,如市场调查、民意测验,都可以用电话访问的方式进行。第七章 标准化访问 在当面访问和电话访问中,资料搜集工作是由专门组织的多位访问员,以标准化访问的形式完成的。由于访问员误差的存在,访问可能会偏离标准化访问程序。因此,访问员能否严格遵循标准化访问原则,减少访问员误差,就成为成功进行标准化访问的关键所在。第一节 标准化访问概述一、标准化访问的含义 一般说来,访问是指访问者通过与被访者的口头交谈来获取信息的过程。访问主要由题目和回答构成;而且交谈双方有不同的角色定位,访问者主要是提出问题,被访者则主要是回答问题,虽然有时访问员也许会主动提供一些相关
41、信息或解释,被访者也会向访问员询问一些问题,但他们这样做的目的却都是为进一步的提问和回答做准备。结构式访问又称为标准化访问,是一种对访问过程高度控制的访问形式。这种控制主要表现在以下几个方面:首先,访问是按照预先设计好的问卷进行的,问卷上的题目可能是开放式的,也可能是封闭式的,对于后者还预先设计了答案选项。其次,访问员在访问时,只能按照问卷上的题目、指导语和顺序进行提问,不能随意对题目进行解释和发挥。第三,当被访者不清楚题目含义时,访问员只能重复题目,或按访问员手册上的统一说明进行解释。二、访问员误差 从理论上讲,误差是指调查资料与研究者所要测量的“真实数据”之间的差异。在调查的各个阶段,如抽
42、样、问卷设计、调查访问和资料处理等,都有可能产生误差。其中,调查访问阶段由于访问员的影响产生的那部分误差,被称为访问员误差。根据测量理论,可以将信度和效度作为评估访问员误差的标准。如前所述,信度是指一个测量产生一致性结果的程度,一致性程度越高,信度也越高;反之亦然。在实际访问中,可以通过以下三种方法来确认与访问员相关的误差。首先,直接对访问员的访问过程进行观察。这种观察既可以由督导员在访问现场实施,也可以事后观看访问过程的现场录像。其次,可以将访问结果与访问员进行相关分析,如果具有显著的相关性,则表明访问员对访问结果有影响,反之亦然。最后,可以将访问结果与某种标准答案进行比较,对访问结果进行效
43、标效度检验。第二节 标准化访问的原则一、完全按题目提问 研究者在设计题目和组织调查时,要预先设想一下被访者对不同词语可能的反应。特别是要留意“社会期望”因素对问答过程的影响。因为,无论是访问员还是被访者,经常会根据“社会期望”来调整自己的言谈话语。当然,为了保险起见,最好制定具体措施防止访问员改变题目用词。二、适当的追问(一)追问与选项不符的回答(二)追问不精确的回答(三)追问不知道的回答(四)追问开放题三、完整记录答案 首先,如果题目要求被访者以开放题的形式阐述自己的意见或感觉,那么访问员在记录时惟一可遵循的规则就是,逐字记下被访者回答的每一个确切字句,不做归纳,也不做删减。其次,对于开放式
44、的事实性题目,并不一定要逐字记录,但被访者提供的信息却要无一遗漏、完整地记录下来。第三,对于封闭式题目,访问员犯错误的可能性不大,因为此时他们的主要工作是让被访者选择答案,然后将选中的答案记录下来,四、保持立场中立 首先,在访问进行时,访问员一定不要向被访者谈论自己的个人经历、自己对社会现实的看法,更不要表述自己的价值判断。其次,在访问的互动中,访问员一定要处理好对被访者回答的反馈。五、训练受访者 标准化指导 示范和承诺 传递访问信息第三节 访问员的挑选一、访问员的基本条件 首先,访问员应具备良好的读写能力和文字理解能力。其次,访问员最好是一种兼职人员。最后,访问员必须要有弹性的工作时间。二、
45、人口学特征的影响 所谓访问员人口学特征主要包括年龄、性别、民族和受教育水平等,在标准化访问中,这些特征对访问过程、调查资料的影响越小越好。访问员人口学特征通常会对被访者与访问员之间的关系产生影响,即具有某些人口学特征可能会使访问员更容易被接受,或更容易与被访者维持互动关系。三、其他因素的影响 以上关于挑选访问员的基本条件的分析看,并没有强调访问员应具备一定的调查经验。那么调查经验是否应成为一项基本条件呢?答案是否定的。这里的调查经验是通过多次调查积累的,无疑它有助于访问员更方便地与被访者建立起关系,但在进一步的访问中,这些经验却未必一定会对调查资料的质量产生正面的影响。综上所述,在标准化访问中
46、,最好是选择标准化的访问员,对访问员提出特殊的资格要求,可能反而产生出素质较差的访问员。除了上面提及的基本条件外,标准化访问员的形成,主要是依靠对访问员的培训和督导。第四节 访问员的培训一、培训内容(一)调查项目(二)抽样方法和问卷(三)访问的技巧及方法(四)注意事项(五)职业道德二、培训方式 讲课 示范 模拟访问 督导访问三、培训时间 一般说来,在专业调查机构中,基本的访问员培训大多持续两天到五天。有研究表明,对访问员的培训时间若短于一天的话,预期培训效果不佳,访问员很难完成标准化访问程序,调查资料会出现较大的差异。不过需要指出的是,究竟安排多长的访问培训时间是最佳的,在专业上并没有统一的认
47、识。第五节 对访问员的督导一、督导指标(一)成本(二)回答率(三)质量二、督导方法(一)现场督导(二)质量控制和检查(三)处罚舞弊行为第八章 数据处理 访问或其他方式搜集到的问卷资料,必须通过一定的数据处理程序,转换成可供计算机分析的数据形式。大体上,调查数据的处理包括资料检查与校订、资料编码、数据录入与整理等几个步骤。第一节 资料检查与校订一、资料检查 资料检查是指对调查得到的原始资料质量的审查与核实,目的是要确定哪些资料可以接受,哪些资料要剔除掉。它主要通过对回收问卷的完整性、准确性和真实性的检查来实现。步骤:检查问卷和回访二、资料校订 首先,访问员没问某些问题,或没记录某些问题的答案。其
48、次,访问员的记录字迹不清。第三,记录的答案模棱两可或含义不清楚。第二节 资料编码一、编码的一般规则 资料编码原则上是将被访者对一个问题的回答,分配一个相对应的计算机软件能够识别的代码,这个代码就是代表该项回答内容的编码。就具体的编码方式而言,研究者可以在问卷设计时事先赋予被访者所可能回答的选项一个代码,编码时只要逐一记录被访者回答的选项代码即可,这种与问卷设计同步进行的编码形式被称为事前编码,或预编码。研究者也可以在访问结束后,再逐一就受访者的回答进行编码的工作,这种编码方式被称为事后编码。二、开放题编码技术 在事后编码中,编码员首先要对已出现的各种答案进行分类,即分析每一个答案,将相类似的归
49、并为一类。其次,代码指南的编制要在设计问卷时就开始,在小组讨论、深入访谈和试调查过程中,研究者要有意识地摘要记录每个不同的答案。第三,编码时,研究者在为编码员提供每一个编码项目的代码指南的同时,还应该附上几张单页编码纸,将需要编码项目的名称和誊写答案的位置清楚地标在每页的顶端。最后,对于事后编码来说,如果有两个或多个编码员参与编码工作,那么他们要么在不同的时间进行编码;要么同时在同一地点,依照同一编码手册进行编码。三、编码手册 在对资料进行编码时,必须事先制订详尽的计划和明确的规则,通常需要编制一份编码手册,用来记载资料数量化的所有格式、内容,以及使用计算机资料的具体步骤。事前编码和事后编码所
50、用的编码手册最后将合并为一个编码手册。编码手册最直接的作用是提供一套标准化的编码作业程序。四、特殊题型的编码 所谓特殊题型主要是指复选题和排序题,即被访者可以选取多个答案,或对选出的多个答案进行排序的情况。与单选题编码相比,这两类题型的编码稍有些复杂,而且相应的统计分析也需要特别的软件指令。(一)复选题的编码 在调查研究中,研究者经常要求被访者针对某一问题在多个答案选项中进行复选,(二)排序题的编码 要求被访者从几个答案选项中选择的答案不止一个,所以具有复选题的特性;与此同时,又由于要求被访者对选项排出顺序,故每一个被选中的答案选项,其排序位置有1、2或3多种可能,这样在实际编码和统计分析中,