概率与概率分布抽样调查理论与方法课件.ppt

上传人(卖家):三亚风情 文档编号:3263927 上传时间:2022-08-14 格式:PPT 页数:48 大小:957KB
下载 相关 举报
概率与概率分布抽样调查理论与方法课件.ppt_第1页
第1页 / 共48页
概率与概率分布抽样调查理论与方法课件.ppt_第2页
第2页 / 共48页
概率与概率分布抽样调查理论与方法课件.ppt_第3页
第3页 / 共48页
概率与概率分布抽样调查理论与方法课件.ppt_第4页
第4页 / 共48页
概率与概率分布抽样调查理论与方法课件.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

1、1 1 概率的概念及其基本运算规则概率的概念及其基本运算规则第二章第二章 概率与概率分布概率与概率分布一一.概率的概念概率的概念 自然界和社会上的现象一般分为两类,一类称为自然界和社会上的现象一般分为两类,一类称为必然现象必然现象如:水在一如:水在一个大气压下加热到摄氏个大气压下加热到摄氏100 100 必然沸腾,同性电荷必然相互排斥等等。另一必然沸腾,同性电荷必然相互排斥等等。另一类称为类称为随机现象随机现象,即带有随机性、偶然性的现象。如:抛掷一枚均匀的硬,即带有随机性、偶然性的现象。如:抛掷一枚均匀的硬币,其结果可能是整面朝上,也可能是反面朝上,事先无法肯定。又如,币,其结果可能是整面朝

2、上,也可能是反面朝上,事先无法肯定。又如,袋中装有红色和白色两种球,从中任意取出一只,取出的球可能是红色也袋中装有红色和白色两种球,从中任意取出一只,取出的球可能是红色也可能是白色,事先无法肯定等等。可能是白色,事先无法肯定等等。必然现象具有某种因果关系,即只要实现某些确定的条件,就肯定会必然现象具有某种因果关系,即只要实现某些确定的条件,就肯定会发生某个必然的结果。物理学、数学、化学中的许多定理、定律都是阐明发生某个必然的结果。物理学、数学、化学中的许多定理、定律都是阐明必然性的因果规律的。随机现象是否就没有规律可循呢?不是的!以抛均必然性的因果规律的。随机现象是否就没有规律可循呢?不是的!

3、以抛均匀硬币为例,虽然抛一次硬币时无法预知是出现正面还是出现反面,但是匀硬币为例,虽然抛一次硬币时无法预知是出现正面还是出现反面,但是抛掷次数很多时,就可发现:出现正面和出现反面的次数大约各占一半!抛掷次数很多时,就可发现:出现正面和出现反面的次数大约各占一半!据此我们说据此我们说“出现正面出现正面”有有1/21/2的机会,或者说的机会,或者说“出现正面出现正面”的可能性为的可能性为1/21/2。1/21/2就是反映抛硬币时就是反映抛硬币时“出现正面出现正面”这一事件的内部规律的一个数值。这一事件的内部规律的一个数值。第1页,共48页。3 3 问卷设计问卷设计(一一)问卷设计是一门技巧性很强的

4、学问,一份设计巧妙的问问卷设计是一门技巧性很强的学问,一份设计巧妙的问卷应当使被访问者完全明确调查的意图并乐意配合作出正确卷应当使被访问者完全明确调查的意图并乐意配合作出正确的回答,同时使得调查机构便于对调查进行计算机处理并作的回答,同时使得调查机构便于对调查进行计算机处理并作出推断与预测。出推断与预测。这样就要求调查问卷的设计者不仅要有大量的统计推断这样就要求调查问卷的设计者不仅要有大量的统计推断知识,而且要对调查内容的有关知识有所了解。例如,调查知识,而且要对调查内容的有关知识有所了解。例如,调查计算机网络设备的市场需求问题,倘若一个人对计算机、网计算机网络设备的市场需求问题,倘若一个人对

5、计算机、网络等都很不熟悉,那就干脆不要去设计问卷。必要时应当与络等都很不熟悉,那就干脆不要去设计问卷。必要时应当与有关专家一起设计。为了使得访问有效,设计者也应当具有有关专家一起设计。为了使得访问有效,设计者也应当具有一定的心理学知识。另外,由于抽样调查的样本容量一般很一定的心理学知识。另外,由于抽样调查的样本容量一般很大,通常要用计算机处理数据,因此要求设计者对计算机数大,通常要用计算机处理数据,因此要求设计者对计算机数据处理也要有所了解。据处理也要有所了解。第2页,共48页。下面讨论若干原则问题下面讨论若干原则问题 (1 1)设置的问题应当围绕调查的目的展开。切忌问一)设置的问题应当围绕调

6、查的目的展开。切忌问一些不着边际的问题,否则,一旦被访问者对调查产生怀疑的些不着边际的问题,否则,一旦被访问者对调查产生怀疑的态度,那么你的调查肯定要以失败告终。态度,那么你的调查肯定要以失败告终。(2 2)访问时间的长短要适当控制。经验告诉我们,大)访问时间的长短要适当控制。经验告诉我们,大约约20202525分钟的调查时间,只要问题妥当,就不会使得被访分钟的调查时间,只要问题妥当,就不会使得被访问者产生不耐烦的情绪并配合完成调查工作。请注意,为了问者产生不耐烦的情绪并配合完成调查工作。请注意,为了调查顺利,请不要在人家家中或办公室坐上半个小时还不想调查顺利,请不要在人家家中或办公室坐上半个

7、小时还不想离开。通常问卷由离开。通常问卷由3030多个提问组成,往往若干个提问是了解多个提问组成,往往若干个提问是了解一项信息的,一般不超过一项信息的,一般不超过5050个提问。个提问。(3 3)问卷的开头往往设置问题以区别被访问者的类型)问卷的开头往往设置问题以区别被访问者的类型这一点在市场调查中尤为突出。对于不同类型的被访问者,这一点在市场调查中尤为突出。对于不同类型的被访问者,问卷进行不同的安排。问卷进行不同的安排。第3页,共48页。倘若抽样单位不是个人而是集体,若工厂、学校、车间倘若抽样单位不是个人而是集体,若工厂、学校、车间等,然而被访问者当然还是等,然而被访问者当然还是“一个人一个

8、人”,此时被访问者的身,此时被访问者的身份很重要,它可使访问员知道此人是否了解很多有关情况,份很重要,它可使访问员知道此人是否了解很多有关情况,为数据的可信度提供依据。为数据的可信度提供依据。盖洛普公司在我国曾经进行过一次有关计算机网络使用盖洛普公司在我国曾经进行过一次有关计算机网络使用及其需求预测的市场调查,在问题展开之前的一个预备问题及其需求预测的市场调查,在问题展开之前的一个预备问题很有启发性:很有启发性:“请问您在网络设备的购买过程中起到哪些作用?(可选请问您在网络设备的购买过程中起到哪些作用?(可选择多项)择多项)我决定有无必要购买网络设备;我决定有无必要购买网络设备;我推荐我推荐/

9、指定品牌;指定品牌;我决定购买的网络产品应该具备哪些功能;我决定购买的网络产品应该具备哪些功能;我评估我评估/进行性能测试;进行性能测试;我是购买品牌的最终决策者;我是购买品牌的最终决策者;我批准购买网络产品(如果只选此项,则终止访问)我批准购买网络产品(如果只选此项,则终止访问)”第4页,共48页。(4 4)所提问题要清晰,用词要妥贴,并注意礼貌。)所提问题要清晰,用词要妥贴,并注意礼貌。清晰的问题才有可能得到正确的回答。一张问卷中如果清晰的问题才有可能得到正确的回答。一张问卷中如果出现较多需要被访问者发表议论、谈谈看法的问题,则会使出现较多需要被访问者发表议论、谈谈看法的问题,则会使得被访

10、问者无所适从,不知从哪儿谈起为好。而且也给计算得被访问者无所适从,不知从哪儿谈起为好。而且也给计算机处理带来很多麻烦。机处理带来很多麻烦。为使问卷清晰,一般问卷常常采用选择题、是非题、填为使问卷清晰,一般问卷常常采用选择题、是非题、填空题之类的形式。其中选择题你定的可供选择必须包含全部空题之类的形式。其中选择题你定的可供选择必须包含全部可能性并且各种选择之间有明确的界限。任何模棱两可的选可能性并且各种选择之间有明确的界限。任何模棱两可的选择、含糊不清的答案都是绝对不容许的,否则容易产生混淆择、含糊不清的答案都是绝对不容许的,否则容易产生混淆 例如,对某产品的评价问题,设计者拟定了若干项评价性例

11、如,对某产品的评价问题,设计者拟定了若干项评价性的选择:信誉最好、质量最好、价格最低、售后服务好等条的选择:信誉最好、质量最好、价格最低、售后服务好等条款。对这些条款再进行打分:非常赞成,款。对这些条款再进行打分:非常赞成,5 5分;赞成,分;赞成,4 4分;分;无所谓,无所谓,3 3分;反对,分;反对,2 2分;非常反对,分;非常反对,1 1分;不知道,分;不知道,9 9分(分(另行处理)。另行处理)。第5页,共48页。在实际操作中,发生了被访问者在在实际操作中,发生了被访问者在“无所谓无所谓”与与“不知不知道道”之间随意选择的混淆现象。之间随意选择的混淆现象。“无所谓无所谓”本指在本指在“

12、赞成赞成”与与“反对反对”之间持中立态度,而之间持中立态度,而“不知道不知道”却是指对该问题却是指对该问题不了解、不知道应该怎样选择才好。两个选择存在重大差别不了解、不知道应该怎样选择才好。两个选择存在重大差别!例如,对!例如,对“价格最低价格最低”一项,有些被访问者反映,他们对一项,有些被访问者反映,他们对待产品最要紧的是质量保证,只要质量好,价格略高或略低待产品最要紧的是质量保证,只要质量好,价格略高或略低均均“无所谓无所谓”,因此,他的确,因此,他的确“不知道不知道”该产品是否真的该产品是否真的“价格最低价格最低”。问卷的礼貌用词也许每位问卷设计着都会注意到。而问问卷的礼貌用词也许每位问

13、卷设计着都会注意到。而问题提法的恰当妥贴更需要设计人员捉摸被访问者的心理状态题提法的恰当妥贴更需要设计人员捉摸被访问者的心理状态,要照顾到被访问者的心理承受能力。,要照顾到被访问者的心理承受能力。例如,在对某行业各工厂的景气程度进行调查时,类似例如,在对某行业各工厂的景气程度进行调查时,类似“你们厂在近几年内有倒闭或被迫转产的可能性吗?你们厂在近几年内有倒闭或被迫转产的可能性吗?”这样这样的问题应该绝对避免。试想被访者往往是一些厂长、经理等的问题应该绝对避免。试想被访者往往是一些厂长、经理等负责人,既使该单位正处于相当困难时期,这样的提问往往负责人,既使该单位正处于相当困难时期,这样的提问往往

14、使对方无心继续配合调查。使对方无心继续配合调查。第6页,共48页。遇到这种尖刻的但又必须提问以获得有关信息的遇到这种尖刻的但又必须提问以获得有关信息的“难题难题”,最好采用婉转曲折、拆成多题、旁敲侧击等手法来力争,最好采用婉转曲折、拆成多题、旁敲侧击等手法来力争达到目的。例如,前面的问题可以换为达到目的。例如,前面的问题可以换为“你对你的工厂近几你对你的工厂近几年的前景持何种看法?年的前景持何种看法?”如果他选择比较悲观的答复,可以如果他选择比较悲观的答复,可以接着问接着问“你的工厂将会作出何种选择?你的工厂将会作出何种选择?”。(5 5)问题要有层次地展开,市场调查等问卷中要注意)问题要有层

15、次地展开,市场调查等问卷中要注意有比较。有比较。一般地,安排问题总是由简单到复杂,从容易到较难,一般地,安排问题总是由简单到复杂,从容易到较难,逐步让被访者有一个适应的过程。一些带有敏感性的问题通逐步让被访者有一个适应的过程。一些带有敏感性的问题通常总是放在较后面部分处理;有些尖刻的问题,若拆成多道常总是放在较后面部分处理;有些尖刻的问题,若拆成多道问题来提问,则不少设计者并不是将它们放在一起接二连三问题来提问,则不少设计者并不是将它们放在一起接二连三地提出,因为有时连珠炮式的提问反而会引起对方的警觉与地提出,因为有时连珠炮式的提问反而会引起对方的警觉与怀疑,从而产生不好的效果。怀疑,从而产生

16、不好的效果。第7页,共48页。对某些特别重要的问题,调查机构非常想核实但又不可对某些特别重要的问题,调查机构非常想核实但又不可能再三地问,只能设计一系列有关(但表面上看并不特别明能再三地问,只能设计一系列有关(但表面上看并不特别明显)的问题逐步提出,一层层地深入到所需了解的中心。显)的问题逐步提出,一层层地深入到所需了解的中心。美国总统选举预测中有一个较关键的问题:美国总统选举预测中有一个较关键的问题:“你是否打算你是否打算在今年在今年11 11月参加投票?月参加投票?”它直接关系到投票率以及预测的精它直接关系到投票率以及预测的精度。美国人可以不去投票,但一般不愿公开承认不去投票,度。美国人可

17、以不去投票,但一般不愿公开承认不去投票,因为这样人们会认为他不关心国事。这种想法会影响到对该因为这样人们会认为他不关心国事。这种想法会影响到对该问题的回答。但是,对于上一次选举没有投票的既成事实比问题的回答。但是,对于上一次选举没有投票的既成事实比较容易承认,而这个事实对这一次是否会去投票的确存在着较容易承认,而这个事实对这一次是否会去投票的确存在着影响,对判断他实际上是否会去参加投票多少有一些参考价影响,对判断他实际上是否会去参加投票多少有一些参考价值。出于这种逻辑推理,盖洛普公司在问卷的适当地方设计值。出于这种逻辑推理,盖洛普公司在问卷的适当地方设计了诸如了诸如“上一次选举你是否投票?上一

18、次选举你是否投票?”、“那次投票站设在何那次投票站设在何处?处?”等问题巧妙地对前面的关键问题进行核实(当然,核等问题巧妙地对前面的关键问题进行核实(当然,核实的过程还需要用到上几次投票的既成事实所提供的信息)实的过程还需要用到上几次投票的既成事实所提供的信息)。第8页,共48页。问题的有层次展开常常是指问题的有层次展开常常是指“深度深度”,其实问题以及提,其实问题以及提供的选择的安排顺序对调查能否成功也有一定的影响。因为供的选择的安排顺序对调查能否成功也有一定的影响。因为合理的顺序将会引导被访者愉快地、配合良好地、合乎逻辑合理的顺序将会引导被访者愉快地、配合良好地、合乎逻辑地完成整份问卷。地

19、完成整份问卷。这里所说的这里所说的“引导引导”,绝对不是以调查机构或调查员的,绝对不是以调查机构或调查员的主观意图去引导被访者,那样的引导本身就不符合抽样调查主观意图去引导被访者,那样的引导本身就不符合抽样调查的目的与要求。的目的与要求。可供选择的答案的排列顺序对被访者有可能产生误导,可供选择的答案的排列顺序对被访者有可能产生误导,人们习惯于认为排在前面的是重要的,事实上排列在前的选人们习惯于认为排在前面的是重要的,事实上排列在前的选择的确容易给人们留下较深刻的印象。我们除了强调择的确容易给人们留下较深刻的印象。我们除了强调 “排排名不分先后名不分先后”之外,恐怕还要采取一些小措施,比如访问之

20、外,恐怕还要采取一些小措施,比如访问员可以随机地按各种不同次序念出所有选择等等。员可以随机地按各种不同次序念出所有选择等等。市场调研中关于某产品的市场供需问题,很要紧的是同市场调研中关于某产品的市场供需问题,很要紧的是同种产品的不同品牌不同型号之间的比较。只有比较才能真正种产品的不同品牌不同型号之间的比较。只有比较才能真正了解什么样的产品、什么样的型号是人们所喜爱的,才能了了解什么样的产品、什么样的型号是人们所喜爱的,才能了解产品的市场竞争情况。解产品的市场竞争情况。第9页,共48页。因此,在设计问卷前以及设计过程中,设计人员必须收因此,在设计问卷前以及设计过程中,设计人员必须收集与了解有关产

21、品的几种最主要的品牌和型号,将它们编入集与了解有关产品的几种最主要的品牌和型号,将它们编入问题中去。千万不要提问问题中去。千万不要提问“请你谈谈对其他品牌的看法请你谈谈对其他品牌的看法”等等笼统的问题。笼统的问题。(6 6)注意问卷的格式。)注意问卷的格式。一般在卷首印有访问员的自我介绍,表明是代表哪个调一般在卷首印有访问员的自我介绍,表明是代表哪个调查机构或公司作何种目的的调查。大方且礼貌的介绍词及其查机构或公司作何种目的的调查。大方且礼貌的介绍词及其感谢语句将为调查的成功创造好的机会。卷末一般写有最终感谢语句将为调查的成功创造好的机会。卷末一般写有最终感谢词。感谢词。(7 7)一般问卷中应

22、设有编码栏。)一般问卷中应设有编码栏。因为大多数调查的样本容量比较大,只能借助于计算机因为大多数调查的样本容量比较大,只能借助于计算机来处理数据,编码栏的设立使计算机可以对调查数据加以统来处理数据,编码栏的设立使计算机可以对调查数据加以统计、汇总和分类。计、汇总和分类。第10页,共48页。以上仅仅是些原则性的,一般为了使问卷设计的合理有以上仅仅是些原则性的,一般为了使问卷设计的合理有效,调查机构常常采用试调查手段,抽少量单元用已设计好效,调查机构常常采用试调查手段,抽少量单元用已设计好的初稿进行试调查,从中发现不完善之处,并进一步修改之的初稿进行试调查,从中发现不完善之处,并进一步修改之。不要

23、认为实施这一步会增加工作量,实际上试调查的样本。不要认为实施这一步会增加工作量,实际上试调查的样本总是作为样本的一部分。总是作为样本的一部分。第11页,共48页。5 5 调查员素质调查员素质 抽样调查是一项严肃认真的工作,对调查员素质要求较抽样调查是一项严肃认真的工作,对调查员素质要求较高。真实可靠的调查资料是抽样调查质量保证的基础。由于高。真实可靠的调查资料是抽样调查质量保证的基础。由于调查员工作态度的马虎和疏漏对数据质量造成的损失是毁灭调查员工作态度的马虎和疏漏对数据质量造成的损失是毁灭性的。性的。试想一个学校为了了解教师的教学质量,发给班长一叠试想一个学校为了了解教师的教学质量,发给班长

24、一叠调查表,班长找几个同学一人填上十份交了回来,这种调查调查表,班长找几个同学一人填上十份交了回来,这种调查结果有多大意义?又如,系里管分配的一位领导找班里几位结果有多大意义?又如,系里管分配的一位领导找班里几位同学开座谈会,了解教师教学情况,同学们不发言,他千方同学开座谈会,了解教师教学情况,同学们不发言,他千方百计地启发、诱导、鼓励大家积极提意见,这样的调查结果百计地启发、诱导、鼓励大家积极提意见,这样的调查结果能不带偏性吗?能不带偏性吗?调查员和调查机构的中立性是保证获得正确信息的必要调查员和调查机构的中立性是保证获得正确信息的必要条件之一。条件之一。第12页,共48页。美国盖洛普调查公

25、司发布的调查结果具有很高的信誉,美国盖洛普调查公司发布的调查结果具有很高的信誉,100100多家有名的的独立报纸都愿意公布他关于总统选举民意多家有名的的独立报纸都愿意公布他关于总统选举民意测验的结果。大半个世纪以来,盖洛普调查公司在调查咨询测验的结果。大半个世纪以来,盖洛普调查公司在调查咨询领域获得了极大的成功,这个成功与它的调查员的中立性以领域获得了极大的成功,这个成功与它的调查员的中立性以及客观公正的态度是分不开的。及客观公正的态度是分不开的。美国现场人口调查所收集的数据之所以有很高的质量,美国现场人口调查所收集的数据之所以有很高的质量,关键在于他们对调查员素质的重视,在于仔细挑选、培训和

26、关键在于他们对调查员素质的重视,在于仔细挑选、培训和指导现场工作人员。在调查员上岗之前,进行约指导现场工作人员。在调查员上岗之前,进行约 4 4 天时间的天时间的调查程序培训;在他们上岗之后,每个月必须进行若干小时调查程序培训;在他们上岗之后,每个月必须进行若干小时的培训。调查员的主管人每年至少要对他们的工作考查一次的培训。调查员的主管人每年至少要对他们的工作考查一次。另外,约。另外,约3 3的月样本(由单独的概率抽样程序选取)由的月样本(由单独的概率抽样程序选取)由主管人重新访问。所有不相符之处都与访问员进行讨论。访主管人重新访问。所有不相符之处都与访问员进行讨论。访问员的报告全部加以校对,

27、即查核不完全和不一致的记载,问员的报告全部加以校对,即查核不完全和不一致的记载,每项差错都与造成此差错的人员核对一下。由于他们的严格每项差错都与造成此差错的人员核对一下。由于他们的严格管理及其认真的态度,一般来说差错率很低,从而保证了它管理及其认真的态度,一般来说差错率很低,从而保证了它们的数据质量。们的数据质量。第13页,共48页。进行抽样调查工作,如有可能应使用专业调查人员。他进行抽样调查工作,如有可能应使用专业调查人员。他们受过专门训练,有长期的调查访问经验,更为重要的是,们受过专门训练,有长期的调查访问经验,更为重要的是,他们以调查为专门职业,调查的质量与他们的工资、奖励相他们以调查为

28、专门职业,调查的质量与他们的工资、奖励相结合,调查机构和组织内部有一整套监督、检查、激励奖惩结合,调查机构和组织内部有一整套监督、检查、激励奖惩措施。一般来说,专业调查人员比起一次性、临时性的调查措施。一般来说,专业调查人员比起一次性、临时性的调查人员来说,比较重视个人的工作信誉,能够较好地保证调查人员来说,比较重视个人的工作信誉,能够较好地保证调查工作的质量。工作的质量。美国人口普查局每个月都要进行一次现场人口抽样调查美国人口普查局每个月都要进行一次现场人口抽样调查,它拥有一支由,它拥有一支由15001500名专职访问员组成的实地工作班子,向名专职访问员组成的实地工作班子,向约约115000

29、115000人的一个全国性概率样本征询意见,调查结果发布人的一个全国性概率样本征询意见,调查结果发布于若干重要的刊物和总统报告上,例如:劳工评论月刊、就于若干重要的刊物和总统报告上,例如:劳工评论月刊、就业与收入(月刊)、现场人口报告(不定期)、特别劳动力业与收入(月刊)、现场人口报告(不定期)、特别劳动力报告(不定期)、美利坚合众国统计摘要(年度)、总统经报告(不定期)、美利坚合众国统计摘要(年度)、总统经济报告(年度)。它的调查结果具有极高的权威性。据说它济报告(年度)。它的调查结果具有极高的权威性。据说它的数据可信度比的数据可信度比1010年一次的人口普查还要高。这当然是由于年一次的人口

30、普查还要高。这当然是由于它的数据是由专业人员采集的而人口普查必须动用大量临时它的数据是由专业人员采集的而人口普查必须动用大量临时人员的原因。人员的原因。第14页,共48页。不少抽样调查是一次性的、临时性的。此时,可以请调不少抽样调查是一次性的、临时性的。此时,可以请调查公司代劳;当然,也可以自己组织。如果自己组织,那么查公司代劳;当然,也可以自己组织。如果自己组织,那么在调查前必须对调查人员进行培训。对访问员的培训是该次在调查前必须对调查人员进行培训。对访问员的培训是该次调查能否取得成功的关键之一。访问员必须熟悉本次调查的调查能否取得成功的关键之一。访问员必须熟悉本次调查的目的与要求,必须熟悉

31、问卷内容,明确访问对象的特征。在目的与要求,必须熟悉问卷内容,明确访问对象的特征。在被访问者筛选过程中,一般应当将不同类型的被访单位和个被访问者筛选过程中,一般应当将不同类型的被访单位和个人一一记录在案,通常要求访问员做到:人一一记录在案,通常要求访问员做到:(1 1)严格遵守访问程序和指示,不允许擅自变通处理)严格遵守访问程序和指示,不允许擅自变通处理 (2 2)访问过程中始终保持中立,不使用任何代诱导性)访问过程中始终保持中立,不使用任何代诱导性语言。语言。(3 3)忠实被访者的回答,严禁在不经询问或被访人尚)忠实被访者的回答,严禁在不经询问或被访人尚未回答之时,擅自代答或代填问卷。未回答

32、之时,擅自代答或代填问卷。(4 4)除出现某种情况下规定的跳答题之外,任何题均)除出现某种情况下规定的跳答题之外,任何题均要按规定询问,不能因为估计被访者有可能不回答而跳过。要按规定询问,不能因为估计被访者有可能不回答而跳过。倘若遇到拒绝回答或被访人确实不知道等情况,则应在答卷倘若遇到拒绝回答或被访人确实不知道等情况,则应在答卷上一一注明。上一一注明。第15页,共48页。(5 5)访问大致完成时,访问员应当场浏览一遍问卷,)访问大致完成时,访问员应当场浏览一遍问卷,把漏记或不明确的地方补充完整。把漏记或不明确的地方补充完整。(6 6)应尽可能在问卷中详细记录被访人的姓名、单位)应尽可能在问卷中

33、详细记录被访人的姓名、单位、地址以及电话等,以便于复查。、地址以及电话等,以便于复查。此外,在培训过程中,应当让访问员明白问卷的重点信此外,在培训过程中,应当让访问员明白问卷的重点信息所在,这对保证调查质量起着至关重要的作用。息所在,这对保证调查质量起着至关重要的作用。每一次抽样调查都要进行抽样复查。一般地,在所访问每一次抽样调查都要进行抽样复查。一般地,在所访问后的问卷中抽后的问卷中抽1010左右复核。复查可以通过再上门或电话访左右复核。复查可以通过再上门或电话访问等手段实现。问等手段实现。以上对访问员的要求当然是针对上门访问:它具有回收以上对访问员的要求当然是针对上门访问:它具有回收率高、

34、精确度高的优点,但花费自然较大。有些大规模的抽率高、精确度高的优点,但花费自然较大。有些大规模的抽样调查采用邮寄或电话访问等形式,比起上门访问效果要差样调查采用邮寄或电话访问等形式,比起上门访问效果要差许多,尤其是邮寄问卷方式,一般回收率较低,因此大大降许多,尤其是邮寄问卷方式,一般回收率较低,因此大大降低调查的质量。低调查的质量。第16页,共48页。6 6 数据处理与调查总结报告数据处理与调查总结报告 问卷回收、核实后,接着进行数据的整理、分类、计算问卷回收、核实后,接着进行数据的整理、分类、计算、汇总等处理工作。除了一些小型、临时抽样调查可用手工、汇总等处理工作。除了一些小型、临时抽样调查

35、可用手工处理数据外,大多数抽样调查数据通常用计算机进行处理。处理数据外,大多数抽样调查数据通常用计算机进行处理。调查结束后,根据圈出的答案进行编码,以方便计算机识别调查结束后,根据圈出的答案进行编码,以方便计算机识别。现在有不少统计软件用于抽样调查的数据处理相当有效,。现在有不少统计软件用于抽样调查的数据处理相当有效,例如例如SASSAS统计软件。当然,也可以请计算机专家和统计专家统计软件。当然,也可以请计算机专家和统计专家编制一些针对具体抽样调查的专用应用程序。通过数据处理编制一些针对具体抽样调查的专用应用程序。通过数据处理,最终得到所要求的浓缩信息,如总量、平均数的估计、比,最终得到所要求

36、的浓缩信息,如总量、平均数的估计、比例、例、P P分位数的估计,以及它们的精度等。分位数的估计,以及它们的精度等。在抽样调查的最后阶段,应该提交一份抽样调查总结报在抽样调查的最后阶段,应该提交一份抽样调查总结报告。理由很简单,调查中所得到的大量数据看上去是那么杂告。理由很简单,调查中所得到的大量数据看上去是那么杂乱无章,一古脑儿地收集在一起上交或转交,上级部门无法乱无章,一古脑儿地收集在一起上交或转交,上级部门无法据此作出决策,委托部门搞不清最终到底有什么样的结论。据此作出决策,委托部门搞不清最终到底有什么样的结论。第17页,共48页。计算机上输出的结果也必须解释和阐明它的实际意义。计算机上输

37、出的结果也必须解释和阐明它的实际意义。因此,必须撰写一份调查总结报告,表现出这次抽样调查和因此,必须撰写一份调查总结报告,表现出这次抽样调查和统计分析的基本成果。统计分析的基本成果。撰写总结报告宜开门见山,简明扼要;应清楚地说明本撰写总结报告宜开门见山,简明扼要;应清楚地说明本次调查的目的,具体的抽样方案也应该简略地一一交待,其次调查的目的,具体的抽样方案也应该简略地一一交待,其中包括调查的实施过程,实际走访了多少单元,发了多少份中包括调查的实施过程,实际走访了多少单元,发了多少份问卷,回收率究竟有多少等等。以上所写通常占总结报告的问卷,回收率究竟有多少等等。以上所写通常占总结报告的一小部分,

38、报告的主体部分当然是调查结果。调查结果必须一小部分,报告的主体部分当然是调查结果。调查结果必须完全依据调查数据以及数据处理结果来写。所有的推断与预完全依据调查数据以及数据处理结果来写。所有的推断与预测必须依据数据而行,即所谓实事求是的作风,严禁凭空设测必须依据数据而行,即所谓实事求是的作风,严禁凭空设想。根据数据分析结果,可以做一些适当的解释和议论,提想。根据数据分析结果,可以做一些适当的解释和议论,提出一些建议和看法。不过,这些不能占过多篇幅,以免喧宾出一些建议和看法。不过,这些不能占过多篇幅,以免喧宾夺主。夺主。总结报告的撰写应当有文字、有数据、有一定的分析。总结报告的撰写应当有文字、有数

39、据、有一定的分析。第18页,共48页。能使人一目了然的统计图表非常受上级或委托部门的欢能使人一目了然的统计图表非常受上级或委托部门的欢迎,因此,调查报告最好作出统计图表。迎,因此,调查报告最好作出统计图表。调查结果要有一定的结论,至少倾向性一定要鲜明,不调查结果要有一定的结论,至少倾向性一定要鲜明,不要模模糊糊的预测或推断。需要明白的是,政府部门或企业要模模糊糊的预测或推断。需要明白的是,政府部门或企业、公司拿出经费来是要你得出一些结论性的东西。因此,每、公司拿出经费来是要你得出一些结论性的东西。因此,每个待估计的参数都要有估计的数字。可以做一些分门别类的个待估计的参数都要有估计的数字。可以做

40、一些分门别类的工作,可以对一些指标或者个体聚类进行分析,这样做也许工作,可以对一些指标或者个体聚类进行分析,这样做也许能为委托单位提供有价值的参考信息。在调查总结报告中有能为委托单位提供有价值的参考信息。在调查总结报告中有一个重要的数据应该报告给委托单位,那就是调查的精确度一个重要的数据应该报告给委托单位,那就是调查的精确度。只告诉委托方参数的估计值而不告诉估计的精确度,那么。只告诉委托方参数的估计值而不告诉估计的精确度,那么你的工作没有全部完成。你的工作没有全部完成。如你告诉电视台某档节目的收视率为如你告诉电视台某档节目的收视率为6565,那么电视,那么电视台精明的负责人一定会问你误差有多大

41、,倘若该百分比的误台精明的负责人一定会问你误差有多大,倘若该百分比的误差为差为1515,则电视台不敢认同这档节目的收视率为,则电视台不敢认同这档节目的收视率为6565;而;而如果你告诉他收视率为如果你告诉他收视率为6565 3 3,那么这个,那么这个6565就显得很就显得很有意义了。有意义了。第19页,共48页。统计图表往往有着用语言难以达到的效果。它可以使人统计图表往往有着用语言难以达到的效果。它可以使人们一下子就抓住事物的全貌或者特征。们一下子就抓住事物的全貌或者特征。有关的大批数据、次要的各种各样的数据图式,一般都有关的大批数据、次要的各种各样的数据图式,一般都以附录的形式放在总结报告的

42、最后面。以附录的形式放在总结报告的最后面。以上仅仅是调查总结报告一般性的特点,具体的内容和以上仅仅是调查总结报告一般性的特点,具体的内容和格式依实际的抽样调查而定。格式依实际的抽样调查而定。第20页,共48页。7 7 若干数学准备若干数学准备 抽样推断既然必须处理收集来的数据,因此数学知识是抽样推断既然必须处理收集来的数据,因此数学知识是必不可少的。下面仅就抽样调查中一些最基本的常用数学知必不可少的。下面仅就抽样调查中一些最基本的常用数学知识和概念以直观简洁的方式做一些介绍。识和概念以直观简洁的方式做一些介绍。1、盒子模型、盒子模型 一般抽样调查面临的总体只有有限多个初级单元。从总一般抽样调查

43、面临的总体只有有限多个初级单元。从总体中抽样,就相当于从一个盒子里摸取若干张票,盒子里的体中抽样,就相当于从一个盒子里摸取若干张票,盒子里的票数相当于有限总体的单元个数,票上记载着反映该单元特票数相当于有限总体的单元个数,票上记载着反映该单元特征的指标的值。设总体有征的指标的值。设总体有N个单元,各指标值为个单元,各指标值为则盒子如图则盒子如图21所示:所示:NYYY,21第21页,共48页。NYYY,21图图21该盒中票的平均数为:该盒中票的平均数为:)(121NYYYNY 即总体平均数,它表示票上指标的中心。即总体平均数,它表示票上指标的中心。另一个重要的总体参数是盒中票的指标的离散程度,

44、用指标另一个重要的总体参数是盒中票的指标的离散程度,用指标值关于中心的距离的平方和的平均数来表示:值关于中心的距离的平方和的平均数来表示:212)(1YYNiNi 这实际上是总体的方差;但大部分情况采用:这实际上是总体的方差;但大部分情况采用:212)(11YYNSiNi 第22页,共48页。如果我们只关心总体中具有某些特定类型的集合占整个如果我们只关心总体中具有某些特定类型的集合占整个总体的比例,那么只需稍加处理,引入总体的比例,那么只需稍加处理,引入01指标,总体比例指标,总体比例的问题立刻转化为总体平均数的一个特例。的问题立刻转化为总体平均数的一个特例。只要将盒子中的票子分为两类,我们感

45、兴趣的一类全标只要将盒子中的票子分为两类,我们感兴趣的一类全标上上1,其余的都标上,其余的都标上0。于是盒子可用图。于是盒子可用图22表示:表示:图图221 0个个1N个个1NN 则盒子中票子指标的平均数为:则盒子中票子指标的平均数为:NNYNYiNi111 正好是我们关心的那类个体占总体的比例。因此,凡对总体正好是我们关心的那类个体占总体的比例。因此,凡对总体平均数有的结果,总体比例也有相应的结果。平均数有的结果,总体比例也有相应的结果。第23页,共48页。此时,盒子的方差化为:此时,盒子的方差化为:212)(1YYNiNi )()(1211211NNNNNNNNN NNNNN11 )0()

46、1(所所占占比比例例总总体体中中所所占占比比例例总总体体中中 常采用的方差表示为:常采用的方差表示为:221 NNSNNNNNNN111 第24页,共48页。从盒子中作随机抽取常常有两种不同方式:随机有放回从盒子中作随机抽取常常有两种不同方式:随机有放回抽取和随机无放回抽取。从直观上看,随机有放回方式存在抽取和随机无放回抽取。从直观上看,随机有放回方式存在着一张票子被抽中两次或两次以上的可能性,而随机无放回着一张票子被抽中两次或两次以上的可能性,而随机无放回方式则不存在这种可能。方式则不存在这种可能。在实际操作中,人们不太可能心甘情愿地花费两倍以上在实际操作中,人们不太可能心甘情愿地花费两倍以

47、上的费用去访问同一个单元。因此,随机无放回通常比随机有的费用去访问同一个单元。因此,随机无放回通常比随机有放回应放回应“有效有效”一些,这一点将在第三章的讨论中在理论上加一些,这一点将在第三章的讨论中在理论上加以肯定。但是,当盒子中的票数相当多,而抽取的票数相对以肯定。但是,当盒子中的票数相当多,而抽取的票数相对较少时,有许多事件的概率习性对于有放回或无放回两种情较少时,有许多事件的概率习性对于有放回或无放回两种情况几乎差不多,因而有时候我们常从随机有放回这一最简单况几乎差不多,因而有时候我们常从随机有放回这一最简单的形式入手讨论问题,而将有关的结果近似地套到随机无放的形式入手讨论问题,而将有

48、关的结果近似地套到随机无放回的情形。回的情形。这里讨论的盒子模型是对简单随机抽样而言的,至于分这里讨论的盒子模型是对简单随机抽样而言的,至于分层、分阶段等其它情况无非是大盒子里放小盒子等。层、分阶段等其它情况无非是大盒子里放小盒子等。第25页,共48页。2、随机误差与无偏估计量、随机误差与无偏估计量 先讨论一个简单的具体例子。设有一个容量为先讨论一个简单的具体例子。设有一个容量为7的总体的总体由下面盒子给出,如图由下面盒子给出,如图23所示:所示:图图231 2 3 4 5 6 7总体平均数和方差为:总体平均数和方差为:47171 iiYY67.4)(1712712 YYSii标准差标准差16

49、.22 SS 此时,盒子中指标值以及总体的参数此时,盒子中指标值以及总体的参数 和和 对于调查者对于调查者来说是未知的。调查者的任务就是从总体中抽出一个样本,来说是未知的。调查者的任务就是从总体中抽出一个样本,构造样本估计量,来推断总体平均数构造样本估计量,来推断总体平均数 和方差和方差 。YY2S2S第26页,共48页。设样本容量设样本容量n=3,使用样本,使用样本 的样本均值和方的样本均值和方差差来估计总体的平均值来估计总体的平均值 和方差和方差 。),(321yyyiiyy 31312312)(131yysii Y2S考虑不放回简单随机抽样,由于抽样是随机的,考虑不放回简单随机抽样,由于

50、抽样是随机的,7个个体中个个体中的任何的任何3个都可能入选样本。所有可能的样本数有个都可能入选样本。所有可能的样本数有3737C 此时,每一个样本被抽中的概率都相等且为此时,每一个样本被抽中的概率都相等且为 371如抽中样本(如抽中样本(2,3,6),则),则67.3)632(31 y33.4)67.36()67.33()67.32(1312222 s第27页,共48页。用它们来估计总体的平均数和方差,误差如下:用它们来估计总体的平均数和方差,误差如下:对平均数有随机误差对平均数有随机误差33.0467.3 Yy对方差有随机误差对方差有随机误差34.067.433.422 Ss 由于样本是随机

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(概率与概率分布抽样调查理论与方法课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|