1、主编主编 周仁郁周仁郁 8.1 调查设计的全过程调查设计的全过程 8.1.1 调查设计的目的与方法调查设计的目的与方法 不加任何干预措施不加任何干预措施,客观描述研究总体的统计设计客观描述研究总体的统计设计,称为调查设计称为调查设计 调查设计包括确定方案调查设计包括确定方案,组织调查组织调查,整理分析全过程整理分析全过程 调查方法可分为普查调查方法可分为普查,抽样调查抽样调查,典型调查典型调查3种种 定抽样方法及样本容量设计方案确定目的及调查对象定调查项目及观测指标组织调查确定调查方式及调查表宣传目的及培训调查员实施调查及抽样复查整理分析数据录入汇总及复查计算得统计及专业结论普查称全面调查:就
2、是对总体普查称全面调查:就是对总体进行调查。普查一般用于了解进行调查。普查一般用于了解总体在某一特定时点上的情况总体在某一特定时点上的情况抽样调查:从总体中抽取一定抽样调查:从总体中抽取一定数量观察单位组成样本,然后数量观察单位组成样本,然后根据样本信息来推断总体特征根据样本信息来推断总体特征典型调查:称案例调查。在对典型调查:称案例调查。在对事物进行全面分析的基础上,事物进行全面分析的基础上,选择典型的人或单位进行调查选择典型的人或单位进行调查8.1.2 随机与系统抽样随机与系统抽样抽样调查的方法有单纯随机抽样、系统抽样、整群抽样调查的方法有单纯随机抽样、系统抽样、整群抽样、分层抽样抽样、分
3、层抽样 单纯随机抽样,是把调查总体的全部观察单位进行编单纯随机抽样,是把调查总体的全部观察单位进行编号,再用随机数表或抽签等方法随机抽取部分观察单号,再用随机数表或抽签等方法随机抽取部分观察单位组成样本。总体例数为位组成样本。总体例数为N,样本例数为,样本例数为n,样本均,样本均数及样本率的标准误分别为数及样本率的标准误分别为nSNnSX21111nppNnSp随机抽样时,样本容量估计使用随机抽样时,样本容量估计使用6.1的方法,但要用的方法,但要用有限总体公式进行校正。总体均数、总体率的样本有限总体公式进行校正。总体均数、总体率的样本容量估计校正式分别为容量估计校正式分别为 NnnnC/1N
4、nnnC/)1(1整群抽样整群抽样随机抽样随机抽样系统抽样系统抽样分层抽样分层抽样系统抽样又称为机械抽样或等距抽样,是把总体观系统抽样又称为机械抽样或等距抽样,是把总体观察单位按一定顺序分为察单位按一定顺序分为n个部分,从第一个部分随机个部分,从第一个部分随机抽取第抽取第k位次的观察单位,再从每一部分中抽取相同位次的观察单位,再从每一部分中抽取相同位次的观察单位,由这些观察单位组成样本位次的观察单位,由这些观察单位组成样本 例例1 某校某校 3000 学生用随机数表抽取学生用随机数表抽取 100 人,若乙肝人,若乙肝表面抗原阳性样本率表面抗原阳性样本率10%,求总体率,求总体率95%置信区间置
5、信区间 把全校学生编为把全校学生编为0、1、2999号,查统计用表号,查统计用表23,任意指定某行某列,以任意指定某行某列,以4个数字为一组,除以个数字为一组,除以3000取取余数为抽取的编号,后面出现与前面有相同的数字余数为抽取的编号,后面出现与前面有相同的数字者弃去。如从第者弃去。如从第9行第行第5列顺序取列顺序取100组数组数 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 除以除以3000取余,随机抽样编号为取余,随机抽样编号为1234 2978 0456 0782 2242 0744 0815 2100 1342 0966 N300
6、0,n=100为大样本,样本率为大样本,样本率p=0.1,标准误为,标准误为0296.099/9.01.0)3000/1001(pS故总体率的故总体率的95%置信区间为置信区间为 pSup2/05.0 0.11.960.0296(0.0419,0.1581)例例2 欲调查某社区贫血患病情况,该社区有居民欲调查某社区贫血患病情况,该社区有居民1000人,试按系统抽样方法,抽取例数为人,试按系统抽样方法,抽取例数为100的样本的样本 先将先将1000名居民按某一特征的顺序编号,总体例数名居民按某一特征的顺序编号,总体例数N1000,样本例数,样本例数n100,抽样间隔,抽样间隔1000/10010
7、,在在 1 10之间随机确定一个数字,比如之间随机确定一个数字,比如7,每间隔,每间隔10个观察单位取一个,抽取个观察单位取一个,抽取7,17,27,997组成组成样本样本 8.1.3 整群与分层抽样整群与分层抽样整群抽样是把总体整群抽样是把总体N个观察单位分为个观察单位分为K个个“群群”,每,每个群包含若干观察单位,随机抽取个群包含若干观察单位,随机抽取k 个个“群群”,用这,用这些群中的全部观察对象组成样本。些群中的全部观察对象组成样本。整群抽样样本均数及其标准误分别为整群抽样样本均数及其标准误分别为 iXNkKX kiiXTTkkKkNKS12)()1(11X为各群观察单位之和,为各群观
8、察单位之和,Ti为第为第i群内观察值之和群内观察值之和整群抽样时,样本率及其标准误分别为整群抽样时,样本率及其标准误分别为iaNkKp kiipaakkKkNKS12)(111其中,其中,ai为各群阳性数之和为各群阳性数之和 分层抽样又称分类抽样,是把总体按影响观察值变异分层抽样又称分类抽样,是把总体按影响观察值变异较大的某种特征分为若干类型或组别,称为层,再从较大的某种特征分为若干类型或组别,称为层,再从每一层随机抽取一定数量的观察单位合起来组成样本每一层随机抽取一定数量的观察单位合起来组成样本分层设计时,先确定总样本容量分层设计时,先确定总样本容量n,再用按比例或最,再用按比例或最优法确定
9、第优法确定第i层样本容量层样本容量n 按比例分配,是由总体第按比例分配,是由总体第i层的观察单位数层的观察单位数Ni占总体占总体所有观察单位数的比例所有观察单位数的比例Ni/N决定样本各层的容量决定样本各层的容量ni NnNnii最优分配,是由总体第最优分配,是由总体第j层观察单位数层观察单位数Nj和标准差的和标准差的大小决定样本各层的容量大小决定样本各层的容量nj,均数抽样和率抽样的公,均数抽样和率抽样的公式分别为式分别为 iijjjNNnn)1()1(iiijjjjppNppNnn分层抽样中,样本均数及其标准误分别为分层抽样中,样本均数及其标准误分别为NXNXiiNSNNnSiXiiiX2
10、2)/1(分层抽样中,样本率及其标准误分别为分层抽样中,样本率及其标准误分别为NpNpiiNSNNnSipiiip22)/1(例例3 在某校在某校40个班个班3000学生中,随机抽查学生中,随机抽查4个班,学个班,学生人数分别为生人数分别为60、80、90、120人,用锡克试验检查人,用锡克试验检查白喉易感情况,查得阳性人数分别为白喉易感情况,查得阳性人数分别为12、11、15、17,试以,试以0.05水准估计该校学生锡克试验阳性率水准估计该校学生锡克试验阳性率 这是整群抽样,这是整群抽样,N3000,K40、k4、a112、a211、a315、a417 a-(12111517)/455/41
11、3.75(1213.75)2(1113.75)2(1513.75)22aai(1713.75)222.75 总体率总体率95%的置信区间为的置信区间为1833.0554300040p0174.075.22)14(414041300040pS0.18331.960.0174(0.1492,0.2174)例例4 某地某地019岁人群共岁人群共 14 万人,欲调查其万人,欲调查其HbsAg阳性率,已知各年龄组分组、人数及既往阳性率,若阳性率,已知各年龄组分组、人数及既往阳性率,若确定样本例数为确定样本例数为 1000 人,试分别按比例分配和最优人,试分别按比例分配和最优分配确定各年龄组的调查人数分配
12、确定各年龄组的调查人数 这是分层抽样,按年龄组分为四层这是分层抽样,按年龄组分为四层 按比例分配时,按比例分配时,N140000,N125000、N231000,N338000、N446000 n1100025000/140000178.57 n2221.43,n3271.43,n4328.57最优分配时,以既往阳性率为各层总体率最优分配时,以既往阳性率为各层总体率pj的估计值的估计值由由p10.03、p20.08、p30.10、p40.11,计算得,计算得)1(111ppN6805.4264)03.01(03.0250000892.8410)1(222 ppN0000.11400)1(333
13、 ppN9288.14392)1(444 ppN)1(iiippN=4264.68+8410.09+11400.00+14392.93=38467.6985 n110004264.6805/38467.6985110.8639n2218.6273,n3296.3525,n4374.1562 年龄组人数Nj比例分配nj最 优 分 配既往阳性率pjnj0250001790.034264.681115310002210.088410.0921910380002710.1011400.002961519460003290.1114392.93374合计140000100038467.701000)1(
14、jjjppN8.1.4 调查误差的控制调查误差的控制在设计阶段常见的非抽样误差及控制方法有下面在设计阶段常见的非抽样误差及控制方法有下面6种种 正确划分调查范围正确划分调查范围 正确选择调查指标正确选择调查指标 明确定义调查项目明确定义调查项目 正确设置调查问题正确设置调查问题 选择恰当的调查方式选择恰当的调查方式 预调查预调查 在调查阶段,常见非抽样误差及控制方法有下面在调查阶段,常见非抽样误差及控制方法有下面2种种 调查人员的工作态度不好,专业知识欠缺,业务调查人员的工作态度不好,专业知识欠缺,业务水平不足水平不足 被调查者不能很好配合,因故不在,故意躲避、被调查者不能很好配合,因故不在,
15、故意躲避、拒查、有意隐瞒事情真相,记忆不清拒查、有意隐瞒事情真相,记忆不清 在整理与分析阶段,非抽样误差主要源于计算机数据在整理与分析阶段,非抽样误差主要源于计算机数据录入、汇总、计算等方面的错误,在条件许可时应当录入、汇总、计算等方面的错误,在条件许可时应当使用机读卡使用机读卡 调查质量一般使用效度与信度两个指标进行评价,应调查质量一般使用效度与信度两个指标进行评价,应做到效度与信度的统一。效度是调查工具对调查对象做到效度与信度的统一。效度是调查工具对调查对象测量的有效程度或准确程度,反映调查的真实性。信测量的有效程度或准确程度,反映调查的真实性。信度是调查工具对调查对象测量的可靠程度,反映调查度是调查工具对调查对象测量的可靠程度,反映调查的稳定性或一致性。的稳定性或一致性。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。