1、教师:胡松华课程要求每次实验课需撰写实验报告,并统一提交,作为实验成绩利用本课程所学方法,选取一个实际问题,进行调查问卷分析,并撰写课程论文,计入平时成绩考核要求本课程以考核为主,总成绩包括:平时成绩占10%实验成绩占20%期末成绩占70%参考教材抽样论,许宝禄编著,北京大学出版社抽样调查,孙山泽编著,北京大学出版社抽样技术(第四版),金勇进等编著,中国人民大学出版社目 录第一章 引言第二章 简单随机抽样第三章 不等概抽样第四章 分层抽样第五章 多阶抽样第六章 整群抽样与系统抽样第七章 二相抽样1.1 大规模抽样调查1.2 有限总体抽样的样本分布1.3 概率抽样的几种基本 的抽样方法抽样调查的
2、意义与分类总体与样本抽样调查的操作流程上讲抽样调查即非全面调查上讲指从构成总体的所有单元中按一定程序选择一部分单元,并根据这部分单元的特征估计或推断总体特征的调查在一些场合,找到总体的所有单位客观上根本不可能在一些场合,能找到所有单元,但时间与费用代价太高在一些场合,能找到所有单元,代价也能承受,但在保证效果前提下可提高效率概率抽样调查非概率抽样调查按照一定概率从构成总体的所有单元中随机选择一部分单元进入样本的抽样方法典型抽样便利抽样“自愿”抽样下列情况是否属于概率抽样?(1)从装有30只小鸡的箱子抓5只,不做任何挑选,随便抓满5只为止。(2)将箱中30只小鸡编上130号,从130中随机抽取5
3、个数字,将对应小鸡抓出来。求126个石头的平均重量样本量1251020典型抽样40.044.935.338.531.0随机抽样80.671.443.334.126.2可以看出:(1)样本容量的增加对典型抽样的精度改进不大,而随机抽样的精度随样本量的增加有明显改善;典型调查的特点:取样很少,无法获得客观的误差评价;要以普查或概率调查为基础。(2)样本量很小时,依靠充足的先验信息获取的典型样本为佳,而样本量较大时,随机样本的估计更好。所有调查客体的集合称为调查总体,构成总体的调查客体称为个体数理统计中总体一般为服从某种分布的无限总体,这里是有限总体。记号:U(N)=U1,U2,UN指标量记号:Y1
4、,Y2,YN其单元满足“与实际总体的每个单元之间存在确定的对应关系,凭借这种对应关系可以找到实际总体中特定的一个或一些单元”条件的实际总体的映射总体称为,构成映射总体的单元称为。抽样框可认为是一个目录性清单。其形式可为:名单、手册、地图、数据库等。抽样框必须是有序的,其包含的抽样单元务必“不重不漏”。抽样单元不仅是“影子”,还指“实体”,又称样本单元或样本点,不一定是基本单元,可划分、分级。从总体全部单位中选择部分单元的活动称为抽样,而抽样的结果从总体全部单元选出的部分单元,其全体称为样本总体,简称样本。记号:y1,y2,ynf=n/N区分以下概念:(1)个体与样本(2)总体与抽样框(3)个体
5、与抽样单元1、建立课题,明确调查目的2、调查的准备阶段3、现场工作阶段4、数据处理阶段5、写出报告结论总体及目标量的确定抽样框收集数据的方法抽样设计 问卷设计数据的验收编辑估计、分析抽样的样本分布入样概率常见待估计总体特征对估计量的要求u对于有限总体U(N)=U1,U2,UN,其指标量为Y1,Y2,YN,从中抽取样本y1,y2,yn,由于是概率抽样,每个可能样本有一个确定出现概率,称为由抽样设计形成的u在某种抽样设计下,由样本概率分布得到的样本统计量的期望方差称为。u对有限总体U(N)=U1,U2,UN作有放回抽样,每次随机抽出一个单元观测后放回再抽下一个单元,得样本y1,y2,ynu对有限总
6、体U(N)=U1,U2,UN作无放回抽样,每次随机抽出一个单元观测后不放回再抽下一个单元,得样本y1,y2,yn,不计每个单元出现顺序。样本总数:Nn每个样本出现概率:1/Nn样本总数:每个样本出现概率:nNCnNC1u 一个总体单元出现在样本中的概率称为对有7个单元的总体 1,2,3,4,5,6,7进行抽样,先分成两个子总体 1,2,3,4和5,6,7再从每个子总体中随机抽取两个单元,共4个单元组成样本,求样本分布与 各单元入样概率。每个样本出现概率为1/18;1,2,3,4入样概率为1/2;5,6,7入样概率为2/3。记一个可能样本为s,样本出现概率为p(s),则有ssp1)(对任一单元Y
7、k,即为Yk的入样概率。kYssp)(对总体Y1,Y2,YN 抽取一个样本量为n的无重复样本(即同一单元不在样本中重复出现),对任一抽样设计,记Yk的入样概率为 ,记两个单元Yk,Yl同时入样的 概率为 ,则有:kkl,)1(1nNkk.,)1()2(1lnlNlkkkl对固定的,N121NkkYY、总体均值,4XYR、总体比值,P3、总体比例或总体中位数。如总体方差、其他,)(11,5122NkkYYNS,11NkkYYN或、总体总值总体总值、均值、比例的统一关系:YNY 则个个体不具有该特征,第个个体具有该特征,第记,0,1iiYkYYNPNkk11以样本统计量w估计总体的数字特征W,B(
8、w)=E(w-W)=E(w)-W称为偏量。MSE(w)=E(w-W)2=var(w)+B2(w)u 样本量n增大时,B(w)与MSE(w)同时变小,且应有即:B(w)的量级低于MSE(w).u 比较两种估计量的好坏,以MSE(w)为准,MSE(w)小者为佳。)1()()(owMSEwB优良抽样方案的衡量准则几种基本的抽样方法目的性:可度量性:可行性:经济性:高要求大样本,复杂设计;低要求小样本,简单设计可给出估计值可能的误差范围设计方案能够得到忠实执行在经费与精度之间折衷 从一个单元数为N的总体逐个抽取单元且无放回,每次都在所有尚未进入样本的单元中等概率地抽取,直到n个单元抽完。每个样本出现概
9、率为nNC1简单直观N很大时,受抽样框限制较难执行 先将总体中的抽样单元按某种顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。仅初始单元需随机抽取,实施简便对抽样框要求不高估计精度较困难 特别地,若在抽取初始单元后按照相等间距抽取其余单元,则称等距抽样。每个单元的入样概率不同,常以辅助信息为依据决定个体的入样概率。赋予适当的入样概率可以提高精度需要辅助信息 先按照某种规则把总体划分为不同的层,然后在层内再进行抽样。各层的抽样独立进行;估计在各层内进行,再由各层估计量加权平均或求和得出总体估计。分层适当时可显著提高精度抽样单元集中,利于调查实施分层需要辅助信息
10、抽样仅对初级抽样单元进行,对抽中的初级单元中调查其全部抽样单元,对没抽中初级单元不调查(群即初级抽样单元)。样本集中只需初级抽样框精度较差(一般比同样本量SRS差)是整群抽样的发展,抽得初级单元后,再从中抽取次级单元,直至达到基本单元。样本集中编制抽样框较方便估计方差较复杂,阶段不宜过多 对总体进行一次以上抽样。通常先以较小工作量获得一些可快速获得的信息(样本量较大),再在辅助信息基础上作一个样本量较小的调查。较小样本通常在前一大样本中取。可根据辅助信息选择合适的二次抽样方法,以提高估计精度。简单随机抽样系统抽样不等概抽样分层抽样整群抽样多阶抽样多重抽样概率抽样要调查全校学生对某个问题的看法,
11、采用各种抽样方法该如何实施?思考P11:4,5,6激励学生学习的名言格言激励学生学习的名言格言220、每一个成功者都有一个开始。勇于开始,才能找到成功的路。221、世界会向那些有目标和远见的人让路(冯两努香港著名推销商)222、绊脚石乃是进身之阶。223、销售世界上第一号的产品不是汽车,而是自己。在你成功地把自己推销给别人之前,你必须百分之百的把自己推销给自己。224、即使爬到最高的山上,一次也只能脚踏实地地迈一步。225、积极思考造成积极人生,消极思考造成消极人生。226、人之所以有一张嘴,而有两只耳朵,原因是听的要比说的多一倍。227、别想一下造出大海,必须先由小河川开始。228、有事者,
12、事竟成;破釜沉舟,百二秦关终归楚;苦心人,天不负;卧薪尝胆,三千越甲可吞吴。229、以诚感人者,人亦诚而应。230、积极的人在每一次忧患中都看到一个机会,而消极的人则在每个机会都看到某种忧患。231、出门走好路,出口说好话,出手做好事。232、旁观者的姓名永远爬不到比赛的计分板上。233、怠惰是贫穷的制造厂。234、莫找借口失败,只找理由成功。(不为失败找理由,要为成功找方法)235、如果我们想要更多的玫瑰花,就必须种植更多的玫瑰树。236、伟人之所以伟大,是因为他与别人共处逆境时,别人失去了信心,他却下决心实现自己的目标。237、世上没有绝望的处境,只有对处境绝望的人。238、回避现实的人,
13、未来将更不理想。239、当你感到悲哀痛苦时,最好是去学些什么东西。学习会使你永远立于不败之地。240、伟人所达到并保持着的高处,并不是一飞就到的,而是他们在同伴们都睡着的时候,一步步艰辛地向上爬241、世界上那些最容易的事情中,拖延时间最不费力。242、坚韧是成功的一大要素,只要在门上敲得够久、够大声,终会把人唤醒的。243、人之所以能,是相信能。244、没有口水与汗水,就没有成功的泪水。245、一个有信念者所开发出的力量,大于99个只有兴趣者。246、环境不会改变,解决之道在于改变自己。247、两粒种子,一片森林。248、每一发奋努力的背后,必有加倍的赏赐。249、如果你希望成功,以恒心为良友,以经验为参谋,以小心为兄弟,以希望为哨兵。250、大多数人想要改造这个世界,但却罕有人想改造自己。