1、 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 统计学原理与应用统计学原理与应用 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 学习目的:学习目的:理解抽样推断的含义、特点与作用。理解抽样推断的含义、特点与作用。理解抽样误差的含义、影响因素。理解抽样误差的含义、影响因素。掌握抽样误差的表现形式,及其计算掌握抽样误差的表现形式,及其计算方法。方法。掌握抽样推断的基本方法。掌握抽样推断的基本方法。理解并区分几种常用的抽样调查组织理解并区分几种常用的抽样调查组织方式。方式。掌握假设检验
2、的一般方法与程序。掌握假设检验的一般方法与程序。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础一、抽样推断的概念、特点与意义一、抽样推断的概念、特点与意义 1 1、抽样推断的概念、抽样推断的概念抽样推断是根据随机原则,从调查总体中抽抽样推断是根据随机原则,从调查总体中抽取部分单位组成样本进行调查,利用样本的取部分单位组成样本进行调查,利用样本的实际数据计算样本指标,并据以推算总体相实际数据计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。应数量特征的一种统计分析方法。第一节第一节 抽样推断概述抽样推断概述 第六章第六章 抽样推断
3、抽样推断Fundamentals of Statistics统计学基础统计学基础特特 点点 它是一种由部分推断整体的研究方法它是一种由部分推断整体的研究方法。抽样推断建立在随机抽样的基础上抽样推断建立在随机抽样的基础上。抽样推断运用概率估计的方法。抽样推断运用概率估计的方法。抽样推断的误差可以事先计算并加以控制。抽样推断的误差可以事先计算并加以控制。2、抽样推断的特点、抽样推断的特点 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础n二、抽样推断的内容二、抽样推断的内容(一)参数估计(一)参数估计(二)假设检验(二)假设检验 第六章第六章
4、抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础三、抽样推断的一些基本概念三、抽样推断的一些基本概念(一)总体和样本(一)总体和样本总体总体:又称全及总体。指所要认识的研究对象全又称全及总体。指所要认识的研究对象全体。总体单位总数用体。总体单位总数用“N”N”表示。表示。样本样本:又称子样。是从全及总体中随机抽取出来,又称子样。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集作为代表这一总体的那部分单位组成的集合体。样本单位总数用合体。样本单位总数用“n”n”表示。表示。第六章第六章 抽样推断抽样推断Fundamentals of Sta
5、tistics统计学基础统计学基础(二)变量总体和属性总体(二)变量总体和属性总体变量变量总体总体:如果每一个总体单位就所研究的标志可以取如果每一个总体单位就所研究的标志可以取不同的量,此时的研究总体称为变量总体不同的量,此时的研究总体称为变量总体。属性总体:如果有些现象总体就所研究的标志只表现如果有些现象总体就所研究的标志只表现为两种性质上的差异,此时的研究总体称为两种性质上的差异,此时的研究总体称为属性总体为属性总体。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(三)总体指标(三)总体指标 和和 样本指标样本指标总体指标总体指标是根
6、据总体中各单位的标志值或标志属性计算的,反映总体的某是根据总体中各单位的标志值或标志属性计算的,反映总体的某种属性或特征的综合指标,称为全及指标,也称为总体参数。种属性或特征的综合指标,称为全及指标,也称为总体参数。参数参数变量总体变量总体条件下条件下总体平均数总体平均数总体方差总体方差X=X NX=XF F(X-X)N2=2(X-X)F F2=2属性总体属性总体条件下条件下总体成数总体成数 方差方差2=P(1-P)P=N1N 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础样本指标样本指标是根据样本各单位标志值或标志属性计算的综合是根据样
7、本各单位标志值或标志属性计算的综合指标。也称为样本统计量。指标。也称为样本统计量。统计量统计量变量总体变量总体条件下条件下属性总体属性总体条件下条件下样本平均数样本平均数 nxxffxx样本标准差样本标准差nxx2ffxxx2样本成数样本成数 nnp1标准差标准差)1(ppp 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(四)重复抽样和不重复抽样(四)重复抽样和不重复抽样重复抽样重复抽样:又称回置抽样。又称回置抽样。不重复抽样不重复抽样:又称不回置抽样。又称不回置抽样。可能组成的样本数目:可能组成的样本数目:N N(N-1N-1)()(
8、N-2N-2)(N-n+1N-n+1)可能组成的样本数目:可能组成的样本数目:nN 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础从从A A、B B、C C、D D四个单位中,抽出两个单位构成四个单位中,抽出两个单位构成一个样本,问一个样本,问可能组成可能组成的样本数目是多少?的样本数目是多少?重复抽样重复抽样AAACADBABBBCBDABCACBCCCDDADBDCDDNn=42=16(个样本)例如例如 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础不重复抽样不重复抽样N(N-1
9、)(N-2).43=12(个样本)第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础第二节第二节 抽抽 样样 误误 差差一、抽样误差的概念一、抽样误差的概念 抽样误差是指按照随机原则抽样,所得的样本指标和总体指标之间的数量差别。抽样误差的特点:抽样误差的特点:是抽样调查所特有的,是不可避免的。是抽样调查所特有的,是不可避免的。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础抽样误差的特点:抽样误差的特点:是抽样调查所特有的,是不可避免的。是抽样调查所特有的,是不可避免的。统计调查中存在的误
10、差(统计误差):统计调查中存在的误差(统计误差):1.登记性误差登记性误差(调查误差):(调查误差):它不是抽样调查所特有的;它不是抽样调查所特有的;是可以避免的。是可以避免的。结论:它不是抽样误差结论:它不是抽样误差 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础2.代表性误差代表性误差 是由于样本不足以代表总体而引起的误差。是由于样本不足以代表总体而引起的误差。第一,系统性误差第一,系统性误差 是由于违反随机原则而产生的误差。是由于违反随机原则而产生的误差。它是不抽样推断所特有的,是能够避免的,它是不抽样推断所特有的,是能够避免的,只
11、要遵循只要遵循随机原则就可以避免系统性误差。随机原则就可以避免系统性误差。结论:它也不是抽样误差结论:它也不是抽样误差第二节第二节 抽抽 样样 误误 差差 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础第二,随机性误差第二,随机性误差 (偶然性误差)(偶然性误差)是指严格按照随机原是指严格按照随机原则,但由于样本不能完全覆盖总体单位而形成的误差。则,但由于样本不能完全覆盖总体单位而形成的误差。它是执行随机原则产生的,它是执行随机原则产生的,是不能够避免的,而必然是不能够避免的,而必然存在,存在,只要抽样调查就会有随机性误差。只要抽样调查就
12、会有随机性误差。结论:它是抽样误差结论:它是抽样误差 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 系统性误差系统性误差随机(性)误差随机(性)误差(偶然(性)误差偶然(性)误差)n统计误差:统计误差:n1.登记性误差(调查误差)登记性误差(调查误差):n2.代表性误差代表性误差:第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础二、抽样误差的表现形式二、抽样误差的表现形式 (一)(一)抽样实际误差抽样实际误差 抽样实际误差抽样实际误差,是指在某一次具体的抽样调查中,是指在某一次具体的
13、抽样调查中,由随机因素引起的样本指标与总体指标之间的离差。由随机因素引起的样本指标与总体指标之间的离差。在多数情况下,它可能是无法计算与测定的。在多数情况下,它可能是无法计算与测定的。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(二)抽样平均误差(二)抽样平均误差 抽样平均误差抽样平均误差,是抽样平均数或抽样成数的标准,是抽样平均数或抽样成数的标准差,反映了抽样指标与总体指标的平均误差程度。差,反映了抽样指标与总体指标的平均误差程度。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础
14、抽样平均误差的计算公式抽样平均误差的计算公式抽样平均数的平均误差抽样平均数的平均误差抽样成数的平均误差抽样成数的平均误差MXxx2MPpp2实际上,利用上述两个公式是计算不出抽样平均误差的。实际上,利用上述两个公式是计算不出抽样平均误差的。想一想,为什么?想一想,为什么?第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础1.1.抽样平均数的抽样平均误差抽样平均数的抽样平均误差采用重复抽样:采用重复抽样:nx公式公式6.171.分子(总体标准差)和抽样误差的关系分子(总体标准差)和抽样误差的关系 2.分母(样本容量)和抽样误差的关系分母(样本容
15、量)和抽样误差的关系 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础采用不重复抽样:采用不重复抽样:12NnNnx公式公式6.18 当当N值较大(一般指大于值较大(一般指大于100)时,式中的修正因子分母)时,式中的修正因子分母的的1将可不予考虑,于是:将可不予考虑,于是:)1(2Nnnx公式公式6.19 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 随机抽选某校学生随机抽选某校学生100100人,调查他们的体重。得到他人,调查他们的体重。得到他们的平均体重为们的平均体重为5858
16、公斤,标准差为公斤,标准差为1010公斤。问抽样推断公斤。问抽样推断的平均误差是多少?的平均误差是多少?已知:已知:n=100例题例题158x=10则:则:)(110010公斤nx即即:当根据样本学生的平均体重估计全部学生的平均体重当根据样本学生的平均体重估计全部学生的平均体重时时,抽样平均误差为抽样平均误差为1 1公斤。公斤。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础已知:已知:N=2000n=400 某厂生产一种新型灯泡共某厂生产一种新型灯泡共20002000只,随机抽出只,随机抽出400400只作只作耐用时间试验,测试结果平均使
17、用寿命为耐用时间试验,测试结果平均使用寿命为48004800小时,样小时,样本标准差为本标准差为300300小时,求抽样推断的平均误差?小时,求抽样推断的平均误差?例题例题24800 x=300则:则:)(15400300小时nxNnnx12)(42.13200040014003002小时 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础2.抽样成数的抽样平均误差抽样成数的抽样平均误差采用重复抽样采用重复抽样:采用不重复抽样:采用不重复抽样:nppp1公式公式6.21Nnnppp11公式公式6.22 第六章第六章 抽样推断抽样推断Funda
18、mentals of Statistics统计学基础统计学基础 某校随机抽选某校随机抽选400400名学生,发现戴眼镜的学生有名学生,发现戴眼镜的学生有8080人。根据样本资料推断全部学生中戴眼镜的学生所占比人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?重时,抽样误差为多大?已知:已知:400n801n则:样本成数则:样本成数例题例题3%20400801nnp抽样平均误差:抽样平均误差:02.04008.02.01nppp 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 一批食品罐头共一批食品罐头共60000600
19、00桶,随机抽查桶,随机抽查300300桶,发现有桶,发现有6 6桶不合格,求合格品率的抽样平桶不合格,求合格品率的抽样平均误差?均误差?已知:已知:60000N300n61n98.030063001nnnp例题例题4 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础则:样本合格率则:样本合格率(%)808.030002.098.01npppNnnppp11(%)806.060000300130002.098.0 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 抽样极限误差抽样极限误差
20、,指在进行抽样估,指在进行抽样估计时,根据研究对象的变异程度和分析计时,根据研究对象的变异程度和分析任务的要求所确定的,样本指标与总体任务的要求所确定的,样本指标与总体指标之间指标之间可允许的可允许的误差范围误差范围。(三)抽样极限误差及其可靠程度(三)抽样极限误差及其可靠程度1、抽样极限误差的概念、抽样极限误差的概念 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础抽样平均数的极限误差抽样平均数的极限误差:抽样成数的极限误差:抽样成数的极限误差:xx Xxx Xxx=pp -Pp P ppp可以变形为:可以变形为:第六章第六章 抽样推断抽
21、样推断Fundamentals of Statistics统计学基础统计学基础 xxxx区间(区间(,)称为平均数的估计区间)称为平均数的估计区间或置信区间区间长度为或置信区间区间长度为2 2x x区间区间(p-(p-p,p+p,p+p)p)称为成数的估计区间或置称为成数的估计区间或置信区间信区间,区间长度为区间长度为2 2p p 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础n【例【例6-4】要估计某乡粮食亩产量和总产量水】要估计某乡粮食亩产量和总产量水平,从平,从8000亩粮食作物中,用不重复抽样方亩粮食作物中,用不重复抽样方法抽取法
22、抽取400亩,求得平均亩产为亩,求得平均亩产为450千克。如千克。如果确定抽样极限误差为果确定抽样极限误差为5千克,这就要求某乡千克,这就要求某乡粮食亩产为粮食亩产为4505千克,即在千克,即在445千克至千克至455千克之间,而粮食总产量为千克之间,而粮食总产量为8000(4505)千克,即在千克,即在3 560吨至吨至3 640吨之间。吨之间。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础n【例【例6-5】要估计某农作物秧苗的成活率,从】要估计某农作物秧苗的成活率,从播种这一品种的秧苗地块随机抽取秧苗播种这一品种的秧苗地块随机抽取秧苗
23、1000棵棵,其中死苗,其中死苗80棵,则样本秧苗成活率棵,则样本秧苗成活率np=(1000-80)/1000=92%。如果确定抽样。如果确定抽样极限误差极限误差p为为2%,这就要求该种秧苗的成活,这就要求该种秧苗的成活率率P为为92%2%,即在,即在90%至至94%之间。之间。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 2 2、抽样估计的概率度、抽样估计的概率度tt抽样估计的概率度抽样估计的概率度是测量抽样估计可靠程度是测量抽样估计可靠程度的一个参数。用符号的一个参数。用符号“t”表示,表示误差范表示,表示误差范围(极限误差)是平均
24、误差的若干倍。围(极限误差)是平均误差的若干倍。t 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础抽样平均数、成数的极限误差抽样平均数、成数的极限误差抽样极限误差与概率度(可靠性)成正比。抽样极限误差与概率度(可靠性)成正比。xxztppzt 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础n如【例如【例6-4】已知某乡粮食亩产的标准差为】已知某乡粮食亩产的标准差为82千克,总体单位数千克,总体单位数N=8000亩,样本单亩,样本单位数位数n=400亩,则可求得抽样平均误差为亩,则可求
25、得抽样平均误差为:n此时,如果我们用概率度此时,如果我们用概率度t=1.25 来表示极限误来表示极限误差的范围差的范围,即,即1.25u来规定误差范围的大小,这来规定误差范围的大小,这就要求某乡的粮食平均亩产为就要求某乡的粮食平均亩产为4501.25u公斤公斤 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 3 3、抽样估计的置信度、抽样估计的置信度-F(t)-F(t)抽样估计的置信度,就是表明抽样指标和总体指标的误差抽样估计的置信度,就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。不超过一定范围的概率保证程度。【例6-6】
26、设样本粮食平均亩产量 为350千克,又知抽样平均误差 =6.25千克,求总体粮食平均亩产量 在345355千克之间的估计置信度。xxX如果允许误差范围扩大至10千克,即总体平均亩产在340360千克之间,则概率度t为:第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 在一定的抽样平均误差条件下,概率度在一定的抽样平均误差条件下,概率度t越大,则越大,则极限误差越大,区间极限误差越大,区间(,)或或(p-p,p+p)范围越宽,总体指标落在该区间内的概率范围越宽,总体指标落在该区间内的概率(可能性)越大,抽样估计的可靠程度越高(可能性)越大,抽
27、样估计的可靠程度越高。xxxx,第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 三、影响抽样误差大小的因素三、影响抽样误差大小的因素1、总体各单位标志值的差异程度、总体各单位标志值的差异程度2、样本容量即样本单位数、样本容量即样本单位数3、抽样调查的组织方式和抽样方法、抽样调查的组织方式和抽样方法 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础一、点估计一、点估计 点估计的含义点估计的含义点估计也叫定值估计,就是用样本指标直接代表总体指标的估计方法,即以样本指标的实际值作为相应总体指
28、标的估计值。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础一、点估计一、点估计抽样估计的优良估计标准抽样估计的优良估计标准 无偏性无偏性一致性一致性有效性有效性 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础二、区间估计二、区间估计区间估计三要素区间估计三要素估计值估计值1 1、区间估计的概念:、区间估计的概念:px,抽样极限误差范围抽样极限误差范围px,概率保证程度概率保证程度 tF 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学
29、基础(1)在给定误差范围条件下的区间估计模式1.1.抽取样本,计算抽样指标。抽取样本,计算抽样指标。2.2.根据给定的极限误差范围,估计算总体指标的上限和下限。根据给定的极限误差范围,估计算总体指标的上限和下限。3.3.计算概率度,查表求出概率计算概率度,查表求出概率F F(t t),并对总体参数作出),并对总体参数作出区间估计。区间估计。【例6-8】【例6-9】2 2、区间估计的模式、区间估计的模式 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础2 2、区间估计的模式、区间估计的模式(2)在给定概率保证程度下的区间估计模式 1.1.抽取
30、样本,计算样本指标。抽取样本,计算样本指标。2.2.根据给定的根据给定的F F(t t)查表求得概率度)查表求得概率度 t t。3.3.根据概率度和抽样平均误差计算极限误差,根据概率度和抽样平均误差计算极限误差,计算被估计算被估计值的上、下限,对总体参数作出区间估计。计值的上、下限,对总体参数作出区间估计。【例6-10】【例6-11】第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础 例如例如某城镇居民电力消费量的有关资料如下某城镇居民电力消费量的有关资料如下 电力消费量电力消费量(度)(度)家庭户数家庭户数45-5545-5555-6555
31、-6565-7565-7575-8575-8585-9585-952 25 59 96 63 3合计合计2525请在请在95%95%的概率保的概率保证程度下,计算该证程度下,计算该城镇家庭用户用电城镇家庭用户用电平均消费量的置信平均消费量的置信区间。区间。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础解:解:第一步,计算第一步,计算2525个家庭的平均用电量个家庭的平均用电量电力消费量电力消费量户数户数 f f组中值组中值 x x xfxf45-5545-5555-6555-6565-7565-7575-8575-8585-9585-95
32、2 25 59 96 63 3 合计合计252550506 60 070708080909010100 030300 063063048048027027017801780fxfx)度(2.71251780 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础解:解:第二步,计算家庭平均用电量的标准差第二步,计算家庭平均用电量的标准差电力消费量电力消费量户数户数 f f组中值组中值 x x 45-5545-5555-6555-6565-7565-7575-8575-8585-9585-952 25 59 96 63 35050606070708
33、0809090 合计合计2525 离差离差)(xx离差平方离差平方2)(xx离差平方和离差平方和fxx2)(-21.2-21.2449.44449.44898.88898.88-11.2-11.2125.44125.44627.20627.20-1.2-1.21.441.44 12.96 12.968.88.877.4477.44 464.64 464.6418.818.8353.44353.441060.321060.32 3064.00 3064.00ffxx2)(25306480.122度071.11 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计
34、学基础统计学基础第三步,计算第三步,计算2525个家庭的平均用电量的抽样平均误差个家庭的平均用电量的抽样平均误差)(214.225071.11度nx第四步,计算第四步,计算2525个家庭的平均用电量的抽样极限误差个家庭的平均用电量的抽样极限误差=t=1.96=t=1.962.214=4.342.214=4.34度度 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础下限:下限:上限:上限:86.6634.42.71xx第五步,计算第五步,计算2525个家庭的平均用电量的置信区间个家庭的平均用电量的置信区间54.7534.42.71xx答:以答
35、:以95%95%的把握程度估计该城镇家庭用户平均用电量的消的把握程度估计该城镇家庭用户平均用电量的消费区间是费区间是66.8666.86度度 75.5475.54度。度。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础三、对总体总量指标的推断三、对总体总量指标的推断样本指标值乘以总体单位数,即 N、pN是总体总量指标的点估计值。总体指标的区间估计值乘以总体单位数,即()N,()N、(p-p)N,(p+p)N是总体总量指标的区间估计值。xxxx 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学
36、基础一、确定样本容量应考虑的因素一、确定样本容量应考虑的因素 (一)确定必要的样本容量的意义和原则(一)确定必要的样本容量的意义和原则样本容量样本容量n n的大小直接关系到抽样推断的准确性的大小直接关系到抽样推断的准确性的抽样过程所产生的费用高低。的抽样过程所产生的费用高低。它是抽样推断中必须要首先确定的一个重要问题。它是抽样推断中必须要首先确定的一个重要问题。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(二)影响必要的样本容量的影响因素(二)影响必要的样本容量的影响因素1.1.总体各单位的标志变动度的大小;总体各单位的标志变动度的大小
37、;2.2.抽样极限误差的大小;抽样极限误差的大小;3.3.调查结果的概率保证程度;调查结果的概率保证程度;4.4.抽取样本单位的方法:是重复还是不重复抽样抽取样本单位的方法:是重复还是不重复抽样5.5.抽样的组织形式:是简单重复抽样、机械抽样、抽样的组织形式:是简单重复抽样、机械抽样、类型抽样还是整群抽样等。类型抽样还是整群抽样等。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础二、二、样本容量的确定样本容量的确定(一)变量总体条件下的计算公式(一)变量总体条件下的计算公式1.重复抽样条件下重复抽样条件下222xxtn公式公式6 6.292
38、92.不重复抽样条件下不重复抽样条件下22222xxxzNNtn公式公式6 6.3030 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(二)属性总体条件下的计算公式(二)属性总体条件下的计算公式1.1.重复抽样条件下重复抽样条件下221ppptn公式公式6 6.31312.2.不重复抽样条件下不重复抽样条件下ppzNpNptnp11222公式公式6 6.3232 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础重复抽样:重复抽样:不重复抽样:不重复抽样:抽样平均数抽样平均数抽样成数抽
39、样成数22222xxxzNNtnppzNpNptnp11222222xxtn221ppptn 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础一、简单随机抽样一、简单随机抽样(一)直接抽选法(一)直接抽选法(二)抽签法(二)抽签法(三)随机号码表法(三)随机号码表法 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础二、分层抽样二、分层抽样 分层抽样又叫类型抽样、分类抽样。它是先对总体各单位按主要标志加以分组,其后再从各组中按随机原则抽取一定样本单位构成样本的抽样方式。特点是由于通过划类分
40、层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础三、等距抽样三、等距抽样 等距抽样又称机械抽样或系统抽样。它是事先把总体的全部单位按某一标志排列,然后按固定顺序和间隔来抽取调查单位的一种抽样方式。按等距抽样方式来抽取调查单位,能够使抽出的调查单位更均匀地分布在总体中。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础四、整群抽样四、整群抽样 整群抽样又称聚类抽样,是将总体中各单位划分成若干个互不交叉、互不重复的集合,称之为群,
41、然后以群为单位,从中随机抽取部分群,对中选群的所有单位进行全面调查的一种抽样方式。简单随机抽样、分层抽样、等距抽样所抽取的样本单位都是个体,而整群抽样所抽取的样本,是由若干个体组成的群。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础一、假设检验的概念一、假设检验的概念 假设检验假设检验是根据一定假设条件由样本是根据一定假设条件由样本推断总体的一种方法,它是根据问题的需推断总体的一种方法,它是根据问题的需要对所研究的总体参数作某种假设,然后要对所研究的总体参数作某种假设,然后抽取样本,构造适当的统计量,对假设的抽取样本,构造适当的统计量,对
42、假设的正确性进行判断,作出拒绝或接受假设的正确性进行判断,作出拒绝或接受假设的判断。判断。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础二二、假设检验的、假设检验的一般方法一般方法(一)原假设和备择假设(一)原假设和备择假设原假设是要根据检验结果予以拒绝或接受的假设,以H0表示。备择假设是原假设被否定之后应选择的、与原假设不相容(即对立)的假设,以H1表示。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(二)显著性水平(二)显著性水平 在进行假设检验时,事先确定一个可允许的作为判断界
43、限的小概率标准非常重要。这个小概率标准就是显著性水平。显著性水平数值越大,则原假设被拒绝的可能性越大,原假设为真而被否定的风险也越大。一般而言,显著性水平采用0.01、0.05和0.10等数值。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(三)双边检验和单边检验(三)双边检验和单边检验1、双边检验,是指当我们所关心的问题是要检验样本平均数和总体平均数有没有显著性差异,而不是差异的方向是正差异还是负差异时,所采用的一种统计检查方法。2、单边检验,是指当所要检验的是样本所取自的总体的参数值是偏高(大于)或是偏低(小于)于某个特定值时,所采用
44、的一种单方向的检查方法。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(四)假设检验中的两类错误(四)假设检验中的两类错误第一类错误就是弃真错误。当原假设H0成立时拒绝了H0,即当应该接受原假设H0而拒绝这个假设时所犯的错误。第二类错误就是取伪错误。当原假设H0不成立时接受了H0,即当应该拒绝原假设H0而接受这个假设时所犯的错误。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(五)假设检验的一般步骤(五)假设检验的一般步骤1、据所研究问题的要求,提出原假设H0和备择假设H1。2、确定
45、适当的检验统计量。3、规定检验的显著性水平,就是选择发生第一类错误的最大允许概率;求出否定原假设和接受原假设的临界值,从而确定水平下的拒绝域。4、计算检验统计量的值,作出统计决策。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础三、总体均值的假设检验三、总体均值的假设检验(一)总体方差已知的检验(一)总体方差已知的检验在假设检验中,设X1,X2,Xn为来自总体N(,2)的样本,样本均值服从期望值为,方差为2/n的正态分布,因此可以选择Z作为检验统计量。第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基
46、础统计学基础)10(0,NnuxZ当H0为真时,检验统计量Z服从均值为0、方差为1的标准正态分布。当 时,拒绝原假设H02ZZ1.双边检验双边检验当 时,接受原假设H0。2ZZ 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础2.单边单边检验检验(1)左边左边检验检验当 时,拒绝原假设H0ZZ当 时,接受原假设H0。ZZ(2)右边右边检验检验当 时,拒绝原假设H0ZZ当 时,接受原假设H0。ZZ 第六章第六章 抽样推断抽样推断Fundamentals of Statistics统计学基础统计学基础(二二)总体方差)总体方差未知未知的检验的检验 在假设检验中,当总体方差2未知,需要用样本方差s2 作为总体方差的估计量,此时样本平均数服从期望值为,方差为s2/n,自由度为n-1的t分布,因此可以选择t作为检验统计量。nsuxt0 在大样本情况下,t分布和标准正态分布极为相似,因此,在大样本下,可用Z检验来近似代替t检验。