1、抽样误差 与 区间估计 魏永越 2 假如事先知道某地七岁男童的平均身高为 119.41cm。研究者从所有符合要求的七岁男 童中每次抽取100人,共计抽取了五次。 从一个例子来谈抽样误差 魏永越 3 =119.4cm = 4.38cm 122.7 121.0 118.1 108.3 124.5 121.1 115.8 120.9 117.9 = 118.4cm S =4.41cm x 119.4 u 魏永越 4 119.41cm = 4.38cm 118.21cm =4.45cm X s 120.18cm =4.90cm X s 117.78cm =3.98cm X s 119.87m =5.1
2、5cm X s 120.81cm =4.33cm X s 魏永越 5 导致总体均数与样本均数、样本均数之间有 差别的可能原因是? 魏永越 6 抽样误差的定义 五次抽样得到了不同的结果,原因何在? 个体变异 随机抽样 不同男童的 身高不同 每次抽到的 人几乎不同 抽样误差 魏永越 7 抽样误差的表现 抽 样 误 差 的 表 现 样本均数和 总体均数间 的差别 i X 样本均数和 样本均数间 的差别 ij XX 魏永越 8 抽样误差 定义: 由于个体变异的存在,由抽样引起的样本统计量与总 体参数间的差别。 原因:个体变异抽样 表现: 不同样本统计量间的差别 样本统计量与总体参数间的差别 抽样误差是
3、不可避免的!抽样误差是不可避免的! 抽样误差是有规律的!抽样误差是有规律的! 魏永越 9 均数的抽样误差之特点 各样本均数未必等于总体均数; 样本均数间存在差异; 样本均数的分布很有规律; 魏永越 10 标准误(standard error) 样本统计量的标准差称为标准误。 样本均数的标准差称为均数的标准误。 均数的标准误表示样本均数的变异度。 前者称为理论标准误,后者称为样本标准误。 x n x s s n 这个公式是怎这个公式是怎 么来的?么来的? 魏永越 11 已知变量x的方差V(x)=S2,则2x的方差为? 已知变量x1的方差V(x1)=S12,变量x2的方差 V(x2)=S22,则x
4、1+x2的方差为? 魏永越 12 中心极限定理中心极限定理(central limit theorem) Case 1: 从正态分布总体N(,) 中随机抽样(每个样 本的含量为n如10),可得无限多个样本如 1000次,每个样本计算样本均数,则样本 均数也服从正态分布。 样本均数的均数为 ; 样本均数的标准差为 。 x n 魏永越 13 中心极限定理中心极限定理(central limit theorem) Case 2: 从非正态分布总体(均数为,方差为)中随 机抽样(每个样本的含量为n),可得无限多个 样本,每个样本计算样本均数,则只要抽样 次数足够大(n50),样本均数也近似服从正态 分
5、布。 样本均数的均数为 ; 样本均数的标准差为 。 x n 魏永越 14 Sampling Distribution of sample means Sampling Distribution of sample means Sampling Distribution of sample means Population B X X Population C X Population D X Population A n=10 n=4 n=25 n=2 Sampling Distribution of sample means X X X X 样本均数的抽样分布 魏永越 15 与样本含量的关系
6、 n 越大,均数的均数就越接近总体均数; n 越大,变异越小,分布越窄; 对称分布接近正态分布的速度,大于非对称 分布。分布越偏,接近正态分布所需样本含 量就越大。 魏永越 16 抽样误差的规律性(1) 均数的抽样误差规律: 在样本含量足够大时,无论总体分布如何,其均 数的分布趋于正态分布 魏永越 17 f(t) (标准正态曲线标准正态曲线) =3 0.1 0.2 -4 -3 -2 -1 0 1 2 3 4 0.3 如果样本含量较小时均数的抽样分布如果样本含量较小时均数的抽样分布 ? 魏永越 18 t 分布 魏永越 19 正态分布的标准化变化 若 X N(,2) , 则则 。 X N(0,1)
7、 因因 , 则则 。 (0,1) X X uN 2 ( ,) X XN 魏永越 20 t 分布的概念 实际工作中,总体方差未知。所以,用样本 方差代替总体方差, 且当样本含量较小时 的分布如何? X X s 魏永越 21 t分布起源 http:/www.economics.soton.ac. uk/staff/aldrich/fisherguide/raffra me.htm 魏永越 22 t 分布的概念 用样本方差代替总体方差,此时 不服从正态分布。而服从 t 分布。记为: X X s n X X tt s (1) 魏永越 23 f(t) =(标准正态曲线标准正态曲线) =5 =1 0.1
8、0.2 -4 -3 -2 -1 0 1 2 3 4 0.3 自由度分别为自由度分别为1、5、 时的时的 t 分布分布 魏永越 24 研究抽样分布的目的 样本统计量的抽样分布规律是统计推 断(statistical inference)的理论基础。 只有了解抽样分布规律,才能深刻理 解统计推断的内涵。 魏永越 25 表示总体均数的标准误。( ) 表示样本均数的标准误。( ) 同一批数值变量资料的标准差不会比标准误大。( ) 即使变量X偏离正态分布,只要每次抽样的样本数足 够大,样本均数也近似服从正态分布。( ) x s x 魏永越 26 表示( ) A 总体标准差 B 样本标准差 C 抽样分布均
9、数的理论标准差 D 抽样分布均数的估计标准差 x 魏永越 27 表示 ( ) A 总体均数的离散程度 B 总体标准差的离散程度 C 样本均数的离散程度 D 样本标准差的离散程度 x s 魏永越 28 从连续性变量X中反复随机抽样,随样本含量n增 大, 将趋于( ) A X的原始分布 B 正态分布 C 均数的抽样分布 D 标准正态分布 x x s 魏永越 29 下面关于标准误的四种说法中,哪一种最不 正确( ) A 标准误是样本统计量的标准差 B 标准误反映了样本统计量的变异 C 标准误反映了总体参数的变异 D 标准误反映了抽样误差的大小 魏永越 30 简答题 请简述标准差与标准误的区别和联系。 区别: 联系: