二节-抽样分布课件.ppt

上传人(卖家):晟晟文业 文档编号:4688962 上传时间:2023-01-01 格式:PPT 页数:24 大小:509.36KB
下载 相关 举报
二节-抽样分布课件.ppt_第1页
第1页 / 共24页
二节-抽样分布课件.ppt_第2页
第2页 / 共24页
二节-抽样分布课件.ppt_第3页
第3页 / 共24页
二节-抽样分布课件.ppt_第4页
第4页 / 共24页
二节-抽样分布课件.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、第二节第二节 抽样分布抽样分布生物统计学的主要任务就是研究总体和样本的关系:生物统计学的主要任务就是研究总体和样本的关系:从样本到总体从样本到总体 从总体到样本从总体到样本 目的就是通过样本来推断总体目的就是通过样本来推断总体 目的就是研究样本统计量的分布及其与原总体的目的就是研究样本统计量的分布及其与原总体的关系关系从特殊到一般,从特殊到一般,从一般到特殊,从一般到特殊,统计推断统计推断 抽样分布抽样分布 抽样分布是统计推断的基础,研究抽样分布的目的就是为了更好地进行统抽样分布是统计推断的基础,研究抽样分布的目的就是为了更好地进行统计推断,并能正确地理解统计推断的结论计推断,并能正确地理解统

2、计推断的结论 1.抽样分布的概念抽样分布的概念x样本平均数样本平均数 和样本方差和样本方差S2是描述样本特征的两个最重要的统计量是描述样本特征的两个最重要的统计量总体平均数总体平均数和总体方差和总体方差2是描述总体特征的两个最重要的参数是描述总体特征的两个最重要的参数 因此,研究总体和样本的关系,实际就是研究:xS2 2 就总体而言,就总体而言,和和2都是常量都是常量 从总体中随机地抽取若干个体所组成的样本,即使每次抽取的样本容量都相等,从总体中随机地抽取若干个体所组成的样本,即使每次抽取的样本容量都相等,每一个样本所得到的样本平均数每一个样本所得到的样本平均数也不可能都相等,同时也不可能就等

3、于总体平均也不可能都相等,同时也不可能就等于总体平均数数 样本统计量将随样本的不同而有所不同,因而样本统计量也是随机变量,也有其概率分布 样本统计量的概率分布称为抽样分布(样本统计量的概率分布称为抽样分布(sampling distribution)样本统计量与总体参数之间的差异称为抽样误差样本统计量与总体参数之间的差异称为抽样误差(sampling error)从总体中抽取样本的过程称为抽样(sampling)抽样分为复置抽样和不复置抽样两种:抽样分为复置抽样和不复置抽样两种:复置抽样是指每次抽出一个个体后,这个个体应返回原总体复置抽样是指每次抽出一个个体后,这个个体应返回原总体 不复置抽样

4、是指每次抽出的个体不返回原总体不复置抽样是指每次抽出的个体不返回原总体 对于无限总体,或者样本容量n与总体容量N相比很小时,返回与否都可保证每个个体被抽到的机会相等,复置抽样等同于不复置抽样 对于有限总体,应该采取复置抽样,否则各个体被抽到的机会就不相等在实际操作中均为不复置抽样在实际操作中均为不复置抽样 在理论研究中则以复置抽样为主在理论研究中则以复置抽样为主 2.样本平均数的抽样分布样本平均数的抽样分布2.1 样本平均数抽样分布的概念从总体容量为从总体容量为N N的总体中进行抽样,如果每个样本的样本容量均为的总体中进行抽样,如果每个样本的样本容量均为n n,将所有,将所有这样的样本都抽出来

5、,并计算出每一个样本的平均数这样的样本都抽出来,并计算出每一个样本的平均数新总体(即样本平均数抽样总体)中,样本平均数的个数即总体容量为:新总体(即样本平均数抽样总体)中,样本平均数的个数即总体容量为:Nn 原来的那个总体,称为原总体原来的那个总体,称为原总体 由样本平均数组成的分布称为样本平均数抽样分布 如果原总体的平均数为如果原总体的平均数为,标准差为,标准差为,那么样本平均数抽样总体:,那么样本平均数抽样总体:平均数为:平均数为:标准差为:标准差为:xx称为样本平均数抽样总体的标准误差 简称为标准误(standard error)由样本平均数组成的新总体,就称为样本平均数抽样总体 标准误

6、表示平均数抽样误差的大小,反映样本平均数与新总体平均数之间的标准误表示平均数抽样误差的大小,反映样本平均数与新总体平均数之间的离散程度离散程度 标准差表示的是原总体中原始数据与原总体平均数的关系标准差表示的是原总体中原始数据与原总体平均数的关系 标准误表示的是从原总体中抽取的样本平均数与样本平均数抽样总体平标准误表示的是从原总体中抽取的样本平均数与样本平均数抽样总体平均数的关系均数的关系 研究总体与样本的关系就转化成了讨论原总体与样本平均数抽样总体的关系:xnx例6:设有一总体,总体容量为N=3,观测值分别为2、4、6,以样本容量n=2对该总体进行复置抽样,证明:(1)x(2)nx原总体的总体

7、平均数为:原总体的总体平均数为:4364223(1)以样本容量以样本容量n=2对该总体进行复置抽对该总体进行复置抽样,则样本平均数抽样总体为:样,则样本平均数抽样总体为:样本平均数抽样总体的总体容量为:nN49369632x样本平均数抽样总体的总体平均数为:9(2)原总体的总体标准差为:原总体的总体标准差为:NxNx2)(23485638NxxNx2)(2样本平均数抽样总体的总体标准差为:样本平均数抽样总体的总体标准差为:99)36(156234238n2.2 样本平均数抽样分布的特点(1 1)样本平均数抽样总体的总体平均数与原总体的总体平均数相等,)样本平均数抽样总体的总体平均数与原总体的总

8、体平均数相等,因此,可用因此,可用代替代替x(2 2)样本平均数抽样总体的方差与原总体的方差的关系为)样本平均数抽样总体的方差与原总体的方差的关系为 nx22(3)当随机变量)当随机变量xN(,2)时,样本平均数)时,样本平均数 n2当随机变量当随机变量x x不呈正态分布或分布未知时,只要样本容量不呈正态分布或分布未知时,只要样本容量n n不断增大(或不断增大(或足够大),则样本平均数的分布逐渐趋向于正态分布,且平均数为足够大),则样本平均数的分布逐渐趋向于正态分布,且平均数为,方差为方差为(4)样本平均数是总体平均数的无偏估计量;样本方差是总体方差的无样本平均数是总体平均数的无偏估计量;样本

9、方差是总体方差的无偏估计量;但样本标准差不是总体标准差的无偏估计量偏估计量;但样本标准差不是总体标准差的无偏估计量 中心极限定理中心极限定理),(2nNx2.3 与 的关系xnx(1)(2)表示原总体中各观测值的离散程度表示原总体中各观测值的离散程度 x表示样本平均数抽样总体中各样本平均数的离散程度表示样本平均数抽样总体中各样本平均数的离散程度(3)是总体中各观测值变异程度的度量值是总体中各观测值变异程度的度量值 是样本平均数抽样误差的度量值是样本平均数抽样误差的度量值是用来衡量样本平均数代表总体平均数的代表程度的是用来衡量样本平均数代表总体平均数的代表程度的x(4)称为标准差,用称为标准差,

10、用Sd表示表示 称为标准误,用称为标准误,用Se表示表示 x3.样本平均数差数的抽样分布样本平均数差数的抽样分布假设有这样两个总体:假设有这样两个总体:总体总体1 总体总体2 N1 N2 1212从以上两个总体中独立地抽取样本容量分别为从以上两个总体中独立地抽取样本容量分别为n1和和n2的样本,可得:的样本,可得:1x2x继续进行抽样,继续进行抽样,最终可分别得到:最终可分别得到:11nN22nN1x2x如果将这两组样本平均数配成差数:如果将这两组样本平均数配成差数:21xx 则可得到差数:2121nnNN由这些样本平均数的差数所组成的新总体称为样本平均数差数抽样总体 由这些样本平均数的差数形

11、成的分布称为样本平均数差数抽样分布 样本平均数差数的抽样分布有两个参数:平均数:平均数:21xx 方差:方差:221xx 当原总体服从正态分布或非正态分布,只要所抽样本容量较大(当原总体服从正态分布或非正态分布,只要所抽样本容量较大(n130,n230),样本平均数差数的抽样分布就可认为是正态分布),样本平均数差数的抽样分布就可认为是正态分布样本平均数差数的抽样总体与原来的两个总体的关系为:2121xx2222121xxxx222121nn21xx 样本平均数差数标准误样本平均数差数标准误 度量样本平均数差数的抽样误差度量样本平均数差数的抽样误差的大小的大小4.标准误的作用标准误的作用(1 1

12、)衡量样本平均数间的变异程度)衡量样本平均数间的变异程度(2 2)推断总体平均数的可能范围)推断总体平均数的可能范围 标准误大,说明样本平均数间的变异程度大 用样本平均数来估计总体平均数的效果差,样本平均数的代表性弱 在通常情况下,可以用样本标准误来估计总体标准误nSSx22nSSx 可用样本平均数标准误来估计总体平均数的可能范围Sx xSx 表示原始数据的变异程度表示原始数据的变异程度 是用样本平均数来估计总体平均数的可能范围是用样本平均数来估计总体平均数的可能范围(3 3)估计总体平均数的置信区间)估计总体平均数的置信区间研究抽样和抽样分布的目的,就是希望用样本统计量来估计总体参数 一般情

13、况下,不可能精确地估计出总体参数的具体值一般情况下,不可能精确地估计出总体参数的具体值 只能在一定的概率(只能在一定的概率(1-)保证下,估计出总体参数所在的范围)保证下,估计出总体参数所在的范围 点估计点估计 区间估计区间估计 置信区间的上下限,分别称为置信上限和置信下限置信区间的上下限,分别称为置信上限和置信下限 置信区间的长度称为置信距置信区间的长度称为置信距 保证概率(保证概率(1-1-)又称为置信度或置信系数)又称为置信度或置信系数 在(1-)概率保证下总体平均数的置信区间公式为:xxuxux1-=95%:xxxx96.196.11-=99%:xxxx58.258.25.t-分布分布

14、5.1 t-分布的定义正态分布的标准化公式为:正态分布的标准化公式为:xu 根据公式可以计算出随机变量根据公式可以计算出随机变量x x在某一区间内出现的概率:在某一区间内出现的概率:uxu对于总体方差对于总体方差2 2已知的总体,根据标准正态分布可以知道样本平均数在某已知的总体,根据标准正态分布可以知道样本平均数在某一区间内出现的概率,公式为:一区间内出现的概率,公式为:xxuxxuxu假如假如2未知,而且样本容量又比较小(未知,而且样本容量又比较小(n30)时:)时:2S2xSx标准化公式可变换为:标准化公式可变换为:xSxtt统计量组成的分布,就称为统计量组成的分布,就称为t分布(分布(t

15、 distribution)不再服从标准正态分布不再服从标准正态分布)(dfttt分布是一组曲线,自由度不同,曲线不同,但均以y轴为对称 t分布只有一个参数,即自由度分布只有一个参数,即自由度 dft t分布的平均数和标准差为:分布的平均数和标准差为:0(df 1))2/(dfdft(df 2)服从服从t-分布分布5.2 t-分布的特点(1)t分布为对称分布,关于分布为对称分布,关于t=0对称;只有一个峰,峰值在对称;只有一个峰,峰值在t=0处;与标准处;与标准正态分布曲线相比,正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平分布曲线顶部略低,两尾部稍高而平(2)t分布曲线受自由度分布曲线

16、受自由度df 的影响,自由度越小,离散程度越大的影响,自由度越小,离散程度越大(3)t分布的极限是正态分布。分布的极限是正态分布。df越大,越大,t分布越趋近于标准正态分布越趋近于标准正态分布分布 当当n 30时,时,t分布与标准正态分布分布与标准正态分布的区别很小;的区别很小;n 100时,时,t分布基分布基本与标准正态分布相同;本与标准正态分布相同;n时,时,t 分布与标准正态分布完全一致分布与标准正态分布完全一致5.3 t-分布的概率计算附表附表4 4给出了给出了t t分布的两尾临界值分布的两尾临界值 当左尾和右尾的概率之和为当左尾和右尾的概率之和为(每侧为(每侧为 /2)时,)时,t分

17、布在横坐标上的临界值的分布在横坐标上的临界值的绝对值,记为绝对值,记为t )()(ttPttP例7:根据附表4查出相应的临界 t值:(1)df=9,=0.05;(2)df=9,=0.01)9(05.0t)9(01.0t261.2250.3从一个已知平均数为从一个已知平均数为,方差为,方差为2的正态总体中,进行独立地抽样,可获得随的正态总体中,进行独立地抽样,可获得随机变量机变量x,则其标准离差:,则其标准离差:xu N(0,1)如果连续进行如果连续进行n次独立抽样,可得次独立抽样,可得n个标准正态离差个标准正态离差ui,对这,对这n个独立的标准正个独立的标准正态离差态离差ui进行平方求和就得到

18、一个新的统计量进行平方求和就得到一个新的统计量2:2222212niuuuu22)(x6.2-分布分布6.1 2-分布的定义222)(xx222)1(Sn222)(x2)(xx如果用样本进行计算:如果用样本进行计算:2)(x由这些由这些2值所组成的一个分布,就称之为值所组成的一个分布,就称之为2分布(分布(2 distribution)2)(2df22)1()(Snxx1)(22nxxS6.2 2-分布的特点(1)2分布的取值范围为分布的取值范围为0,+),无负值),无负值(2)2分布的平均数为:分布的平均数为:df2方差为:方差为:dfx222(3)2分布的形状决定于自由度分布的形状决定于自

19、由度df 当当df=1时,曲线呈反时,曲线呈反 J 形形 随着随着df 的增大,曲线渐趋对称的增大,曲线渐趋对称 当当df 30时,向正态分布渐近时,向正态分布渐近(4)2还可以定义为理论次数与观察次数间的符合程度 iiiEEO22)(O 观察次数 E 理论次数 6.3 2-分布的概率计算附表附表3 3给出了给出了2 2分布的右尾临界值分布的右尾临界值 当右尾概率为当右尾概率为 时,时,2分布在横坐标分布在横坐标上的临界值的绝对值,记为上的临界值的绝对值,记为2)(22P例8:根据附表3查出相应的右尾临界2值:(1)df=9,=0.05;(2)df=9,=0.012)9(05.02)9(01.

20、0919.16666.21如果计算左尾概率为 时2分布的临界值,只需查右尾概率为1-的右尾临界值即可7.F-分布分布7.1 F-分布的定义从一个方差从一个方差2的正态总体中独立地抽取样本容量分别为的正态总体中独立地抽取样本容量分别为n1、n2的两个样本,的两个样本,这两个样本的方差分别为:这两个样本的方差分别为:21S22S221121)1(Sn 则有:222222)1(Sn 这两个这两个2变量除以各自的自由度后的比值为:变量除以各自的自由度后的比值为:)1()1(222121nn2222221211)1()1()1()1(nSnnSn2221SSF由一系列由一系列F值所构成的分布称为值所构成

21、的分布称为F分布(分布(F distribution)F F(df1,df2)7.2 F-分布的特点(1)F分布密度曲线是随自由度分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线的变化而变化的一簇偏态曲线 其形状随着其形状随着df1、df2的增大逐渐趋于对称;的增大逐渐趋于对称;(2)F分布的取值范围是(分布的取值范围是(0,+),其平均数:),其平均数:1F7.3 F-分布的概率计算附表附表5 5给出了给出了F F分布的右尾临界值分布的右尾临界值 当右尾概率为当右尾概率为 时,时,2分布在横坐分布在横坐标上的临界值的绝对值,记为标上的临界值的绝对值,记为F)(FFP例9:根据附表5查出相应的右尾临界F值:(1)df1=4,df2=20,=0.05;(2)df1=4,df2=20,=0.01F0.01(4,20)=4.43 F0.05(4,20)=2.87

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(二节-抽样分布课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|