随机变量的概率分布通常是已知的-课件.ppt

上传人(卖家):晟晟文业 文档编号:4500378 上传时间:2022-12-15 格式:PPT 页数:30 大小:410.50KB
下载 相关 举报
随机变量的概率分布通常是已知的-课件.ppt_第1页
第1页 / 共30页
随机变量的概率分布通常是已知的-课件.ppt_第2页
第2页 / 共30页
随机变量的概率分布通常是已知的-课件.ppt_第3页
第3页 / 共30页
随机变量的概率分布通常是已知的-课件.ppt_第4页
第4页 / 共30页
随机变量的概率分布通常是已知的-课件.ppt_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、数数 理理 统统 计计华南农业大学理学院应用数学系StatisticsApplied Mathematic Department,College of Sciences,SCAU引引 言言 随机变量及其所伴随的概率分布全面描述了随机随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律。现象的统计性规律。概率论的许多问题中,随机变量的概率分布通常概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。是在这已知是基础上得出来的。但实际中,情况往往并非如此,一个随机现象所但实际中,情况往

2、往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分布概服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。型,但是其中的某些参数是未知的。引引 言言例如:例如:某公路上行驶车辆的速度服从什么某公路上行驶车辆的速度服从什么分布是未知的分布是未知的;电视机的使用寿命服从什么电视机的使用寿命服从什么分布是未知的分布是未知的;产品是否合格服从两点分布,但参数产品是否合格服从两点分布,但参数合格率合格率p是是未知的未知的;数理统计的任务则是数理统计的任务则是以概率论为基础,根据试验以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合所得到的数

3、据,对研究对象的客观统计规律性做出合理的推断。理的推断。从第五章开始,我们学习数理统计的基础知识。从第五章开始,我们学习数理统计的基础知识。数理统计的任务是数理统计的任务是以概率论为基础,根据试验所得到以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性作出合理的推的数据,对研究对象的客观统计规律性作出合理的推断断.数理统计所包含的内容十分丰富,本书介绍其中数理统计所包含的内容十分丰富,本书介绍其中的的参数估计、假设检验、方差分析、回归分析参数估计、假设检验、方差分析、回归分析等内容等内容.第五章主要介绍数理统计的一些基本术语、基本概念、第五章主要介绍数理统计的一些基本术语、基本概

4、念、重要的统计量及其分布,它们是后面各章的基础。重要的统计量及其分布,它们是后面各章的基础。学习的基本内容学习的基本内容样本与统计量样本与统计量 总体与样本总体与样本 在数理统计中,把研究对象的全体称为在数理统计中,把研究对象的全体称为总体总体(population)或母体或母体,而把组成总体的每个单元,而把组成总体的每个单元称为称为个体个体。抽样抽样 要了解总体的分布规律,在统计分析工作中,往往要了解总体的分布规律,在统计分析工作中,往往是是从总体中抽取一部分个体进行观测从总体中抽取一部分个体进行观测,这个过程称为,这个过程称为抽抽样。样。样本与统计量样本与统计量 子样子样 子样子样 是是n

5、个随机变量个随机变量,抽取之后,抽取之后的观测数据的观测数据 称为称为样本值或子样观察值样本值或子样观察值。12,nx xx12,nXXX 在抽取过程中,每抽取一个个体,就是对总体在抽取过程中,每抽取一个个体,就是对总体X进进行一次随机试验,行一次随机试验,每次抽取的每次抽取的n个个体个个体 ,称为总体称为总体X的一个容量为的一个容量为n的样本(的样本(sample)或子)或子样样;其中样本中所包含的个体数量称为样本容量。;其中样本中所包含的个体数量称为样本容量。12,nXXX随机抽样方法的基本要求随机抽样方法的基本要求 独立性独立性即每次抽样的结果既不影响其余各次抽样的即每次抽样的结果既不影

6、响其余各次抽样的 结果,也不受其它各次抽样结果的影响。结果,也不受其它各次抽样结果的影响。满足上述两点要求的子样称为满足上述两点要求的子样称为简单随机子样简单随机子样.获得简获得简单随机子样的抽样方法叫单随机子样的抽样方法叫简单随机抽样简单随机抽样.代表性代表性即子样即子样()的每个分量的每个分量 与总体与总体 具有具有相同的概率分布相同的概率分布。12,nXXXiXX 从简单随机子样的含义可知,从简单随机子样的含义可知,样本样本 是来自总体是来自总体 、与总体、与总体 具有相同分布的随机变量具有相同分布的随机变量.12,nXXXXX简单随机抽样简单随机抽样 例如例如:要通过随机抽样了解一批产

7、品的次品率,:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。这是一个简单随机抽样。但实际抽样中,往往是不再放回产品,则这不是一但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量个简单随机抽样。但当总量N很大时,很大时,可近似看成可近似看成是简单是简单随机抽样。随机抽样。统计量统计量 定义定义 设(设()为总体)为总体X的一个样本,的一个样本,为为不含任何未知参数不含任何未知参数的的连续函数连续函数,则,则称称 为样本(为样本()的一个统计量。)的一个统计量。12,nXXX1

8、2(,)nf XXX12(,)nf XXX12,nXXX则则 例如例如:设设 是从正态总体是从正态总体 中抽取中抽取的一个样本,其中的一个样本,其中 为已知参数为已知参数,为未知参数,为未知参数,123(,)XXX2(,)N 1233XXX21233XX X123X X X2123XXX是统计量是统计量 不是统计量不是统计量 几个常用的统计量几个常用的统计量 样本均值样本均值(sample mean)设设 是总体是总体 的一个样本,的一个样本,12(,)nXXXX11niiXXn样本方差样本方差(sample variance)22111niiSXXn样本均方差或标准差样本均方差或标准差 它们

9、的观测值用相应的小写字母表示它们的观测值用相应的小写字母表示.反映总反映总体体X取值的取值的平均平均,或反映,或反映总体总体X取值的离散程度取值的离散程度。几个常用的统计量几个常用的统计量 niiXXnS1211设设 是总体是总体 的一个样本,的一个样本,12(,)nXXXX子样的子样的K阶(原点)矩阶(原点)矩几个常用的统计量几个常用的统计量 设设 是总体是总体 的一个样本,的一个样本,12(,)nXXXX11nkkiiAXn子样的子样的K阶中心矩阶中心矩11nkkiiBXXn它包括两个方面它包括两个方面数据整理数据整理 计算样本特征数计算样本特征数数据的简单处理数据的简单处理 为了研究随机

10、现象,首要的工作是收集原始数据为了研究随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是杂乱无章一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。的,需要通过整理后才能显示出它们的分布状况。数据的简单处理是以一种直观明了方式加工数据。数据的简单处理是以一种直观明了方式加工数据。计算样本特征数计算样本特征数:数据的简单处理数据的简单处理 数据整理数据整理:将数据分组:将数据分组 计算各组频数计算各组频数 作频率分布表作频率分布表 作频率直方图作频率直方图(1)反映趋势的特征数)反映趋势的特征数 样本均值样本均值11niiXXn中位数

11、中位数:数据按大小顺序排列后,位置居中的那个数:数据按大小顺序排列后,位置居中的那个数 或居中的两个数的平均数。或居中的两个数的平均数。众数众数:样本中出现最多的那个数。:样本中出现最多的那个数。数据的简单处理数据的简单处理 (2)反映分散程度的特征数:极差、四分位差)反映分散程度的特征数:极差、四分位差 极差极差样本数据中最大值与最小值之差,样本数据中最大值与最小值之差,RMm四分位数四分位数将样本数据依概率分为四等份的将样本数据依概率分为四等份的3个数椐,个数椐,依次称为第一、第二、第三四分位数。依次称为第一、第二、第三四分位数。第一四分位数第一四分位数Q1:10.25P XQ第二四分位数

12、第二四分位数Q2:20.5P XQ第三四分位数第三四分位数Q3:30.75P XQ例例1 为对某小麦杂交组合为对某小麦杂交组合F2代的株高代的株高X进行研究,抽进行研究,抽取容量为取容量为100的样本,测试的原始数据记录如下的样本,测试的原始数据记录如下(单位:单位:厘米厘米),试根据以上数据,画出它的频率直方图,求随,试根据以上数据,画出它的频率直方图,求随机变量机变量X的分布状况。的分布状况。87 88111 91 73 70 92 98105 94 99 91 98110 98 97 90 83 92 88 86 94102 99 89104 94 94 92 96 87 94 92 8

13、6102 88 75 90 90 80 84 91 82 94 99102 91 96 94 94 85 88 80 83 81 69 95 80 97 92 96109 91 80 80 94102 80 86 91 90 83 84 91 87 95 76 90 91 77103 89 88 85 95 92104 92 95 83 86 81 86 91 89 83 96 86 75 92 第一整理原始数据,加工为分组资料,作出频率分布第一整理原始数据,加工为分组资料,作出频率分布表,画直方图,提取样本分布特征的信息表,画直方图,提取样本分布特征的信息.步骤如下:步骤如下:1.找出数据中

14、最小值找出数据中最小值m=69,最大值,最大值M=111,极差为,极差为 Mm=422.数据分组,根据样本容量数据分组,根据样本容量n的大小,决定分组数的大小,决定分组数k。一般规律一般规律 30n40 5k6 40n60 6k8 60n100 8k10 100n500 10k20数据分组数参考表数据分组数参考表 数据数4060100150200400600800100015002000500010000分组数68791015162024273035395674 一般采取等距分组(也可以不等距分组),组距一般采取等距分组(也可以不等距分组),组距等于比极差除以组数略大的测量单位的整数倍。等于比

15、极差除以组数略大的测量单位的整数倍。57.4969111kmM本例取本例取k=9.本例测量单位为本例测量单位为1厘米,组距为厘米,组距为 3确定组限和组中点值。确定组限和组中点值。注意:组的上限与下限应比数据多一位小数。注意:组的上限与下限应比数据多一位小数。当取当取a=67.5,b=112.49(a略小于略小于m,b略大于略大于M,且且a和和b都比数据多一位小数),分组如下:都比数据多一位小数),分组如下:一般根据算式:一般根据算式:各组中点值各组中点值 组距组距=组的上限或下限组的上限或下限1267.5,72.5)72.5,77.5)77.5,82.5)82.5,87.5)87.5,92.

16、5)92.5,97.5)97.5,102.5)102.5,107.5)107.5,112.5)组中值分别为:组中值分别为:70 75 80 85 90 95 100 105 1104将数据分组,计算出各组频数,作频数、频率分布表将数据分组,计算出各组频数,作频数、频率分布表组序组序区间范围区间范围频数频数fj频率频率Wj=fj/n累计频率累计频率Fj167.5,72.5)20.020.02272.5,77.5)50.050.07377.5,82.5)100.100.17482.5,87.5)180.180.35587.5,92.5)300.30.65692.5,97.5)180.180.837

17、97.5,102.5)100.10.938102.5,107.5)40.040.979107.5,112.5)30.031.00作频率直方图作频率直方图 5.作出频率直方图作出频率直方图以样本值为横坐标,频率以样本值为横坐标,频率/组距为纵坐标;组距为纵坐标;以分组区间为底,以以分组区间为底,以 为高为高 15jjjjjWWYXX 从频率直方图可看到:靠近两个极端的数据出现比从频率直方图可看到:靠近两个极端的数据出现比较少,而中间附近的数据比较多,即中间大两头小的分较少,而中间附近的数据比较多,即中间大两头小的分布趋势,布趋势,随机变量分布状况的最粗略的信息。随机变量分布状况的最粗略的信息。在

18、频率直方图中,在频率直方图中,每个矩形面积恰好等于样本值每个矩形面积恰好等于样本值落在该矩形对应的分组区间内的频率,即落在该矩形对应的分组区间内的频率,即 频率直方图中的小矩形的面积近似地反映了样本数频率直方图中的小矩形的面积近似地反映了样本数据落在某个区间内的可能性大小,故它可近似描述据落在某个区间内的可能性大小,故它可近似描述X的的分布状况。分布状况。11jjjjjjjWSXXWXX样本方差样本方差 样本标准差样本标准差 Q1 Q3 极差极差 四分位差四分位差 68.6909 8.288 85.25 95 42 4.875第二计算样本特征数第二计算样本特征数 1.反映集中趋势的特征数:反映

19、集中趋势的特征数:样本均值、中位数、众数样本均值、中位数、众数等等样本均值样本均值MEAN 中位数中位数MEDIAN 众数众数 2.反映分散程度的特征数:反映分散程度的特征数:样本方差、样本标准差、样本方差、样本标准差、极差、四分位差等极差、四分位差等上述差异特征统计量的值越小,表示离散程度越小上述差异特征统计量的值越小,表示离散程度越小.90.3X 9191,94 MTB set c1DATA 87 88 111 91 73 70 92 98 105 94 99 91 98 DATA 110 98 97 83 90 83 92 88 86 94 102 99 89 104 DATA 94 9

20、4 92 96 87 94 92 86 102 88 75 90 90 80 DATA 84 91 82 94 99 102 91 96 94 94 85 88 80 83 DATA 81 69 95 80 97 92 96 109 91 80 80 94 102 DATA 80 86 91 90 83 84 91 87 95 76 90 91 77 103DATA 89 88 85 95 92 104 92 95 83 86 81 86 91 89 83 DATA 96 86 75 92MTB endMTB describe c1例例1 DOS状态下的状态下的MINITAB操作操作显示:显示

21、:N MEAN MEDIAN TRMEAN STDEV C1 100 90.300 91.000 90.322 8.288 SEMEAN MIN MAX Q1 Q3 C1 0.829 69.000 111.000 85.250 95.00011niiXXn中位数中位数 211()1niiSXXnSn第一四分位数第一四分位数 第三四分位数第三四分位数 MTBCODE(67.5:72.49)70 (72.5:77.49)75 (77.5:82.49)80 (82.5:87.49)85 (87.5:92.49)90 (92.5:97.49)95 (97.5:102.49)100 (102.5:107

22、.49)105 (107.5:112.49)110 C1 C2MTBTALLY C2;SUBCALL.将将C1数据列重新编码,数据列重新编码,并保存到并保存到C2数据列数据列显示各列数据的频数、显示各列数据的频数、累计频数、频率、累计频率累计频数、频率、累计频率 C2 COUNTS CUMCNTS PERCENTS CUMPCENTS (频数)(频数)(累计频数)(累计频数)(频率)(频率)(累计频率)(累计频率)1 2 0.02 0.02 5 7 0.05 0.07 10 17 0.10 0.17 18 35 0.18 0.35 30 65 0.30 0.65 18 83 0.18 0.83 10 93 0.10 0.93 4 97 0.04 0.97 3 100 0.03 1.00显示结果显示结果 作业作业 习题五习题五 P111 2;3;4预习预习 第三节第三节 统计量的分布统计量的分布

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(随机变量的概率分布通常是已知的-课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|