1、第八章 概率统计与数学软件第一节 随机数的产生与蒙特卡洛方法第二节 常见分布的 MATLAB实现第三节 随机变量的数字特征第四节 参数估计与假设检验第八章 概率统计与数学软件第一节 随机数的产生与蒙特卡洛方法第八章 概率统计与数学软件一、随机数的生成1.调用通用函数产生常用分布的随机数通过调用通用函数random,在参数设置里给定分布类型,可以产生服从特定分布的随 机数据.该函数格式为其中,name的取值见表8.1;A,B,C,D 为分布的参数;m,n 指定输出随机数的行数和 列数.第八章 概率统计与数学软件2.调用专用函数产生特定分布的随机数产生特定分布随机数的专用函数是在rnd前面增加分布
2、名称.二项分布是最常用的离散型随机变量.为产生参数为N,p 的二项随机数据,可调用函 数binornd.这里提供如下三种调用格式:二、蒙特卡洛方法20世纪40年代 由S.M.乌拉姆和冯诺伊曼首先提出的蒙特卡洛方法也称统计模拟方法,是以概率统计理论为指导的一类非常重要的数值计算方法.该方法使用随机数来解决很多计算问题.随着电子计算机的发展和科学技术问题的日趋复杂,蒙特卡洛方法的应用也越来越广泛,它不仅较好地解决了多重积分计算、微分方程求解、积分方程求解、特征值计算和非线性方程组求解等复杂的数学计算问题,而且在统计物理、核物理、真空技术、系统科学、信息科学、公用事业、地质、医学和计算机科学等领域都
3、得到成功的应用.第八章 概率统计与数学软件第二节 常见分布的 MATLAB实现第八章 概率统计与数学软件一、概率密度值的确定离散型随机变量的分布律(也称为概率密度)或连续型随机变量的概率密度全面刻画了 随机变量,是解决相关概率问题的基础.与随机数的生成相同,MATLAB中有两种产生概 率密度的方法:一种是调用通用函数 PDF,在参数设置里给定分布类型;另一种是调用专 用函数,得到所需的取值概率或密度函数值.1.调用通用函数计算概率密度函数值PDF函数可按以下三种格式调用:Y=pdf(name,K,A)Y=pdf(name,K,A,B)Y=pdf(name,K,A,B,C)其中name为分布函数
4、名,其取值如表8.1;A,B,C为随机变量 X 的参数.对于不同 的分布,参数个数是不同.运行该命令可以得到离散型随机变量在 X=K 的概率P(X=K)或连续型随机变量的密度函数f(x)在x=K 时的值f(K)(统称为概率密度函数值).第八章 概率统计与数学软件2.调用专用函数计算概率密度函数值其他常用分布的专用概率密度函数(或分布律)见表8.3.第八章 概率统计与数学软件二、随机变量分布函数值的确定为确定随机变量落在任意区间内的概率,需要用到累积概率值函数(即分布函数)F(x)=P(Xx).工具箱中提供了通用函数CDF及专用函数计算累积概率值.使用格式均与PDF相同.第八章 概率统计与数学软
5、件三、逆累积分布函数值的确定对给定的(0k)=,这里的k 称为随机变量X 的 上侧 分位数.在一些概率问题和区间估计及假设检验中经常出现常见分布的分位数.记X 的分布函数为F(x),则P(Xk)=1-P(Xk)=1-F(k),即F(k)=1-.寻找k 就 转化为对分布函数F(x)寻找函数值为1-的自变量取值.MATLAB提供了函数ICDF及 专用逆累积分布函数来解决F(?)=的问题.相关函数见表8.5.第八章 概率统计与数学软件第三节 随机变量的数字特征第八章 概率统计与数学软件一、常见分布的期望和方差在 MATLAB统计工具箱中,以 stat结尾的函数可以用于计算给定参数的某种分布的 期望和
6、方差.求常见分布的期望和方差的函数见表8.6第八章 概率统计与数学软件二、一般分布的期望和方差如果 X 不是常用的随机变量,计算期望和方差要分两种情况考虑:1.X 为离散型随机变量若离散型随机变量 X 只取有限个值,可借助同维数组的点乘运算及求和来求期望和 方差.2.X 为连续型随机变量为计算一般连续型随机变量的数学期望,需要调用积分命令int(f,x,a,b)来计算 定积分 ,其中f 为被积函数(符号表达式),a,b 是数值(可为inf).三、样本的函数在数理统计中,总是从总体中抽取个体,构造统计量进行统计推断.MATLAB中提供 了对观测值(向量X)求样本函数的常见命令,如表8.7所示.第
7、八章 概率统计与数学软件第八章 概率统计与数学软件第四节 参数估计与假设检验第八章 概率统计与数学软件一、参数估计1.点估计点估计是用单个数值作为未知参数的估计,常用的方法有矩估计法和最大似然估计法.由于待估参数往往是总体原点矩或原点矩的函数,矩估计法就是以取自总体的样本的 原点矩或样本原点矩的函数值作为待估参数的估计.例如,样本均值总是总体均值的矩估 计量,样本方差总是总体方差的矩估计量,样本标准差总是总体标准差的矩估计量.在 MATLAB中,调用计算矩的函数 moment即可进行估计值的计算.最大似然估计法是在待估参数的可能取值范围内进行挑选,使得似然函数值(即样本 取固定观察值的概率)最
8、大的那个参数值为最大似然估计值.求最大似然估计值,可以调用 MATLAB统计工具箱中的函数 mle.该函数的调用格式是其中,name为总体的分布类型(取值见表8.1),缺省时默认正态分布.第八章 概率统计与数学软件2.区间估计求参数的区间估计,首先要求该参数的点估计,然后构造一个含有该参数的随机变量,并根据一定的置信水平确定该估计值的范围.函数 mle不仅可以用于求指定分布参数的最大似然估计,还可以用来求指定分布参数 的区间估计.此时,函数的调用格式有两种:phat,pci=mle(name,data)其功能是:利用样本值data,确定分布类型 name 的参数的最大似然估计phat和置信 度
9、为95%的置信区间pci.phat,pci=mle(name,data,alpha)该格式返回参数的最大似然估计phat和置信度为100(1-alpha)%的置信区间pci除了调用 mle函数可以求指定分布的参数估计值,MATLAB工具箱中还提供了求常 见分布的参数估计的专用函数,见表8.8.第八章 概率统计与数学软件二、假设检验在总体分布类型已知但参数未知或分布类型未知时,为了推断总体的某些性质(样本 数据是否来自具有特定分布的总体、两组样本数据是否具有相同的分布等)需要进行假设 检验.MATLAB提供了进行假设检验的相应函数,涉及正态分布、t分布和卡方分布等检 验统计量,见表8.9.第八章 概率统计与数学软件