1、MATLABMATLAB在概率统计教学中的应用在概率统计教学中的应用1感谢你的观看2020-11-9引言引言 而而MATLAB 软件具有简单易学、易操作和绘软件具有简单易学、易操作和绘图功能强等特点,图功能强等特点,利用利用MATLAB 软件的图形可软件的图形可视功能将概率统计的内容用图形表示出来,通过图视功能将概率统计的内容用图形表示出来,通过图形让学生加深理解,以达到事半功倍的效果。形让学生加深理解,以达到事半功倍的效果。概率论与数理统计知识比较抽象,逻辑性较强。概率论与数理统计知识比较抽象,逻辑性较强。因此,建议让学生结合理论和公式推导,进行数值因此,建议让学生结合理论和公式推导,进行数
2、值试验和相关调查,直观地感受数学概念和理论,从试验和相关调查,直观地感受数学概念和理论,从而提高学生解决实际问题的信心和能力。而提高学生解决实际问题的信心和能力。2感谢你的观看2020-11-9概率论概率论3感谢你的观看2020-11-91.rand(m,n):生成生成mn的随机矩阵,每个元素都在的随机矩阵,每个元素都在(0,1)间,生成方式为均匀分布。间,生成方式为均匀分布。2.randn(m,n):生成生成mn的随机矩阵,每个元素都在的随机矩阵,每个元素都在(0,1)间,生成方式为正态分布。间,生成方式为正态分布。3.randperm(m):生成一个生成一个1m的随机整数排列。的随机整数排
3、列。4.perms(1:n):生成一个生成一个1n的全排列,共的全排列,共n!个。个。5.取整函数系列:取整函数系列:(1)fix(x):截尾法取整;截尾法取整;(2)floor(x):退一法取整(不超过退一法取整(不超过x的最大整数);的最大整数);(3)ceil(x):进一法取整(进一法取整(=floor(x)+1););(4)round(x):四舍五入法取整。四舍五入法取整。6.unique(a):合并合并a中相同的项。中相同的项。7.prod(x):向量向量x的所有分量元素的积。的所有分量元素的积。一、一、MATLAB常用的与随机数产生相关的函数常用的与随机数产生相关的函数:4感谢你的
4、观看2020-11-9示例:示例:rand(1)%生成一个生成一个(0,1)间的随机数间的随机数rand(2,2)%生成一个生成一个22阶阶(0,1)间的随机数矩阵间的随机数矩阵randperm(5)%生成一个生成一个15的随机整数排列的随机整数排列unique(a)5感谢你的观看2020-11-9例例1 1 随机投掷均匀硬币,观察国徽朝上与国徽随机投掷均匀硬币,观察国徽朝上与国徽 朝下的频率。朝下的频率。解 n=3000100000000;m=0;for i=1:n t=randperm(2);%生成一个12的随机整数排列 x=t-1;%生成一个01的随机整数排列 y=x(1);if y=0
5、;m=m+1;end end p1=m/n p2=1-p16感谢你的观看2020-11-9试验次数试验次数n300050001万2万3万国徽朝上国徽朝上频率频率0.50400.50060.48790.49990.5046国徽朝下国徽朝下频率频率0.49600.49940.51210.50010.4954试验次数试验次数n5万10万100万100万1亿国徽朝上国徽朝上频率频率0.50210.49990.49990.50010.5000国徽朝下国徽朝下频率频率0.49790.50010.50010.49990.5000 APAfnn可见当可见当 时,时,7感谢你的观看2020-11-9解解 记事件
6、记事件 为第为第i个人拿到自已枪,事件个人拿到自已枪,事件 为第为第i个人个人没拿到自己枪,易知:没拿到自己枪,易知:又记又记 为没有一个人拿到自己枪的概率。为没有一个人拿到自己枪的概率。有乘法公式可知:有乘法公式可知:例例2 2 某班有某班有n n个人,每人各有一支枪,这些枪外形个人,每人各有一支枪,这些枪外形一样。某次夜间紧急集合,若每人随机地取走一一样。某次夜间紧急集合,若每人随机地取走一支枪,问没有一个人拿到自己枪的概率是多少?支枪,问没有一个人拿到自己枪的概率是多少?iAiAnAPi1 nnAPi1ni,2,10p!1321nAAAAPnnjinnAAPAPAAPijiji111nk
7、jinnnAAAPAPAAAPkjikkji12118感谢你的观看2020-11-9于是于是 所以所以特别地,当特别地,当n较大时,较大时,。因此,可随机模拟出没有人拿到自己枪的频率,因此,可随机模拟出没有人拿到自己枪的频率,根据频率的稳定性,近似当做概率,然后去估计自然根据频率的稳定性,近似当做概率,然后去估计自然常数常数e。算法如下:。算法如下:!1,211,132131211nAAAAPnnnCAAAPnnCAAPAPnnnnkjikjinnnjijiniinkknnnniiknnnnCnnCAPp013210!1!121111110 ep9感谢你的观看2020-11-91 1、产生、产
8、生n个随机数的随机序列;个随机数的随机序列;2 2、检验随机列与自然列是否至少有一个配对;、检验随机列与自然列是否至少有一个配对;3 3、对没有一个配对的序列进行累积、对没有一个配对的序列进行累积 p;4 4、重复、重复1 1、2 2、3 3步步 m 次;次;5 5、估计、估计 。pme 具体程序及相关结果为(注:具体程序及相关结果为(注:自然常数自然常数 e 2.7183):):10感谢你的观看2020-11-9 m=40000;n=50;p=0;for j=1:m k=0;sui=randperm(n);for i=1:n if sui(i)=i k=k+1;else k=k;end en
9、d if k=0 p=p+1;else p=p;endende=m/pe=2.7313模拟次数模拟次数m400004000040000人数人数n100020005000e2.71552.70822.7202模拟次数模拟次数m400040000400000人数人数n505050e2.73792.73132.719411感谢你的观看2020-11-9 设针与平行线的夹角为设针与平行线的夹角为 ,针的中心与最,针的中心与最近直线的距离为近直线的距离为 。针与平行线相交的充要。针与平行线相交的充要条件是条件是 ,则所求概率为,则所求概率为故可得故可得 的近似计算公式的近似计算公式 ,其中,其中n为随机
10、试验为随机试验次数,次数,m为针与平行线相交的次数。为针与平行线相交的次数。例例3 3 Buffon Buffon投针实验投针实验 在画有许多间距为在画有许多间距为 的等距平行线的白纸上,随的等距平行线的白纸上,随机投掷一根长为机投掷一根长为 的均匀直针,求针与平行线的均匀直针,求针与平行线相交的概率,并计算相交的概率,并计算 的近似值。的近似值。)(dlld)0()20(dyysin2ly nmdlddlp22sin20mdnl212感谢你的观看2020-11-9解解 clear,clf n=10000000;l=0.5;m=0;d=1;for i=1:n x=l/2*sin(rand(1)
11、*pi);y=rand(1)*d/2;if x=y m=m+1;end end p1=m/n pai=2*n*l/(m*d)13感谢你的观看2020-11-9试验次数试验次数n5千1万10万100万1000万针长针长l/平行间平行间距距d3/103/103/103/103/10相交频率相交频率0.18360.19710.18870.19050.1912的近似值的近似值3.26803.04413.17983.14983.1387试验次数试验次数n5千1万10万100万1000万针长针长l/平行间平行间距距d2/52/52/52/52/5相交频率相交频率0.24960.25620.25490.25
12、440.2543的近似值的近似值3.20513.12263.13863.14513.143314感谢你的观看2020-11-9试验次数试验次数n5千1万10万100万1000万针长针长l/平行间平行间距距d1/21/21/21/21/2相交频率相交频率0.32540.31480.31580.31780.3183的近似值的近似值3.07313.17663.16673.14703.1417试验次数试验次数n5千1万10万100万1000万针长针长l/平行间平行间距距d4/54/54/54/54/5相交频率相交频率0.51420.51340.50860.50930.5093的近似值的近似值3.111
13、63.11653.14603.14183.141815感谢你的观看2020-11-9试验次数试验次数n5千1万10万100万1000万针长针长l/平行间平行间距距d17/2017/2017/2017/2017/20相交频率相交频率0.54320.54520.54200.54120.5410的近似值的近似值3.12963.11813.13663.14133.1426试验次数试验次数n5千1万10万100万1000万针长针长l/平行间平行间距距d9/109/109/109/109/10相交频率相交频率0.58600.57000.57560.57330.5731的近似值的近似值3.07173.157
14、93.12723.13953.141016感谢你的观看2020-11-9在在100100个人的团体中,不考虑年龄差异,个人的团体中,不考虑年龄差异,研究是否有两个以上的人生日相同。假设每人研究是否有两个以上的人生日相同。假设每人的生日在一年的生日在一年365365天中的任意一天是等可能的,天中的任意一天是等可能的,那么随机找那么随机找n n个人个人(不超过不超过365365人人)。(1)(1)求这求这n n个人生日各不相同的概率是多少?个人生日各不相同的概率是多少?从而求这从而求这n n个人中至少有两个人生日相同这一随个人中至少有两个人生日相同这一随机事件发生的概率是多少?机事件发生的概率是多
15、少?(2)(2)近似计算在近似计算在3030名学生的一个班中至少有名学生的一个班中至少有两个人生日相同的概率是多少?两个人生日相同的概率是多少?17感谢你的观看2020-11-9 解:(1)clear,clf for n=1:100 p0(n)=prod(365:-1:365-n+1)/365n;p1(n)=1-p0(n);end p1=ones(1,100)-p0;n=1:100;plot(n,p0,n,p1,-)xlabel(人数),ylabel(概率)legend(生日各不相同的概率,至少两人生日相同的概率)axis(0 100-0.1 1.199),grid on18感谢你的观看202
16、0-11-9010203040506070809010000.20.40.60.81人 数概率 生 日 各 不 相 同 的 概 率至 少 两 人 生 日 相 同 的 概 率 p1(30)=0.7063,p1(60)=0.994119感谢你的观看2020-11-9100f20感谢你的观看2020-11-9(2)clear,clf n=0;for m=1:100%做100次随机试验 y=0;x=1+fix(365*rand(1,30);%产生30个随机数 for i=1:29%用二重循环寻找30个随机数 中是否有相同数 for j=i+1:30 if x(i)=x(j)y=1;break;end
17、end end n=n+y;%累计有两人生日相同的试验次数 end f=n/m%计算频率21感谢你的观看2020-11-9 f=0.6900 f=0.7900 f=0.6700 f=0.7300 f=0.7500 f=0.6900 f=0.7200 f=0.6700 f=0.6800重复观察,数据如下:22感谢你的观看2020-11-9GaltonGalton钉板模型和二项分布钉板模型和二项分布 Galton钉板试验是由英国生物统计学家和人类学家钉板试验是由英国生物统计学家和人类学家Galton设计的。故而得名。设计的。故而得名。通过模拟通过模拟Calton钉板试验,观察和体会二项分布概率钉板
18、试验,观察和体会二项分布概率分布列的意义、形象地理解分布列的意义、形象地理解De Moivre-Laplace中心极中心极限定理。限定理。23感谢你的观看2020-11-9Ox-8 -7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 8W ,XX(15,0.5)b ,YY(15,0.5)b sign()/2WXYXY 24感谢你的观看2020-11-9Ox-8-7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 8151kkX)51 ,0 (N),(2nnN1,1,kX(1,2,15)k kk151,0 1522nn25感谢你的观看2020-11-9 模拟模拟
19、Galton钉板试验的步骤:钉板试验的步骤:(1)确定钉子的位置:将钉子的横、纵坐标存储在两个矩阵确定钉子的位置:将钉子的横、纵坐标存储在两个矩阵X和和Y中。中。(2)在在Galton钉板试验中,小球每碰到钉子下落时都具有两种钉板试验中,小球每碰到钉子下落时都具有两种可能性,设向右的概率为可能性,设向右的概率为p,向左的概率为,向左的概率为q1-p,这里,这里p=0.5,表示向左向右的机会是相同的。表示向左向右的机会是相同的。模拟过程如下:首先产生一均匀随机数模拟过程如下:首先产生一均匀随机数u,这只需调用随机数发,这只需调用随机数发生器指令生器指令rand(m,n)。rand(m,n)指令:
20、用来产生指令:用来产生mn个个(0,1)区间中的随机数,并区间中的随机数,并将这些随机数存于一个将这些随机数存于一个mn矩阵中,每次调用矩阵中,每次调用rand(m,n)的结果的结果都会不同。如果想保持结果一致,可与都会不同。如果想保持结果一致,可与rand(seed,s)配合使用,配合使用,这里这里s是一个正整数,例如是一个正整数,例如 rand(seed,1),u=rand(1,6)u=0.5129 0.4605 0.3504 0.0950 0.4337 0.7092而且再次运行该指令时结果保持不变。除非重设种子而且再次运行该指令时结果保持不变。除非重设种子seed的值,如的值,如 ran
21、d(seed,2),u=rand(1,6)u=0.0258 0.9210 0.7008 0.1901 0.8673 0.4185这样结果才会产生变化。这样结果才会产生变化。26感谢你的观看2020-11-9 将将0,1区间分成两段,区间区间分成两段,区间0,p)和和p,1。如果随机数。如果随机数u属于属于0,p),让小球向右落下;若,让小球向右落下;若u属于属于p,1,让小球向左,让小球向左落下。将这一过程重复落下。将这一过程重复n次,并用直线连接小球落下时所经过的次,并用直线连接小球落下时所经过的点,这样就模拟了小球从顶端随机地落人某一格子的过程。点,这样就模拟了小球从顶端随机地落人某一格子
22、的过程。(3)模拟小球堆积的形状。输入扔球次数模拟小球堆积的形状。输入扔球次数m(例如例如m50、100、500等等等等),计算落在第,计算落在第i个格子的小球数在总球数个格子的小球数在总球数m中中所占的比例,这样当模拟结束时,就得到了频率所占的比例,这样当模拟结束时,就得到了频率 用频率反映小球的堆积形状。用频率反映小球的堆积形状。(4)用如下动画指令制作动画:用如下动画指令制作动画:movien(n):创建动画矩阵;制作动画矩阵数据;:创建动画矩阵;制作动画矩阵数据;Getframe:拷贝动画矩阵;:拷贝动画矩阵;movie(Mat,m):播放动画矩阵:播放动画矩阵m次。次。M文件如下:文
23、件如下:nimmfii,1,0,27感谢你的观看2020-11-9 解解:clear,clf,m=100;n=5;y0=2;%设置参数 ballnum=zeros(1,n+1);p=0.5;q=1-p;for i=n+1:-1:1%创建钉子的坐标x,y x(i,1)=0.5*(n-i+1);y(i,1)=(n-i+1)+y0;for j=2:i x(i,j)=x(i,1)+(j-1)*1;y(i,j)=y(i,1);end end mm=moviein(m);%动画开始,模拟小球下落路径 for i=1:m s=rand(1,n);%产生n个随机数 xi=x(1,1);yi=y(1,1);k=
24、1;l=1;%小球遇到第一个钉子 for j=1:n plot(x(1:n,:),y(1:n,:),o,x(n+1,:),y(n+1,:),.-),%画钉子的位置 axis(-2 n+2 0 y0+n+1),hold on 28感谢你的观看2020-11-9 k=k+1;%小球下落一格 if s(j)p l=l+0;%小球左移 else l=l+1;%小球右移 end xt=x(k,l);yt=y(k,l);%小球下落点的坐标 h=plot(xi,xt,yi,yt);axis(-2 n+2 0 y0+n+1)%画小球运动轨迹 xi=xt;yi=yt;end ballnum(l)=ballnum
25、(l)+1;%计数 ballnum1=3*ballnum./m;bar(0:n,ballnum1),axis(-2 n+2 0 y0+n+1)%画各格子的频率 mm(i)=getframe;%存储动画数据 hold off end movie(mm,1)%播放动画一次29感谢你的观看2020-11-9-2-101234567012345678-2-101234567012345678-2-101234567012345678-2-10123456701234567830感谢你的观看2020-11-9-2-101234567012345678-2-101234567012345678-2-101
26、23456701234567831感谢你的观看2020-11-9 概率密度函数(概率密度函数(pdfpdf),求随机变量),求随机变量X X在在x x点处的概率密度值点处的概率密度值 累积分布函数(累积分布函数(cdfcdf),求随机变量),求随机变量X X在在x x点处的分布函数值点处的分布函数值 逆累积分布函数(逆累积分布函数(invinv),求随机变量),求随机变量X X在概率点在概率点 处的分处的分 布函数反函数值布函数反函数值 均值与方差计算函数(均值与方差计算函数(statstat),求给定分布的随机变量),求给定分布的随机变量X X的的 数学期望数学期望E E(X X)和方差)和
27、方差varvar(X X)。)。随机数生成函数(随机数生成函数(rndrnd),模拟生成指定分布的样本数据。),模拟生成指定分布的样本数据。xpy xduupxXPxF 1 Fx二、二、MATLAB为常见自然概率分布提供了下列为常见自然概率分布提供了下列5 5类函数:类函数:32感谢你的观看2020-11-9 具体函数的命名规则是:具体函数的命名规则是:函数名分布类型名称函数名分布类型名称+函数类型名称函数类型名称其中,分布类型名称如下:其中,分布类型名称如下:分布类型分布类型 MATLAB名称名称33感谢你的观看2020-11-9例如例如,normpdf、normcdf、norminv、no
28、rmstat和和normrnd分别是正态分布的概率密分别是正态分布的概率密度、累积分布、逆累积分布、数字特征和随机数生度、累积分布、逆累积分布、数字特征和随机数生成函数成函数。关于这关于这5类函数的语法,请详见有关书籍。类函数的语法,请详见有关书籍。快捷的学习可借助快捷的学习可借助MATLAB的系统帮助,通的系统帮助,通过指令过指令doc获得具体函数的详细信息,语法是获得具体函数的详细信息,语法是 doc 34感谢你的观看2020-11-9 到某服务机构办事总是要排队等待的。设等到某服务机构办事总是要排队等待的。设等待时间待时间T T是服从指数分布的随机变量是服从指数分布的随机变量(单位:分钟
29、单位:分钟),概率密度为概率密度为设某人一个月内要到此办事设某人一个月内要到此办事1010次,若等待时间超次,若等待时间超过过1515分钟,他就离去。求:分钟,他就离去。求:(1)(1)恰好有两次离去的概率;恰好有两次离去的概率;(2)(2)最多有两次离去的概率;最多有两次离去的概率;(3)(3)至少有两次离去的概率;至少有两次离去的概率;(4)(4)离去的次数占多数的概率离去的次数占多数的概率。00010110ttetft35感谢你的观看2020-11-9解解 首先求任一次离去的概率,依题意首先求任一次离去的概率,依题意 设设1010次中离去的次数为次中离去的次数为X X,则,则 。1510
30、1510115dtedttfTPptpBX,10 p=1-expcdf(15,10)%任一次离去的概率 p1=binopdf(2,10,p)%恰有两次离去的概率 q=binopdf(0:2,10,p);p2=sum(q)%最多有两次离去的概率 q=binopdf(0:1,10,p);p3=1-sum(q)%最少有两次离去的概率 q=binopdf(0:5,10,p);p4=1-sum(q)%离去的次数占多数的概率 p=0.2231p1=0.2972p2=0.6073p3=0.6899p4=0.011236感谢你的观看2020-11-9例例7 7 某一急救中心在长度为某一急救中心在长度为t t的
31、时间间隔内的时间间隔内收到的紧急呼救次数服从参数为收到的紧急呼救次数服从参数为t t2 2的泊松的泊松分布,而与时间间隔的起点无关分布,而与时间间隔的起点无关(时间以小时时间以小时计计),求:,求:(1)(1)在某一天中午在某一天中午1212时至下午时至下午3 3时没有收时没有收到紧急呼救的概率;到紧急呼救的概率;(2)(2)某一天中午某一天中午1212时至下午时至下午5 5时至少收到时至少收到1 1次紧急呼救的概率。次紧急呼救的概率。37感谢你的观看2020-11-9 (1)P1=poisscdf(0,3/2)P1=0.2231 或者 P1=poisspdf(0,3/2)P1=0.2231中
32、午12时到下午3时没有收到紧急呼救的概率为0.2231。(2)P2=1-poisscdf(0,5/2)P2=0.9179中午12时至下午5时至少收到1次紧急呼救的概率为0.9179。解解 本题计算需调用函数本题计算需调用函数poisscdf,其格式为,其格式为poisscdf(x,),返回返回 的值。的值。ekkXPxFxkkxk00!)(38感谢你的观看2020-11-9例例8 8 某厂研发了一种新产品,现要设计它的包某厂研发了一种新产品,现要设计它的包装箱,要求每箱至少装装箱,要求每箱至少装100100件产品,且开箱验货件产品,且开箱验货时,每箱至少装有时,每箱至少装有100100件合格产
33、品的概率不应小件合格产品的概率不应小于于0.90.9,假设随机装箱时每箱中的不合格产品数,假设随机装箱时每箱中的不合格产品数服从参数为服从参数为3 3的泊松分布。的泊松分布。问:要设计的这种包装箱,每箱至少应装问:要设计的这种包装箱,每箱至少应装多少件产品才能满足要求?多少件产品才能满足要求?39感谢你的观看2020-11-9 每箱至少装每箱至少装100+m100+m件产品,件产品,X X表示每箱中的不合格品数,则表示每箱中的不合格品数,则X X 服从参数为服从参数为3 3的泊松分布,即的泊松分布,即 ,依,依题意,即要求按下面的不等式确定题意,即要求按下面的不等式确定m mmkekkXPk,
34、2,1,0!3)(39.0!3)(030mkkmkekkXP clear;clf,m=0;p=0;while p0.90.9。即设计的包装箱每箱至少应。即设计的包装箱每箱至少应装装106106件产品件产品。40感谢你的观看2020-11-9例例9 9某种重大疾病的医疗险种,每份每年需某种重大疾病的医疗险种,每份每年需交保险费交保险费100100元,若在这一年中,投保人得了元,若在这一年中,投保人得了这种疾病,则每份可以得到索赔额这种疾病,则每份可以得到索赔额1000010000元,元,假设该地区这种疾病的患病率为假设该地区这种疾病的患病率为0.00020.0002,现该,现该险种共有险种共有1
35、000010000份保单,问:份保单,问:(1)(1)保险公司亏本的概率是多少保险公司亏本的概率是多少?(2)(2)保险公司获利不少于保险公司获利不少于8080万元的概率是多少万元的概率是多少?41感谢你的观看2020-11-9 解解 设设 表示这一年中发生索赔的份数,依题意,表示这一年中发生索赔的份数,依题意,的统计的统计规律可用二项分布规律可用二项分布 来描述。由二项分来描述。由二项分布与泊松分布的近似计算关系有布与泊松分布的近似计算关系有 近似服从参数为近似服从参数为2的泊松分布。的泊松分布。当索赔份数超过当索赔份数超过100份时,则保险公司发生亏本,亏本份时,则保险公司发生亏本,亏本的
36、概率为的概率为 当索赔份数不超过当索赔份数不超过20份时,则保险公司获利就不少份时,则保险公司获利就不少于于80万元,其概率为万元,其概率为XX0002.0,10000 BX100!1npeknpppCnpkknkknX100021!211001100kkekXPXPp19022!220kkekXPp42感谢你的观看2020-11-9 p=poisspdf(0:19,2);%计算出20个泊松分布概率值 或 p=binopdf(0:19,10000,0.0002);%按二项分布计算 p2=sum(p)%求出保险公司获利不少于80万元的概率 p2=1.0000 p=poisspdf(0:100,2
37、);%计算101个泊松分布概率值或 p=binopdf(0:100,10000,0.0002);%按二项分布计算 p1=1-sum(p)%求出保险公司亏本的概率 p1=0.0000 43感谢你的观看2020-11-9例例1010 设设 ,求,求 本题计算正态分布的累积概率值,调用函数本题计算正态分布的累积概率值,调用函数normcdf,其其格式为格式为normcdf(x,),返回返回 的值。的值。解:解:p1=normcdf(6,4,3)-normcdf(3,4,3)p1=0.3781 p2=1-normcdf(3,4,3)p2=0.630623,4 NX63 XP3XP xdttfxF44感
38、谢你的观看2020-11-9解:解:clear mu=2.5;sigma=0.6;x=(mu-4*sigma):0.005:(mu+4*sigma);y=normpdf(x,mu,sigma);f=normcdf(x,mu,sigma);plot(x,y,-g,x,f,:b)M,V=normstat(mu,sigma)legend(pdf,cdf,-1)45感谢你的观看2020-11-9 M=2.5000 V=0.360000.511.522.533.544.5500.10.20.30.40.50.60.70.80.91 pdfcdf 从图中可以看出,正态密度曲线是关于从图中可以看出,正态密度
39、曲线是关于x对对称的钟形曲线称的钟形曲线(两侧在两侧在处各有一个拐点处各有一个拐点),正态,正态累积分布曲线当累积分布曲线当x时时F(x)0.5。46感谢你的观看2020-11-9观察观察正态分布参数对密度曲线的影响。正态分布参数对密度曲线的影响。解:解:clear mu1=2.5;mu2=3;sigma1=0.5;sigma2=0.6;x=(mu2-4*sigma2):0.01:(mu2+4*sigma2);y1=normpdf(x,mu1,sigma1);%考察均值的影响 y2=normpdf(x,mu2,sigma1);y3=normpdf(x,mu1,sigma1);%考察方差的影响
40、y4=normpdf(x,mu1,sigma2);subplot(1,2,1)%考察结果的可视化 plot(x,y1,-g,x,y2,-b)xlabel(fontsize1212,1=2)legend(1,2)subplot(1,2,2)plot(x,y3,-g,x,y4,-b)xlabel(fontsize121=2,12)legend(1,2)47感谢你的观看2020-11-9024600.10.20.30.40.50.60.70.812,1=2 12024600.10.20.30.40.50.60.70.81=2,1 clear,clf%(标准)正态分布密度曲线下的面积 X=linspa
41、ce(-5,5,100);Y=normpdf(X,0,1);yy=normpdf(-3,-2,-1,0,1,2,3,0,1);plot(X,Y,k-,0,0,0,yy(4),c-.)hold on plot(-2,-2,0,yy(2),m:,2,2,0,yy(6),m:,-2,-0.5,yy(6),yy(6),m:,0.5,2,yy(6),yy(6),m:)plot(-1,-1,0,yy(3),g:,1,1,0,yy(5),g:,-1,-0.5,yy(5),yy(5),g:,0.5,1,yy(5),yy(5),g:)plot(-3,-3,0,yy(1),b:,3,3,0,yy(7),b:,-3
42、,-0.5,yy(7),yy(7),b:,0.5,3,yy(7),yy(7),b:)49感谢你的观看2020-11-9 hold off text(-0.5,yy(6)+0.005,fontsize1495.44%)text(-0.5,yy(5)+0.005,fontsize1468.26%)text(-0.5,yy(7)+0.005,fontsize1499.74%)text(-3.2,-0.03,fontsize10-3)text(-2.2,-0.03,fontsize10-2)text(-1.2,-0.03,fontsize10-)text(-0.05,-0.03,fontsize10)
43、text(0.8,-0.03,fontsize10+)text(1.8,-0.03,fontsize10+2)text(2.8,-0.03,fontsize10+3)50感谢你的观看2020-11-9-5-4-3-2-101234500.050.10.150.20.250.30.350.495.44%68.26%99.74%-3-2-+2+351感谢你的观看2020-11-9例例1414 标准正态分布标准正态分布分位数分位数的概念图示。的概念图示。解%分位数示意图(标准正态分布,=0.05)clear,clf data=normrnd(0,1,300,1);xalpha1=norminv(0.
44、05,0,1);xalpha2=norminv(0.95,0,1);xalpha3=norminv(0.025,0,1);xalpha4=norminv(0.975,0,1);subplot(3,1,1)capaplot(data,-inf,xalpha1);axis(-3,3,0,0.45)subplot(3,1,2)capaplot(data,xalpha2,inf);axis(-3,3,0,0.45)subplot(3,1,3)capaplot(data,-inf,xalpha3);axis(-3,3,0,0.45)hold on capaplot(data,xalpha4,inf);a
45、xis(-3,3,0,0.45)hold off xalpha1 xalpha2 xalpha3 xalpha452感谢你的观看2020-11-9-3-2-1012300.20.4Probability Between Limits=0.063571-3-2-1012300.20.4Probability Between Limits=0.058995-3-2-1012300.20.4Probability Between Limits=0.031504 xalpha1=-1.6449 xalpha2=1.6449 xalpha3=-1.9600 xalpha4=1.960053感谢你的观看2
46、020-11-9数理统计基础数理统计基础54感谢你的观看2020-11-9 1、基本统计量、基本统计量 对于随机变量x,计算其基本统计量的命令如下:均值:mean(x)标准差:std(x)中位数:median(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)2、频数直方图的描绘、频数直方图的描绘 A、给出数组data的频数表的命令为:N,X=hist(data,k)此命令将区间min(data),max(data)分为k个小区间(缺省为10),返回数组data落在每一个小区间的频数N和每一个小区间的中点X。B、描绘数组data的频数直方图的命令为:hist(dat
47、a,k)55感谢你的观看2020-11-9 3、参数估计、参数估计 A、对于正态总体,点估计和区间估计可同时由以下命令获得:muhat,sigmahat,muci,sigmaci=normfit(x,alpha)此命令在显著性水平alpha下估计x的参数(alpha缺省值为5%),返回值muhat是均值的点估计值,sigmahat是标准差的点估计值,muci是均值的区间估计,sigmaci是标准差的区间估计。B、对其他分布总体,两种处理办法:一是取容量充分大的样本,按中心极限定理,它近似服从正态分布,仍可用上面估计公式计算;二是使用特定分布总体的估计命令,常用的命令如:muhat,muci=e
48、xpfit(x,alpha)lambdahat,lambdaci=poissfit(x,alpha)phat,pci=weibfit(x,alpha)56感谢你的观看2020-11-9 4、正态总体假设检验、正态总体假设检验 A、单总体均值的z检验:h,sig,ci=ztest(x,m,sigma,alpha,tail)检验数据x关于总体均值的某一假设是否成立,其中sigma为已知方差,alpha为显著性水平,究竟检验什么假设取决于tail的取值:tail=0,检验假设“x的均值等于m”tail=1,检验假设“x的均值大于m”tail=-1,检验假设“x的均值小于m”tail的缺省值为0,al
49、pha的缺省值为5%。返回值h为一个布尔值,h=1表示可拒绝原假设,h=0表示不可拒绝原假设,sig为假设成立的概率,ci为均值的1-alpha置信区间。B、单总体均值的t检验:h,sig,ci=ttest(x,m,alpha,tail)C、双总体均值的t检验:h,sig,ci=ttest2(x,y,alpha,tail)57感谢你的观看2020-11-9 5、非参数检验:总体分布的检验、非参数检验:总体分布的检验 Matlab统计工具箱提供了两个对总体分布进行检验的命令:A、h=normplot(x)此命令显示数据矩阵x的正态概率图,如果数据来自于正态分布,则图形显示出直线形态,而其他概率分
50、布函数显示出曲线形态。B、h=weibplot(x)此命令显示数据矩阵x的Weibull概率图,如果数据来自于Weibull分布,则图形显示出直线形态,而其他概率分布函数显示出曲线形态。58感谢你的观看2020-11-9例例1515 一道工序用自动化车床连续加工某种零件,由于刀具损一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障。故障是完全随机的,并假定生产任一零件时坏等会出现故障。故障是完全随机的,并假定生产任一零件时出现故障机会均相同,工作人员是通过检查零件来确定工序是出现故障机会均相同,工作人员是通过检查零件来确定工序是否出现故障的。现积累有否出现故障的。现积累有100次故