1、1在概率统计中的应用在概率统计中的应用许海洋. . .28.1 分布率和概率密度函数分布率和概率密度函数8.1.1 通用函数计算概率密度函数值通用函数计算概率密度函数值8.1.2 专用函数计算概率密度函数值专用函数计算概率密度函数值 8.1.3 常见分布的密度函数作图常见分布的密度函数作图 8.2 随机变量的累积概率值随机变量的累积概率值(分布函数值分布函数值)8.2.1 通用函数计算累积概率值通用函数计算累积概率值 8.2.2 专用函数计算累积概率值专用函数计算累积概率值8.3 样本描述样本描述8.3.1 集中趋势集中趋势8.3.2 离中趋势离中趋势 . . .38.4 随机变量的数字特征随
2、机变量的数字特征8.4.1 期望期望8.4.2 方差方差8.4.3 常见分布的期望和方差常见分布的期望和方差8.4.4 协方差与相关系数协方差与相关系数 8.5参数估计参数估计8.5.1 点估计点估计8.5.2 区间估计区间估计8.5.3 常见分布的参数估计常见分布的参数估计 . . .48.6假设检验假设检验8.6.1 2已知,单个正态总体的均值已知,单个正态总体的均值的假设检验的假设检验(U检验法)检验法)8.6.2 2未知,单个正态总体的均值未知,单个正态总体的均值的假设检验的假设检验( t检验法检验法) 8.6.3 两个正态总体均值差的检验(两个正态总体均值差的检验(t检验)检验)8.
3、6.4 两个总体一致性的检验两个总体一致性的检验秩和检验秩和检验8.6.5 两个总体中位数相等的假设检验两个总体中位数相等的假设检验符号秩检验符号秩检验8.6.6 两个总体中位数相等的假设检验两个总体中位数相等的假设检验符号检验符号检验8.7方差分析方差分析8.7.1 单因素方差分析单因素方差分析8.7.2 双因素方差分析双因素方差分析 . . .5 利用MATLAB统计工具箱,可以进行基本概论和数理统计分析,以及进行比较复杂的多元统计分析。概率论概率论. . .68.1 分布率和概率密度函数分布率和概率密度函数8.1.1 通用函数计算概率密度函数值通用函数计算概率密度函数值格式 Y=pdf(
4、name,K,A) Y=pdf(name,K,A,B) Y=pdf(name,K,A,B,C) 返回在X=K处、参数为A、B、C的概率密度值,对于不同的分布,参数个数是不同;name为分布函数名,其取值如表。 . . .7name的取值函数说明beta或 BetaBeta分布bino或 Binomial二项分布chi2或 Chisquare卡方分布exp或 Exponential 指数分布f或 FF分布gam或 GammaGAMMA分布geo或 Geometric几何分布norm 或 Normal正态分布poiss 或 Poisson泊松分布t或 TT分布unif或 Uniform均匀分布常见
5、分布函数表常见分布函数表 . . .8 例如二项分布:设一次试验,事件A发生的概率为p,那么,在n次独立重复试验中,事件A恰好发生K次的概率P_K为:P_K=PX=K=pdf(bino,K,n,p) 例 计算正态分布N(0,1)的随机变量X在点0.6578的密度函数值。 pdf(norm,0.6578,0,1)ans = 0.3213 例 自由度为8的卡方分布,在点2.18处的密度函数值。 pdf(chi2,2.18,8)ans = 0.0363. . .98.1.2 专用函数计算概率密度函数值专用函数计算概率密度函数值 (1)二项分布的概率值 binopdf (k, n, p) p 每次试验
6、事件A发生的概率;K事件A发生K次;n试验总次数(2)泊松分布的概率值 poisspdf(k, Lambda) (3)正态分布的概率值 normpdf(K,mu,sigma) %计算参数为=mu,=sigma的正态分布密度函数在K处的值. . .10函数名调用形式注 释Unifpdfunifpdf (x, a, b)a,b上均匀分布(连续)概率密度在X=x处的函数值unidpdfUnidpdf(x,n)均匀分布(离散)概率密度函数值Exppdfexppdf(x, Lambda)参数为Lambda的指数分布概率密度函数值normpdf normpdf(x, mu, sigma)参数为mu,sig
7、ma的正态分布概率密度函数值chi2pdfchi2pdf(x, n)自由度为n的卡方分布概率密度函数值Tpdftpdf(x, n)自由度为n的t分布概率密度函数值Fpdffpdf(x, n1, n2)第一自由度为n1,第二自由度为n2的F分布概率密度函数值binopdfbinopdf(x,n,p)参数为n, p的二项分布的概率密度函数值geopdfgeopdf(x,p)参数为 p的几何分布的概率密度函数值专用函数计算概率密度函数表 . . .11 例 绘制卡方分布密度函数在自由度分别为1、5、15的图形 x=0:0.1:30; y1=chi2pdf(x,1); plot(x,y1,:) hol
8、d on y2=chi2pdf(x,5);plot(x,y2,+)y3=chi2pdf(x,15);plot(x,y3,o)axis(0,30,0,0.2) %指定显示的图形区域. . .12 例 计算参数为mu和1的正态分布概率密度函数在1.5处的值,其中mu为1到2之间以0.2为间隔的小数。mu=0:0.2:2;y=normpdf(1.5,mu,1)y=0.1295 0.1714 0.2179 0.2661 0.3123 0.3521 0.3814 0.3970 0.3970 0.3814 0.3521. . .138.1.3 常见分布的密度函数作图常见分布的密度函数作图 1二项分布x =
9、 0:10;y = binopdf(x,10,0.5);plot(x,y,+)2卡方分布x = 0:0.2:15;y = chi2pdf(x,4);plot(x,y) . . .143非中心卡方分布x = (0:0.1:10);p1 = ncx2pdf(x,4,2);p = chi2pdf(x,4);plot(x,p,-,x,p1,-)4指数分布x = 0:0.1:10;y = exppdf(x,2);plot(x,y) . . .158. 2 随机变量的累积概率值随机变量的累积概率值(分布函数值分布函数值) 为X的分布函数。如果知道X的分布函数,就可以知道落在任一区间(x1,x2)上的概率。
10、若X为随机变量,x为任意实数,则函数( )F xp Xx. . .168.2.1 通用函数计算累积概率值通用函数计算累积概率值 通用函数cdf用来计算随机变量XK的概率之和(累积概率值) cdf(name,K,A) cdf(name,K,A,B) cdf(name,K,A,B,C) 返回以name为分布、随机变量XK的概率之和的累积概率值,name的取值见常见分布函数表. . .17 例 求标准正态分布随机变量X落在区间(-,0.4)内的概率。cdf(norm,0.4,0,1)ans = 0.6554 例 求自由度为16的卡方分布随机变量落在0,6.91内的概率cdf(chi2,6.91,16
11、)ans = 0.0250. . .188.2.2 专用函数计算累积概率值专用函数计算累积概率值(随机变量(随机变量XK的概率之和)的概率之和) . . .19例 设 XN(3, 22) 求3XP,2XP,10X4P,5X2P 解 p1=52 XP p2=104XP p3=212XPXP p4=3XP13XP 则有:p1=normcdf(5,3,2)-normcdf(2,3,2)p1 = 0.5328p2=normcdf(10,3,2)-normcdf(-4,3,2)p2 = 0.9995p3=1-normcdf(2,3,2)-normcdf(-2,3,2)p3 = 0.6853p4=1-no
12、rmcdf(3,3,2)p4 = 0.5000 . . .20专用函数的累积概率值函数表专用函数的累积概率值函数表 函数名调用形式注 释unifcdfunifcdf (x, a, b)a,b上均匀分布(连续)累积分布函数值 F(x)=PXxunidcdfunidcdf(x,n)均匀分布(离散)累积分布函数值 F(x)=PXx expcdfexpcdf(x, Lambda)参数为Lambda的指数分布累积分布函数值 F(x)=PXxnormcdfnormcdf(x, mu, sigma)参数为mu,sigma的正态分布累积分布函数值 F(x)=PXxchi2cdfchi2cdf(x, n)自由度
13、为n的卡方分布累积分布函数值 F(x)=PXxtcdftcdf(x, n)自由度为n的t分布累积分布函数值 F(x)=PXxfcdffcdf(x, n1, n2)第一自由度为n1,第二自由度为n2的F分布累积分布函数值gamcdfgamcdf(x, a, b)分布累积分布函数值 F(x)=PXxbetacdfbetacdf(x, a, b)分布累积分布函数值 F(x)=PXx. . .21 描述样本数据集中趋势的统计量有算描述样本数据集中趋势的统计量有算术平均值、中位数、众数、几何均值、术平均值、中位数、众数、几何均值、调和均值和截尾均值等。调和均值和截尾均值等。8.3 样本描述样本描述8.3
14、.1 集中趋势集中趋势. . .22(1)利用mean求算术平均值 mean(X) %X为向量,返回X中各元素的平均值 mean(A) %A为矩阵,返回A中各列元素的平均值构成的向量 mean(A,dim) %在给出的维数内的平均值 . . .23例 A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5mean(A)ans = 1.3333 3.0000 3.0000 5.3333mean(A,1)ans = 1.3333 3.0000 3.0000 5.3333. . .24 (2)利用geomean计算几何平均数 M=geomean(X)
15、 X为向量,返回X中各元素的几何平均数。 M=geomean(A) A为矩阵,返回A中各列元素的几何平均数构成的向量。. . .25例B=1 3 4 5B = 1 3 4 5M=geomean(B)M = 2.7832A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5M=geomean(A)M = 1.2599 3.0000 2.5198 5.3133. . .26(3)利用median计算中值(中位数) median(X) %X为向量,返回X中各元素的中位数。 median(A) %A为矩阵,返回A中各列元素的中位数构成的向量。 medi
16、an(A,dim) %求给出的维数内的中位数. . .27例 A=1 3 4 5;2 3 4 6;1 3 1 5 A = 1 3 4 5 2 3 4 6 1 3 1 5 median(A) ans = 1 3 4 5. . .28(4)利用harmmean求调和平均值 M=harmmean(X) %X为向量,返回X中各元素的调和平均值。 M=harmmean(A) %A为矩阵,返回A中各列元素的调和平均值构成的向量。 调和平均值的数学含义是其中:样本数据非0,主要用于严重偏斜分布。n1iix1nM. . .29例B=1 3 4 5B = 1 3 4 5M=harmmean(B)M = 2.24
17、30A=1 3 4 5;2 3 4 6;1 3 1 5A = 1 3 4 5 2 3 4 6 1 3 1 5M=harmmean(A)M = 1.2000 3.0000 2.0000 5.2941. . .308.3.2 离中趋势离中趋势 描述离散趋势的统计量包括均值绝对差、极差、方差和标准差。 (1)均值绝对差y=mad(X) 若X为矢量,则y用mead(abs(X-mean(X)计算;若X为矩阵,则y为包含X中每列数据均值绝对差的行矢量。mad(X,0): 与mad(X)相同,使用均值。mad(X,1): 基于中值计算y,即:median(abs(X-median(X). (2)极差y=r
18、ange(X) 返回X中数据的最小值与最大值之间的差值。. . .318. 4 随机变量的数字特征随机变量的数字特征8.4.1 期望期望计算样本均值函数 meanX-2-1012P0.30.10.20.10.3例 设随机变量X的分布律为:求E (X) E(X2-1)解:在Matlab编辑器中建立M文件如下:X=-2 -1 0 1 2;p=0.3 0.1 0.2 0.1 0.3;EX=sum(X.*p)Y=X.2-1EY=sum(Y.*p)运行后结果如下:EX = 0Y = 3 0 -1 0 3EY = 1.6000 . . .328.4.2 方差方差求样本方差求样本方差 . . .33求标准差
19、求标准差 . . .34 例 求下列样本的样本方差和样本标准差,方差和标准差 14.70 15.21 14.90 15.32 15.32解:X=14.7 15.21 14.9 14.91 15.32 15.32;DX=var(X,1) %方差 DX = 0.0559sigma=std(X,1) %标准差sigma = 0.2364DX1=var(X) %样本方差DX1 = 0.0671sigma1=std(X) %样本标准差sigma1 = 0.2590. . .358.4.3 常见分布的期望和方差常见分布的期望和方差(1)均匀分布(连续)的期望和方差 M,V = unifstat(A,B)
20、%A、B为标量时,就是区间上均匀分布的期望和方差,A、B也可为向量或矩阵,则M、V也是向量或矩阵。例a = 1:6; b = 2.*a;M,V = unifstat(a,b)M =1.5000 3.0000 4.5000 6.0000 7.5000 9.0000V =0.0833 0.3333 0.7500 1.3333 2.0833 3.0000. . .36(2)正态分布的期望和方差 M,V = normstat(MU,SIGMA) %MU、SIGMA可为标量也可为向量或矩阵,则M=MU,V=SIGMA2。 例 n=1:4;M,V=normstat(n*n,n*n)M = 1 2 3 4
21、2 4 6 8 3 6 9 12 4 8 12 16V = 1 4 9 16 4 16 36 64 9 36 81 144 16 64 144 256. . .37 (3)二项分布的均值和方差 M,V = binostat(N,P) %N,P为二项分布的两个参数,可为标量也可为向量或矩阵。例 n = logspace(1,5,5)n = 10 100 1000 10000 100000M,V = binostat(n,1./n)M =1 1 1 1 1V = 0.9000 0.9900 0.9990 0.9999 1.0000m,v = binostat(n,1/2)m =5 50 500 5
22、000 50000v =1.0e+04 *0.0003 0.0025 0.0250 0.2500 2.5000. . .38常见分布的均值和方差常见分布的均值和方差 函数名调用形式注 释unifstatM,V=unifstat ( a, b)均匀分布(连续)的期望和方差,M为期望,V为方差unidstatM,V=unidstat (n)均匀分布(离散)的期望和方差expstatM,V=expstat (p, Lambda) 指数分布的期望和方差normstatM,V=normstat(mu,sigma) 正态分布的期望和方差chi2statM,V=chi2stat (x, n)卡方分布的期望和
23、方差tstatM,V=tstat ( n)t分布的期望和方差fstatM,V=fstat ( n1, n2)F分布的期望和方差gamstatM,V=gamstat ( a, b)分布的期望和方差betastatM,V=betastat ( a, b)分布的期望和方差. . .398.4.4 协方差与相关系数协方差与相关系数 (1)协方差 cov(X) %求向量X的协方差 cov(A) %求矩阵A的协方差矩阵,该协方差矩阵的对角线元素是A的各列的方差,即:var(A)=diag(cov(A)。 cov(X,Y) %X,Y为等长列向量,等同于cov(X Y)。. . .40例X=0 -1 1;Y=
24、1 2 2;C1=cov(X) %X的协方差C1 = 1C2=cov(X,Y) %列向量X、Y的协方差矩阵,对角线元素为各列向量的方差C2 = 1.0000 0 0 0.3333A=1 2 3;4 0 -1;1 7 3A = 1 2 3 4 0 -1 1 7 3. . .41C1=cov(A) %求矩阵A的协方差矩阵C1 = 3.0000 -4.5000 -4.0000 -4.5000 13.0000 6.0000 -4.0000 6.0000 5.3333C2=var(A(:,1) %求A的第1列向量的方差C2 = 3C3=var(A(:,2) %求A的第2列向量的方差C3 = 13C4=v
25、ar(A(:,3)C4 = 5.3333. . .42(2)相关系数 corrcoef(X,Y) %返回列向量X,Y的相关系数,等同于corrcoef(X Y)。 corrcoef (A) %返回矩阵A的列向量的相关系数矩阵. . .43例A=1 2 3;4 0 -1;1 3 9A =1 2 3 4 0 -1 1 3 9C1=corrcoef(A) %求矩阵A的相关系数矩阵C1 = 1.0000 -0.9449 -0.8030 -0.9449 1.0000 0.9538 -0.8030 0.9538 1.0000C1=corrcoef(A(:,2),A(:,3) %求A的第2列与第3列列向量的
26、相关系数矩阵C1 = 1.0000 0.9538 0.9538 1.0000. . .448.5 参数估计参数估计 8.5.1 点估计:用单个数值作为参数的估计 (1)矩法:用总体的样本矩来估计总体的同阶矩。 例 随机取8个活塞环,测得它们的直径为(以mm计):74.001 74.005 74.003 74.001 74.000 73.998 74.006 74.002,设环直径的测量值服从正态分布,现估计总体的方差。 解:因为样本的2阶中心矩是总体方差的矩估计量,所以可以用moment函数进行估计。X=74.001 74.005 74.003 74.001 74.000 73.998 74.
27、006 74.002;moment(X,2)ans = 6.0000e-006. . .45(2 2)最大似然法)最大似然法p=mle(dist,data) 使用data矢量中的样本数据,返回dist指定的分布的最大似然估计。 例 用最大似然估计法解上例。X=74.001 74.005 74.003 74.001 74.000 73.998 74.006 74.002;p=mle(norm,X);p(2)*p(2)ans = 6.0000e-006. . .468.5.2 区间估计区间估计 区间估计不仅仅给出了参数的近似取值,还给出了取该值的误差范围。. . .47 phat=mle(dist
28、,X) %返回用dist指定分布的最大似然估计值 phat, pci=mle(dist,X) %置信度为95%的区间 phat, pci=mle(dist,X,alpha) %置信度由alpha确定 phat, pci=mle(dist,X,alpha,pl) %仅用于二项分布,pl为试验次数。 dist为分布函数名,如:beta(分布)、bino(二项分布)等,X为数据样本,alpha为显著水平,(1-)100%为置信度。. . .48例X=binornd(20,0.75) %产生二项分布的随机数X = 11p,pci=mle(bino,X,0.05,20) %求概率的估计值和置信区间,置信
29、度为95%p = 0.5500pci = 0.3153 0.7694. . .49 例 从一批灯泡中随机地取5只作寿命试验,测得寿命(以小时计)为:1050 1100 1120 1250 1280,设灯泡寿命服从正态分布,求灯泡寿命平均值的95%置信区间.X=1050 1100 1120 1250 1280;p,ci=mle(norm,X,0.05)p=1.0e+003* 1.1600 0.0892 ci=1.0e+003* 1.0751 -0.0499 1.2449 0.2283. . .508.5.3 常见分布的参数估计常见分布的参数估计(1)分布的参数a和b的最大似然估计值和置信区间PH
30、AT=betafit(X)PHAT,PCI=betafit(X,ALPHA) PHAT为样本X的分布的参数a和b的估计量PCI为样本X的分布参数a和b的置信区间,是一个22矩阵,其第1例为参数a的置信下界和上界,第2例为b的置信下界和上界,ALPHA为显著水平,(1-)100%为置信度。 . . .51 例 随机产生100个分布数据,相应的分布参数真值为4和3。则4和3的最大似然估计值和置信度为99%的置信区间为:解:X = betarnd (4,3,100,1); %产生100个分布的随机数PHAT,PCI = betafit(X,0.01) %求置信度为99%的置信区间和参数a、b的估计值
31、. . .52结果显示PHAT = 4.0317 3.1046PCI = 2.7249 2.1644 5.3386 4.0448 说明:估计值3.9010的置信区间是2.5244 5.2776,估计值2.6193的置信区间是1.7488 3.4898。 . . .53(2)正态分布的参数估计 muhat,sigmahat,muci,sigmaci = normfit(X) muhat,sigmahat,muci,sigmaci = normfit(X,alpha) muhat,sigmahat分别为正态分布的参数和的估计值,muci,sigmaci分别为置信区间,其置信度为;alpha给出显著
32、水平,缺省时默认为0.05,即置信度为95% . . .54 例 有两组(每组100个元素)正态随机数据,其均值为10,均方差为2,求95%的置信区间和参数估计值。解:r = normrnd (10,2,100,2); %产生两列正态随机数据mu,sigma,muci,sigmaci = normfit(r)则结果为mu = 10.0959 9.7460 %各列的均值的估计值sigma = 1.7370 1.8894 %各列的均方差的估计值muci = 9.7512 9.3711 10.4405 10.1209sigmaci = 1.5251 1.6589 2.0178 2.1949 说明 m
33、uci,sigmaci中各列分别为原随机数据各列估计值的置信区间,置信度为95% . . .55 例 分别使用金球和铂球测定引力常数(1)用金球测定观察值为:6.683 6.681 6.676 6.678 6.679 6.672(2)用铂球测定观察值为:6.661 6.661 6.667 6.667 6.664设测定值总体为,和为未知。对(1)、(2)两种情况分别求和的置信度为0.9的置信区间。解:建立M文件:X=6.683 6.681 6.676 6.678 6.679 6.672;Y=6.661 6.661 6.667 6.667 6.664;mu,sigma,muci,sigmaci=n
34、ormfit(X,0.1) %金球测定的估计MU,SIGMA,MUCI,SIGMACI=normfit(Y,0.1) %铂球测定的估计. . .56运行后结果显示如下:mu = 6.6782sigma = 0.0039muci =6.6750 6.6813sigmaci = 0.0026 0.0081MU = 6.6640SIGMA = 0.0030MUCI = 6.6611 6.6669SIGMACI = 0.0019 0.0071. . .57 由上可知,金球测定的估计值为6.6782,置信区间为6.6750,6.6813; 的估计值为0.0039,置信区间为0.0026,0.0081。
35、泊球测定的估计值为6.6640,置信区间为6.6611,6.6669; 的估计值为0.0030,置信区间为0.0019,0.0071 . . .58常用分布的参数估计函数函数名调 用 形 式函 数 说 明binofitPHAT= binofit(X, N)PHAT, PCI = binofit(X,N)PHAT, PCI= binofit (X, N, ALPHA)二项分布的概率的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数估计和置信区间poissfitLambdahat=poissfit(X)Lambdahat, Lambdaci = poissfit(X)Lambdahat
36、, Lambdaci= poissfit (X, ALPHA)泊松分布的参数的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数和置信区间normfitmuhat,sigmahat,muci,sigmaci = normfit(X)muhat,sigmahat,muci,sigmaci = normfit(X, ALPHA)正态分布的最大似然估计,置信度为95%返回水平的期望、方差值和置信区间betafitPHAT =betafit (X)PHAT, PCI= betafit (X, ALPHA)返回分布参数a和 b的最大似然估计返回最大似然估计值和水平的置信区间unifitahat
37、,bhat = unifit(X)ahat,bhat,ACI,BCI = unifit(X)ahat,bhat,ACI,BCI=unifit(X, ALPHA)均匀分布参数的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数估计和置信区间expfitmuhat =expfit(X)muhat,muci = expfit(X)muhat,muci = expfit(X,alpha) 指数分布参数的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数估计和置信区间. . .59 各函数返回已给数据向量各函数返回已给数据向量X的参数最大似然估计值和的参数最大似然估计值和置信度为(置
38、信度为(1-)100%的置信区间。的置信区间。的默认值为的默认值为0.05,即置信度为即置信度为95% gamfitphat =gamfit(X)phat,pci = gamfit(X)phat,pci = gamfit(X,alpha)分布参数的最大似然估计置信度为95%的参数估计和置信区间返回最大似然估计值和水平的置信区间weibfitphat = weibfit(X)phat,pci = weibfit(X)phat,pci = weibfit(X,alpha)韦伯分布参数的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数估计及其区间估计Mlephat = mle(dist,
39、data)phat,pci = mle(dist,data)phat,pci = mle(dist,data,alpha)phat,pci = mle(dist,data,alpha,p1)分布函数名为dist的最大似然估计置信度为95%的参数估计和置信区间返回水平的最大似然估计值和置信区间仅用于二项分布,pl为试验总次数. . .608.6 假设检验假设检验 检验关于分布或参数未知的总体的假设是否合理。. . .618.6.1 2已知,单个正态总体的均值已知,单个正态总体的均值的假设检验的假设检验 (U检验法)检验法)h = ztest(x,m,sigma) % x为正态总体的样本,m为均值
40、0,sigma为标准差,显著性水平为0.05(默认值)h = ztest(x,m,sigma,alpha) %显著性水平为alphah,sig,ci,zval = ztest(x,m,sigma,alpha,tail) %sig为观察值的概率,当sig为小概率时则对原假设提出质疑,ci为真正均值的1-alpha置信区间,zval为统计量的值。. . .62. . .63 例 某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015。某日开工后检验包装机是否正常,随机地抽取所包装的糖9袋,称得净重为(公斤)0.497, 0.
41、506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512问机器是否正常?. . .64. . .658.6.2 2未知,单个正态总体的均值未知,单个正态总体的均值的假设检验的假设检验( t检验法检验法) h = ttest(x,m) % x为正态总体的样本,m为均值0,显著性水平为0.05h = ttest(x,m,alpha) %alpha为给定显著性水平h,sig,ci = ttest(x,m,alpha,tail) %sig为观察值的概率,当sig为小概率时则对原假设提出质疑,ci为真正均值的1-alpha置信区间。. . .66. . .6
42、7 例 某种电子元件的寿命X(以小时计)服从正态分布, 、2均未知。现测得16只元件的寿命如下159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命大于225(小时)? . . .68. . .698.6.3 两个正态总体均值差的检验(两个正态总体均值差的检验(t检验)检验) 两个正态总体方差未知但等方差时,比较两正态总体样本均值的假设检验h,sig,ci=ttest2(X,Y) %X,Y为两个正态总体的样本,显著性水平为0.05 h,sig,ci=ttest2(X,Y,alpha) %alp
43、ha为显著性水平h,sig,ci=ttest2(X,Y,alpha,tail) %sig为当原假设为真时得到观察值的概率,当sig为小概率时则对原假设提出质疑,ci为真正均值的1-alpha置信区间。 . . .70. . .71. . .72解:两个总体方差不变时,在水平下检验假设X=78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3;Y=79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1;h,sig,ci=ttest2(X,Y,0.05,-1)结果显示为:h =1 sig = 2.1759e-0
44、04 %说明两个总体均值相等的概率很小ci = -Inf -1.9083结果表明:H=1表示在水平下,应该拒绝原假设,即认为建议的新操作方法提高了产率,因此,比原方法好。012112:,:HH. . .738.6.4 两个总体一致性的检验两个总体一致性的检验秩和检验秩和检验 p = ranksum(x,y,alpha) %x、y为两个总体的样本,可以不等长,alpha为显著性水平p,h = ranksum(x,y,alpha) % h为检验结果,h=0表示X与Y的总体差别不显著h=1表示X与Y的总体差别显著p,h,stats = ranksum(x,y,alpha) %stats中包括:ran
45、ksum为秩和统计量的值以及zval为过去计算p的正态统计量的值P为两个总体样本X和Y为一致的显著性概率,若P接近于0,则不一致较明显。 . . .74 例 某商店为了确定向公司A或公司B购买某种商品,将A和B公司以往的各次进货的次品率进行比较,数据如下所示,设两样本独立。问两公司的商品的质量有无显著差异。设两公司的商品的次品的密度最多只差一个平移,取=0.05。A:7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5B:5.7 3.2 4.1 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3. . .75解:设、分别为A、B两
46、个公司的商品次品率总体的均值。则该问题为在水平=0.05下检验假设A=7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5;B=5.7 3.2 4.1 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3;p,h,stats=ranksum(A,B,0.05)结果为:p = 0.8041h = 0stats = zval: -0.2481 ranksum: 116结果表明:1)两样本总体均值相等的概率为0.8041,不接近于0;2),H=0也说明可以接受原假设,即认为两个公司的商品的质量无明显差异。01:,:ABABHH. . .7
47、68.6.5 两个总体中位数相等的假设检验两个总体中位数相等的假设检验符号秩检验符号秩检验p = signrank(X,Y,alpha) % X、Y为两个总体的样本,长度必须相同,alpha为显著性水平,P两个样本X和Y的中位数相等的概率,p接近于0则可对原假设质疑。p,h = signrank(X,Y,alpha) % h为检验结果:h=0表示X与Y的中位数之差不显著,h=1表示X与Y的中位数之差显著。p,h,stats = signrank(x,y,alpha) % stats中包括:signrank为符号秩统计量的值以及zval为过去计算p的正态统计量的值。 . . .77例 两个正态随
48、机样本的中位数相等的假设检验x=normrnd(0,1,20,1);y=normrnd(0,2,20,1);p,h,stats=signrank(x,y,0.05)p = 0.0251h = 1stats = zval: -2.2400 signedrank: 45 结果表明:h=0表示X与Y的中位数之差不显著 . . .788.6.6 两个总体中位数相等的假设检验两个总体中位数相等的假设检验符号检验符号检验p=signtest(X, Y, alpha) % X、Y为两个总体的样本,长度必须相同,alpha为显著性水平,P两个样本X和Y的中位数相等的概率,p接近于0则可对原假设质疑。p, h=
49、signtest(X, Y, alpha) % h为检验结果:h=0表示X与Y的中位数之差不显著,h=1表示X与Y的中位数之差显著。p,h,stats = signtest(X,Y,alpha) % stats中sign为符号统计量的值. . .79例 两个正态随机样本的中位数相等的假设检验X=normrnd(0,1,20,1);Y=normrnd(0,2,20,1);p,h,stats=signtest(X,Y,0.05)p = 0.8238h = 0stats = sign:9结果表明:h=0表示X与Y的中位数之差不显著. . .808.7 方差分析方差分析8.7.1 单因素方差分析单因素
50、方差分析 单因素方差分析是比较两组或多组数据的均值,它返回原假设均值相等的概率 . . .81p = anova1(X) %X的各列为彼此独立的样本观察值,其元素个数相同,p为各列均值相等的概率值,若p值接近于0,则原假设受到怀疑,说明至少有一列均值与其余列均值有明显不同。p = anova1(X,group) %X和group为向量且group要与X对应p = anova1(X,group,displayopt) % displayopt=on/off表示显示与隐藏方差分析表图和盒图p,table = anova1() % table为方差分析表p,table,stats = anova1(
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。