1、1. 直方图 hist(频数), ecdfhist(频率)2. 正态概率图normplot3. 盒图(箱线图)boxplot4. QQ图(分位数图) qqplot5. 绘制数据的最小二乘拟合线lsline样本均值mean样本方差var(x, 0) var(x, 1)样本标准差std样本中心矩moment样本中位数median样本众数mode样本极差range平均绝对偏差mad样本偏度skewness样本峰度kurtosis二项分布binocdf泊松分布poisscdf均匀分布unifcdf正态分布normcdf卡方分布chi2cdft分布tcdfF分布fcdf 概率密度函数normpdf, p
2、oisscdf 逆累积分布函数norminv, poissinv 随机数生成normrnd, poissrnd 离散均匀分布unidrnd, 连续均匀分布unifrnd 均值与方差normstat, poisstat 经验分布函数图像ecdf, cdfplot 单个总体参数的估计值和相应的区间估计: 正态拟合normfit二项拟合binofit泊松拟合poissfit指数拟合expfit 最大似然估计mle 命令: ksdensity 例题: 产生60个来自由N(0, 1)和N(5, 1)组成的混合正态样本,画出密度函数的核估计图像。x=randn(30, 1); 5+randn(30, 1)
3、;f, xi=ksdensity(x); plot(xi, f) f1, xi1=ksdensity(x,kernel,normal); f2, xi2=ksdensity(x,kernel,box); f3, xi3=ksdensity(x,kernel,triangle); f4, xi4=ksdensity(x,kernel,epanechnikov); plot(xi1, f1,k) hold on plot(xi2, f2,r:) plot(xi3, f3,b-) plot(xi4, f4,c-) legend(Gaussian, Uniform, Triangle, Epanech
4、nikov, Location, NorthWest) 分别产生100个标准正态分布的随机数和参数为1的指数分布的随机数,并画出它们的正态概率图。x=normrnd(0, 1, 100, 1);y=exprnd(1, 100, 1);normplot(x)normplot(y) 随机生成5组9个整数数据,求每组数据的中位数。x=fix(30*rand(9, 5);median(x)固定随机数的生成结果 :mystream=RandStream(mt19937ar, Seed, 0);RandStream.setDefaultStream(mystream); 产生二项分布b(20, 0.75)
5、的随机数,并求最大似然估计和置信区间。x=binornd(20, 0.75, 100, 1);p, pci=mle(bino, x, 0.05, 20)p是估计量,pci是相应的置信区间。 某批产品中有正品数a,次品数ka(k为待估参数)。从中任取一只,若为正品,记X=1,否则记X=0.现在有放回地抽取n次,得m只正品。求k的矩估计和最大似然估计。矩估计法clearsyms k ex m npx1=1/(1+k);px0=k/(1+k);ex=m/n;k=solve(ex-1*px1-0*px0, k)最大似然估计法clearsyms k m nlike=k(n-m)/(1+k)n;like1
6、=log(like);like2=diff(like1, k);k=solve(like2, k) 会用函数 diff 和 solve 求解矩估计和最大似然估计1. 产生10个标准正态分布的随机数,指出分布特征,并画出经验分布函数。2. 一组来自正态分布总体的样本观察值683, 681, 676, 678, 679, 672, 求总体均值和标准差的点估计值及置信水平为0.95的置信区间.1. x=normrnd(0, 1, 10, 1)h, stats=cdfplot(x)2. x=683, 681, 676, 678, 679, 672;mu, sigma, muci, sigmaci=no
7、rmfit(x)1. 某工厂生产10欧的电阻,假定电阻值服从正态分布,标准差为0.1欧。现随机地抽取10个电阻,测得它们的值为: 9.9, 10.1, 10.2, 9.7, 9.9, 9.9,10, 10.5, 10.1, 10.2。问能否认为该厂的电阻平均值为10欧? (取alpha=0.1)H_0: mu=10,H_1: mu不等于10。标准差已知,用ztest( )格式。x= 9.9, 10.1, 10.2, 9.7, 9.9, 9.9,10, 10.5, 10.1, 10.2;h,sig,ci=ztest(x, 10, 0.1, 0.1)h=0,表示不拒绝原假设。2. 某种元件的寿命X
8、(单位: h)服从正态分布,均值和方差均未知。现随机抽取16只元件,测得其寿命为: 159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170。问是否有理由认为元件的平均寿命大于225 h ? (取alpha=0.05)H_0: mu225。标准差未知,用ttest( )格式。x=159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170; h, sig, ci=ttest(x, 225, 0.05,
9、 1)% tail 是both,right或left; 或 0, 1, 或 -1。默认是0. h=0,表示不拒绝原假设。3. 杜鹃总是把蛋生在别的鸟巢中,现在从甲和乙两种鸟巢分别得到杜鹃蛋9只和15只,测得杜鹃蛋的长度数据如下:甲: 21.2, 21.6, 21.9, 22, 22, 22.2, 22.8, 22.9, 23.2;乙: 19.8, 20, 20.3, 20.8, 20.9, 20.9, 21, 21, 21.1, 21.2, 21.5, 22, 21.9, 21.1, 22.3. 假设这两个样本来自同方差的正态总体,试鉴别杜鹃蛋的长度差异是由于随机因素造成的,还是与它们被发现的
10、鸟巢不同有关?(alpha=0.05)H_0: mu_1=mu_2, H_1: 不等h, sig, ci=ttest2(x, y, 0.05) h=1表示不能接受原假设,杜鹃蛋的长度与被发现的鸟巢有关4. 化肥厂用自动包装机包装化肥,某日测得9包化肥的重量(单位:kg)如下: 49.4, 50.5, 50.7, 51.7, 49.8, 47.9, 49.2, 51.4, 48.9 检验每包化肥的重量的方差是否等于1.5? (alpha=0.05) H_0: sigma2=1.5,H_1: sigma2不等于1.5 h, p, varci, stats=vartest(x, 1.5, alpha
11、, both) h0,papha,接受原假设。h=0或者palpha时接受原假设5. 针对问题3中的数据,假设总体来自两个正态分布且均值未知,检验甲和乙两种杜鹃蛋的长度的方差是否相等? (alpha=0.05)H_0: sigma_12= sigma_22,H_1: 不等h, p, varci, stats=vartest2(x, y, alpha, both)h=0或者palpha时接受原假设6. 某工厂生产一种黄金饰品,现随机抽取20件,测得每件含黄金量如下: 0.693, 0.749, 0.654, 0.670, 0.662, 0.672, 0.615, 0.606, 0.690, 0.
12、628, 0.668, 0.611, 0.606, 0.609, 0.601, 0.553, 0.570, 0.844, 0.576, 0.933 试验证这些饰品的含金量是否服从正态分布? (alpha=0.05) H, P, LSTAT, CV=lillietest(x) H=1, P0.05, 接受原假设,没有显著差别 产生100个正态随机数N(20, 52)样本,分别在方差已知和未知的情形下,检验总体均值mu=20和mu=23.5。(取alpha=0.05)x=normrnd(20, 5, 1, 100); 总体方差已知时用ztest( )格式,未知时用ttest( )格式hz0, si
13、gmaz0, ciz0=ztest(x, 20, 5)hz1, sigmaz1, ciz1=ztest(x, 23.5, 5)ht0, sigmat0, cit0=ttest(x, 20)ht1, sigmat1, cit1=ttest(x, 23.5) 结果表明: 两种情况下都接受假设mu=20且拒绝假设mu=23.51. 对如下数据,求出因变量y、自变量x的一元线性回归模型,并对各参数进行检验。x=100, 110, 120, 130, 140, 150, 160,170,180,190;y=45, 51, 54, 61, 66, 70, 74, 78, 85, 89;plot(x, y,
14、 r.) % 观察散点图X=ones(10, 1), 100, 110, 120, 130, 140, 150, 160, 170, 180, 190;b, bint, r, rint, stats=regress(y, X) b是回归方程中相应参数的估计值,bint是回归方程对应参数的95置信区间,r和rint分别表示残差及残差对应的95置信区间。 stats输出的四个数字分别表示相关系数R2、F统计量的观测值、检验的p值和误差方差的估计值。 所得回归方程为y=-2.7394+0.4830 x.2. 根据如下数据,建立线性回归模型并进行检验,诊断是否有异常点。x2=5, 2, 4, 2.5,
15、 3, 3.5, 2.5, 3;x1=1.5, 2, 1.5, 2.5, 3.3, 2.3, 4.2, 2.5;y=96, 90, 95, 92, 95, 95, 94, 94;X=ones(length(x1),1), x1, x2;b, bint, r, rint, stats=regress(y, X) 检验p值0.00250.05,总体上说明模型线性相关显著,所以回归方程与原数据拟合得比较好。 残差分析 rcoplot(r, rint) 从残差图上可以看出,除第一个数据外,其余数据的残差离0点均较近,且残差的置信区间均包含0,这说明回归模型能较好得符合原始数据,而第一个线没有过0线,视为异常。3. 对数据做二次多项式拟合.x=0:0.1:1;y=-0.447, 1.978, 3.28, 6.16, 7.08, 7.34, 7.66, 9.56, 9.48, 9.30, 11.2;a=polyfit(x, y, 2)z=polyval(a, x)plot(x, y, k+, x, z, r)
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。