统计工具箱的介绍_第1页
统计工具箱的介绍_第2页
统计工具箱的介绍_第3页
统计工具箱的介绍_第4页
统计工具箱的介绍_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

七统计工具箱的简介71统计工具箱的功能及应用步骤1 基本功能(1) 提供了常见的20多中概率分布的分布密度函数、分布函数逆分布函数,参数估计函数和随机数生成函数;(2) 提供多种概率分布的分布参数和置信区间的估计方法;(3) 提供包括单因子方差分析、双因子方差分析和多因子方差分析方法;(4) 提供多元线性回归,非线性回归,一般线性拟合,多项式拟合等功能;(5) 提供多种有效的假设检验,分布的检验,非参数检验等功能;(6) 提供多种判别分析,主成分分析,因子分析等方法。2 应用步骤(1) 根据实际中所研究的概率统计问题,建立问题的数学模型,选择适当的概率分布密度函数合分布函数,对有关的概率分布参数作相应的估计;(2) 对所需要的数学模型作适当的回归或拟合;(3) 对所建立的模型作必要的分析和检验;62 统计工具箱的函数使用方法1 常见分布的随机数产生常见分布的随机数的使用格式与上面相同表4-1 随机数产生函数表函数名调用形式注 释Unifrndunifrnd ( A,B,m,n)A,B上均匀分布(连续) 随机数Unidrndunidrnd(N,m,n)均匀分布(离散)随机数Exprndexprnd(Lambda,m,n)参数为Lambda的指数分布随机数Normrndnormrnd(MU,SIGMA,m,n)参数为MU,SIGMA的正态分布随机数chi2rndchi2rnd(N,m,n)自由度为N的卡方分布随机数Trndtrnd(N,m,n)自由度为N的t分布随机数Frndfrnd(N1, N2,m,n)第一自由度为N1,第二自由度为N2的F分布随机数gamrndgamrnd(A, B,m,n)参数为A, B的分布随机数betarndbetarnd(A, B,m,n)参数为A, B的分布随机数lognrndlognrnd(MU, SIGMA,m,n)参数为MU, SIGMA的对数正态分布随机数nbinrndnbinrnd(R, P,m,n)参数为R,P的负二项式分布随机数ncfrndncfrnd(N1, N2, delta,m,n)参数为N1,N2,delta的非中心F分布随机数nctrndnctrnd(N, delta,m,n)参数为N,delta的非中心t分布随机数ncx2rndncx2rnd(N, delta,m,n)参数为N,delta的非中心卡方分布随机数raylrndraylrnd(B,m,n)参数为B的瑞利分布随机数weibrndweibrnd(A, B,m,n)参数为A, B的韦伯分布随机数binorndbinornd(N,P,m,n)参数为N, p的二项分布随机数georndgeornd(P,m,n)参数为 p的几何分布随机数hygerndhygernd(M,K,N,m,n)参数为 M,K,N的超几何分布随机数Poissrndpoissrnd(Lambda,m,n)参数为Lambda的泊松分布随机数2.常见的概率密度分布函数,见下表:分布类型数学表达式调用函数说明二项分布 B(n,p)Y=binopdf(X,N,P)N为正整数,0P1泊松分布P()Y=poisspdf(X,Lambda)X为非负整数连续均匀分布U(a,b)Y=unifpdf(X,A,B)A0指数分布Y=exppdf(X,Mu)Mu0例1 计算正态分布 x=-2:0.1:2; f=normpdf(x,0,1)f = Columns 1 through 10 0.0540 0.0656 0.0790 0.0940 0.1109 0.1295 0.1497 0.1714 0.1942 0.2179 Columns 11 through 20 0.2420 0.2661 0.2897 0.3123 0.3332 0.3521 0.3683 0.3814 0.3910 0.3970 Columns 21 through 30 0.3989 0.3970 0.3910 0.3814 0.3683 0.3521 0.3332 0.3123 0.2897 0.2661 Columns 31 through 40 0.2420 0.2179 0.1942 0.1714 0.1497 0.1295 0.1109 0.0940 0.0790 0.0656 Column 41 0. 0540画出图像:plot(x,f)2.累积分布函数与逆累积分布函数累积分布函数(cdf)与逆累积分布函数(icdf或inv)分布类型数学表达式累积分布函数逆累积分布函数二项分布 B(n,p)B=binocdf(X,N,P)X=binoinv(B,N,P)泊松分布P()P=poisscdf(X,Lambda)X=Poissinv(P,Lambda)连续均匀分布U(a,b)U=unifcdf(X,A,B)X=unifinv(U,A,B)正态分布N=normcdf(X,Mu,Sigma)X=norminv(N,Mu,Sigma)指数分布E=expcdf(X,Mu)X=expinv(E,Mu)例2 用正态分布说明cdf与inv函数之间的关系 x=-2:0.5:2; xnew=norminv(normcdf(x,0,1),0,1); xx = -2.0000 -1.5000 -1.0000 -0.5000 0 0.5000 1.0000 1.5000 2.0000 xnewxnew = -2.0000 -1.5000 -1.0000 -0.5000 0 0.5000 1.0000 1.5000 2.0000例3 利用逆累积分布函数计算正态分布的80%置信区间 p=0.013,0.813; x=norminv(p,0,1)x = -2.2262 0.88903 参数估计参数估计式统计推断问题,即当总体分布的数学形式已知,用有限个参数表示估计的问题。它可以分为点估计和区间估计两个方面。在参数模型中,最常用的是极大似然法。统计工具箱采用极大似然法给出了常用的概率分布模型参数的点估计和区间估计值。其函数通常以”fit”结尾。常用分布的参数估计函数表4-7 参数估计函数表函数名调 用 形 式函 数 说 明binofitPHAT= binofit(X, N)PHAT, PCI = binofit(X,N)PHAT, PCI= binofit (X, N, ALPHA)二项分布的概率的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数估计和置信区间poissfitLambdahat=poissfit(X)Lambdahat, Lambdaci = poissfit(X)Lambdahat, Lambdaci= poissfit (X, ALPHA)泊松分布的参数的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数和置信区间normfitmuhat,sigmahat,muci,sigmaci = normfit(X)muhat,sigmahat,muci,sigmaci = normfit(X, ALPHA)正态分布的最大似然估计,置信度为95%返回水平的期望、方差值和置信区间betafitPHAT =betafit (X)PHAT, PCI= betafit (X, ALPHA)返回分布参数a和 b的最大似然估计返回最大似然估计值和水平的置信区间unifitahat,bhat = unifit(X)ahat,bhat,ACI,BCI = unifit(X)ahat,bhat,ACI,BCI=unifit(X, ALPHA)均匀分布参数的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数估计和置信区间expfitmuhat =expfit(X)muhat,muci = expfit(X)muhat,muci = expfit(X,alpha) 指数分布参数的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数估计和置信区间gamfitphat =gamfit(X)phat,pci = gamfit(X)phat,pci = gamfit(X,alpha)分布参数的最大似然估计置信度为95%的参数估计和置信区间返回最大似然估计值和水平的置信区间weibfitphat = weibfit(X)phat,pci = weibfit(X)phat,pci = weibfit(X,alpha)韦伯分布参数的最大似然估计置信度为95%的参数估计和置信区间返回水平的参数估计及其区间估计Mlephat = mle(dist,data)phat,pci = mle(dist,data)phat,pci = mle(dist,data,alpha)phat,pci = mle(dist,data,alpha,p1)分布函数名为dist的最大似然估计置信度为95%的参数估计和置信区间返回水平的最大似然估计值和置信区间仅用于二项分布,pl为试验总次数说明 各函数返回已给数据向量X的参数最大似然估计值和置信度为(1-)100%的置信区间。的默认值为0.05,即置信度为95%。4 常用的数据样本统计量函数对于实际采集到的样本数据,常常要用一些统计量来描述数据的分布情况,即研究数据的集中程度和分散程度,并通过这些统计量来对数据的总体特征进行分析研究。函数功能函数功能max最大元素mad平均绝对偏差min最小元素range样本极差sum元素和std标准差sort递增排序moment任意阶中心矩geomean几何均值cov协方差矩阵harmmean调和均值corrcoef相关系数mean算术平均值median中位元素var方差例3求随机矩阵X和Y的协方差和相关系数 rand(seed,0) X=rand(10,1); Y=rand(10,1); CX=cov(X); CY=cov(Y); Cxy=cov(X,Y)Cxy = 0.1154 -0.0764 -0.0764 0.0919 CXCX = 0.1154 PX=corrcoef(X)PX = 1 Pxy=corrcoef(X,Y)Pxy = 1.0000 -0.7418 -0.7418 1.00005 方差分析及回归分析方差分析、回归分析是分析实验数据的一种方法,是数理统计中的一个重要分支。它可以通过数据的分析,弄清除与研究对象有关的各个因素以及他们之间相互作用的影响,其线性模型的一般形式为其中y为实验中观测值向量,x为模型的系数矩阵,为参数向量,为随机误差向量函数分类函数功能方差分析anoval1单因素方差分析anoval2多因素方差分析回归分析regress多重线性回归lscov给定方差矩阵回归ridge岭回归stepwise逐步回归多项式回归ployfit多项式拟合ployval多项式预测ployconf给出置信区间的多项式预测1.在Matlab统计工具箱中使用命令regress()实现多元线性回归,调用格式为 b=regress(y,x) 或 b,bint,r,rint,statsl = regess(y,x,alpha)其中因变量数据向量y和自变量数据矩阵x按以下排列方式输入对一元线性回归,取k=1即可。alpha为显著性水平(缺省时设定为0.05),输出向量b,bint为回归系数估计值和它们的置信区间,r,rint为残差及其置信区间,stats是用于检验回归模型的统计量,有三个数值,第一个是R2,其中R是相关系数,第二个是F统计量值,第三个是与统计量F对应的概率P,当P时拒绝H0,回归模型成立。 画出残差及其置信区间,用命令rcoplot(r,rint)例4:已知某湖八年来湖水中COD浓度实测值(y)与影响因素湖区工业产值(x1)、总人口数(x2)、捕鱼量(x3)、降水量(x4)资料,建立污染物y的水质分析模型。 (1)输入数据 x1=1.376, 1.375, 1.387, 1.401, 1.412, 1.428, 1.445, 1.477 x2=0.450, 0.475, 0.485, 0.500, 0.535, 0.545, 0.550, 0.575x3=2.170 ,2.554, 2.676, 2.713, 2.823, 3.088, 3.122, 3.262 x4=0.8922, 1.1610 ,0.5346, 0.9589, 1.0239, 1.0499, 1.1065, 1.1387 y=5.19, 5.30, 5.60,5.82,6.00, 6.06,6.45, 6.95 (2)保存数据(以数据文件.mat形式保存,便于以后调用) save data x1 x2 x3 x4 y load data (取出数据) (3)执行回归命令 x =ones(8,1),x1,x2,x3,x4; b,bint,r,rint,stats = regress(y,x); 得结果: b = (-13.9849,13.1920,2.4288,0.0754,-0.1897) stats = (0.9846,47.9654,0.0047) 即 = -13.9849 + 13.1920xl + 2.4288x2 +0.0754x3 -0.1897x4 R2 = 0.9846,F = 47.9654,P = 0.00472. 多项式曲线拟合函数:polyfit( )调用格式:p=polyfit(x,y,n)p,s= polyfit(x,y,n)说明:x,y为数据点,n为多项式阶数,返回p为幂次从高到低的多项式系数向量p。矩阵s用于生成预测值的误差估计。(见下一函数polyval)例2:由离散数据x0.1.2.3.4.5.6.7.8.91y.3.511.41.61.9.6.4.81.52拟合出多项式。程序:x=0:.1:1;y=.3 .5 1 1.4 1.6 1.9 .6 .4 .8 1.5 2n=3;p=polyfit(x,y,n)xi=linspace(0,1,100);z=polyval(p,xi); %多项式求值plot(x,y,o,xi,z,k:,x,y,b)legend(原始数据,3阶曲线)结果:p = 16.7832 -25.7459 10.9802 -0.0035多项式为:16.7832x3-25.7459x2+10.9802x-0.0035曲线拟合图形:也可由函数给出数据。例3:x=1:20,y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论