MATLAB数理统计分析_第1页
MATLAB数理统计分析_第2页
MATLAB数理统计分析_第3页
MATLAB数理统计分析_第4页
MATLAB数理统计分析_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数理统计分析的MATLAB实现MATLAB基础知识统计分析的基本概念、工具及推理基础统计估计第一章MATLAB基础知识1.1MATLAB概况1.1.1MATLAB发展历程

1980年,美国的CleverMoler博士建立了MATLAB(MatrixLaboratory),即矩阵实验室。随后1984年建立了名为MathWorks的软件开发公司。早期的MATLAB只能做矩阵运算,绘图也只能用星号描点的形式画图。而后经过不断的改进发展,现在MATLAB已经成为国际最为流行的科学与工程计算软件之一,它以其模块化的计算方法、可视化与智能化的人机交互功能、丰富的矩阵运算、图形绘制和数据处理函数,以及模块化图形组态的动态系统仿真工具Simulink,成为控制系统设计和仿真领域最受欢迎的软件系统。1.1.2MATLAB的语言特点

MATLAB命令和数学中的符号、公式非常接近,可读性强,容易掌握。MATLAB语言除了具有强大数值计算和图形功能以外,还提供了应用于许多领域的工具箱。它与其他语言的接口能够保证其与各种强大的计算机软件相结合,可扩展性很强。MATLAB目前为止可以在各种类型的计算机上运行,程序也可以直接移植到其他机型上使用。可以说MATLAB是和机器类型及操作系统基本无关的软件。MATLAB语言具有较高的运算精度,矩阵类运算可以达到10-15数量级的精度,符合一般科学与工程运算的要求。1.2MATLAB的功能

MATLAB产品族被广泛地应用于信号图像处理、控制系统设计、通信、系统仿真、虚拟现实等诸多领域。它的一大特性是有众多面向具体应用的工具箱和仿真块,包含了完整的函数集用来对信号和图像处理、控制系统设计、神经网络等特殊应用进行分析和设计。图1-1世界正则矩阵地图图1-2朝鲜半岛的数字高程模型图1-3经过光照处理的三维图MATLAB主要功能如下:(1)MATLAB。MATLAB是MathWorks公司所有产品的数值分析和图形基础环境,它将二维和三维图形、MATLAB语言能力集成到一个单一的、易学易用的环境之中。(2)MATLABToolbox。工具箱是一系列专用的MATLAB函数库,以解决特定领域的问题,它是开放的、可扩展的,也就是说用户可以查看其中的算法或开发自己的算法。(3)MATLABCompiler。编译器可以将MATLAB语言编写的M-文件自动转换成C或C++文件,支持用户进行独立应用开发。(4)Simulink。Simulink是结合了框图界面和交互仿真能力的非线性动态系统仿真工具,它以MATLAB的核心数学、图形和语言为基础。(5)Stateflow。Stateflow与Simulink框图模型相结合,描述复杂事件驱动系统的逻辑行为,驱动系统在不同的模式之间进行切换。(6)Real-TimeWorkshop。直接从Simulink框图自动生成C代码,整个代码的生成可以根据需要进行完全定制。(7)SimulinkBlockset。专门为特定领域设计的Simulink功能块的集合,用户也可以利用已有的块或自动编写的C和MATLAB程序建立自己的块。1.3MATLAB的开发环境1.3.1MATLAB桌面平台

桌面平台是各桌面组件的展示平台,默认设置情况下的桌面平台包括4个窗口,即命令窗口(CommandWindow)、命令历史窗口(CommandHistory)、当前目录窗口(CurrentDirectory)和工作空间窗口(Workspace)。此外,MATLAB还有编译窗口、图形窗口和帮助窗口等其他种类的窗口。1.3.2.运行方式

MATLAB提供了两种运行方式,即命令行方式和M文件方式。1.3.3.MATLAB帮助系统1.3.4.工具箱第二章统计分析的基本概念、工具及推理基础2.1变量与数据的基本概念2.1.1变量及其概率分布1.绘制正态分布的密度函数、分布函数程序如下:clearmu=2.5;sigma=0.6;x=(mu-4*sigma):0.005:(mu+4*sigma);y=normpdf(x,mu,sigma);f=normcdf(x,mu,sigma);plot(x,y,'-g',x,f,':b')legend('pdf','cdf',-1)表2-1线型和颜色控制符线形点标记颜色-实线:虚线-.点划线--间断线.点o小圆圈x叉子符+加号*星号s方格d菱形^朝上三角v朝下三角>朝右三角<朝左三角p五角星h六角星y黄m棕色c青色r红色g绿色b蓝色w白色k黑色2.正态分布参数μ和σ对密度曲线的影响程序如下:clearmu1=2.5;mu2=3;sigma1=0.5;sigma2=0.6;x=(mu2-4*sigma2):0.01:(mu2+4*sigma2);y1=normpdf(x,mu1,sigma1);y2=normpdf(x,mu2,sigma1);y3=normpdf(x,mu1,sigma1);y4=normpdf(x,mu1,sigma2);subplot(1,2,1)plot(x,y1,'-g',x,y2,'-b')xlabel('\fontsize{12}mu1<mu2,sigma1=sigma2')legend('mu1','mu2')subplot(1,2,2)plot(x,y3,'-g',x,y4,'-b')xlabel('\fontsize{12}mu1=mu2,sigma1<sigma2')legend('sigma1','sigma2')3.正态分布参数μ和σ对变量X取值规律的约束—3σ原则clear,clfX=linspace(-5,5,100);Y=normpdf(X,0,1);yy=normpdf([-3,-2,-1,0,1,2,3],0,1);plot(X,Y,'k-',[0,0],[0,yy(4)],'c-.')holdonplot([-2,-2],[0,yy(2)],'m:',[2,2],[0,yy(6)],'m:',[-2,-0.5],[yy(6),yy(6)],'m:',[0.5,2],[yy(6),yy(6)],'m:')plot([-1,-1],[0,yy(3)],'g:',[1,1],[0,yy(5)],'g:',[-1,-0.5],[yy(5),yy(5)],'g:',[0.5,1],[yy(5),yy(5)],'g:')plot([-3,-3],[0,yy(1)],'b:',[3,3],[0,yy(7)],'b:',[-3,-0.5],[yy(7),yy(7)],'b:',[0.5,3],[yy(7),yy(7)],'b:')holdofftext(-0.5,yy(6)+0.005,'\fontsize{14}95.44%')text(-0.5,yy(5)+0.005,'\fontsize{14}68.26%')text(-0.5,yy(7)+0.005,'\fontsize{14}99.74%')text(-3.2,-0.03,'\fontsize{10}μ-3σ')text(-2.2,-0.03,'\fontsize{10}μ-2σ')text(-1.2,-0.03,'\fontsize{10}μ-σ')text(-0.05,-0.03,'\fontsize{10}μ')text(0.8,-0.03,'\fontsize{10}μ+σ')text(1.8,-0.03,'\fontsize{10}μ+2σ')text(2.8,-0.03,'\fontsize{10}μ+3σ')

由图可以看出尽管正态变量的取值范围是(-∞,+∞),但它的值落在(μ-3σ,μ+3σ)内几乎是肯定的事。2.2统计分析的基本工具2.2.1数据集中度的度量1.样本均值函数名称:mean调用格式:m=mean(X)2.样本中值函数名称:median调用格式:m=median(X)3.几何平均函数名称:geomean调用格式:m=geomean(X)4.调和平均函数名称:harmmean调用格式:m=harmmean(X)2.2.2数据差异性的度量1.样本方差函数名称:var调用格式:y=var(X)2.样本标准差函数名称:std调用格式:y=std(X)3.样本极差函数名称:range调用格式:y=range(X)2.2.3数据分布特征的度量1.样本的经验分位数函数名称:prctile调用格式:y=prctile(X,p)2.样本峰度函数名称:kurtosis调用格式:y=kurtosis(X)3.样本偏度函数名称:skewness调用格式:y=skewness(X)2.2.4两组数据线性相依程度的度量1.样本协方差函数名称:cov调用格式:y=cov(X)2.样本相关系数函数名称:corrcoef调用格式:y=corrcoef(X)2.3.1三大分布与分位数1.t分布和标准正态分布的比较(n=2,4,45)clear,clfX=linspace(-4,4,100);Y0=normpdf(X,0,1);Y1=tpdf(X,45);Y2=tpdf(X,4);Y3=tpdf(X,2);YY0=normpdf(0,0,1);plot(X,Y0,'.b',X,Y1,'-c',X,Y2,'-m',X,Y3,'-k',[0,0,],[0,YY0],':r')title('\fontsize{18}\fontname{华文新魏}不同自由度的t分布概率密度曲线')legend('N(0,1)','df:n=45','df:n=4','df:n=2')2.3统计分析的理论基础2.α分位数的定义、求上侧、下侧、双侧α分位数介绍程序中几个关键的MATLAB函数:(1)计算标准正态分布的0.05分位点。如上侧α/2分位点的计算指令是:xalpha=norminv(0.975,0,1)下面几个数值是标准正态分布的0.05分位点:下侧分位点:-1.6449;上侧分位点:1.6449;双侧分位点:-1.9600,1.9600。(2)生成样本数据。如生成300个标准正态分布随机数的计算指令是:data=normrnd(0,1,300,1)(3)绘制工序能力图(绘制由分位点控制的密度曲线下的面积图,用阴影表示,并计算样本数据落入控制区域的概率,显示在标题位置上)。计算指令是:capaplot(data,[xalpha,inf])程序如下:%alpha分位点示意图(alpha=0.05)clearclfdata=normrnd(0,1,300,1);xalpha1=norminv(0.05,0,1);xalpha2=norminv(0.95,0,1);xalpha3=norminv(0.025,0,1);xalpha4=norminv(0.975,0,1);subplot(3,1,1)capaplot(data,[-inf,xalpha1]);axis([-3,3,0,0.45])subplot(3,1,2)capaplot(data,[xalpha2,inf]);axis([-3,3,0,0.45])subplot(3,1,3)capaplot(data,[-inf,xalpha3]);axis([-3,3,0,0.45])holdoncapaplot(data,[xalpha4,inf]);axis([-3,3,0,0.45])holdoff第三章统计估计3.1变量分布形态的估计3.1.1 频率分布表

例3-1钢材中的含硅量X是影响材料性能的一项重要因素。在炼钢生产过程中,由于各种随机因素的影响,各炉钢的含硅量X是有差异的。对含硅量X概率分布的了解是有关钢材料性能分析的重要依据。某炼钢厂120炉正常生产的25MnSi钢的含硅量(单位:%)如下:0.860.830.770.810.810.800.790.820.820.810.820.780.800.810.870.810.770.780.770.780.770.710.950.780.810.790.800.770.760.820.840.790.900.820.790.820.790.860.810.780.820.780.730.840.810.810.830.890.780.860.780.840.840.750.810.810.740.780.760.800.750.790.850.780.740.710.880.820.760.850.810.790.770.810.810.870.830.650.640.780.800.800.770.840.750.830.900.800.850.810.820.840.850.840.820.850.840.820.850.840.810.770.820.830.820.740.730.750.770.780.870.770.800.750.820.780.780.820.780.78编制25MnSi钢含硅量数据的频率分布表。频率分布表的编制步骤:1.数据分组。(1)确定数据组个数。根据样本容量n确定分组数k,推荐公式为k=1.87(n-1)2/5

。(2)计算极差。(3)确定组距。(4)确定各组端点。2.统计各组频数。各组频数就是数据落入各个小组中的个数,记为ni。3.计算频率。(1)计算各组频率。计算公式为fi=ni/n。(2)计算各组累积频率。4.编制频率分布表。程序如下:clearloadE:\matlab7\mnsi.txtk=ceil(1.87*(length(mnsi)-1)^0.4);[ni,ak]=hist(mnsi,k);fi=ni/length(mnsi);mfi=cumsum(fi);stats=[[1:k]',ak',ni',fi',mfi']表3-1120炉25MnSi钢的含硅量数据频率分布表3.1.2频率直方图绘制例3-1的频率直方图clearloadE:\matlab7\mnsi.txthist(mnsi)h=findobj(gca,'Type','patch');set(h,'FaceColor','y','EdgeColor','b')h=histfit(mnsi,13);%画附正态参考曲线的直方图,并提取图形句柄hset(h(1),'FaceColor','c','EdgeColor','w')set(h(2),'Color','r')3.1.3经验分布函数求出例3-1中25MnSi钢含硅量的经验分布函数clearloadE:\matlab7\mnsi.txt[h,stats]=cdfplot(mnsi)

由图可以看出,样本经验分布函数图像上升速度较快,均值与中值接近,图像的S形状均衡对称,均值处函数值为0.5.这些特征表明,25MnSi钢的含硅量可能服从均值为0.8026、标准差为0.0450的正态分布。接下来可以通过正态分布拟合检验进一步证实这种推测。3.2 变量分布参数的估计3.2.1 极大似然估计表3-2重复观测样本数据20124212021511311155例3-2对于表3-2中的数据,请利用MATLAB函数解答下列问题。(1)假设表3-2中的数据为X~P(λ)的重复观测样本数据,计算X方差的极大似然估计值;(2)假设表3-2中的数据为X~N(μ,σ2)的重复观测样本数据,计算μ的极大似然估计值;(3)假设表3-2中的数据为X~N(μ,σ2)的重复观测样本数据,计算μ和σ的极大似然估计值;(4)假设表3-2中的数据为X~U(a,b)的重复观测样本数据,计算a的极大似然估计值;(5)假设表3-2中的数据为X~U(a,b)的重复观测样本数据,计算a和b的极大似然估计值;解:先

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论