Matlab在概率统计中的应用.ppt_第1页
Matlab在概率统计中的应用.ppt_第2页
Matlab在概率统计中的应用.ppt_第3页
Matlab在概率统计中的应用.ppt_第4页
Matlab在概率统计中的应用.ppt_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

在概率统计中的应用,MATLAB,一、统计量的数字特征,1平均值,MATLAB中mean(x)命令函数计算数据x的平均值,调用格式为,mean(x) 或mean(x,dim),维数dim取值1,2,例如,x=1 7 1;2 8 0;3 9 0; 4 1 0; 5 2 0; 6 3 0;,mean(x) ans = 3.5000 5.0000 0.1667,mean(x,2) ans = 3.0000 3.3333 4.0000 1.6667 2.3333 3.0000,2方差和标准差,随机变量x的方差为,标准差,样本方差为,MATLAB的方差函数为Var,调用格式为,var(x),对于向量x,得到x的方差值;对于矩阵X,得到一行向量,它的每个值分别是矩阵X对应的列元素的方差值。,var(x,1),得到向量(或矩阵)x的简单方差,即前置因子为1/n的方差,var(x,w),得到向量(或矩阵)x以w为权的方差,例如,var(x) ans = 3.5000 11.6000 0.1667,var(x,1) ans = 2.9167 9.6667 0.1389,w = 0.0667 0.1667 0.2333 0.3000 0.0333 0.2000 var(x,w) ans = 2.2225 11.3819 0.0623,样本标准差,MATLAB的标准差函数为std,调用格式,std(x),对向量x,得到x的样本标准差(前置因子为1/n-1);对于矩阵X,得到一行向量,它的每个值分别是矩阵X对应的列元素的标准差,std(x,1),得到向量(或矩阵)x的样本标准差(前置因子为1/n),std(x,flag,dim),得到向量(或矩阵)中以dim为维数的标准差。其中flag=0时,前置因子为1/n-1,否则前置因子为1/n,例如,std(x) ans = 1.8708 3.4059 0.4082,std(x,1) ans = 1.7078 3.1091 0.3727,std(x,0,1) ans = 1.8708 3.4059 0.4082,std(x,0,2) ans = 3.4641 4.1633 4.5826 2.0817 2.5166 3.0000,3协方差和相关系数,二维随机变量(X,Y) 的协方差为,相关系数为,MATLAB中,协方差和相关系数函数cov和coffcoef实现,协方差,调用格式,cov(x),当x是向量时,返回此向量的协方差;当x是矩阵时,返回此矩阵的协方差矩阵,其中x的每一行是一个观测值,x的每一列是一个变量。由Cov(x)的对角元素为构成的向量是x的各列的方差所构成的向量, 是标准差向量,cov(x,y),返回向量x、y的协方差矩阵,cov(x)或cov(x,0),返回向量x的样本协方差矩阵,前置因子为1/n-1,cov(x,1),返回向量x的样本协方差矩阵,前置因子为1/n,cov(x,y),cov(x,y,1)的区别同上,相关系数,corrcoef(x),返回矩阵相关系数矩阵,其中x的每一行是一个观测值,x的每一列是一个变量,corrcoef(x,y) 返回向量x、y的相关系数,例如,X=1 2 3 4 5;11 12 3 5 7;2 4 6 9 0;3 6 9 7 9;10 9 7 5 4;,cov(X) ans = 22.3000 17.9500 -1.5500 -3.5000 3.5000 17.9500 15.8000 -0.4500 -1.7500 4.7500 -1.5500 -0.4500 6.8000 2.7500 1.2500 -3.5000 -1.7500 2.7500 4.0000 -3.0000 3.5000 4.7500 1.2500 -3.0000 11.5000,corrcoef(X) ans = 1.0000 0.9563 -0.1259 -0.3706 0.2186 0.9563 1.0000 -0.0434 -0.2201 0.3524 -0.1259 -0.0434 1.0000 0.5273 0.1414 -0.3706 -0.2201 0.5273 1.0000 -0.4423 0.2186 0.3524 0.1414 -0.4423 1.0000,x= 1,5,7,9,1,6;y=1,2,1,5,2,1;,cov(x,y,1) ans = 8.8056 2.1667 2.1667 2.0000,corrcoef(x,y) ans = 1.0000 0.5163 0.5163 1.0000,二、参数估计,当总体分布的数学形式已知,且可以用有限个参数表示时,我们可以利用样本对参数进行估计,这便是参数估计,参数估计一般可分为点估计和区间估计,参数估计的方法:矩估计、最小二乘法和极大似然估计,1二项分布的参数估计,MATLAB中由命令函数binofit来实现,调用格式,p,pci=Binofit(x,N,alpha),其中p为参数,pci为p的区间的端点,置信度为1-alpha,x=6,8,9,4,6,7,9,3,7,5 p,pci=binofit(x,10),p = 0.6000 0.8000 0.9000 0.4000 0.6000 0.7000 0.9000 0.3000 0.7000 0.5000 pci =0.2624 0.4439 0.5550 0.1216 0.2624 0.34750.5550 0.0667 0.3475 0.1871 0.8784 0.9748 0.9975 0.7376 0.8784 0.9333 0.9975 0.6525 0.9333 0.8129,2正态分布的参数估计,MATLAB中由命令函数normfit来实现,调用格式,m,s,mci,sci= normfit(x,alpha),例如,m,s,mci,sci=normfit(x) m = 6.4000 s = 2.0111 mci = 4.9614 7.8386 sci =1.3833 3.6714,3指数分布的参数估计,MATLAB中由命令函数expfit来实现,调用格式,mu,mci=expfit(x,alpha),x= 0.1586 4.5407 1.5484 2.2369 0.3567 0.8422 2.4311 12.3683 0.6099 2.5121 1.5048 0.7231 0.2524 0.9409 5.3809,mu,mci=expfit(x,0.01) mu = 2.4271 mci = 1.1154 4.3423,例如,4泊松分布的参数估计,MATLAB中由命令函数poissfit来实现,调用格式,Lamd,Lci= poissfit(x,alpha),三、假设检验,假设检验是统计推断的基本问题之一。在总体的分布函数完全未知或只知其形式但不只参数的情况下,为了推断总体的某些性质,提出某些关于总体的假设,假设检验首先提出假设H0,然后检验这组数据是否支持这个假设。根据这组数据计算检验统计量以及显著性概率(p值)。如果p值很小,则所提出的假设是非常可疑的,并提供否定这个假设的证据。伴随假设H0,总能写出备择假设H1,备择假设也称对立假设,1已知时的检验(z检验),MATLAB中的z检验由命令函数ztest来实现,调用格式,H,p,ci,zval=ztest(x,m,s,a,t),说明,x是样本值,m是平均值的评判标准,s是已知的标准差,alpha是显著水平,默认值为0.05,t为备择假设选项,只有三个值0,1和1,其中t=0表示“期望值不等于m”, t=1表示“期望值大于m”, t=1表示“期望值小于m”,t的默认值为0。,H=0 表示“在显著性水平a的情况下,不能拒绝原假设”。 H=1 表示“在显著性水平a的情况下,可以拒绝原假设”。 P为显著性概率;ci表示置信水平为1a的置信区间。 zval是检验统计量。,例如 某糖厂用自动包装机将糖果装箱,已知规定每箱的标准重量为100公斤。设每箱重服从正态分布。由以往经验知重量的均方差为0.9公斤。某天开工后检验包装机是否正常,随机抽取该包装机所包装的9箱,称得净重为(公斤)99.3,98.7,100.5,101.2,98.3,99 .7,105.1,102.6,100.5。取a=0.05,问机器是否正常?,解 可设 =0.9,xN(,0.92),提出假设 H0 =0=100 H1 100,x=99.3 ,98.7 ,100.5 ,101.2 ,98.3 ,99.7 ,105.1 ,102.6 ,100.5,h,p,ci,t=ztest(x,100,0.9,0.05,0),h = 1 p = 0.0289 ci =100.0676 101.2435 t = 2.1852,因此拒绝原假设H0,即自动包装机工作是不正常的,2 未知时的检验(t检验),MATLAB中的t检验由命令函数ttest来实现,调用格式,H,p,ci,tval=ttest(x,m,a,t),例如 某电子元件的寿命x(以小时计)服从正态分布,均未知。测得16只元件的寿命为159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为电子元件的平均寿命大于225(小时)?,解 H0 0=225 H1 225,x=159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 ;,h,p,ci,t=ttest(x,225,0.05,1) h = 0 p = 0.2570 ci =198.2321 Inf t = tstat: 0.6685 检验统计量 df: 15 自由度(n-1),因此不能拒绝原假设,即可以认为电子元件的平均寿命不大于225小时,3两个正态总体均值差的检验(t检验),MATLAB中的由命令函数ttest2来实现,调用格式,H,p,ci,zval=ttest2(x,y,a,t),例如 在漂白工艺中要考察温度对针制品断裂强力的影响,在70与80下分别作了7次和9次测试,其测试数据如下(单位:公斤),根据以往经验知两种温度下的断裂强力都服从正态分布,其方差相等且相互独立。试问两种温度下的平均断裂强力有无显著变化?,解 H0 1=2 H1 12,x=20.5 18.8 20.9 21.5 19.5 21.6 21.8;,y=17.7 19.2 20.3 20 18.6 19 19.1 20 18.1;,h,p,ci,t=ttest2(x,y,0.05,0) h = 1 p = 0.0085 ci = 0.4626 2.6294 t = tstat: 3.0606 df: 14,四、回归分析,回归分析是研究变量之间关系的一种统计方法,即利用统计数据来寻求变量之间关系近似表达式(经验公式),并利用所得公式进行统计描述、分析和推断,以解决预测、优化和控制问题。,线性回归的变量之间的关系为,根据观测数据 确定回归系数,MATLAB中提供了多元线性回归函数regress,调用格式,b=regress(y,x,a),b,bint,r,rint,stats=regress(y,x,a),y为观察得到的随机变量,x为自变量矩阵。若回归系数中包含常数,则x的第一列应全部为1,y与x的行数相等,x的列数等于回归系数的个数。a为输出各种置信区间用的显著性水平。,输出结果有5项:,b是参数的点估计; bint为参数的区间估计; r为残差的点估计; rint为残差的区间估计,当点估计落在区间估计之外时,拒绝无效假设;,stats中包含三个项:,R2是回归方程的相关系数R的平方; F是回归方程的F统计量, ; P是拒绝无效假设的概率(显著性概率),当Pa时拒绝假设H0 : ,即接受y与x有线性关系。,例如 为了研究钢材消费与国民收入之间的关系,在统计年鉴上查得一组历史数据如下表,试分析预测若1981到1985年我国国民收入以4.5%的速度递增,钢材消费量将达到什么样的水平?,令钢材消费量为y,国国民收入为x,x=1097 1284 1502 1394 1303 1555 1917 2051 2111 2286 2311 2003 2435 2625 2948 3155 3372 ,y=698 872 988 807 738 1025 1316 1539 1561 1765 1762 1960 1902 2013 2446 2736 2825 ,作出x,y的散点图,plot(x,y,o),从图中可看出,y随x增大有明显的线性增长趋势,X=ones(size(x),x; b,bint,r,rint,stats=regress(y,X,0.05),b = -460.5282 0.9840 bint = -691.8478 -229.2085 0.8779 1.0900 r = 略 stats = 0.9631 391.2713 0.0000,结果解释,回归系数: 残差平方和: Q=r*r= 2.7523e+005 回归方程: 统计量:R2=0.9631, F=391.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论