版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、概率论与数理统计数学实验目录实验一几个重要的概率分布的MATLA联现p2-3实验二数据的统计描述和分析p4-8实验三参数估计p9-11实验四假设检验p12-14实验五方差分析p15-17实验六回归分析p18-27实验一几个重要的概率分布的MATLA或现实验目的(1)学习MATLAB(件与概率有关的各种计算方法(2)会用MATLAB(件生成几种常见分布的随机数(3)通过实验加深对概率密度,分布函数和分位数的理解Matlab统计工具箱中提供了约20种概率分布,对每一种分布提供了5种运算功能,下表给出了常见8种分布对应的Matlab命令字符,表2给出了每一种运算功能所对应的Matlab命令字符。当需
2、要某一分布的某类运算功能时,将分布字符与功能字符连接起来,就得到所要的命令。分布均匀指数正态2,.分布t分布F分布二项泊松字符unifexpnormchi2tfbinopoiss功能概率密度分布函数逆概率密度均值与方差随机数生成字符pdfcdfinvstatrnd例1求正态分布N1,2,在*=处的概率密度。解:在MATLAB命令窗口中输入:normpdf,-1,2)结果为:例2求泊松分布P3,在k=5,6,7处的概率。解:在MATLAB命令窗口中输入:poisspdf(567,3)结果为:例3设X服从均匀分布U1,3,计算P2X2.5。解:在MATLAB命令窗口中输入:unifcdf,1,3)
3、-unifcdf(-2,1,3)结果为:例4求概率0.995的正态分布N1,2的分位数X。解:在MATLAB命令窗口中输入:norminv,1,2)结果为:例5求t分布t10的期望和方差。解:在MATLAB命令窗口中输入:m,v=tstat(10)m=0v=例6生成一个2*3阶正态分布的随机矩阵。其中,第一行3个数分别服从均值为1,2,3;第二行3个数分别服从均值为4,5,6,且标准差均为的正态分布。解:在MATLAB命令窗口中输入:A=normrnd(123;456,2,3)A=例7生成一个2*3阶服从均匀分布U1,3的随机矩阵。解:在MATLAB命令窗口中输入:B=unifrnd(1,3,
4、2,3)B=注:对于标准正态分布,可用命令randn(m,n);对于均匀分布U0,1,可用命令rand(m,n)实验二数据的统计描述和分析实验目的(1)学习MATLAB件关于统计作图的基本操作(2)会用MATLA献件计算计算几种常用统计量的值(3)通过实验加深对均值、方差、中位数等常用统计量的理解1.频数表和直方图一组数据(样本观察值)虽然包含了总体的信息,但往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一个阶
5、梯形的图,称为直方图,或频数分布图。2经验累计分布函数图设Xi,X2,Xn是总体X的一个容量为n的样本观察值。将Xi,X2,Xn按自小到大的次序排列,并重新编号,设为则称FnX为总体X的经验累积分布函数,它的图像即为经验累计分布函数图。3几种常用的统计量(1)算术平均值和中位数1算术平均值(简称均值),X1Xi,中位数是将数据由小到大排序后位于中间位ni1置的那个数值(2)标准差、方差1标准差:s Xin 1 i 1-2一2X,它是各个数据与均值偏离程度的度量。方差是标准差的平方,记为s2(3)偏度和峰度_3表示数据分布形状的统计量有偏度和峰度。偏度:g1TXiX反映数据分布对si1称性的指标
6、,当gi0时,称为右偏态,此时数据位于均值右边的比位于左边的多;当gi0时称为左偏态,情况相反;而gi接近0时,则可认为分布是对称的。峰度:1n4g2XiX),是数据分布形状的另一种度重,正态分布的峰度为3,右g2比3大Si1得多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可以用作衡量偏离正态分布的尺度之一。将样本的观测值x1,x2,xn代入以上各式后,即可求得对应统计量的观测值。4MATLAB实现下面我们列出用于数据的统计描述和分析的常用MATLA除令。其中,x为原始数据行向量。(1)用hist命令实现作频数表及直方图,其用法是:n,y=hist(x,k)返回x的频数表
7、。它将区间min(x),max(x)等分为k份(缺省时k设定为10),n返回k个小区间的频数,y返回k个小区间的中点。hist(x,k)返回x的直方图。(2)用cdfplot命令作累积分布函数图,其用法是:h,stats=cdfplot(x)在返回x的累积分布函数图的同时,在stats中给出样本的一些特征:样本最小值、最大值、平均值、中位数和标准差。cdfplot(x,k)则直接返回x的累积分布函数图。(3)算术平均值和中位数Matlab中mean(x)返回x的均值,median(x)返回中位数。(4)标准差、方差和极差极差是x1,x2,xn的最大值与最小值之差。Matlab中std(x)返回
8、x的标准差,var(x)返回方差,range(x)返回极差。(4)偏度和峰度Matlab中skewness(x)返回x的偏度,kurtosis(x)返回峰度。例1某学校随机抽取100名学生,测量他们的身高,所得数据如下表1721691691711671781771701671691711681651691681731701601791721661681641701651631731651761621601751731721681651721771821751551761721691761701701691861741731681691671701631721761661671661611731
9、75158172177177169166170169173164165182176172173174167171166166172171175165169168173178163169169177184166171170解:在MATLAB命令窗口中输入:X=172169169171167178177170167169171168165169168173170160179172166168164170165163173165176162160175173172168165172177182175155176172169176170170169186174173168169167170163172
10、176166167166161173175158172177177169166170169173164165182176172173174167171166166172171175165169168173178163169169177184166171170;n,y=hist(X)n=23618262211822y=hist(X)直方图x1=mean(X)x1=x2=median(X)x2=170x3=range(X)x3=31x4=std(X)x4=x5=skewness(X)x5=x6=kurtosis(X)x6=例2产生50个服从标准正态分布的随机数,指出它们的分布特征,并画出经验累积分
11、布函数图解:在MATLAB命令窗口中输入:x=normrnd(0,1,1,50);h,stats=cdfplot(x)h=stats=min:max:mean:median:std:经验累积分布函数图实验三参数估计实验目的(1)学习MATLAB(件关于参数估计的有关操作命令(2)会用MATLAB(件求参数的点估计和置信区间(3)通过实验加深对参数估计基本概念和基本思想的理解1 参数估计的方法利用样本对总体进行统计推断的一类问题是参数估计,即假定总体的概率分布类型已知,由样本估计参数的分布。参数估计的方法主要有点估计和区间估计两种。2 参数估计的Matlab实现在Matlab统计工具箱中,有专门
12、计算总体均值、标准差的点估计和区间估计的函数。对于正态总体,命令是mu,sigma,muci,sigmaci=normfit(x,alpha)其中x为样本(数组或矩阵),alpha为显着性水平(alpha缺省时设定为),返回总体均值和标准差的点估计mif口sigma,及总体均值和标准差的区间估计muci和sigmaci。当x为矩阵时返回行向量。此外,Matlab统计工具箱中还提供了一些具有特定分布总体的区间估计的命令,如expfit,poissfit,分别用于指数分布和泊松分布的区间估计,具体用法可参见MATLAB勺帮助系统。2、例1已知某种木材横纹抗压力的实验值XN(,),对10个试件做横纹
13、抗压力的试验数据如下:482,493,457,471,510,446,435,418,394,496(单位:公斤/平方厘米),试以95%勺可靠性估计该木材的平均横纹抗压力的置信区间:(1)2未知;(2)2302o解:(1)2未知时,可直接使用normfit命令在MATLA瑜令窗口中输入:x=482,493,457,471,510,446,435,418,394,496;musigmamucisigmaci=normfit(x)mu=sigma=muci=sigmaci=未知时,平均横纹抗压力的估计值为,其置信度为的置信区间为(2)已知时,的置信度为的置信区间为x u1 /2=,xu1/2在MA
14、TLA瑜令窗口中输入:x=482,493,457,471,510,446,435,418,394,496;muci=mean(x)-norminv*30/sqrt(10),mean(x)+norminv*30/sqrt(10)muci=2已知时,平均横纹抗压力的置信度为的置信区间为,。同(1)比较可得,在置信水平相同的条件下,利用方差得到的置信区间的长度要小于忽略方差得到的置信区间长度。例2某厂生产的瓶装运动饮料的体积假定服从正态分布,抽取10瓶,测得体积(毫升)为求出方差的置信度为的置信区间595,602,610,585,618,615,605,620,600,606解:在MATLA命令窗口
15、中输入:x=595,602,610,585,618,615,605,620,600,606;musigmamucisigmaci=normfit(x,mu=sigma=muci=sigmaci=sigmaA2ans=sigmaci.A2ans=2即的估计值为,其置信度为的置信区间为,。例3某炸药制造厂,一天中发生着火现象的次数X是一个随机变量,假设它服从以0为参数的泊松分布,参数未知。现有以下样本值:着火次数k0123456发生着火的天数75905422621试求的极大似然估计值和置信水平为95%的置信区间。解:在MATLA命令窗口中输入:x=75,90,54,22,6,2,1;lamda,l
16、amdaci=poissfit(x)lamda=lamdaci=即的极大似然估计值为,其置信水平为95%的置信区间为,实验四假设检验实验目的(1)学习MATLAB(件关于假设检验的有关操作命令会用MATLAB件求单个正态总体和双正态总体的假设检验问题(3)会用MATLA敷件判断总体是否服从正态分布(4)通过实验加深对假设检验基本概念和基本思想的理解1参数假设检验如果总体的分布函数类型已知,只是对总体分布中的参数做某种假设。然后,用样本检验此假设是否成立,这种检验称为参数检验。下面我们给出几种参数检验对应的Matlab命令,相关的理论知识可参考教材。假设检验Matlab命令单个总体均值(2已知)
17、H0:0H1:0(0,0)h,p,ci=ztest(x,mu,sigma,alpha,tail)单个总体均值(2未知)H0:0H1:0(0,0)h,p,ci=ttest(x,mu,alpha,tail)两个总体均值2212已知)H0:12H1:12(12,12)h,p,ci=ttest2(x,y,alpha,tail)注1:x是样本,muHH0中的0,sigma是总体标准差,alpha是显着性水平(alpha缺省时设定为),tail是对备择假设H1的选择:H1为0时,令tail=0(可缺省);H1为0时,令tail=1;H1为0时,令tail=-1。输出参数h=0表示接受H0,h=1表示拒绝H
18、0,p表示在假设H0下样本均值出现的概率,p越小H0越值得怀疑,ci是0的置信区间。注2:ttest2输入的是两个样本x,y,长度可以不同。例1某种电子元件的寿命X(以小时计)服从正态分布,2未知.现得16只元件的寿命如下:159280101212224379179264222362168250149260485170问是否有理由认为元件的平均寿命大于225(小时)?()解:需要检验:H0:225,Hi:225x=159280101212224379179264222362168250149260485170;h,p,ci尸ttest(x,225,1)0P=ci=Infh=0,p=,说明在显着
19、水平为的情况下,不能拒绝原假设,认为元件的平均寿命不大于225小时。例2在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一平炉上进行的。每炼一炉钢时除操作方法外,其它条件都可能做到相同。先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交换进行,各炼了10炉,其得率分别为:10标准方法2。新方法设这两个样本相互独立且服从标准差相同的正态分布,问建议的新方法能否提高得率?(取。)解需要检验:H0:12,H1:12x=;y=;h,p,ci=ttest2(x,y,-1)h=1P=ci=-Infh=1,p=X10。表明在的显着水平下,可以拒绝原假设,即认为建议的新操作方法能提
20、高得率。2分布拟合检验在实际问题中,有时不能预知总体服从什么类型的分布,这时就需要根据样本来检验关于分布的假设。下面我们给出几种检验总体是否服从正态分布对应的Matlab命令。总体分布正态性检验MATLA命令备注一2H0:总体服从N,h,p=jbtest(x,alpha)适用于大样本2H0:总体服从N,2h,p=l川ietest(x,alpha)适用于小样本H0:总体服从N0,1h=kstest(x)注1:输入参数x是样本,alpha是显着性水平(alpha缺省时设定为),输出h=1,则拒绝总体是正态分布的假设,若h=0,则接受总体服从正态分布的假设。p为检验概率值,p越小,则H0越值得怀疑例
21、3试检验实验二例1中的学生身高数据是否来自正态总体(取。解:在MATLA瑜令窗口中输入:h,p=jbtest(x,h=0p=h=0,因此,接受总体服从正态分布的假设。实验五方差分析实验目的(1)学习MATLAB(件关于方差分析的有关操作命令(2)会用MATLA敷件求解单因素和双因素方差分析问题(3)通过实验加深对方差分析基本概念和基本思想的理解1单因素方差分析Matlab实现Matlab统计工具箱中单因素方差分析的命令是anoval,用法为:p=anoval(x,group)输入参数x是一个向量,从第1个总体的样本到第r个总体的样本依次排列,group是一个与x有相同长度的向量,反映了x中数据
22、的分组情况。比如,可以用数字i代表第i个总体的样本。输出值p是一个率值(p值),当P时接受原假设,即认为因素A对指标有无显着影响。另外,该命令还给出一个标准的方差分析表和一个盒子图。例1用4种工艺生产灯泡,从各种工艺制成的灯泡中各抽出了若干个测量其寿命,结果如下表,试推断这几种工艺制成的灯泡寿命是否有显着差异。序号工艺A1A2A3A4116201580146015002167016001540155031700164016201610417501720168051800解:在MATLA瑜令窗口中输入:x=162015801460150016701600154015501700164016201
23、6101750172016801800;g=ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4);p=anova1(x,g)P=p=1时,输出p还包含另外一个概率值,该p值接近于零(小于时,认为两个因素交互作用的效应是显着的。例2下表给出某种化工过程在三种浓度、四种温度水平下得率的数据。假设在诸水平配对下的试验结果如下表所示。试在水平下,检验在不同浓度(因素A)、不同温度(因素B)下的得率是否有显着差异?交互作用是否显着?浓度(B)温度(A)1024385221111131010119124910767811106513121411141310解:在MAT
24、LA瑜令窗口中输入:x=11111310;1011912;91076;781110;5131214;11141310;p=anova2(x,2)P=p=。即认为温度因素不显着、而浓度因素有显着差异,交互作用不显着。双因素方差分析表实验六回归分析实验目的(1)学习MATLAB(件关于回归分析的有关操作命令(2)会用MATLAB(件求解各种类型的回归分析问题(3)通过实验加深对回归分析基本概念和基本思想的理解1多元线性回归的Matlab实现Matlab统计工具生f用命令regress实现多元线性回归,用的方法是最小二乘法,其MATLAB命令为:b,bint,r,rint,stats=regress
25、(y,x,alpha)其中y,x为输入数据,alpha是显着性水平(缺省值为),输出b为回归系数估计值,bint是的置信区间,r是残差向量,rint是r的置信区间,stats中包含了三个检验量:决定系数222R,F值和p值。它们的用法如下:R值反映了变量间的线性相关的程度,R越接近1,则变量间的线性关系越强;如果满足斤n2F,同样可以认为Y与x显着地有线性关系;若p,则线性模型可用。残差及其置信区间还可以用rcoplot(r,rint)画图。若某个数据的残差置信区间不包含零点,则该数据可视为异常点,通常可将其剔除后重新计算。例1某饮料公司发现饮料的销售量与气温之间存在着相关关系,即气温越高,人
26、们对饮料的需求量越大。下表记录了饮料销售量和气温的观察数据:气温x(度)3021354237208173525销量y(箱)430335520490470210195270400480试建立销售量与气温之间的关系。解:首先画出散点图,从图形可以看出,这些点大致分布在一条直线上,所以,可以考虑一元线性回归。散点图在MATLA瑜令窗口中输入:x=3021354237208173525;y=430335520490470210195270400480;plot(x,y,o)X=ones(10,1),x;bbintrrints=regress(y,X,b=bint=P=s(3)P=p=,说明模型成立,即
27、气温x与饮料销售量丫有显着的线性关系。接下来画残差分布图rcoplot(r,rint)残差分布图由残差分布图可知,除第10个数据外其余残差的置信区间土包含零点。因此,第10个点应视为异常点,将其剔除后重新计算,可得x=30213542372081735;y=430335520490470210195270400;X=ones(9,1),x;bbintrrints=regress(y,X,;b=bint=P=s(3)P=p值小于原模型的p值,所以应该用修改后的模型。2多项式回归的MATLA改现一元多项式回归的MATLABt令为:p,s=ployfit(x,y,n)其中输入x,y是样本数据,n表示
28、多项式的阶数,输出p是回归多项式的系数,s是一个数据结构,可用于其他函数的计算,比如,ydelta=polyconf(p,x0,s)可用于计算x0处的预测值y及其置信区间的半径delta。一元多项式回归还可以采用如下命令:polytool(x,y,n,alpha)该命令输出一个交互式画面,画面显示回归曲线及其置信区间,通过图左下方的export下拉式菜单,还可以得到回归系数的估计值及其置信区间、残差等。还可以在正下方左边的窗口中输入x,即可在右边窗口得到预测值y及其对应的置信区间。例2将1任29岁的运动员每两岁一组分为7组,每组两人测量其旋转定向能力,以考察年龄对这种运动能力的影响。现得到一组
29、数据如下表:年龄17192123252729第一人第二人试建立二者之间的关系。解数据的散点图(略)明显地呈现两端低中间高的形状,所以应拟合一条二次曲线x=17:2:29;X=x,x;y=;p,s=polyfit(X,y,2)p=即所求的回归模型为:下面的命令给出了年龄为26岁时的预测值及其置信区间的半径。x0=26;y0,delta=polyconf(p,x0,s)y0=delta=若采用命令polytool(X,y,2),则可得到一个如下图所示的交互式画面,其中实曲线为拟合曲线,它两侧的虚线是y的置信区间。点击左下方的Export按钮,可以在MATLA的工作空间中得到回归系数等。3多元二项式
30、回归的MATLA期现MATLAB中提供了一个作多元二项式回归的命令rstool,同命令polytool类似也可产生一个交互式画面,并输出有关信息,用法是rstool(x,y,model,alpha)其中输入数据x,y分别为n?m巨阵和n维向量,alpha为显着性水平?(缺省时设定为),model对应4个模型(用字符串输入,缺省时设定为线性模型),分别为:linear(只包含线性项);purequadratic(包含线性项和纯二次项);interaction(包含线性项和纯交叉项);quadratic(包含线性项和完全二次项)。例3对下面这组数据采用多元二项式回归确定它们之间的关系:x11201
31、40190130155175125145180150x210011090150210150250270300250y10210012077469326696585解:在MATLABT令窗口中输入x1=120140190130155175125145180150;x2=10011090150210150250270300250;y=10210012077469326696585;x=x1x2;rstool(x,y,quadratic)得到一个如下图所示的交互式画面。通过按钮Export向Matlab工作区传送:beta(回归系数),rmse(剩余标准差)和residuals(残差)等数据。可得:
32、beta=rmse=对应的回归模型为:利用图左下方的下拉式菜单,选择不同的模型并通过按钮Export向Matlab工作区传送数据,就可以比较它们的剩余标准差,会发现模型(purequadratic)的rmse=最小,对应的回归模型为:4非线性回归的Matlab实现Matlab提供的非线性回归命令有:nlinfit,nlparci,nlpredci,nlintool。它们的具体用法如下:b,R,J=nlinfit(x,y,model,b0)其中输入数据x,y分另IJ为nm矩阵和n维向量。Model是事先用Mt件定义的非线性函数,其形式为yfx,为待估参数。b0是的初值。输出b是的估计值,R是残差
33、,J是用于估计误差的Jacobi矩阵。进一步,将以上输出代入命令bi=nlparci(b,R,J)可得的置信区间bi。若代入命令y0delta=nlpredci(model,x0,b,R,J)则可得回J/3函数在x0处的预测值y0及其置信区间。命令nlintool可产生一个交互式画面,并输出有关信息,用法是:nlintool(x,y,model,b0,alpha)例4在工程中希望建立一种能由混凝土的抗压强度x推算抗剪强度y的经验公式,下表中给出了现有9对数据。试分别按以下三种形式建立y又tx的回归方程,并从中选出最优模型。(1) yabxycx(2) yablnxx141152168182195204223254277yb解:首先对每个回归方程建立相应的帔件如下:functiony=f1(beta,x);y=beta(1)+beta(2)*sqrt(x);functiony=f2(beta,x);y=beta(1)+beta(2)*log(x);functiony=f3(beta,x);y=beta(1)*x.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年阳泉市粮食和物资储备系统事业单位人员招聘考试备考试题及答案详解
- 房地产行业智能家居解决方案
- 公司门禁安防控制方案
- 2026年山东省卫生健康系统事业单位人员招聘考试备考试题及答案详解
- 2026年眉山市消防救援系统事业单位人员招聘考试备考试题及答案详解
- 招1人!公开招聘达卡乡卫生院兰青村乡村医生考试备考试题及答案解析
- 2026年宁夏回族自治区劳动保障监查系统事业单位人员招聘考试备考试题及答案详解
- 2026年自贡市市场监督管理系统事业单位人员招聘考试备考试题及答案详解
- 2026年盐城市卫生行政系统事业单位人员招聘考试备考试题及答案详解
- 2026年曲靖市医疗系统事业编乡村医生人员招聘考试备考试题及答案详解
- 2026中国铁路兰州局集团有限公司招聘普通高校毕业生113人(三)笔试备考题库及答案解析
- 精神科风险评估管理规范2026.1.10
- 2026年中国邮政集团面试与笔试全攻略
- 2026无锡市中考历史押题必刷卷含答案
- 第10课 学会表达 课件(内嵌视频)2025-2026学年道德与法治三年级下册统编版
- 2025-2030韩国造船设备行业市场深度调研及发展趋势与投资前景预测研究报告
- 发展对象应知应会题库
- 内蒙古自治区包头市2025-2026学年中考二模物理试题(含答案解析)
- 雨课堂学堂在线学堂云人工智能与医学数据计算(中国医科大学)单元测试考核答案
- 广东省江门市2026年高考模拟考试(一模)英语试题( 含答案)
- 瑞幸咖啡入职在线测评题库
评论
0/150
提交评论