版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学实验国家“十二五”规划教材山东省优秀教材一等奖主编:李秀珍庞常词2第七章回归分析实验7.1一元回归分析实验7.2多元回归分析数学实验3实验7.1一元回归分析一、一元线性回归分析二一元非线性回归分析数学实验4一、一元线性回归分析模型两个变量x与y可以表示为:称为一元线性回归模型,
y称为响应变量自变量x是可以控制的变量,称为未知参数a,b称为回归系数,回归变量;(7.1)
一元线性回归分析实验的主要任务是:(1)用试验值(样本观测值)对未知参a,b做出估计;或因变量,(2)对建立的回归方程进行显著性检验;(3)利用建立的回归方程进行预测或控制。
是随机误差.
假设均服从正态分布5(7.1)式,得这里是相互独立的随机变量,假设均服从正态分布,,.即,
使用最小二乘方法,求得a,b的值,可得到回归方程:1.模型回归系数的估计
假定试验得到两个变量x与y
的n个数据对,我们将这n对观测值代入62.回归方程的显著性检验剩余(残差)平方和它是由观测误差等其他因素引起的误差.它反映了回归变量x对变量y线性关系的密切程度.回归平方和它表示观测值总的分散程度.检验中常用的几个统计量:偏差平方和7(1)拟合优度检验(2)回归方程的显著性检验反映了回归直线与观测值的拟合程度,值越大,说明直线对数据的拟合程度越好.在实际应用中也可通过F的统计值对应的概率P<a来说明y与x之间的线性相关性显著.当P<0.01时,称回归方程高度显著;当0.01<P<0.05时,称回归方程显著;当P>0.05时,称回归方程不显著.83.利用模型预测和控制把的值代入回归方程得到预测值.当n很大时,99%的预测区间可分别近似为这里s是剩余标准差,它表示观测值偏离回归直线的平均误差.观测值与回归值之差称为残差.
如果模型的假定成立,那么残差数据散点图应该以0为均值,呈宽度一致的带状分布.9函数功能regress(y,x,alpha)计算回归系数及其区间估计,残差及其置信区间,并给出检验回归模型的参数(决定系数,F统计量等),alpha缺省为0.05rcoplot(r,rint)画出残差及其置信区间fitlm(x,y,model)以x为数据矩阵,以y为响应变量,用model的方式建立一个线性回归模型.Modelspec方式见软件说明,可缺省.plotDiagnostics(mdl,plottype)以plottype选项的方式显示数据与回归模型的数据诊断图plotResiduals(mdl,plottype)以plottype指定选项的方式显示数据与回归模型的误差图predict(mdl,Xnew)返回(线性、非线性)模型mdl在Xnew的预测值和99%置信区间相关matlab命令函数4.一元回归分析的matlab实现10例1
设为x某个时期的家庭人均收入,y为该时期内平均每十户拥有照相机的数量.统计数据如下表7-2所示,求y与x的回归方程,并画出参差及用回归方程进行预测.表7-2家庭人均收入与需照相机的关系(百元)1.51.82.43.03.53.94.44.85.0(台/十户)2.83.75.06.38.810.511.011.613.2用regress函数执行实验实验方法如下:11(1)输入数据,观察x与y是否线性关系x=[1.51.82.43.03.53.94.44.85.0]’Y=[2.83.75.06.38.810.511.011.613.2]’;plot(x,Y,'*')↙在命令窗口输入:12(2)求回归方程在命令窗口输入:X=[ones(9,1)x];[b,bint,r,rint,stats]=regress(Y,X)↙b=-1.70702.9130bint=-2.9748-0.43932.55853.2675r=….rint=…stats=0.9818377.57990.00000.2944决定系数R^2F统计值F的值对应的概率误差平方的均值s2回归系数的估计值回归系数的置信区间残差(此处略)残差的100(1-alpha)%置信区间13(3)相关的检验可得回归方程:决定系数R2=0.9818,F=377.5799,对应的概率P=0.000<0.01因此线性相关性高度显著.(4)残差分析在命令窗口输入:rcoplot(r,rint)↙检验拟合效果,以进一步优化和改进模型。必要时可以剔除异常数据。14生成右边的残差图,可以看出,数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型能很好的拟合原始数据.(5)利用回归方程预测及作图在命令窗口输入:z=b(1)+b(2)*x;plot(x,Y,'k+',x,z,'r')↙图7-315给定x=4.5,利用回归方程可以预测:注意
一般情况下,建立模型后还要对模型的假定——
随机误差是服从正态分布且相互独立——进行一定的检验,以进一步优化和改进模型。常用的方法是残差分析法
当然也可利用模型对预测目标进行区间估计,对给定的置信度其预测区间为:16运行matlab:(1)录入数据同实验方法一(1).(2)求回归方程在命令窗口输入:lmf=fitlm(x,Y)↙注意,此处是用x,而非X.否则出错.lmf=线性回归模型:y~1+x1估计系数:EstimateSEtStatpValue(Intercept)-1.7070.53613-3.1840.015405x12.9130.1499119.4312.3846e-07
这是回归模型的说明,lmf是自己定义的.实验方法二:用fitlm函数来执行17lmf=线性回归模型:(这是回归模型的说明).y~1+x1估计系数:EstimateSEtStatpValue(Intercept)-1.7070.53613-3.1840.015405x12.9130.1499119.4312.3846e-07所求的回归方程为:系数估计值
从以上运行结果可知,系数的t统计值和对应的概率,而regress命令则没有这个。所求的回归方程为:18
从以上运行结果可知,决定系数=0.982,F=378,对应的概率P=2.38e-07<0.01,可知回归方程:线性相关性高度显著.观测值数目:9,误差自由度:7均方根误差:0.543R-方:0.982,调整R-方0.979F统计量(常量模型):378,p值=2.38e-07
可知:剩余标准差是s=0.543,决定系数R2=0.982,F统计量的值是:378,对应的概率是:2.38e-07.(注意,在用regress中得到的是s2=0.2944.即stats的第四个参数.)(3)回归方程的显著性检验19(4)残差分析在命令窗口输入:plotResiduals(lmf,'probability')↙该命令可画出残差与回归拟合分布图●可见没有残差明显偏离回归拟合直线.模型无需改进.●可用下列命令找到残差大于0.8的数据位置:find(lmf.Residuals.Raw>0.8)↙ans=620(5)点预测与95%的置信区间预测x=4.5的值.在命令窗口输入:[NewlmfNewCI]=predict(lmf,4.5)↙Newlmf=11.4014NewCI=10.814611.9881
可得到回归预测值为11.4014,其置信区间为[10.8146,11.9881].思考题:如何利用该命令画出回归方程的95%置信区间的图形?或者用feval(lmf,4.5)也可.21二一元非线性回归分析选择适当的曲线求回归方程其中a,b为未知参数。常见的可化为一元线性回归的非线性(即曲线型)问题详见教材,此处略去.
两个变量之间的相关关系不是线性的,可以根据专业知识或散点图,22非线性回归Matlab命令函数函数功能nlinfit(x,y,’model’beta0)计算非线性回归的系数,残差,估计预测误差的数据nlintool(x,y,’model’,beta0,alpha)产生拟合曲线和y的置信区间等信息的交互画面nlpredci(‘model’,x,beta,r,J)求回归函数在x处的预测值y及其置信区间nlparci(beta,r,J)计算回归系数的置信区间fitnlm(x,y,fun,beta0)与nlinfit函数采用相同算法的另一个非线性回归命令plotDiagnostics(mdl,plottype)以plottype选项的方式显示数据与回归模型的数据诊断图plotResiduals(mdl,plottype)以plottype指定选项的方式显示数据与回归模型的误差图predict(mdl,Xnew)返回(线性、非线性)模型mdl在Xnew的预测值和99%置信区间23例2
在彩色显影中,根据经验形成燃料光学密度y与析出银的光学密度x由公式表7-3光学密度与析出银的光学密度实验数据xi0.050.060.070.100.140.200.250.310.380.430.47yi0.100.140.230.370.590.791.001.121.191.251.29求y关于x的回归方程.表示,测得实验数据如下:24实验流程如下:(2)对要拟合对非线性模型建立M文件volum.m如下(1)输入数据x=[0.050.060.070.100.140.200.250.310.380.430.47]';
y=[0.100.140.230.370.590.791.001.121.191.251.29]‘;beta0=[0.10.1];在命令行窗口输入:这里初始残数的设定没有一般的方法.该初值的选取直接影响到计算和拟合的质量,在没有相关信息的情况下可用beta0=randn(nVars,1).
functionyhat=volum(beta,x)yhat=beta(1)*exp(beta(2)./x);25(3)求回归系数[beta,r,J]=nlinfit(x,y,'volum',beta0);可得非线性回归方程(4)回归方程的预测及作图[yy,delta]=nlpredci('volum1',x,beta,r,J);beta=↙1.7924-0.153426plot(x,y,'k+',x,yy,'r')↙可见回归曲线与原始数据拟合的很好。可以用剩余标准差来定量的判定拟合效果。27实验方法二:用fitnlm命令流程如下:(1)输入数据在命令窗口输入x,y的数据.同上(2)模型选择模型也可以用匿名函数.yhat=@(b,x)b(1)*exp(b(2)./x);(3)回归与检验在命令窗口输入:nlf=fitnlm(x,y,yhat,beta0)↙得到如下结果:在命令窗口输入:28nlf=非线性回归模型:y~b1*exp(b2/x)估计系数:EstimateSEtStatpValueb11.79240.03026159.2315.6151e-13b2-0.153390.0043739-35.0696.1601e-11观测值数目:11,误差自由度:9均方根误差:0.0236R-方:0.998,调整R-方0.997F-statisticvs.zeromodel:7.25e+03,p值=3.68e-15这是回归模型的说明,nlf是自己定义的.可得非线性回归方程29我们还可知道:决定系数,F统计值对应概率P=3.68e-15<0.01.系数的统计值对应概率很小.此外,剩余标准差为0.0236相比y的数据范围小的多,也说明模型拟合较好.(4)回归方程的预测在命令行窗口输入:[yhat,yci]=predict(nlf,x);↙plot(x,y,'k+',x,yhat,'r')↙此函数线性和非线性通用30
下表为1980~1991年间以1987年不变价计算的美国个人消费支出Y与国内生产支出X数据(单位:10亿美元)年份YX年份YX19802447.13776.319862969.14404.519812476.93843.119873052.24539.919822503.73760.319883162.44718.619832619.43906.619893223.34838.019842746.14148.519903260.44877.519852865.84279.819913240.84821.0(1)在直角坐标系下,作X与Y的散点图,并判断Y与X是否存在线性相关关系.(2)试求Y与X的一元线性回归方程.三应用实例31(3)对所得回归方程作显著性检验(a=0.05).(4)若国内生产支出为x0=4500,试求对应的消费支出y0的点预测和包含概率为的95%区间预测.实验流程(1)输入数据,观察散点图.x=[3776.33843.13760.33906.64148.54279.84404.54539.94718.64838.04877.54821.0]’;y=[2447.12476.92503.72619.42746.12865.82969.13052.23162.43223.33260.43240.8]’;plot(y,x,'+')↙在命令窗口输入:图7-5632(2)求回归方程在命令窗口输入:lmf=fitlm(x,y)↙lmf=线性回归模型:y~1+x1估计系数:EstimateSEtStatpValue(Intercept)-231.894.528
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 政府采购服务保证金制度
- 私人单位采购制度
- 精煤采购渠道管理制度
- 中小学食堂集中采购制度
- 绿色建材采购制度范本
- 专项采购管理制度汇编
- 中药材采购出差管理制度
- 中药诊所采购管理制度
- 薯片土豆采购制度
- 无纺布物料采购制度
- 艺术类学生入团申请书实例
- GB/T 196-2025普通螺纹基本尺寸
- 等腰三角形复习课教案
- 初三化学知识梳理:酸碱盐
- 麻醉科气道管理护理
- 《2025年工贸企业重大事故隐患判定标准解读》知识培训
- 岗位晋升申请书理由
- 个人简历模板完整版(带封面和自荐信)
- T-CNCIA 02020-2024 含异氰脲酸三缩水甘油酯(TGIC)的粉末涂料密闭生产工艺要求
- 部编小学二年级语文下册第五单元寓言两则(教学设计教案及反思)
- 董氏针灸奇穴全集
评论
0/150
提交评论