MATLAB统计工具箱中的回归分析命令ppt课件_第1页
MATLAB统计工具箱中的回归分析命令ppt课件_第2页
MATLAB统计工具箱中的回归分析命令ppt课件_第3页
MATLAB统计工具箱中的回归分析命令ppt课件_第4页
MATLAB统计工具箱中的回归分析命令ppt课件_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关与回归分析 第一节变量间的相关关系第二节一元线性回归第三节多元线性回归第四节可化为线性回归的曲线回归 雷学习目标 1 掌握相关系数的含义 计算方法和应用2 掌握一元线性回归的基本原理和参数的最小二乘估计方法掌握回归方程的显著性检验利用回归方程进行预测掌握多元线性回归分析的基本方法了解可化为线性回归的曲线回归用matlab进行回归分析 第一节变量间的相关关系 一 变量相关的概念二 相关系数及其计算 变量相关的概念 变量间的关系 函数关系 是一一对应的确定关系设有两个变量x和y 变量y随变量x一起变化 并完全依赖于x 当变量x取某个数值时 y依确定的关系取相应的值 则称y是x的函数 记为y f x 其中x称为自变量 y称为因变量各观测点落在一条线上 变量间的关系 函数关系 函数关系的例子某种商品的销售额 y 与销售量 x 之间的关系可表示为y px p为单价 圆的面积 S 与半径之间的关系可表示为S R2企业的原材料消耗额 y 与产量 x1 单位产量消耗 x2 原材料价格 x3 之间的关系可表示为y x1x2x3 变量间的关系 相关关系 变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个值时 变量y的取值可能有几个各观测点分布在直线周围 变量间的关系 相关关系 相关关系的例子商品的消费量 y 与居民收入 x 之间的关系商品销售额 y 与广告费支出 x 之间的关系粮食亩产量 y 与施肥量 x1 降雨量 x2 温度 x3 之间的关系收入水平 y 与受教育程度 x 之间的关系父亲身高 y 与子女身高 x 之间的关系 相关关系的类型 相关关系的图示 相关系数及其计算 相关关系的测度 相关系数 对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数若相关系数是根据总体全部数据计算的 称为总体相关系数 记为 若是根据样本数据计算的 则称为样本相关系数 记为r 相关关系的测度 相关系数 样本相关系数的计算公式 或化简为 相关关系的测度 相关系数取值及其意义 r的取值范围是 1 1 r 1 为完全相关r 1 为完全正相关r 1 为完全负正相关r 0 不存在线性相关关系相关 1 r 0 为负相关0 r 1 为正相关 r 越趋于1表示关系越密切 r 越趋于0表示关系越不密切 相关关系的测度 相关系数取值及其意义 r 统计工具箱中的回归分析命令 1 多元线性回归 2 多项式回归 3 非线性回归 4 逐步回归 返回 回归模型的类型 多元线性回归 b regress Y X 1 确定回归系数的点估计值 3 画出残差及其置信区间 rcoplot r rint 2 求回归系数的点估计和区间估计 并检验回归模型 b bint r rint stats regress Y X alpha 例1 解 1 输入数据 x 143145146147149150153154155156157158159160162164 X ones 16 1 x Y 8885889192939395969897969899100102 2 回归分析及检验 b bint r rint stats regress Y X b bint stats ToMATLAB liti11 题目 3 残差分析 作残差图 rcoplot r rint 从残差图可以看出 除第二个数据外 其余数据的残差离零点均较近 且残差的置信区间均包含零点 这说明回归模型y 16 073 0 7194x能较好的符合原始数据 而第二个数据可视为异常点 4 预测及作图 z b 1 b 2 x plot x Y k x z r 返回 ToMATLAB liti12 多项式回归 一 一元多项式回归 1 确定多项式系数的命令 p S polyfit x y m 2 一元多项式回归命令 polytool x y m 1 回归 y a1xm a2xm 1 amx am 1 多项式回归 一 一元多项式回归 y a1xm a2xm 1 amx am 1 2 预测和预测误差估计 1 Y polyval p x 求polyfit所得的回归多项式在x处的预测值Y 2 Y DELTA polyconf p x S alpha 求polyfit所得的回归多项式在x处的预测值Y及预测值的显著性为1 alpha的置信区间YDELTA alpha缺省时为0 05 法一 直接作二次多项式回归 t 1 30 1 30 14 30 s 11 8615 6720 6026 6933 7141 9351 1361 4972 9085 4499 08113 77129 54146 48 p S polyfit t s 2 ToMATLAB liti21 得回归模型为 法二 化为多元线性回归 t 1 30 1 30 14 30 s 11 8615 6720 6026 6933 7141 9351 1361 4972 9085 4499 08113 77129 54146 48 T ones 14 1 t t 2 b bint r rint stats regress s T b stats ToMATLAB liti22 得回归模型为 Y polyconf p t S plot t s k t Y r 预测及作图 ToMATLAB liti23 二 多元二项式回归 命令 rstool x y model alpha 例3设某商品的需求量与消费者的平均收入 商品价格的统计数据如下 建立回归模型 预测平均收入为1000 价格为6时的商品需求量 法一 直接用多元二项式回归 x1 10006001200500300400130011001300300 x2 5766875439 y 10075807050659010011060 x x1 x2 rstool x y purequadratic 在画面左下方的下拉式菜单中选 all 则beta rmse和residuals都传送到MATLAB工作区中 将左边图形下方方框中的 800 改成1000 右边图形下方的方框中仍输入6 则画面左边的 PredictedY 下方的数据由原来的 86 3791 变为88 4791 即预测出平均收入为1000 价格为6时的商品需求量为88 4791 在MATLAB工作区中输入命令 beta rmse ToMATLAB liti31 结果为 b 110 53130 1464 26 5709 0 00011 8475stats 0 970240 66560 0005 法二 ToMATLAB liti32 返回 非线性回归 1 确定回归系数的命令 beta r J nlinfit x y model beta0 2 非线性回归命令 nlintool x y model beta0 alpha 1 回归 例4对第一节例2 求解如下 2 输入数据 x 2 16 y 6 428 209 589 59 7109 939 9910 4910 59 10 6010 8010 6010 9010 76 beta0 82 3 求回归系数 beta r J nlinfit x y volum beta0 beta 得结果 beta 11 6036 1 0641 即得回归模型为 ToMATLAB liti41 题目 4 预测及作图 YY delta nlpredci volum x beta r J plot x y k x YY r ToMATLAB liti42 例5 财政收入预测问题 财政收入与国民收入 工业总产值 农业总产值 总人口 就业人口 固定资产投资等因素有关 表中列出了1952 1981年的原始数据 试构造预测模型 解设国民收入 工业总产值 农业总产值 总人口 就业人口 固定资产投资分别为x1 x2 x3 x4 x5 x6 财政收入为y 设变量之间的关系为 y ax1 bx2 cx3 dx4 ex5 fx6使用非线性回归方法求解 1 对回归模型建立M文件model m如下 functionyy model beta0 X a beta0 1 b beta0 2 c beta0 3 d beta0 4 e beta0 5 f beta0 6 x1 X 1 x2 X 2 x3 X 3 x4 X 4 x5 X 5 x6 X 6 yy a x1 b x2 c x3 d x4 e x5 f x6 2 主程序liti6 m如下 X 598 00349 00461 0057482 0020729 0044 00 2927 006862 001273 00100072 043280 00496 00 y 184 00216 00248 00254 00268 00286 00357 00444 00506 00 271 00230 00266 00323 00393 00466 00352 00303 00447 00 564 00638 00658 00691 00655 00692 00657 00723 00922 00 890 00826 00810 0 beta0 0 50 0 03 0 600 01 0 020 35 betafit nlinfit X y model beta0 ToMATLAB liti6 betafit 0 5243 0 0294 0 63040 0112 0 02300 3658即y 0 5243x1 0 0294x2 0 6304x3 0 0112x4 0 0230 x5 0 3658x6 结果为 返回 逐步回归 逐步回归的命令是 stepwise x y inmodel alpha 运行stepwise命令时产生三个图形窗口 StepwisePlot StepwiseTable StepwiseHistory 在StepwisePlot窗口 显示出各项的回归系数及其置信区间 StepwiseTable窗口中列出了一个统计表 包括回归系数及其置信区间 以及模型的统计量剩余标准差 RMSE 相关系数 R square F值 与F对应的概率P 例6水泥凝固时放出的热量y与水泥中4种化学成分x1 x2 x3 x4有关 今测得一组数据如下 试用逐步回归法确定一个线性模型 1 数据输入 x1 7111117113122111110 x2 26295631525571315447406668 x3 615886917221842398 x4 6052204733226442226341212 y 78 574 3104 387 695 9109 2102 772 593 1115 983 8113 3109 4 x x1x2x3x4 2 逐步回归 1 先在初始模型中取全部自变量 stepwise x y 得图StepwisePlot和表StepwiseTable 图StepwisePlot中四条直线都是虚线 说明模型的显著性不好 从表StepwiseTable中看出变量x3和x4的显著性最差 2 在图StepwisePlot中点击直线3和直线4 移去变量x3和x4 移去变量x3和x4后模型具有显著性 虽然剩余标准差 RMSE 没有太大的变化 但是统计量F的值明显增大 因此新的回归模型更好 ToMATLAB liti51 3 对变量y和x1 x2作线性回归 X ones 13 1 x1x2 b regress y X 得结果 b 52 57731 46830 6623故最终模型为 y 52 5773 1 4683x1 0 6623x2 ToMATLAB liti52 返回 相关关系的测度 相关系数计算例 练习1 在研究我国人均消费水平的问题中 把全国人均消费额记为y 把人均国民收入记为x 我们收集到1981 1993年的样本数据 xi yi i 1 2 13 数据见表10 1 计算相关系数 答案 用matlab可得 经验 方程 人均消费金额对人均国民收入的回归方程为 y 54 22286 0 52638x 二元线性回归的练习 练习2 一家百货公司在10个地区设有经销分公司 公司认为商品销售额与该地区的人口数和年人均收入有关 并希望建立它们之间的数量关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论