MATLAB数据分析方法2.doc_第1页
MATLAB数据分析方法2.doc_第2页
MATLAB数据分析方法2.doc_第3页
MATLAB数据分析方法2.doc_第4页
MATLAB数据分析方法2.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析一、一元线性回归模型例 基本概念一元线性回归模型: 1.第一类回归问题设X为自变量(预报变量),Y为因变量(响应变量),已知X的取值后,且有 2.第二类回归问题设x为可控变量(一般变量),Y为随机变量,有 其中是随机误差,一般假设.由于的随机性导致Y为随机变量.总的离差平方和(sum of squares total, SST);回归平方和(sum of squares of regression, SSR);残差平方和(sum of squares error, SSE);回归的平均平方和(regression mean squares, MSR);残差的平均平方和(error mean squares, MSE);一元线性回归方程显著性检验的方差分析表方差来源平方和自由度均方F值总计回归1残差平方相关系数(coefficient of determination 决定性系数): 例3.1.1liti3_1_1.m%例3.1.1 近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)数据如下表3.1。clearx=23.80,27.60,31.60,32.40,33.70,34.90,43.20,52.80,63.80,73.40;y=41.4,51.8,61.70,67.90,68.70,77.50,95.90,137.40,155.0,175.0;注:GUI界面命令: polytool(x,y,n,alpha)例3.1.2liti3_1_2.m%例3.1.2 某种合金中的主要成分为A,B两种金属,经过试验发现:这两种金属成分之和x与合金的膨胀系数y有如下关系,建立描述这种关系的数学表达式. clearx=37:0.5:43; y=3.4,3,3,2.27,2.1,1.83,1.53,1.7,1.8,1.9,2.35,2.54,2.9;例3.1.3liti3_1_3.m%例3.1.3为了分析X射线的杀菌作用,用200千伏的X射线来照射细菌,每次照射6分钟用平板计数法估计尚存活的细菌数,照射次数记为t,照射后的细菌数y%如表2.3所示。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15352 211 197 160 142 106 104 60 56 38 36 32 21 19 15clear% 输入原始数据t=1:15;y=352,211,197,160,142,106,104,60,56,38,36,32,21,19,15;例3.1.5liti3_1_5.m%例3.1.5炼钢厂出钢时所用盛钢水的钢包,由于钢水对耐火材料的侵蚀,%容积不断增大,我们希望找出使用次数与增大容积之间的函数关系.实验数据如表3.4。clearx=2:16;y=6.42,8.2,9.58,9.5,9.7,10,9.93,9.99,10.49,10.59,10.6,10.8,10.6,10.9,10.76;%求a,b值%a,b=solve(6.42*(2*a+b)=2,10.76*(16*a+b)=16)%预测钢包使用17次后增大的容积,可在执行上面的程序中,继续输入命令%ypred=nlpredci(fun,17,beta,r,J)%求回归模型参数的95%的置信区间,只要继续添加程序%ci = nlparci(beta,r,J)例3.1.6liti3_1_6.m%例3.1.6 对例题3.1.3进行非线性回归,并预测照射16次后细菌残留数目,给出模型参数的95%的置信区间,绘出模型交互图形.cleart=1:15;y=352 211 197 160 142 106 104 60 56 38 36 32 21 19 15;例3.1.7liti3_1_7.m%例3.1.7在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g)与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程,计%算模型误差平方和以及可决系数,当雏鹅重分别为:85,95,115时预测其70日龄重,以及置信区间。clearx=80 86 98 90 120 102 95 83 113 105 110 100; % 雏鹅重观测值列向量y=2350 2400 2720 2500 31502680 2630 2400 3080 2920 2960 2860; %70日龄重%建立直线回归方程果二、多元线性回归模型例 基本概念多元线性回归模型:设是一个可观测的随机变量,它受到个非随机变量因素,和随机误差的影响.若与有如下线性关系: (1)其中是固定的未知参数,称为回归系数; 是均值为0,方差为的随机变量; 称为被解释变量; 称为解释变量.模型(1)称为多元线性回归模型.总的离差平方和(sum of squares total, SST);回归平方和(sum of squares of regression, SSR);残差平方和(sum of squares error, SSE);回归的平均平方和(regression mean squares, MSR);残差的平均平方和(error mean squares, MSE);多元线性回归方程显著性检验的方差分析表方差来源平方和自由度均方F值总计回归残差平方相关系数(coefficient of determination 可决系数): 例3.2.1liti3_2_1.m%例3.2.1某销售公司将其连续18个月的库存占用资金情况、广告投入的费用、员工薪酬以及销售额等方面的数据作了汇总(如表3.7所示)。该公司的管理人员%试图根据这些数据找到销售额与其他三个变量之间的关系,以便进行销售额预测并为未来的工作决策提供参考依据。%(1)试建立销售额的回归模型;(2)如果未来某月库存资金额为150万元,广告投入预算为45万元,员工薪酬总额为27万元,%试根据建立的回归模型预测该月的销售额。clearA=75.2 30.6 21.1 1090.477.6 31.3 21.4 113380.7 33.9 22.9 1242.176 29.6 21.4 1003.279.5 32.5 21.5 1283.281.8 27.9 21.7 1012.298.3 24.8 21.5 1098.867.7 23.6 21 826.374 33.9 22.4 1003.3151 27.7 24.7 1554.690.8 45.5 23.2 1199102.3 42.6 24.3 1483.1115.6 40 23.1 1407.1125 45.8 29.1 1551.3137.8 51.7 24.6 1601.2175.6 67.2 27.5 2311.7155.2 65 26.5 2126.7174.3 65.4 26.8 2256.5;例3.2.2liti3_2_2.m%例3.2.2 葛洲坝机组发电耗水率的主要影响因素为库水位,出库流量。现从数据库中将2005年10月%某天15时-16时06分范围内的出库流量、库水位对应的耗水率读取出来如表3.8所示,%利用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。clear% 输入原始数据A=65.08 15607 60.4665.10 15565 60.2865.12 15540 60.1065.17 15507 59.7865.21 15432 59.4465.37 15619 59.2565.38 15536 58.9165.39 15514 58.7665.40 15519 58.7365.43 15510 58.6365.47 15489 58.4865.53 15437 58.3165.62 16355 57.9665.58 14708 57.0665.70 14393 56.4365.84 14296 55.83;例3.2.3liti3_2_3.m%例3.2.3现代服务业是社会分工不断深化的产物,随着经济的发展,科学技术的进步,%现代服务业的发展受到多种因素和条件的影响。不仅受到经济总体发展水平的%影响,还受到第二产业、就业、投入等因素的影响,.clear%输入各影响因素的数据x0=203870.24589.74252.01210935.53623.19275.822353101.33640.95330.713106325.34706.39439.324321478.79786.37620.975801588.72855.97858.917319528.49920.451102.718471358.86975.661293.439371337.741025.221370.2110049228.241102.311624.7410695280.051151.681773.3711765515.741192.021903.3712882471.571263.772131.8714396697.031341.862189.78168301182.621407.632686.57202231650.881443.373362.19245601917.051542.463930.56288141895.81625.064628.59339282055.561713.335287.91;y=37.76 ,28.13,93.58,160.62,286.58,277.12,387.11,367.16,291.77,280.01,227.61,329.16,385.44,437.02,601.39,704.72,1291.11,1360.09,1769.28; %Y 例3.3.1liti3_3_1.m%逐步回归%例3.3.1(Hald,1960)Hald数据是关于水泥生产的数据。clearX =7 26 6 6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论