




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、A题思路之一多元非线性回归分 析A题思路之一一一多元非线性回归分析本题求解关键为建立工资与其他7个因素之间的关系模型,可以考虑采用回归分析法,也可以考虑 其他方法;以下仅以回归分析法过程为例给出分析思路, 仅供 参考:注意:根据下述结果发现本问题应该考虑为多元非 线性回归,因此请大家优先挑出使用非线性回归模型 的论文,其余酌情考虑。i.数据预处理便于回归分析;作为因变量1)为数据分析方便,应该考虑名义变量或有序变量 的量化处理(编码),如可以考虑如下编码方案(含 符号约定):y 日平均工资的对数, 1男性."0 女性'X2X3工龄1男性或单身女性.0已婚女性X 4(受教育状况
2、)=X5(工作部门性质)0本科1硕士2博士 ,3博士后1管理岗位.0技术岗位'%(培训情况)1 受过培训0未受过培训'X 7( 一线工作情况)1 两年以上未从事一线工作0其它情况2)分别作出y与各自变量之间的散点图,发现与 x2 非线性关系较为明显(下图所示),所以应该考虑为 非线性模型,data=xlsread('Adata.xls',2);y=data(:,1);x=data(:,2:8);plot(x(:,2),y,'r*')title('lny vs x2')54.84.64.44.243.83.63.4Iny vs x2
3、0501001502002503003504004505003)相关性分析 data=xlsread('Adata.xls',2);y=data(:,1);x=data(:,2:8);s=corrcoef(data);xlswrite('coef.xls',s)lnyX110.26699X2 0.77529X3 0.28613X4 0.50552X5 X6 X70.277920.199170.4897851569860.2669910.160380.679440.312340.41762-0.10490.3160259681850.775290.1603810.
4、226090.103140.098850.151140.1563219664610.286130.679440.2260910.266930.21336-0.27960.2295356673650.505520.312340.103140.2669310.412740.219760.8552368675260.277920.417620.098850.213360.412741-0.05300.4233591435750.19917-0.10490.15114-0.27960.21976-0.053010.2556688662750.489780.316020.156320.229530.85
5、5230.423350.2556616515655相关系数表也提示y仅与x2,x4关系密切.与婚姻状况 x1,x3关系不明显.2、3真及简易余/ (第1、3问)以下考虑分别用多元线性回归模型、线性逐步回归模型、非线性模型分析,从中选择相对最优的模型。1).多元线性回归结果源程序:data=xlsread('Adata.xls',2);Y=data(:,1);x=data(:,2:8);X=ones(90,1),x;b,bint,r,rint,stats=regress(Y,X);b,bint,stats结果:b (系数)=项常Xlx2X3X4X5X6X73.5957-0.082
6、80.0014-0.09300.0849-0.0536-0.0798-0.12543.72890.09170.00190.09100.25770.08760.07730.15403.66230.00440.0016-0.00100.17130.0170-0.00120.0143Bint (系数95%置信区间)=置信区间包含零点,可认为在95%置信度下,相应 变量对y影响不显著,应该考虑改进模型。stats (统计量)=0.7852 (决定系数)42.8304(%1¥0 (P 值)0.0193关于异常值:利用上述多元线性回归模型分析结果,继续做异常点分析)rcoplot(r,rint)
7、发现5个异常点:43 52 60 61 90Residual Case Order Plot102030405060708090Case Number从原始数据中将其剔除后,重新做多元线性回归,源程序:data=xlsread('Adata.xls',4);Y=data(:,1);x=data(:,2:8);X=ones(85,1),x;b,bint,r,rint,stats=regress(Y,X);b,bint,stats结果3.65020.00550.0017-0.02820.17520.0188-0.00760.0330bint =3.59493.7055-0.0688
8、0.07980.00150.0019-0.10560.04930.10260.2477-0.04060.0782-0.07390.0587-0.08800.1539stats =0.852663.607100.0132可见决定系数与F值均提高!2)线性逐步回归结果(考虑采用逐步回归方法) data=xlsread('Adata.xls',4);y=data(:,1);x=data(:,2:8);stepwise(x,y);Stfjpwise Kejression目固冈file EJj.1 IjoLsi it- 口色"i 口 p lijudow 氏八X2 疮洌XSXE牙
9、Coefficients with Errcr EarsCccf t.p-val-0 00432d59-0. IMOQ0 0017176917.74010.0000-0 020332-0 7613O.44670.19Z64610.63010.00000 .02056120.7047Cl . 44c70.00253330.0.310Q . 033Q建50.55570.5133Ne Kt step:Mme io termsExport .00.10.2nLcrcEjl = 3 4 44 比rf-squaic - 0.03514F = 231 451RNSE-OJ12367MR-Sfl* 03440
10、08r> oMode History04系数:beta =00.00170 0.1926 000系数95%置信区间:betaci =000.00150.0019000.15660.2287000000统计量stats =intercept: 3.6449(常数项)rmse: 0.1124rsq: 0.8495 (决定系数)adjrsq: 0.8440fstat: 231.4507 (F 值)pval: 0 (P 值)较多元线性模型相比,尽管决定系数略有下降, 但F值上升很快,逐步回归整体效果优于多元线性 模型。3)多元非线性回归(含平方项、交叉项)模型:y=a+b*x2+c*x2八2+d
11、*x4+e*x5*x6(仅为一特例,考虑工资可能与x5,x6有一定的关系 另外其他组合较多,留给大家更多思考空间!)data=xlsread('Adata.xls',4);y=data(:,1);x=data(:,2:8);% rstool(x,y,'quadratic')X=ones(85,1) x(:,2),x(:,2)八2,x(:,4),x(:,5).*x(:,6);b,bint,r,rint,stats=regress(y,X);b,bint,statsb =3.52850.0038-0.000005050575980.16290.0300bint =3
12、.48413.57300.00320.0043-0.00000638020871 -0.000003720943260.13070.1950-0.04120.1011 (包含零点)stats =0.9122(决定系数)207.8439F 值)(P值)0.0075可见上述交叉项对y影响不够显著,考虑剔除4)多元非线性回归(仅含平方项)模型:y=a+b*x2+c*x2八2+d*x4data=xlsread('Adata.xls',4);y=data(1,1);x=data(:,2:8);X=ones(85,1) x(:,2),x(:,2)八2,x(:,4);b,bint,r,rint,stats=regress(y,X);b,bint,stats结果:b =3.52820.0038-0.000004994975610.1691bint =3.48393.57260.00320.0043-0.00000631534196 -0.000003674609270.14060.1976stats =0.9115快定系数)277.9148 F 值) 0(P 值) 0.0075本模型较带交叉项模型决定系数减小,但是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年江苏省常州市新北区外国语学校英语八年级第二学期期中学业质量监测试题含答案
- 2025年婚姻性格分歧处理协议书
- 2025年餐饮企业信息保密协议规定
- 2025年租赁合同定金协议书范本
- 2025年学生租赁协议官方文本
- 2025年标准评估协议案例
- 2025年地质环境监测设备购销协议
- 企业合并与收购中的风险识别
- 供应链管理中的合规监管与风险管控
- 2025年林草种植代理加盟协议
- 教学设计:2.1 声音的产生与传播
- 龙舟竞渡 y-2024-2025学年人美版(2024)初中美术七年级下册
- ISO 37001-2025 反贿赂管理体系要求及使用指南(中文版-雷泽佳译-2025)
- 水利工程监理规划(标准范本)
- DB4403-T 81-2020 绿化迁移技术规范
- 《剪映+即梦Dreamina:AI文案、图片与视频生成技巧大全》 课件 第1-7章 通过剪映生成AI文案-使用智能画布二次创作
- 2025年江苏盐城燕舞集团有限公司招聘笔试参考题库含答案解析
- 员工质量意识培训
- 公路工程安全保证体系及措施
- PB编程培训资料
- 2025年压力容器作业证理论全国考试题库(含答案)
评论
0/150
提交评论