A题思路之一多元非线性回归分析_第1页
A题思路之一多元非线性回归分析_第2页
A题思路之一多元非线性回归分析_第3页
A题思路之一多元非线性回归分析_第4页
A题思路之一多元非线性回归分析_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

A 题思路之一 多元非线性回归分析 本题求解关键为建立工资与其他 7 个因素之间的关系模型 可以考虑采用回归分析法 也可以 考虑其他方法 以下仅以回归分析法过程为例给出分析思路 仅供参考 注意 根据下述结果发现本问题应该考虑为注意 根据下述结果发现本问题应该考虑为多元非线性回归多元非线性回归 因此 因此请大家优先挑出使用非线性请大家优先挑出使用非线性 回归模型的论文回归模型的论文 其余酌情考虑 其余酌情考虑 1 数据预处理数据预处理 1 为数据分析方便 应该考虑名义变量或有序变量的量化处理 编码 如可以考虑如下编码方案 含符号约定 日平均工资的对数 便于回归分析 作为因变量 y 1 1 0 x 男性 女性 工龄 2 x 3 1 0 x 男性或单身女性 已婚女性 4 0 x 本科 1 硕士 受教育状况 2 博士 3 博士后 5 1 0 x 管理岗位 工作部门性质 技术岗位 6 1 0 x 受过培训 培训情况 未受过培训 7 1 0 x 两年以上未从事一线工作 一线工作情况 其它情况 2 分别作出 y 与各自变量之间的散点图 发现与 x2 非线性关系较为明显 下图所示 所以应该 考虑为非线性模型 data xlsread Adata xls 2 y data 1 x data 2 8 plot x 2 y r title lny vs x2 050100150200250300350400450500 3 4 3 6 3 8 4 4 2 4 4 4 6 4 8 5 lny vs x2 3 相关性分析 data xlsread Adata xls 2 y data 1 x data 2 8 s corrcoef data xlswrite coef xls s lnyX1X2X3X4X5X6X7 10 2669950 7752910 2861350 5055260 2779290 1991780 489786 0 26699510 1603890 6794460 3123480 417621 0 104980 316025 0 7752910 16038910 2260960 1031460 0988540 1511460 156321 0 2861350 6794460 22609610 2669370 213363 0 279660 229535 0 5055260 3123480 1031460 26693710 4127450 2197620 855236 0 2779290 4176210 0988540 2133630 4127451 0 053070 423355 0 199178 0 104980 151146 0 279660 219762 0 0530710 255665 0 4897860 3160250 1563210 2295350 8552360 4233550 2556651 相关系数表也提示 y 仅与 x2 x4 关系密切 与婚姻状况 x1 x3 关系不明显 2 建模及简易求解 第 建模及简易求解 第 1 3 问 问 以下考虑分别用多元线性回归模型 线性逐步回归模型 非线性模型分析 从中选择相对最优 的模型 1 多元线性回归结果多元线性回归结果 源程序 源程序 data xlsread Adata xls 2 Y data 1 x data 2 8 X ones 90 1 x b bint r rint stats regress Y X b bint stats 结果 结果 b 系数 3 6623 常数项 0 0044 x1 0 0016 x2 0 0010 x3 0 1713 x4 0 0170 x5 0 0012 x6 0 0143 x7 Bint 系数 95 置信区间 3 5957 3 7289 0 0828 0 0917 0 0014 0 0019 0 0930 0 0910 0 0849 0 2577 0 0536 0 0876 0 0798 0 0773 0 1254 0 1540 置信区间包含零点 可认为在 95 置信度下 相应变量对 y 影响不显著 应该考虑改进模型 stats 统计量 0 7852 决定系数决定系数 42 8304 F 值 值 0 P 值 值 0 0193 关于异常值关于异常值 利用上述多元线性回归模型分析结果 继续做异常点分析 rcoplot r rint 发现 5 个异常点 43 52 60 61 90 102030405060708090 0 6 0 4 0 2 0 0 2 0 4 Residual Case Order Plot Residuals Case Number 从原始数据中将其剔除后 重新做多元线性回归 源程序 源程序 data xlsread Adata xls 4 Y data 1 x data 2 8 X ones 85 1 x b bint r rint stats regress Y X b bint stats 结果 b 3 6502 0 0055 0 0017 0 0282 0 1752 0 0188 0 0076 0 0330 bint 3 5949 3 7055 0 0688 0 0798 0 0015 0 0019 0 1056 0 0493 0 1026 0 2477 0 0406 0 0782 0 0739 0 0587 0 0880 0 1539 stats 0 8526 63 6071 0 0 0132 可见决定系数与 F 值均提高 2 线性逐步回归结果 线性逐步回归结果 考虑采用逐步回归方法 data xlsread Adata xls 4 y data 1 x data 2 8 stepwise x y 系数 beta 0 0 0017 0 0 1926 0 0 0 系数 95 置信区间 betaci 0 0 0 0015 0 0019 0 0 0 1566 0 2287 0 0 0 0 0 0 统计量 stats intercept 3 6449 常数项 rmse 0 1124 rsq 0 8495 决定系数 决定系数 adjrsq 0 8440 fstat 231 4507 F 值 值 pval 0 P 值 较多元线性模型相比 尽管决定系数略有下降 但较多元线性模型相比 尽管决定系数略有下降 但 F 值上升很快 逐步回归整体效果优于多元值上升很快 逐步回归整体效果优于多元 线性模型 线性模型 3 多元非线性回归 含平方项 交叉项 多元非线性回归 含平方项 交叉项 模型 y a b x2 c x2 2 d x4 e x5 x6 仅为一特例 考虑工资可能与仅为一特例 考虑工资可能与 x5 x6 有一定的关系 另外其他组合较多 留给大家更多思考空间 有一定的关系 另外其他组合较多 留给大家更多思考空间 data xlsread Adata xls 4 y data 1 x data 2 8 rstool x y quadratic X ones 85 1 x 2 x 2 2 x 4 x 5 x 6 b bint r rint stats regress y X b bint stats b 3 5285 0 0038 0 00000505057598 0 1629 0 0300 bint 3 4841 3 5730 0 0032 0 0043 0 00000638020871 0 00000372094326 0 1307 0 1950 0 0412 0 1011 包含零点 stats 0 9122 决定系数决定系数 207 8439 F 值 值 0 P 值 值 0 0075 可见上述交叉项对可见上述交叉项对 y 影响不够显著 考虑剔除 影响不够显著 考虑剔除 4 多元非线性回归 仅含平方项 多元非线性回归 仅含平方项 模型 y a b x2 c x2 2 d x4 data xlsread Adata xls 4 y data 1 x data 2 8 X ones 85 1 x 2 x 2 2 x 4 b bint r rint stats regress y X b bint stats 结果 b 3 5282 0 0038 0 00000499497561 0 1691 bint 3 4839 3 5726 0 0032 0 0043 0 00000631534196 0 00000367460927 0 1406 0 1976 stats 0 9115 决定系数决定系数 277 9148 F 值 值 0 P 值 值 0 0075 本模型较带交叉项模型决定系数减小 但是系数本模型较带交叉项模型决定系数减小 但是系数 95 置信区间均显示各变量对 置信区间均显示各变量对 y 影响显著 影响显著 并且并且 F 大幅提升 因此最终选择模型如下 大幅提升 因此最终选择模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论