数学建模统计回归模型_第1页
数学建模统计回归模型_第2页
数学建模统计回归模型_第3页
数学建模统计回归模型_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计回归模型姓名:姚敏俊 班级:08数学(1)班 学号 08070210025摘要 随着社会经济的飞速发展,社会人员更关心的是自己的社会福利和工资待遇问题。在这里我们就中学教师的工资待遇问题建立了模型,并对模型作出了一系列讨论。如:教师的薪金与他们的工作时间、性别、学历、以及培训情况等因素之间的关系。我们首先利用MATLAB(程序见附录五)软件作出薪金与老师工作时间的散点图,如图(二),然后假设工作时间与教师薪金为线性关系,其关系式如模型(一);再运用统计回归模型分别从各个方面特别考虑了中学女教师的工资待遇是否受她们的婚姻状况的影响。经过对模型的各个变量的逐步回归和作残差图,详见图我们从众多变量中挑选出了对教师薪金影响最大的变量及,各个变量对教师的薪金的影响的回归系数如图(三),程序见附录(二)。从影响系数的表图中我们得出了学历对教师的薪金的影响最大。经过对模型的分析、讨论和进一步的优化,此模型还可以运用到市场调查、教师调研、影响农作物生长的的因素等等相关问题上。模型(一): 模型(二):关键词:散点图 线性关系 统计回归模性 回归系数 逐步回归一、问题重述每地人事部门研究中学教师的薪金与他们的资历、性别、教育程度、及培训情况等因素之间的关系,要建立一个数学模型,分析人事策略的合理性,特别是考察女教师是否受到不公正的待遇,以及她们的婚姻状况是否会影响收入。为此,从当地教师中随机选中3414位进行观察,然后从中保留了90个观察对象,得到关键数据。二、问题分析与假设分析:本题要求我们分析教师薪金与他们的资历、性别、教育程度及培训情况等因素之间的关系。按到日常生活中的常识,教师薪金应该与他们的资历、受教育程度有密切关系,资历高、受教育程度高其薪金也应该相应的要高,与其性别、婚姻状况应该没有必然的联系。为了说明教师薪金与各个因素之间的关系以及女教师是否受到不公正的待遇,她们的婚姻状况是否影响其收入。我们建立统计回归模型,通过各组数据来说明它们之间的关系,并进一步分析论证来确定影响教师薪金的因素。假设:(1)假设教师薪金除题中所列因素之外不再考虑其他因素对教师薪金的影响。(2)假设工作时间对教师薪金影响是成线性分布的,如图(二)所示。(3)假设其他因素对教师薪金的影响也是成线性的。三、模型的建立于求解薪金z与资历,教育时间(),性别(),婚姻状况(),教育程度(),受雇学校(),培训是否(),从事教育的年线限(),之间的多元化的线性回归模型为:(注:为了数据方便起见我们令y=log10(z))y= (1)其中的是带估计的回归系数,是随即误差。利用MATLAB(见附录四)的统计工具可以得到回归系数极其置信区间,检验统计的量。从而得到回归模型:y=3.0599+0.0007+ 0.0058+0.0067+ 0.0356+0.0179+0.0103+0.0136图(四)从数据来看分别等于0.7750,40.3490,0,可以看出教师的薪金与工作时间和学历、学历程度、性别、婚姻状况、受雇学校,培训是否从事教育的年限有密切的关联。但是从图(三)和残差分析图(四)中可以看到回归系数中=0.0058、=0.0067、=0.0179、=0.0103、=0.0136。它们的置信区间包含零点且区间右端的距离距零点很近,表明其回归系数(对因变量y的影响)不是太显著。从而我们将性别、婚姻状况、受雇学校,培训是否、从事教育的年限。从模型中剔除不予考虑,建立一个只关于工作时间和学历程度的模型。得到模型如下: (2)利用MATLAB附录(二)的统计工具可以得到回归系数极其置信区间(如图四),检验统计的量。从而得到回归模型:参数估计参数置信区间3.05133.0513 3.09490.00070.0006 0.00080.03560.0332 0.0544 图(五)从而上述两个模型进行比较,模型(二)中将性别、婚姻状况、受雇学校,培训是否、从事教育的年限。剔除后出结果与模型(一)进行相应的比较,减少了一点,但是F大大的增加。进而模型达到了进一步优化。在对比当中不难发现性别、婚姻状况、受雇学校,培训是否、从事教育的年限。对模型的德贡献率极少。而对模型起较大作用的是教师的工作时间和教师的学历。四、模型的进一步讨论 为了更模型具有更好的说服力,我继续将模型进行改造,得到更精确的答案。在模型(一)中教学资历和教育程度,起到了决定性的作用二者起到的交互作用。以上的分析提示,我们应该将它们的平方项或交互项加到模型当中去。用逐步回归的方式,可以得到更好的模型。y= 利用MATLAB(附录三)的统计工具可以得到回归系数极其置信区间(如图六)检验统计的量。从而得到回归模型:y=3.0056+0.0019-0.000002+0.022+0.0559-0.0088 (2)参数估计参数置信区间3.000562.9827 3.02850.00190.0016 0.0021-0.000002-0.000003 0.000001 -0.000001 -0.0000010.0220.0057 0.03860.05590.0074 0.1044-0.0088-0.0315 0.0140 图(六)图(七)在图(五)的回归系数给出=3.00056、=0.0019、=-0.000002、=0.022、=0.0559、=-0.0088,从图(六)和残差分析图(七)中可以看到只有和的置信区间包含零点(且区间右端的距离零点很近),表明其回归系数(对因变量y的影响)不是太显著,但是由于是显著的,我们仍将变量保留在模型中。进而得到下列模型: (3) 利用MATLAB(见附录一)的统计工具可以得到回归系数极其置信区间(如图八),检验统计的量。从而得到回归模型:y=3.008 将公式进行改行后分别为0.8734、146.6085、0,虽然的稍比前面的模型的值减少了一些,由此可见对的贡献率不大。但是其F值有了相当大的提高,且少了一个变量对解题带了许多不必要的麻烦。五、模型的评价优点:(1)对于影响因变量(婚姻状况,培训是否,从事业的年线,性别),可以引入(01)变量来处理,从而是使复杂的问题变的简单化。(2)用残差分析方法可以发现模型的缺陷,引入交互作用项常常能给予改善。使的模型进一步的优化。(3)关于线性回归统计模型,在模型的建立过程中,若发现异常的值应及时剔除,有助于结果的合理性。(4) 此问题所建立的模型是从一般问题到特殊问题的过渡,所用的数学方法为统计回归模型,易于用多种数学软件编程求

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论