




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、教师薪金问题杨婕 孙佳彬 郭芸摘要:本文是一个关于建立教师薪金影响因素的回归模型。对于问题(1)我们很难确定到底与哪些因素有关,所以在模型中我们考虑到了题目给出的所有因素,通过题目给出的数据,发现这七个变量之间与因变量均呈线性关系,因此我们初步的建立了一般的线性回归模型,然后我们用MATLAB软件求解。通过对解出的数据进行分析,我们发现模型存在缺陷,有些变量对因变量的影响不显著,这也就说明性别和婚姻状况上的差异对所调查的教师的薪金影响较小。为了使模型得到进一步的改进,我们剔除了其中对因变量影响不显著的变量,然后再用对因变量影响显著的X1和X4建立了简单的统计回归模型,求解之后发现,模型依然没有
2、达到理想的效果,然后再利用残差分析法,在前一模型中增加了他们的交互项和平方项,最终得到进一步改进的模型。然后再利用MATLAB软件对其进行求解。关键词:统计回归模型;MATLAB软件;残差分析法;逐步回归一问题重述某地人事部门为研究中学教师的薪金与他们的资历,性别,教育程度及培训情况等因素之间的关系,要建立一个数学模型,分析人士策略的合理,特别是考虑女教师是否受到不公平的待遇,以及他们的婚姻状况是否会影响收入。为此,从当地教师中随机选了3414位进行观察,然后从中保留了90个观察对象,得到了下表给出的相关数据。尽管这些数据具有一定的代表性,但是仍有统计分析的必要。现将表中数据的符号介绍如下:Z
3、月薪(元);X1工作时间(月);X2=1男性,X2=0女性;X3=1男性或单身女性,X3=0已婚女性;X4学历(取值06,值越大表示学历越高);X5=1受雇于重点中学,X5=0其它;X6=1受过培训的毕业生,X6=0未受过培训的毕业生或受过培训的肄业生;X7=1以两年以上未从事教学工作,X7=0其它。注意组合(X2,X3)=(1,1),(0,1),(0,0)的含义。(1) 进行变量选择,建立变量X1X7与Z的回归模型(不一定包括每个自变量),说明教师的薪金与哪些变量关系密切,是否存在性别和婚姻状况上的差异。为了数据处理上的方便,建立对薪金取对数后作为因变量。(2) 除了变量X1X7本身之外,尝
4、试将他们的平方项或交互项加入到模型中,建立更好的模型量。(3) 给出变量X1X7的相关系数,偏向关系,并对z,X1X7分析因子关系。Z X1 X2 X3 X4 X5 X6 X7Z X1 X2 X3 X4 X5 X6 X71998 7 0 0 0 0 0 0462201 158 1 1 4 0 1 121015 14 1 1 0 0 0 0472992 159 1 1 5 1 1 131028 18 1 1 0 1 0 0481695 162 0 1 0 0 0 041250 19 1 1 0 0 0 0491792 167 1 1 0 1 0 051028 19 0 1 0 1 0 05016
5、90 173 0 0 0 0 0 161028 19 0 0 0 0 0 0511827 174 0 0 0 0 0 171018 27 0 0 0 0 0 1522604 175 1 1 2 1 1 081072 30 0 0 0 0 0 0531720 199 0 1 0 0 0 091290 30 1 1 0 0 0 0541720 209 0 0 0 0 0 0101204 30 0 1 0 0 0 0552159 209 0 1 4 1 0 0111352 31 0 1 2 0 1 0561852 210 0 1 0 0 0 0121204 31 0 0 0 1 0 0572104
6、213 1 1 0 1 0 0131104 38 0 0 0 0 0 0581852 220 0 0 0 0 0 1141118 41 1 1 0 0 0 0591852 222 0 0 0 0 0 0151127 42 0 0 0 0 0 0602210 222 1 1 0 0 0 0161259 42 1 1 0 1 0 0612266 223 0 1 0 0 0 0171127 42 1 1 0 0 0 0622027 23 1 1 0 0 0 0181127 42 0 0 0 1 0 0631852 227 0 0 0 1 0 0191095 47 0 0 0 0 0 1641852
7、232 0 0 0 0 0 1201113 52 0 0 0 0 0 1651995 235 0 0 0 0 0 1211462 52 0 1 2 0 1 0662616 245 1 1 3 1 1 0221182 54 1 1 0 0 0 0672324 253 1 1 0 1 0 0231404 54 0 0 0 1 0 0681852 257 0 1 0 0 0 1241182 54 0 0 0 0 0 0692054 260 0 0 0 0 0 0251594 55 1 1 2 1 1 0702617 284 1 1 3 1 1 0261459 66 0 0 0 1 0 0711948
8、 287 1 1 0 0 0 0271237 67 1 1 0 1 0 0721720 290 0 1 0 0 0 1281237 67 0 1 0 1 0 0732604 308 1 1 2 1 1 0291496 75 0 1 0 0 0 0741852 309 1 1 0 1 0 1301424 78 1 1 0 1 0 0751942 319 0 0 0 1 0 0311424 79 0 1 0 0 0 0762027 325 1 1 0 0 0 0321347 91 1 1 0 1 0 0771942 326 1 1 0 1 0 0331343 92 0 0 0 0 0 178172
9、0 329 1 1 0 1 0 0341310 94 0 0 0 1 0 0792048 337 0 0 0 0 0 0351814 103 0 0 2 1 1 0802334 346 1 1 2 1 1 1361534 103 0 0 0 0 0 0811720 355 0 0 0 0 0 1371430 103 1 1 0 0 0 0821942 357 1 1 0 0 0 0381439 111 1 1 0 1 0 0832117 380 1 1 0 0 0 1391946 114 1 1 3 1 1 0842742 387 1 1 2 1 1 1402216 114 1 1 4 1 1
10、 0852740 403 1 1 2 1 1 1411834 114 1 1 4 1 1 1861942 406 1 1 0 1 0 0421414 117 0 0 0 0 0 1872266 437 0 1 0 0 0 0432052 139 1 1 0 1 0 0882436 453 0 1 0 0 0 0442087 140 0 0 2 1 1 1892067 458 0 1 0 0 0 0452264 154 0 0 2 1 1 1902000 464 1 1 2 1 1 0图1二问题分析与模型假设1.问题分析本题要求我们分析教师薪金与他们的资历,性别,教育程度及培训情况等因素之间的关
11、系。按我们日常生活中的常识,教师薪金应该与他们的资历,受教育程度有密切关系,资历高,受教育程度高其薪金也应该相应的要高,与其性别,婚姻状况应该没有必然的联系。为了说明教师薪金于各个因素之间的关系以及女教师是否收到不公平的待遇,她们的婚姻状况是否影响其收入。我们建立统计回归模型,通过各组数据来说明他们之间的关系,并进一步分析论证来确定影响教师薪金的因素。2.模型假设1.工作时间、性别、教育程度及培训情况之间相互独立,没有交互作用;2.假设教师薪金除题中所列因素之外不再考虑其他因素对教师薪金的影响;3.女性是否结婚与其工作能力无关;4.该地区的人事部门对中学教师的薪金调查是可信的;三模型建立与求解
12、按一般生活常识,薪金随工作时间的增加而增加,学历越高薪金也越高。假定工作时间,学历对薪金的作用是线性的。受雇于重点中学的薪金应高于没有受雇于重点中学的,受过培训的毕业生的薪金应高于未受过培训的毕业生的薪金,从事过教学工作的薪金应高于其他的。为了便于研究,假定:培训情况,性别,单身与否,受雇于重点中学与否,以前从事过教师职业与否等之间没有交互作用,建立薪金Z与工作时间(X1),性别(X2),婚姻状况(X3),学历(X4),受雇学校(X5),培训情况(X6)及从事教育年限(X7)之间的多元线性回归模型(为了数据方便起见我们令y=log10(Z))为:y=a0+a1X1+a2X2+a3X3+a4X4
13、+a5X5+a6X6+a7X7+ (1)其中a0,a1,a2,a3,a4,a5,a6,a7是待估计的回归系数,是随机误差。它是由众多的未加考虑的因素(包括随机因素)所产生的影响。利用Matlab统计工具可以得到回归系数及其置信区间(置信水平=0.05),检验统计的量R²,F,P的结果见下表:从而得到回归模型结果分析:从表中R²=0.7874,即因变量(薪金)的78.74 %可由模型决定,F值远大于F检验的临界值,P远小于置信水平,所以模型一从整体上看是可用的。进一步的讨论:模型一的结果中我们发现对于a2,a3,a5,a6,a7其置信区间中包含0点;所以该模型是不可靠的,为了
14、寻求改进方向,我们常用残差分析法表明其回归系数(对因变量y的影响)不是太显著。从而我们将性别,婚姻状况,受雇学校,培训情况及从事教育年限从模型中剔除不予考虑,建立一个只关于工作时间和学历程度的模型。得到模型如下:y=b0+b1X1+b4X4+ (2)其中b0,b1,b4是待估计的回归系数,是随机误差。它是由众多的未加考虑的因素(包括随机因素)所产生的影响。利用Matlab统计工具可以得到回归系数及其置信区间(置信水平=0.05),检验统计的量R²,F,P的结果见下表 ,从而得到回归模型:y=50.4557-7.2050x1+0.046022x4分析,我们通过用Matlab统计工具箱逐
15、步回归方法,我们可看出薪金可能与其它量如资力、性别、教育程度及培训情况等因素存在联系,为讨论出薪金具体与哪些量存在关系,用stepwise命令作了薪金关于工作时间、学历、培训情况、性别、结婚状况的Stepwise Plot 图,和Stepwise Table表,对剩余标准差(RMSE)和统计量F的值的分析,可以大概估计薪金主要与工作时间、学历、培训情况有关(按相关性是由大到小排列),而与性别和婚姻状况关系甚小。在这里就可以大致说明:分析人事策略的合理性,女教师是没有受到不公平的待遇的,同时她们的结婚与否并不会影响其收入。2通过上述的分析,为了得到更好的模型,我们对上面的模型引入一些自变量之间交
16、互关系以及引出对模型影响不显著的自变量,同时,这个模型也属于一个统计模型,为此可我们运用统计软件从众多的自变量中选出与因变量相关性较大的那些,我们设置信区间alpha为0.05,容许误差beta为0.10,并同时采用逐步回归。根据所给的观测数据以及自变量间的相互关系,运用统计软件,可很快得到影响薪金因素的最佳模型:X1 +0.08899358484063X4 同时通过MATLAB软件可得出:R²=0.777 F=151.194 P=0 对该模型我们做如下结果分析:我们可以通过查看对回归后的曲线图象,可以很好地反映出薪金与工作时间、性别、教育程度及培训情况的关系。对于用MATLAB软件
17、求出的结果我们做如下分析: R² =0.777,表示变量(薪金)的77.7%是由该模型决定的,F的值远远的大于了F检验的临界值,而且此模型的F值大于了模型一的F值,所以此模型从整体上来考虑可知此模型更优。3虽然薪金的关于工作时间、性别、教育程度及培训情况的一个线性回归模型已经求出,并看到了它与观测数据比较吻合,但是,我们也应该清楚地看到:该模型仍然有相关系数 不很理想(即不太接近于1),F也好像没有达到理想的大小,为了求的更好的、更合理的、更有合适的模型,我们在上面的基础模型中加入一些两自变量的交叉项或平方项,也许可以还有一些组合项很是非常之重要,与因变量有很强的相关性呢?于是我们可
18、以在这七个自变量中任意组其中两个,当然也是把这七个变量的组合都加到模型中。一时出现了大量的自变量,这时我们就可以再次使用统计软件MATLAB通过它的帮忙下,我们就可以很简单也在大量的自变量中使用逐步回归的方法,选择出只与因变量相关性很大的、且满足一定要求的那些,并且它算出了该模型的相关系数、F检验值、概率P等等一些评价模型稳定性、合理性的相关指标。相应的模型为: 6.907947097856+0.004509446782595X1X2+(-6.766785398321e-006)X3 +(-0.0259629801793X4X5 +0.09580956153614X6 设月薪Z与x1、x2、x
19、3、x4、x5、x6、x7的相关系数为r1、r2、r3、r4、r5、r6、r7,相关系数的计算公式为:nozx1x2x3x4x5x6x7x8019987000000006102819000000008107230000000013110438000000015112742000000024118254000000036153410300000005417202090000000591852222000000079204833700000006920542600000000图2:Z与X1的关系图图2是从图1中抽取Z只与X1相关的部分,即X2,X3,X4,X5,X6,X7 都为零,并且Z的平均值为
20、z=1429,X1的平均值为x1=120.091. 所以由(1)得r1的分子为:476925,分母为:487577.427,r1=476925/487577.427=0.9782因此,在不考虑其他因素影响的条件下Z与X1正相关。Z、X1、X2、X3、X4、X5、X6、X7的平均值为下图: nozx1x2x3x4x5x6x71728.04172.20.460.640.60.440.210.26图3.平均值Z、X1、X2、X3、X4、X5、X6、X7的值与对应平均值的差值如下图:zx1x2x3x4x5x6x7zx1x2x3x4x5x6x7-730-165-0.5-0.6-0.6-0.4-0.21-
21、0.3473-140.540.363.4-0.40.790.74-713-1580.540.36-0.6-0.4-0.21-0.31264-130.540.364.40.560.790.74-700-1540.540.36-0.60.56-0.21-0.3-33-10-0.50.36-0.6-0.4-0.21-0.26-478-1530.540.36-0.6-0.4-0.21-0.364-5.20.540.36-0.60.56-0.21-0.26-700-153-0.50.36-0.60.56-0.21-0.3-380.8-0.5-0.6-0.6-0.4-0.210.74-700-153-0.
22、5-0.6-0.6-0.4-0.21-0.3991.8-0.5-0.6-0.6-0.4-0.210.74-710-145-0.5-0.6-0.6-0.4-0.210.748762.80.540.361.40.560.79-0.26-656-142-0.5-0.6-0.6-0.4-0.21-0.3-826.8-0.50.36-0.6-0.4-0.21-0.26-438-1420.540.36-0.6-0.4-0.21-0.3-836.8-0.5-0.6-0.6-0.4-0.21-0.26-524-142-0.50.36-0.6-0.4-0.21-0.343136.8-0.50.363.40.56
23、-0.21-0.26-376-141-0.50.361.4-0.40.79-0.312437.8-0.50.36-0.6-0.4-0.21-0.26-524-141-0.5-0.6-0.60.56-0.21-0.337640.80.540.36-0.60.56-0.21-0.26-624-134-0.5-0.6-0.6-0.4-0.21-0.312447.8-0.5-0.6-0.6-0.4-0.210.74-610-1310.540.36-0.6-0.4-0.21-0.312449.8-0.5-0.6-0.6-0.4-0.21-0.26-601-130-0.5-0.6-0.6-0.4-0.21
24、-0.348249.80.540.36-0.6-0.4-0.21-0.26-469-1300.540.36-0.60.56-0.21-0.353850.8-0.50.36-0.6-0.4-0.21-0.26-601-1300.540.36-0.6-0.4-0.21-0.329950.80.540.36-0.6-0.4-0.21-0.26-601-130-0.5-0.6-0.60.56-0.21-0.312454.8-0.5-0.6-0.60.56-0.21-0.26-633-125-0.5-0.6-0.6-0.4-0.210.7412459.8-0.5-0.6-0.6-0.4-0.210.74
25、-615-120-0.5-0.6-0.6-0.4-0.210.7426762.8-0.5-0.6-0.6-0.4-0.210.74-266-120-0.50.361.4-0.40.79-0.388872.80.540.362.40.560.79-0.26-546-1180.540.36-0.6-0.4-0.21-0.359680.80.540.36-0.60.56-0.21-0.26-324-118-0.5-0.6-0.60.56-0.21-0.312484.8-0.50.36-0.6-0.4-0.210.74-546-118-0.5-0.6-0.6-0.4-0.21-0.332687.8-0
26、.5-0.6-0.6-0.4-0.21-0.26-134-1170.540.361.40.560.79-0.38891120.540.362.40.560.79-0.26-269-106-0.5-0.6-0.60.56-0.21-0.32201150.540.36-0.6-0.4-0.21-0.26-491-1050.540.36-0.60.56-0.21-0.3-8118-0.50.36-0.6-0.4-0.210.74-491-105-0.50.36-0.60.56-0.21-0.38761360.540.361.40.560.79-0.26-232-97.2-0.50.36-0.6-0.
27、4-0.21-0.31241370.540.36-0.60.56-0.210.74-304-94.20.540.36-0.60.56-0.21-0.3214147-0.5-0.6-0.60.56-0.21-0.26-304-93.2-0.50.36-0.6-0.4-0.21-0.32991530.540.36-0.6-0.4-0.21-0.26-381-81.20.540.36-0.60.56-0.21-0.32141540.540.36-0.60.56-0.21-0.26-385-80.2-0.5-0.6-0.6-0.4-0.210.74-81570.540.36-0.60.56-0.21-
28、0.26-418-78.2-0.5-0.6-0.60.56-0.21-0.3320165-0.5-0.6-0.6-0.4-0.21-0.2686-69.2-0.5-0.61.40.560.79-0.36061740.540.361.40.560.790.74-194-69.2-0.5-0.6-0.6-0.4-0.21-0.3-8183-0.5-0.6-0.6-0.4-0.210.74-298-69.20.540.36-0.6-0.4-0.21-0.32141850.540.36-0.6-0.4-0.21-0.26-289-61.20.540.36-0.60.56-0.21-0.33892080
29、.540.36-0.6-0.4-0.210.74218-58.20.540.362.40.560.79-0.310142150.540.361.40.560.790.74488-58.20.540.363.40.560.79-0.310122310.540.361.40.560.790.74106-58.20.540.363.40.560.790.742142340.540.36-0.60.56-0.21-0.26-312-55.2-0.5-0.6-0.6-0.4-0.210.74538265-0.50.36-0.6-0.4-0.21-0.26324-33.20.540.36-0.60.56-0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 软件测试基础知识试题及答案
- 2025届钦州市重点中学数学七下期末复习检测模拟试题含解析
- 2025届北京东城二中学八年级数学第二学期期末质量检测试题含解析
- C++高级编程技巧试题及答案
- 网络安全攻防演练中的策略与技巧试题及答案
- 如何开展精益管理实践计划
- 医院内部培训体系建设计划
- 重庆市彭水一中学2025届七年级数学第二学期期末教学质量检测模拟试题含解析
- 软件开发常见问题解析试题及答案
- 城市交通与城市规划方法创新研究重点基础知识点
- 2023年四川省第一期医疗护理员理论考试试题及答案
- 2022-2023学年宁夏回族石嘴山市大武口区小学六年级第二学期小升初数学试卷含答案
- 经济与社会:如何用决策思维洞察生活学习通课后章节答案期末考试题库2023年
- 日本文化知识竞赛真题模拟汇编(共877题)
- 幼儿园小班语言活动《我不想离开你》绘本故事PPT课件【幼儿教案】
- 2023汽车智能座舱分级与综合评价白皮书
- 职业暴露针刺伤应急预案演练脚本-
- 校外培训机构章程示范文本
- 大学生就业指导之职业素养与职业能力
- 砂检验报告(机制砂)国标 亚甲蓝值<1.4或合格
- YY/T 0068.2-2008医用内窥镜硬性内窥镜第2部分:机械性能及测试方法
评论
0/150
提交评论