软件开发人员的薪金_第1页
软件开发人员的薪金_第2页
软件开发人员的薪金_第3页
软件开发人员的薪金_第4页
软件开发人员的薪金_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、软件开发人员的薪金问题:一家高技术公司人事部为研究软件开发人员的薪金与他们的资历管理责任教育程度等因素之间的关系,要建立一个数学模型,以便分析公司人事策略的合理性,并作为新聘用人员的薪金的参考。他们认为目前公司人员的薪金总体上是合理的,并作为建模的依据,于是调查了46名软件开发人员的档案资料,如表1,其中资历一列指从事专业工作的年数,管理一列中1表示管理人员,0表示非管理人员,教育一列中1表示中学程度,2表示大学程度,3表示更高的程度(研究生)编号薪金资历管理教育编号薪金资历管理教育01138761112422884612021160810325169787110318701113261480

2、380204112831022717404811051176710328221848130620872212291354880107117722023014467100108105352013115942100209121952033223174101310123133023323780101211149753113425410111212213713123514861110113198003133616882120214114174013724170121315202634133815990130116132314033926330130117128844024017949140218132

3、4550241256851513191367750342278371612201596551143188381602211236660144174831601222135261345192071702231383960246193462001表1 软件开发人员的薪金与他们的资历、管理责任、教育程度分析与假设:按照常识,薪金自然随着资历(年)的增长而增加,管理人员的薪金应高于非管理人员,教育程度越高薪金也越高。薪金记作y,资历(年)记作x1,为了表示是否管理人员,定义为了表示三种教育程度,定义 这样,中学用x3=1, x4=0表示,大学用x3=0, x4=1表示, 研究生则用x3=0, x4=0

4、表示。则表一的数据应变化为:编号yx1x2x3x4编号yx1x2x3x4011387611102422884610102116081000251697871100318701110026148038001041128310012717404811005117671000282218481000620872210129135488010071177220013014467100100810535201031159421000109121952000322317410100101231330013323780101011114975311034254101110112213713101351486

5、1110101319800310036168821200114114174010372417012100152026341003815990130101613231400039263301310117128844001401794914001181324550014125685151001913677500042278371610120159655110431883816001211236660104417483160102221352610045192071700123138396001461934620010表2变换后软件开发人员的薪金与他们的资历、管理责任、教育程度 为了简单起见,我们假

6、定资历(年)对薪金的作用是线性的,即资历每增加一年,薪金的增长是常数;管理责任、教育程度、资历诸因素之间没有交互作用,建立线性回归模型。 基本模型:薪金y与资历x1,管理责任x2,教育程度x3,x4之间的多元线性回归模型为 (1)其中是待估计的回归系数,是随即误差。利用SAS编程可以得到回归系数及置信区间(置信水平为0.05)检验统计量,F,p的结果,见表3 参数参数估计值p值a011033<.0001a1546<.0001a26883<.0001a3-2994<.0001a41480.7053 R*R =0.957 F=226 p=0 表3 模型(1)的计算结果 结果

7、分析:从表3,=0.957,即因变量(薪金)的95.7%可由模型确定,F值远远超过F检验的临界值,p远小于,因而模型(1)从整体来看是可用的。比如,利用模型可以估计(或预测)一个大学毕业、有2年资历、非管理人员的薪金为 模型中各个回归系数的含义可初步解释如下:x1的系数为546,说明资历每增加1年,薪金增长546;x2的系数为6883,说明管理人员的薪金比非管理人员的多6883;x3的系数为-2994,说明中学程度的薪金比研究生少2994;x4的系数为148,说明大学程度的薪金比研究生多148,但是应注意到对应的p值为0.7053,远大于0.05,所以这个系数的解释是不可靠的。需要指出,以上解

8、释是就平均值来说,并且,一个因素改变引起的因变量的变化量,都是在其它因素不变的条件下才成立的。进一步的讨论: 对应的p值远大于0.05,说明模型(1)存在缺点。为寻找改进的方向,常用残差分析方法(残差指薪金的实际值y与用模型估计的薪金之差,是模型(1)中随机误差的估计值,这里用了同一个符号)。我们将因影响因素分成资历与管理教育组合两类,管理教育组合的定义如表4。组合123456管理010101教育112233 表4 管理教育组合为了对残差进行分析,图1给出了管理教育组合与资历x1的关系,图2给出了与管理x2教育x3,x4组合间的关系。图1 模型(1)与x1的关系图2 模型(1)与x2x3,x4

9、组合间的关系从图1看,残差大概分成三种水平,这是由于6种管理教育组合混在一起,在模型中未被正确反映的结果;从图2看,对于前4个管理教育组合,残差或者全为正,或者全为负,也表明管理教育组合在模型中处理不当。 在模型(1)中管理责任和教育程度是分别起作用的,事实上,二者可能起着交互作用,如大学程度的管理人员的薪金会比二者分别的薪金之和高一点。 以上分析提示我们,应在基本模型(1)中增加管理x2与教育x3,x4的交互项,建立新的回归模型。 更好的模型 增加x2与x3,x4的交互项后,模型记作 (2)利用SAS得到以下结果如表5。参数参数估计值p值a011204<.0001a1497<.0

10、001a27048<.0001a3-1727<.0001a4-3480.0009a5-3071<.0001a61836<.0001 R*R =0.9988 F=5544.8 p<.0001表5 模型(2)的计算结果由表5可知,模型(2)的和F值都比模型(1)有所改进,并且所有回归系数的p值都小于置信水平0.05,表明模型是完全可用的。与模型(1)类似,作模型(2)的两个残差分析图(图3,图4),可以看出,已经消除了图1、图2中的不正常现象,这也说明了模型(2)的适用性。图3 模型(2)与x1的关系图4 模型(2)与x2x3,x4组合间的关系从图3、图4还可以发现一

11、个异常点:具有10年资历、大学程度的管理人员(从表1可以查出是33号),他的实际薪金明显低于模型的估计值,也明显低于与他有类似经历的其他人的薪金。这可能是由于我们未知的原因造成的。为了使个别的数据不致影响整个模型,应该将这个异常值去掉,对模型(2)重新估计回归系数,得到的结果如表6,残差分析见图5,图6。可以看出,去掉异常数据后结果又有改善。参数参数估计值p值a011200<.0001a1498<.0001a27041<.0001a3-1737<.0001a4-356<.0001a5-3056<.0001a61997<.0001 R*R =0.9998

12、 F=36701 p=0表6 模型(2)去掉异常数据后的回归系数图5模型(2)去掉异常数据后的与x1的关系图6 模型(2)去掉异常数据后的与x2x3,x4组合间的关系模型应用 对于回归模型(2),用去掉异常数据(33号)后估计出的系数,得到的结果是满意的。作为这个模型的应用之一,不妨用它来“制订”6种管理教育组合人员的“基础”薪金(即资历为零的薪金,当然,这也是平均意义上的)。利用模型(2)和表6容易得到表7。组合管理教育系数"基础"薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a01

13、1200613a0+a218241表7 6种管理教育组合人员的“基础”薪金可以看出,大学程度的管理人员的薪金比研究生程度的管理人员的薪金高,而大学程度的非管理人员的薪金比研究生程度的非管理人员的薪金略低。当然,这是根据这家公司实际数据建立的模型得到的结果,并不具普遍性。评注:从建立回归模型的角度我们通过本例介绍了以下内容:(1) 对于影响因变量的定性因素(管理、教育),可以引入01变量来处理,01变量的个数可比定性因素的水平少(如教育程度有3个水平,引入2个01变量)。(2) 用残差分析方法可以发现模型的缺陷,引入交互作用项常常能够给予改善。(3) 若发现异常值应剔除,有助于结果的合理性。在本

14、例中我们由简到繁,先分别引进管理和教育因素,再进入交互项。实际上,可以对6种管理教育组合引入5个01变量,由于篇幅原因,这里不作讨论!附录输入数据的程序:data youya ;input y x1 x2 x3 x4 x5;cards;138761110 2 116081000 5187011100 6112831001 3117671000 5208722101 4117722001 3105352010 1121952000 5123133001 3149753110 2213713101 4198003100 6114174010 1202634100 6132314000 512884

15、4001 3132455001 3136775000 5159655110 2123666010 1213526100 6138396001 3228846101 4169787110 2148038001 3174048110 2221848100 6135488010 11446710010 11594210001 32317410100 62378010101 42541011101 41486111010 11688212001 32417012100 61599013010 12633013101 41794914001 32568515100 62783716101 4188381

16、6001 31748316010 11920717001 31934620010 1run; proc print data=youya;run;模型(1)的程序:proc reg data=youya;var y x1-x5;model y=x1-x4;run;plot residual.*x1;run;plot residual.*x5;run;模型(2)的程序:data youya;set youya;x2x3=x2*x3;x2x4=x2*x4;proc reg data=youya;var y x1 x2 x3 x4 x5 x2x3 x2x4;model y=x1 x2 x3 x4 x

17、2x3 x2x4;run;plot residual.*x1;run;plot residual.*x5;run;模型(2)去掉异常数据的程序:data youya;set youya(drop obs=33);x2x3=x2*x3;x2x4=x2*x4;proc reg data=youya;var y x1 x2 x3 x4 x5 x2x3 x2x4;model y=x1 x2 x3 x4 x2x3 x2x4;run;plot residual.*x1;run;plot residual.*x5;run;模型(1)的运行结果The REG ProcedureAnalysis of Vari

18、ance Sum of MeanSource DF Squares Square F Value Pr > FModel 4 957459467 239364867 226.43 <.0001Error 41 43342939 1057145Corrected Total 45 1000802406Root MSE 1028.17549 R-Square 0.9567Dependent Mean 17271 Adj R-Sq 0.9525Coeff Var 5.95324Parameter EstimatesParameter StandardVariable DF Estimat

19、e Error t Value Pr > |t|Intercept 1 11033 383.49248 28.77 <.0001x1 1 546.12765 30.54112 17.88 <.0001x2 1 6882.53292 314.14454 21.91 <.0001x3 1 -2994.17834 412.04857 -7.27 <.0001x4 1 147.73798 387.93786 0.38 0.7053模型(2)的运行结果The REG ProcedureAnalysis of VarianceSum of MeanSource DF Squa

20、res Square F Value Pr > FModel 6 999630569 166605095 5544.80 <.0001Error 39 1171837 30047Corrected Total 45 1000802406Root MSE 173.34097 R-Square 0.9988Dependent Mean 17271 Adj R-Sq 0.9986Coeff Var 1.00366Parameter EstimatesParameter StandardVariable DF Estimate Error t Value Pr > |t|Intercept 1 11204 78.85272 142.08 <.0001x1 1 496.86393 5.55144 89.50 <.0001x2 1 7047.99973 102.31318 68.89 <.0001x3 1 -1726.50419 105.05048 -16.43 <.0001x4 1 -348.39254 97.30539 -3.58 0.0009x2x3 1 -3070.59619 148.92867 -20.62 <.0001x2x4 1 1835.96

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论