(概率论与数理统计专业论文)线性混合模型的模型选择.pdf_第1页
(概率论与数理统计专业论文)线性混合模型的模型选择.pdf_第2页
(概率论与数理统计专业论文)线性混合模型的模型选择.pdf_第3页
(概率论与数理统计专业论文)线性混合模型的模型选择.pdf_第4页
(概率论与数理统计专业论文)线性混合模型的模型选择.pdf_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 回归方程的选择是现代应用统计的一个重要研究方向。主要研究模型假设的 合理性和自变量的选择。线性混合模型是既包含固定效应又包含随机效应的一类 线性模型,它被频繁的应用于生物、医学、经济、抽样设计和质量控制等过程。 通常人们为全面起见,而把各种与因变量有关或可能有关的自变量引进回归方 程,导致其结果是把一些对因变量影响很小的,有些甚至没有影响的自变量也包 含在回归方程中,过多的自变量会使回归方程的计算量增加,并导致回归模型参 数的估计和对因变量预测的精度下降。同时对有些实际问题,某些自变量的观测 数据的获得代价昂贵,过多的选入自变量势必造成观测数据收集和模型应用费用 的不必要增加。 本文将讨论线性混合模型的模型选择问题,提出了新的模型选择准则。以前 的文献中在考虑到模型选择的问题时,多会应用到已有的准则,例如:a i c 准则, b i c 准则,c p 准则以及逐步法。这些准则以及方法都会依赖于回归模型的分布, 参数的估计以及检验的分布。本文应用均方误差的方法,构造出修正均方误差准 则,通过考察修正均方误差,来对回归模型的自变量做出选择。通过修正均方误 差准则来进行判断,减小了计算量,并且该准则不依赖于模型的分布。 在解决人力资源管理中的困难问题定薪问题时,本文将线性混合模型与 线性回归模型同时应用于此问题,通过计算可以看到线性混合模型的残差平方和 要小于线性回归模型的残差平方和。通过使用线性混合模型,残差平方和明显下 降,其下降程度达到了7 ,这说明线性混合模型的拟合程度要优于线性回归模 型,显示出线性混合模型在处理带有随机效应问题时的优势。 最后,本文将修正均方误差准则应用到人力资源管理的实际工作中去,通过 对现有薪酬数据以及人员各种信息的分析和计算,得到了良好的效果,显示出修 正均方误差准则同其他准则具备相同的功效。同时,也为薪酬管理问题的解决提 出了新的方法和途径。 关键词:模型选择自变量选择 广义最小二乘估计方差分量模型 线性混合模型线性回归模型均方误差 人力资源管理薪酬战略 a b s t r a c t t h er e f e s s i o nm o d e ls e l e c t i o ni sa ni m p o r t a i l tr e s e a r c hd i r e c t i o no fm o d e m 印p l i c a t i o ns t a t i s t i c i tm a i n l yr e s e a r c h e s 恤er a t i o n a l i t ) ro fr e 蓼e s s i o nm o d e la n dt h e i n d 印e n d e n t v a r i a b l e ss e l e c t i o n l i n e a rm i x e dm o d e l i sa 虹n do fl i n e a rm o d e l s ,w l l i c h i n c l u d e sb o t hf i x e de f r e c t sa n dr a n d o me f r c c t s n i s 丘e q u e n t l yu s e d i nb i 0 1 0 幽 m e d i c i n e ,e c o n o m i c s ,d e t e n n i n i n g ,s a n l p l i n gd e s i g n sa i l dq u a l i t yc o n t r 0 1p r o c e d l l r e s , a i l ds oo n p e o p l eu s u a l l yp ma l lr e l a t i o n a li n d 印e n d e n tv a r i a b l e si n t ot l l er e f e s s i o n m o d e l i tm a yi n c r e a s em ea m o u n to ft l l e r e 野e s s i o nm o d e lc a l c u l a t i o n ,a 1 1 dm a y d e c r e a s et h ep r e c i s i o no ft 1 1 ee s t i m a t i o na n dt h ep r e d i c t i o n t h e r e f o r ei ti s c o s t l yt o a c q u i r es o m ei n d e p e n d e n tv a r i a b l e sd a t aa n dp u tt h e mi n t ot l l em o d e l t os 0 1 v es o m e p r a c t i c a lp r o b l e i i l s , t h j sm e s i sw i l lf o c u so nt l l em o d e ls e l c c t i o np m b l e mi nl i n e a rm i x e d m o d e l ,a 1 1 d p u tf o n a r da n e wc r i t e r i o n n l i sm e s i su s e sm em e a j ls q u a r ee n d r m e t l l o d ,a n di t c o n s 讯i c t st 1 1 er “i s e dm s e c r i t 谢o n b yr e v j e 丽n gt l l er e v i s e dm s e ,w e c a nc h o o s e t h ei n d 印e n d e n tv a r i a b l e so fm e r e 簪e s s i o nm o d e la i l dd e c r e a s et h ec a l c u l a t i o n a n d t h j sc r i t e r i o nd o e s n td 印e 1 1 do nd i s 研b 砸o no f m em o d e l h l 也i st h e s i s ,m ec r i 矧o ni s1 l s e dt os 0 1 v e 也es a l a r y p r o b l e m ,w h j c h i so n eo f t h e p r o b l e m so fh 啪孤r e s o u r c em a n a g e m 饥t t h ea p p l i c a t i o no ft h er e v i s e dm s e r e c e i v e sr i g h tr e s u l t s ,a 1 1 di th 嬲t h es 栅ee 丘e c tw i t l lm eo t l l e rc r i t 鲥o n nc a nb eu s e d a san e ww a yt 0s o l v et l l e p o l i c yo fc o m p s a t i o n 趾db e n e f i ts y s t 锄p r o b l e mi n h u m a nr e s o u r c em a l l a g e m e n t k e y w o r d s :m o d e ls e l e c t i o n s ;一a b l e ss e l e c t j o n s ;l i n e a rm i x e dm o d e l ;l i n e a r r e 孕e s s i o nm o d e l ;m e a ns q u a r ee r r o r ;g e n e r a l l e a s t s q u a r ee s t 面a t e ;a n o v a m o d e l ;h u m a i l r e s 0 1 l r c em a l l a g 锄e m ;p 0 1 i c yo f c o m p e n s a t i o n a i l db e l l e f i ts y s t e m l l 1 1 模型的选择 第1 章引言 线性模型是重要的一类统计模型,它包括通常的线性回归模型、方差分析模 型、协方差分析模型和方差分量模型等等。线性模型的一般形式是 y = x 口+ e ,( 1 1 ) 这里】,是n 1 的观测向量,z 为h 。p 的己知设计矩阵,为p 1 的非随机的未 知参数向量,e 为n l 的随机向量,e 为通常意义上的误差。一般假设 0 )e ( 力= 0 , ( 6 ) c d “e ) = 盯2 l : 这就是g a u s s m a r k o v 假设。我们还假定吩服从正态分布,即p ,( 0 ,口“。) ( 参 见王松桂,1 9 8 7 ) 。 在处理实际问题时,首先要解决的问题回归方程的选择。对回归方程的 选择包含两方面的内容,一是选择回归方程的类型,即判断是用线性回归模型, 还是用非线性回归模型来处理要解决的实际问题,统计上称为回归模型的线性检 验,这一内容不在本文讨论的范围内。二是在模型选定后,自变量的选择问题, 当我们根据经验的、专业的、统计的方法,确定因变量以及对其可能有影响的自 变量,这时回归方程的选择就成为回归自变量的选择。通常,为全面起见,在做 回归分析时,人们把各种与因变量有关或可能有关的自变量引进回归方程,其结 果是把一些对因变量影响很小的,有些甚至没有影响的自变量也包含在回归方程 中,从而使计算量大为增加,并导致回归模型参数的估计和对因变量预报的精度 下降。此外,对有些实际问题,某些白变量的观测数据的获得代价昂贵。如果这 些自变量本身就对因变量影响不大或者根本就没有影晌,而我们又不加选择的将 其包罗进回归方程,势必造成观测数据收集和模型应用费用的不必要增加。因此, 在应用回归分析解决实际问题时,从与因变量保持线性关系的自变量集合中,选 择一个“最优”的自变量子集是非常重要的。 通常,建立最优回归方程的计算量都很大,所以在本世纪6 0 年代以前,人 们多局限于从理论上讨论提出或添加一个自变量所引起的后果。随着高速电子计 第1 页 。,。,。,堡型鐾箜些耋譬丝鎏。,。一 算机日益广泛的应用,这个方向得到迅速发展,提出了许多变量选择准则,可供 使用的计算方法和程序。 1 2 模型选择的方法 首先,我们假定模型( 1 1 ) 为建立的全模型,即将全部自变量考虑到模型 当中。然后将设计矩阵z 写成分块形势z = ( x 。;z ,) ,相应的将分块为 卢= ( ;j ) ,于是,模型( 1 1 ) 可以改写成为 y = x 口卢目+ x ,卢。+ e , ( 1 2 ) 这里,x ,和x ,分别有g ,f 列( g + f = p ) ,并且x ,和置都是列满秩矩阵, 即r ( 。) = g ,五( x ,) = f ( 参见王松桂等,1 9 9 9 ) 。 在模型( 1 1 ) 的情况下,口和盯2 的三s 估计分别为 夕= ( x x ) 一1 y , ( 1 3 ) 彦2 = y ( ,一( x ) - 1 x ) y 0 一p ) 。 ( 1 4 ) 残差平方和为 尼镕= y u 一( 。y 并) 。1 j ) y 。 ( 1 5 ) 在选模型( 1 2 ) 下,尾和盯2 的上s 估计分别为 以= ( z ;z 。) 。1 x ;y , ( 1 6 ) 子2 = y ( ,一x 。( x ;x ,) 。1 x ;) y ,( n q ) 。 ( 1 7 ) 残差平方和为 r 瓯= 】,u x 。( x ;x 。) 1 ) y , ( 1 8 ) 对于模型选择而言,不少选择准则或标准是从某种直观想法出发的,如;要 求回归系数的估计准确些,要求预测偏差的方差小些等等。不同的标准导致了不 同的选择方法,因而造成的“最优”变量子集也不必相同。总而言之,建立最优 回归方程的方法不外有两大类。其中一类是准则法,主要包括4 ,c 准则、印准 则、预测平方和准则等:另一类是逐步回归法( 包括向前法、向后法和逐步法) 。 第2 页 在准则法当中,主要是彳c 准则。这是一个在统计分析特别是在统计模型的 选择中有着广泛应用的准则。其显著特点之一就是“吝啬原理( p r i n c i p l eo f p a r s i m o n y ) ”的具体化。对一组数据,模型的拟和优度是同程度时,采用参数数 目最少的模型为最有模型。彳j c 最小化模型法表明,由尽可能少的参数来表现模 型是重要的。a ,c 在数学上并不复杂,但实践表明这一准则能够处理复杂的模型 问题。但是,c 有一定的缺点,由4 伦来进行判断的模型其分布类型必须是已知 的。 4 伦= 一2 1 n ( 模型似然度) + 2 ( 模型自由度个数) , ( 1 9 ) 对于模型( 1 1 ) 爿圮准则可以推导为( 参见陈希儒等1 9 8 7 ) 御c = ”m r 船。) + 2 q , ( 1 1 0 ) 或一庀= 一n l n ( r 船。) 一2 9 。 ( 1 1 1 ) 另外一个较为重要的准则是c p 统计量,o 统计量与彳,c 准则是相似的,事 实上可以证明。与4 ,c 渐进相等。在样本数较少的情况下,c p 准则可以节省参 数。印准则还有一个优点就是它不需要假定分布类型是已知的。然而在计算c p 统计量时,怎样来估计未知参数误差方差人没有十分令人满意的方法,而且误差 方差的不同估计值还会影响变量选择的结果,这可以说是c p 准则的另一个缺点 ( 参见陈希儒等1 9 8 7 ) 。 c p :粤一( n 一2 q ) , ( 1 1 2 ) c 扫= 一( n 一2 4 ) , ( 1 1 2 ) 在建立最优回归模型的逐步回归法当中,向前法是从回归方程仅含常数项开 始,把自变量逐个引入回归方程。第一步,把与因变量y 有最大简单相关系数的 变量作回归系数的显著性检验,若它显著的异于零,则把该自变量选入方程。而 后在与余下的自变量中,考虑在消除了已选入变量的影响之后,对与y 由最大相 关系数的变量,作回归系数显著性检验,己决定是否选入。这样做下去,一直到 在排除已选入变量y 的影响之后,为选入变量对y 的回归系数的检验都不显著为 止。这一方法有一个明显的缺点,就是由于各自变量之间可能存在着相关关系, 第3 页 北京工业大学理学硕士学位论文 因此后续变量的选入可能会是前面选入的自变量变得不重要。这样最后得到的 “最优”回归方程可能会包含一些对y 影响不大的自变量。向后法与向前法正好 相反。他是将全部变量选入回归模型,即从全模型开始,然后逐个剔除对残差平 方和贡献较小的变量。若一开始所有自变量的f 值经检验后都显著,则“最优” 回归方程就是全模型。不然,如果有若干个f 值不显著,则剔除具有最小f 值的 变量。然后对剩下的变量建立新的回归方程。重复这个过程,直到剩下的自变量 都不能剔除为止。逐步法即通常所称的逐步回归,本质上是向前法,但吸收了向 后法的做法,前面已经指出向前法有一个缺点,就是后续变量的引入会使得一些 已在回归方程中的自变量变得不重要。因此在逐步法当中,在每一步增加了对已 选变量的显著性检验。也就是在每一步,经f 检验选择进入方程的变量,而后又 作,检验,看是否需要剔除某些自变量。这个过程一直进行到既没有变量需要进 入也没有变量需要剔除为止。 在应用上,逐步型方法面临着一个较大的困难是f 检验显著水平的选择。显 著水平选得太大了,最后得到的方程含较多的自变量,相反,方程所含的自变量 则偏少。另外,人们对逐步型方法的批评也多于采用的f 检验的合理性有关。事 实上,每一步是在一组相关的f 变量中找出最大值或最小值作f 检验。直观上, 供选择的自变量越多找出的最大值( 或最小值) 也就越大( 或越小) 。显然出了 一些极端情况之外,这些量并不服从f 分布,因而并不能保证所挑选出的回归方 程在某种准则下是好的或是较好。 1 3 混合模型( m i x e dm o d e l ) 线性模型包括通常的线性回归模型、方差分析模型、协方差分析模型和方差 分量模型等等。方差分量模型不同于其他只带有固定效应的模型,在模型中至少 有部分效应为随机变量。如果在一个线性模型中既有固定效应又有随即效应,则 该模型被称为混合效应模型( m i x e dm o d e l ) 。混合模型的一种表示形式为( 参见 s e a r l e 1 9 9 2 ) : 】,= 盖移+ z “+ e ,( 1 1 3 ) 这里y 是n l 的观测向量,卢为p 1 的非随机的未知参数向量,称为固定效 第4 页 应。和z 是分别为n “p 和。g 已知设计矩阵。“和e 分别为g 1 和n l 随机 向量,称h 为随机效应,8 为n 1 的随机向量,e 为通常意义上的误差。一般假 设 e ( “) = o ,e ( 8 ) = 0 , “和e 互不相关并且它们的协方差阵为 c b 咖) = 口2 g ,c b v ( p ) = 仃2 r , ( 1 1 4 ) 这里g 和r 为已知或未知正定阵。当他们未知时他们可依赖于一个未知参数 向量口称为方差参数。如果模型( 1 1 3 ) 的随机部分历+ 8 可以分解为 z “+ 8 = 【,1 点+ + u t 磊, ( 1 1 5 ) 这里【,l i 一,u 是已知的设计阵,善l i 一,彘为互不相关的随机效应( 一般 乩= ,。,色= p ) ,并且叻“毒) = 盯x 。则此时线性混合模型具备以下形式 t e j ,= 邓,c d v ( y ) = u ,u p ;, 矿= u ,u 群 ( 1 1 6 ) 这就变成了线性混合模型的另一种常见形式,其中仃? ,一是未知的,称 为方差分量,于是这样的线性混合模型也常称为方差分量模型。对于方程分量模 型,重要的问题之一就是估计方差分量。因此方差分量模型可以表示为 y = 爿+ ( ,l 最+ + u 孝i , t e y = 邵,c b v ( 】,) = 矿= u ,u p ? l = l 因此y 一。( x 声,矿( 盯? ) ) 。 有了上面的知识背景,把模型选择应用到线性混合模型中去,方法和前面的 回归模型是相似的。所不同的是对方差分量的处理,要想使混合模型的模型选择 像前面介绍的模型那样实用,关键在于提出有效的计算公式以及新的方法,能够 使新标准不依赖于方差分量模型的分布。 第5 页 北京工业大学理学硕士学位论文 1 4 均方误差 对模型估计评价的标准有很多,本文重要使用的标准是均方误差( m e a n s q u a r e de r r o r s ,以下简记为m s e ) 。 设口为p 1 未知参数向量,歹为臼的一个估计。定义目的均方误差为 臌( 歹) = e ”口1 1 2 = e ( 口一口) ( 口一日) ( 1 1 7 ) 它度量了估计万跟未知参数向量口平均偏离度的大小。一个好的估计应该有较小 的均方误差( 参见王松桂等1 9 9 9 ) 。 第6 页 第2 章线性混合模型的模型选择 第2 章线性混合模型的模型选择 2 1 修正均方误差( r e v i s e dm s ec r l i er o n ) 引理2 1 :假设全模型( 1 2 ) 正确,那么对于全模型有 e ( 反) = 卢,+ 4 , ( 2 1 ) 这里爿= ( x ;矿。1 x 。) - 1 z ;矿- 1 置,厦= ( x ;y 一1 x 。) 。1 z ;矿。1 】,。 证明: e ( 厦) = e 【( x ;矿一1 x 。) 一1 r :矿一1 y = ( 矿“并,) 。矿。e ( 】,) = c ;矿。1 x ,尸;矿。1 c i x ,( 2 其中彳= ( 爿;y 。1 x 。) 。1 z ;矿1 x ,。 引理2 2 :假设全模型( 1 2 ) 正确,那么对于全模型有 声。= k x ;矿。x 。) 。+ 爿d 4 b o y 。y 一4 d j y 。1 y 声,= 一( d 爿x :+ d ;) y 一1 y , 其中d = ( x ;y 一1 ) 一一( 墨x ,) ( 一。) 一1 ( x ;矿一1 置) ,夕= 证明 将x 矩阵进行分块得到x = ( z 。;z ,) ,x , 1ill y 一= y2 矿2 ,且矿2 = 矿2 。 1 设z = y :x ,因此 第7 页 = 阱 ( 2 2 ) ( 2 3 ) 、, 他屈 锄 “ 以 岛 = = ;。;尘薹些垄馨篁些型型鎏; 矿一1 = 矿一j 矿一i x = ( 矿一j 彳) ( y j x ) = z ,z 。 因此,根据分块矩阵求逆 c z 刁= ( 荔乏荔乏 。1 = ( ;匐 其中z ;z 。= ( y2 x 。) ( 矿2 五) = z ;y 。1 x 。,z j z ,= ( 矿2 置) 2 置) = x y 。1 , z ;z ,= ( 矿2 z ,) ( y2 一) = x ;矿_ 1 x , c = ( z ;z ,) - 1 + ( z ;z ,) _ 1 z ;z ,d z ;z 。( z ;z 。) 卅 = ( x ;矿。) 。+ ( 一矿。1 ) 。1 x ;y 。x ,d y 1 x 。( z :矿。工。) 。1 = ( z ;矿。1 xg ) 。1 + 肋4 b = 一( z ;z 。) - 1 z ;z ,d 一( z :矿1 x 。) - 1z ;矿。1 x ,d = 一 d = z ;z ,一z ;z 。( z :z 。) q z ;z = ( y 。1 ,) 一( x y 。1 ) ( x ;矿。z 。) 。1 ( x ;y 。1 置) 叫= p 。名一一甜缈y 。l 一删d i | x :l 一 ( r :y 。x 。) 。1 + 删k ;矿1 ,一一d x j 矿。1 】, l 一( d a x ;+ 嬲:) y 。y j 夕,= i x ;y 一1 x 。) 一1 + 删k ;矿一1 y 一胱j y 一1 y 夕,= 一( d 省i z :+ d j ) 矿一1 】, 引理得证。 对于厦( 反= ( x :矿“x 。) _ 1 矿。1 y ) 我们转换一种方式表示,即 第8 页 ( 2 4 ) ( 2 5 ) ( 2 6 ) e ( 恽一郴) = 忙即+ f r ( x ) 。1 十1 2 , ( 2 6 ) 构造修正均方误差准则( r e v i s e dm s ec r i t e r i o n ) 一。剑堡二坐, , 来进行变量选择。r 臃e ,越小越好,模型应选择砌伽。最小时的g 个自变量。 证明: 居( 8 露一2 ) = e ( 历一) ( 历一) = e ( 吾 一( 台 吾 一( 2 = e 巴胆 = e ( 反一履) ( 厦一成) + ( 一屈) ( 一屈) = 层阪一甜) + 矧1 2 e ( 1 晦一级n = e l ( z ;矿1 z 。) 。_ 矿。1 y 一成9 2 = e i f c z ;y _ 1 z 。,“爿:y 。1 ( c _ ;z ( 台 + e 一卢, = e l i 岛+ ( x ;矿- 1 ) 。1 x ;矿。x ,尼+ ( z ;矿。1 x ,) 。z ;矿。p 一岛 = e l i ( x ;矿。x 。) 。x ;矿。屈+ ( x ;矿- 1 ,) “一y 。e = ( 一矿。z ,) 。五旷圳2 + 司l ( 彳;矿。1 ) 。一矿。1 酬2 = 忙屈1 1 2 + e ( e 矿。1 z ,( z ;矿。x ,) 。1 ( 墨矿。1 ) “x ;y 1 e ) = 陋屈1 1 2 + e g y 一1 x ,( y 一1 x 。) 1 ( x ;y 一1 一) 。1 x ;矿一1 e ) :1 1 4 卢,1 1 2 + f r ( z 矿一1 z 。) 一t 第9 页 因此e ( 1 防一矧2 ) = e 4 院一岛n + 忪1 1 2 = 4 卢,j f 2 + f ,( 爿:p ,。1 x 。) - 1 + l ,j 1 2 在进行计算中我们可以用忙夕,2 以及l 限l | 2 来代替忙屈| 1 2 以及8 屈n 从而计 算出e ( 1 | 厉一硎2 ) 。e ( i j 茸一硎2 ) 越小说明回归拟和的越好,但是我们还应该考 虑设法防止选取自变量过多,因此我们对均方误差增加惩罚因子,可以定义如下 变量 一。剑堡二坐,月一g 那么我们通过选择最小的脚。来决定模型的选择。 审弹证明完毕。 采用r m s e 作为选择标准有以下几点好处: 相对于一圮准则,采用r m s e 作为选择标准不必要求模型的分布类型必 须是已知的。 相对于c p 准则,采用s e 作为选择标准减少了所使用的参数个数。 相对于逐步回归法作用,采用脒s e 作为选择标准不用为每次引入变量 都进行显著性水平检验,减小了计算量。 采用跚s e 作为选择标准有以下缺点: 我们使用i i 彳扈i j 2 以及0 房0 2 来代替i 阻屈8 2 以及0 肛n 使结果产生出一些误 差。 以上结论为当矿。已知时,卢的广义l s 解为卢= ( z 矿1 z ) 一z 矿- 1 】,如果x 列满秩加n 七( z ) = p ,那么,卢的广义l s 估计为夕= ( z 矿一1 z ) 。1 矿一1 y 。 对于方差分量模型( 1 1 6 ) 来说,要计算出p 的估计值。当y 已知时,先讨 论y 一- 的计算方法,当七= 1 时, y = b ;,+ 盯? z 1 z 汀1 。 因为 ( 一+ 曰c d ) = a 一彳- 1 曰( c _ 1 + d _ _ 1 曰) _ 1 d 一一,其中4 。,b 村f ,c f x f ,d 。可逆, 令4 = 盯:,c = ,d = 盯。z ;有 第1 0 页 矿= 盯f 2 一盯f 2 ,仃,z ,p + 仃,z j 仃i 2 ,仃,z 。】矿,召仃f :, = 盯i 2 ,一盯? 盯i 4 z 。 ,+ 口? 互z ,仃i :l _ 1 互 注意这里只涉及吼g z 阵求逆,阶数下降了。如果七 1 ,可以进行迭代计算 矿t 如七= 2 ,矿。k + 盯:z :召r 1 = 巧一盯;k 1 z :( ,+ 口;互吒一,z :) 一z 互k 一,这 里只涉及g z g z 阶阵求逆a 沿用上面的式子可推导出矿,进而得到矽。解决了 计算彦的问题。 当y 未知时,我们首先要对矿进行估计。要计算出y :壹u 珥霄的估计 首先要得到方差分量砰,的估计 然后用矿( 岔) = 圭叩? 代替矿,由于 2 。一,磊2 e , 并且c d 瞧) = 盯? t 。 因此我们可以记作 瞩2 弘哆) 脚谚是够= 等,硼黼镶啪估计。 因此用矿( 乒,疔2 ) 代替矿可以得到的广义l s估计 夕= ( x 矿( 谚,彦2 ) 一1 z ) 一1 z 矿( 谚,彦z ) 一- y 。 定理一的结论可以改写为: 根据修正均方误差准则我们构造统计量 :到堡二坐 1 胛一g 来进行变量选择。模型应选择砌织最小时的g 个自变量。其中 e ( f 防一卵) = e ( 爿矗) 2 + e ( 矗) 2 + 扣( _ i ,( 谚,子:) 一t ) 一陆瞳) 肠,( 彳应) , 扈= 一( d 爿;+ 蹦j ) 矿( 嗔,毋z ) 一ty , d = ( x ;矿( 谚,彦2 ) 一1 置) 一( 矿( 谚,考2 ) 。1 _ ) ( _ 矿( 谚,彦2 ) 一,) 一( _ 矿 ,彦z ) 一- z ) 爿= ( 巧矿( 谚,子2 ) 一1 ) 一1 一矿( 谚,舀:) 一- 置。 同时,由于用矿 ,毋2 ) 代替矿,因此在从设计阵中删除因变量时,从新计算 北京工业大学理学硕士学位论文 的矿( 谚,彦2 ) 都因为设计阵的改变而发生改变,这也就影响到删舾。的最小值的 计算。 2 ,2a i c 准则在方差分量模型中的应用 按照我们上面提到的a ,c 准则 一伦= _ 2 1 n ( 模型似然度) + 2 ( 模型自由度个数) , 我们可以构造出应用于方差分量模型刖c 准则。 首先,考虑混合模型( 1 1 6 ) ,因为y 一。( 邓,y ( 盯? ) ) ,所以未知参数卢和 盯? ,西的似然函数的对数为 1 1 1 = 刚s t a n r 一吉1 n j 矿( 盯? ) j ) 一吉( y 一筇) 盯扩b 一筇) 。 对于矿未知的情况,我们可以通过对似然函数的对数得到似然方程,并对似 然方程求解得y ( ) 的估计矿 ,彦2 ) 以及的估计矽。将y ( 砰) 的估计 矿( 谚,疗2 ) 以及的估计矽带入式中,我们得到 1 n ( 驴c 伽t a n 卜扣陴,子2 ) 1 ) 一丢( y 一劫) 矿( 谚,子2 ) _ 1 ( y 一黟) 。 模型的残差平方和为r 船= ( y 一黟) y ( 盯? ) 一1 ( y 一劫) ,将矿( 盯? ) 的估计 矿( 谚,子2 ) 以及的估计夕带入式中我们可以得到 r 镕( 谚,子2 ) = ( y 一爿夕) 矿( 谚,子2 ) 一1 ( y a 夕) , 所以包含4 个因变量的选模型的残差平方和为: r 骝( 谚,方2 ) ,= ( y 一爿矽。) 矿( 谚,彦2 ) ,。1 ( 】,一爿反) 。 因此 1 n 艚一三m 陴) ,i ) 吉r 驱( 谚,确。 我们将常数项去掉,将( 2 4 ) 式带入a ,c 准则可以得到 们= r 5 s ( 谚,子2 ) 。+ l n ( i 矿( 谚,子2 ) 。i ) + 2 ( g ) 。 第1 2 页 ( 2 8 ) ( 2 9 ) 2 3 近似w a l d 检验 考虑混合模型( 1 1 6 ) ,因为y 。( 筇,矿( 盯? ) ) ,当矿。1 已知时,对于未知 参数的估计夕有如下性质( 参见s u z a n n es o 唧e r 等,1 9 9 6 ) ( 夕一) 。( o ,( z 矿( 仃;) 一1 z ) 一1 ) , 对于y 1 未知时,我们用矿( 盯? ) 的估计矿( 反,子2 ) 代替矿( 盯? ) ,因此在应用上我们 可以近似的认为 ( 夕一) 。( o ,( 彳矿( 谚,子2 ) 一1 ) 。1 ) 。 对于参数声,我们可以写成卢= ( 台 c 其中p = 。+ r ,我们需要检验屈是 否为零,因此我们有如下检验h 。:= o ,我们可以将此检验改写成。:爿= o 其中爿是f 。p 的矩阵,并且一= ( o ,r ) 。我们构造如下统计量 = ( 一声) ( 爿( r 矿( 谚,彦2 ) 一1 ) i ) 一1 爿) 一1 一夕, ( 2 1o ) 在一定条件下近似服从自由度为的开方分布,即一z 0 2 4 极大似然比检验 极大似然比检验是一种经典统计检验,当样本量n 趋于无穷时,概翠为1 的 能将两个不同参数区分开。对于参数卢,= ( 鲁 ( 其中p = g + r ) ,我们需要 检验,是否为零,我们设定零假设为日。:屈= o ,对于零假设我们可以改写为 h 。:卢曰儿。那么备则假设为日,:屈o ,也就是日,:卢巳a 我们定义统计 量( 参见g e e r cv e r b e k e 等,2 0 0 0 ) h - 卅h i 粼| , 我们可以得到 一2 1 n 九= 一2 1 n 扛。( 乳,。) ) 一2 1 1 l 仁。( 钆) ) 第1 3 页 。,。垫鎏些鐾些墼耋丝垒圣。:,:。:。一 = 1 n ( 1 矿( 谚,彦2 ) i ) + 月舳( 色,毋2 ) 岫( 1 矿( 反,子2 ) 1 ) 一r 嬲( 谚,毋2 ) 。 = r 船( 谚,彦2 ) 一r 船( 谚,彦2 ) 。 ( 2 1 1 ) 2 1 n 兄。在一定条件下近似服从自由度为f 的开方分布,即一2 h a ,一z ? 。 第1 4 页 第3 章应用实例 3 1 人力资源中的薪酬问题 对于企业来说面临着两大问题,一是财力资源的问题,另一个就是人力资源 的问题。只有能够处理好这两方面问题企业才可能良好的发展。随着知识经济的 到来,在当今日益激烈的竞争当中,人才的竞争变得越来越激列,企业间的竞争 转变为人才的竞争。人才作为知识的载体必将成为企业在竞争中取得优势地位的 种资源,而且这种资源是否充足,可能在竞争中发挥决定性的作用。微软首席 执行管比尔盖茨曾经坦言:“如果将微软最优秀的2 0 个人拿走,我们在世界上 将无足轻重。”日本一家著名公司的领导人也宣称“本公司9 7 资产是我们的员 工”,人才在知识经济时代的重要性可见一斑。这也难怪“人力资本”的称呼已 经悄然出现。 既然能够被成为资本,也就意味着人力是可以增值的。通过这种增值,企业 可以获得回报。但是,问题随之产生,这就是:如何才能吸引人才,利用人才, 使人才增值。这就需要企业对人力资源进行有效的管理。 吸引、保留和激励是人力资源管理中一个永恒的话题。吸引组织需要的人才, 把他们保留在组织内,并激励他们,使他们能够将自己所有的才智奉献给组织, 这些就是人力资源管理的核心问题。为了能够有效的完成吸引、保留和激励员工 的工作,组织向成员提供的回报就必须具有外部的竞争性和内部的公平性。 在今天的市场经济下,人才在为组织工作的同时,理应得到相应的回报( 这 种回报可能是物质的,也可能是非物质的) 。为了能够在竞争激烈的人才市场上 获得自己需要的人才,组织给予劳动者的回报必须在人才市场具有一定的竞争 力,这就是我们所提到的外部竞争性。 因此“全面薪酬战略”是目前发达国家普遍推行的一种薪酬支付方式,它源自 8 0 年代中期的美国。当时美国公司处在结构大调整时期,许多公司将相对稳定 的、基于岗位的薪酬战略转向相对浮动的、基于绩效的薪酬战略,使薪酬福利与 绩效紧密挂钩。“全面薪酬战略”的概念在此基础上产生。 公司给受聘者支付的薪酬分成“外在”的和“内在”的两大类,两者的组合,被 第1 5 页 北京工业大学理学硕士学位论文 称之为“全面薪酬”。“外在”的激励主要是指为受聘者提供的可量化的货币性价 值。比如:基本工资、奖金等短期激励薪酬,股票期权等长期激励薪酬,失业保 险金、医疗保险等货币性的福利,以及公司支付的其他各种货币性的开支,如住 房津贴、俱乐部成员卡、公司配车等等。 “内在的”激励则是指那些给员工提供的不能以量化的货币形式表现的各种 奖励价值。比如,对工作的满意度、为完成工作而提供的各种顺手的工具( 比如 好的电脑) 、培训的机会、提高个人名望的机会( 比如为著名大公司工作) 、吸引 人的公司文化、相互配合的工作环境、以及公司对个人的表彰、谢意等等。 外在的激励与内在的激励各自具有不同的功能。它们相互补充,缺一不可。 在过去的计划经济体制下,我们只强调精神的作用而在物质报酬上“吃大锅饭”, 伤害了员工的工作积极性。在市场经济的条件下,又往往忽视了精神方面的激励, 一切都想用钱来解决问题,动辄扣奖金,同样会伤害员工的积极性。 据不久前中国社会调查事务所的统计,当代大学生择业主要考虑的因素依次 为:个人发展前途、薪金水平、公司的实力、公司的管理水平、职位、人际关系 和工作环境。又据惠悦顾问公司去年在美国通过对1 0 0 万名员工的调查统计,对 员工们有吸引力的因素依次为:保持本人好的工作声望、对工作有重要性、有表 现自己能力的机会、有意思的工作、喜欢共同工作、有机会得到提升、所希望的 薪酬。虽然美国和中国的经济发展不在一个水平上,但也反映出人们对物质和精 神的激励都是需要的。 但是在现实社会中,如何科学地把握全面薪酬的两个方面,使它们有效地配 合起来,是企业经营者经常面临的一个难题。一般地来说,内在的激励是非货币 化并难以量化的,但有一部分内容也反映在市场竞争之中,也可以通过市场进行 了解,如培训机会、公司名望等。还有一部分内容则完全要靠公司自身不断地培 育和积累,如公司文化、工作环境、公司对个人的名誉表彰等等。 外在的激励由于是可量化的,它们可以通过市场竞争来达到一个平均的水 平。关键是企业要能适时地了解和掌握市场上本行业内各种岗位的各种薪酬方式 的平均水平,否则,把握和控制自己公司的薪酬待遇水平就失去了依据。薪酬高 了则增加企业成本,低了又吸引不来人。 因此如何制定外在激励成为各个企业的问题之一,而外在激励中最重要的便 第1 6 页 是基本工资和短期激励的多寡,这一点我们可以从以下的资料中看出。 对员工的影响 组成薪资的要素 吸引保留激励 基本工资高高 中 员工福利低 由 低 特殊津贴低 中低 短期激励高中高 长期激励 由 高 由 资料来源:i h r m 2 0 0 0 其中短期激励可以通过制定相应的绩效管理来完成,但是对于基本工资来说却需 要相对固定的设置。根据什么来设定一个人的基本工资,对于企业来说面对一个 刚刚进入企业的新员工,企业对其能力还不甚了解,这就成为企业所面临的一大 问题,也就是定薪定岗问题。如果基本工资制定的过高,那么企业支付了过高的 成本,制定的过低,那么无法在激烈的竞争中吸引和保留优秀的人才。这样从一 名新员工所能够的指标中获取信息,制定出相对和具备竞争力( 对于外部而言) , 以及相对公平( 对于内部而言) 的薪金标准成为一个非常重要的问题。下面我们 分别通过线性回归模型以及线性混合模型的模型选择方法来解决这个问题。 3 2 数据分析 3 2 1 定义阶段:分清问题,提出目标。 要制定具备公平性以及竞争性的薪酬标准,首先要知道新员工可以提供的可 供参考的指标有哪些。要得到这个结论,就要进行一定的试验收集数据,主要目 的就是根据试验的数据,确定各个数据的性质,方便我们对那些数据进行分析。 3 2 2 获取数据: 第1 7 页 北京工业大学理学硕士学位论文 所属年龄工作学历英语年薪所属年龄工作学历英语年薪 公司阶段时间程度公司阶段时间程度 14 55o2 4 0 0 0 05236 17 2 0 0 0 133518 1 6 s13515 4 0 0 0 112527 2 0 513513 6 0 1234o4 2 0 0 0512627 2 0 16 1507 2 0 0 0512515 4 0 11 33o3 3 6 0 0s1 2513 6 0 0 0 1 14302 4 0 0 0512513 6 0 0 0 127511 0 2 0 ( ) 0512513 0 0 0 0 12451 4 8 0 0 051 15 12 4 0 0 0 114403 3 0 513514 8 0 0 0 13 55 1 1 0 6 5 0 05 12513 6 0 0 0 124s18 7 0 0 0s12512 4 0 0 0 1244o7 5 6 0 05335j4 8 0 1124o3 3 0 521513 0 0 0 0 123517 5 6 0 0511512 4 0 0 0 123721 5 0 0525623 0 0 0 0 0 12 35 1 1 3 8 0 0 0525622 4 0 0 0 0 123511 2 0 0 0 05255118 ( ) 0 0 0 114521 2 0 0 0 0535622 4 0 0 0 0 124s11 1 4 0 0 0525621 8 0 0 0 0 133611 0 8 0 0 0525511 2 0 ( ) 0 0 134519 9 0 0 052562 2 8 ,0 0 0 122618 4 0 0 0524511 9 8 0 112527 2 0 0 05235 11 0 8 0 0 0 1235l9 6 0 ( ) 0524611 2 0 0 0 0 124516 6 0 5245l9 0 0 1255119 2 0 ( ) 05245 16 0 0 0 0 133611 2 0 0 0 053 4623 6 0 0 0 0 123621 0 8 0 0 053 5623 0 0 0 0 0 135619 6 0 0 0524511 9 5 0 0 0 122626 6 0 0 0524519 0 0 0 0 121515 7 6 53 4611 3 2 0 0 0 124622 0 4 0 0 0523519 0 0 0 0 135611 9 2 0 0 0s3 25l4 8 0 0 0 123511 6 2 0 0 052 2513 6 0 132721 2 0 0 0 053 4 52 19 2 0 0 0 125621 9 2 0 0 053 4 511 2 6 0 124511 8 0 0 0 05 23514 8 0 0 0 12 5 511 1 4 0 0 0s12513 0 0 112529 7 2 5 11511 2 0 143502 5 2 053 4522 5 2 0 0 0 第1 8 页 所属年龄工作学历英语年薪所属年龄工作学历英语年薪 公司阶段时间程度公司阶段 时间 程度 135611 3 2 0 0 052 4 5 12 3 4 0 0 0 125519 9 0 0 053 4 s22 1 6 0 0 0 132619 0 0 0 052 3s 12 4 0 0 0 0 112527 8 0 0 0523512 1 0 0 0 0 12 35 17 2 0 52 35 11 8 0 0 0 0 112513 6 0 0 0523511 2 0 0 0 0 124622 0 4 0 ( ) 0523519 0 0 0 0 i33611 8 0 0 0 0523516 0 0 0 0 1354o1 0 8 0 0 0523516 0 0 0 0 133519 9 6 0 0523s13 9 0 0 0 123408 16 0 0523511 8 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论