(运筹学与控制论专业论文)百分位数回归方法在财务管理中的应用.pdf_第1页
(运筹学与控制论专业论文)百分位数回归方法在财务管理中的应用.pdf_第2页
(运筹学与控制论专业论文)百分位数回归方法在财务管理中的应用.pdf_第3页
(运筹学与控制论专业论文)百分位数回归方法在财务管理中的应用.pdf_第4页
(运筹学与控制论专业论文)百分位数回归方法在财务管理中的应用.pdf_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 对于进行定量分析的管理学研究者来说,普通最小平方( o l s ) 表达式已经成为 一种进行大范围经验性问题分析的熟悉的可信赖的工具( w e s t e r n ,1 9 9 5 ) 。但是运 用最小二乘法的条件比较高,如线性回归模型要求满足同方差性、随机误差间两 两不相关等条件,当需要进行回归系数的显著性推断时,通常还要假设残差服从 正态分布。在实际问题中,完全满足这些基本假设的情况并不多见,然而一旦违 背了某一项基本假设,那么在应用时就难以得到无偏的、有效的参数估计量。 本论文针对上述问题,以混合成本的分解和o i l p l u s 公司取暖用燃油消耗的 分布为主要研究对象,在进行参数估计时,应用百分位数回归方法,并与最小一 乘法、最小二乘法进行比较。主要结论有:通过对混合成本的分解,可以看到采 用百分位数回归方法得到的模型与采用最小二乘法得到的模型显著不同;通过对 o i l p l u s 公司取暖用燃油消耗分布的模拟,既可以看到采用百分位数回归方法与 采用最小二乘法得到的模型显著不同,又可以得到比最小二乘法更为丰富的信息。 关键词:百分位数回归,最小二乘法,混合成本的分解,取暖用燃油消耗的分布 a b s t r a c t f o rm a n a g e m e n ts c i e n c er e s e a r c h e rw h oc o n d u c t st h eq u a n t i t a t i v ea n a l y s i sr e s e a r c h , t h eo r d i n a r yl e a s ts q u a r e s ( o l s ) e x p r e s s i o nh a sa l r e a d yb e c o m eaf a m i l i a r ,r e l i a b l et o o l f o rt h ea n a l y s i so ft h el a r g e s c a l ea n de m p i r i c a lp r o b l e m ( w e s t e r n ,1 9 9 5 ) b u tw h e n w e u s et h el e a s ts q u a r e sm e t h o d ,t h ec o n d i t i o ni sq u i t eh i g h ,s u c ha st h el i n e a rr e g r e s s i o n m o d e lr e q u e s t st o s a t i s f yt h eh o m o s c e d a s t i c i t y , t h er a n d o me r r o rb e t w e e nt w oi s n o n - c o r r e l a t e da n ds oo n w h e nw en e e dt o c a r r yo nt h es i g n i f i c a n c ei n f e r e n c eo ft h e r e g r e s s i o nc o e f f i c i e n t ,w eu s u a l l ym u s ts u p p o s et h er e s i d u a le r r o ro b e y sn o r m a l d i s t r i b u t i o n i n p r a c t i c a lp r o b l e m s ,t h es i t u a t i o n sw h i c hf u l l ym e e tt h e s e b a s i c a s s u m p t i o n sa r er a r e ,b u to n c eab a s i ca s s u m p t i o ni sv i o l a t e di nt h ea p p l i c a t i o n ,t h e ni t w i l lb ed i f f i c u l tt oo b t a i nu n b i a s e da n de f f e c t i v ep a r a m e t e re s t i m a t o r t h i s p a p e ri s t or e s o l v et h ep r o b l e m ,t a k em i x e dc o s t s d e c o m p o s i t i o na n d o i l p l u sc o m p a n yf u e lc o n s u m p t i o nd i s t r i b u t i o na st h em a i no b j e c to fs t u d y , w h e n c a r r i n go nt h ep a r a m e t e re s t i m a t i o n ,ip r o p o s et h eq u a n t i l er e g r e s s i o nm e t h o d ,a n d c o m p a r e 、枷mt h eo r d i n a r yl e a s ts q u a r e sm e t h o d t h em a i nc o n t e n t sa r e : t h ef i r s tc h a p t e ri st h ei n 们d u c t i o n ,e l a b o r a t et h eb a c k g r o u n do fq u a n t i l er e g r e s s i o n m e t h o d ;s u m m a r i z e st h ed o m e s t i ca n df o r e i g ns t u d ys i t u a t i o n ;a r t i c l ef r a m e t h ec h a p t e r2i st h et h e o r e t i c a lf o u n d a t i o n , i n t r o d u c e dt h ec o n c e p to fq u a n t i l e ; q u a n t i l er e g r e s s i o nm o d e l ;t h en a t u r eo fq u a n t i l ee s t i m a t o rt h a ti sc o n s i s t e n c ya n d g r a d u a ln o r m a l i t y t h ec h a p t e r3a p p l yq u a n t i l er e g r e s s i o nm e t h o dt of i n a n c i a lm a n a g e m e n t ,s i m u l a t e m i x e dc o s t sd e c o m p o s i t i o na n do i l p l u sc o m p a n yf u e lc o n s u m p t i o nd i s t r i b u t i o n , a n a l y s i st h ed i f f e r e n c eb e t w e e nt h el e a s ts q u a r e sr e g r e s s i o nm e t h o da n dq u a n t i l e r e g r e s s i o nm e t h o d ,o b t m nm o r er i c hi n f o r m a t i o nc o m p a r e dw i t ht h el e a s ts q u a r e s t h ec h a p t e r4i st h ec o n c l u s i o na n dt h ep r e d i c t i o n ,s u m m a r yt h ef u l lt e x t ;p o i n to u t t h es t u d yd e f i c i e n c y k e y w o r d s :q u a n t i l er e g r e s s i o n ,t h el e a s ts q u a r em e t h o d ,t h ed e c o m p o s i t i o no fm i x e d c o s t s ,o i l p l u sc o m p a n yf u e lc o n s u m p t i o nd i s t r i b u t i o n i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名:鸳! 旦型兰 日期:v ,踔j 月j1 日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:啬! 竺丛导师签名: 彩灯 日期:卜g 年r 月 日 第一章绪论 第一章绪论 1 1 百分位数回归方法产生的背景及现状 1 1 1 百分位数回归方法产生的背景 1 8 7 0 年,英国的高尔顿在研究人类身高的遗传规律时发现【l 】:父母是高个子的,其 子女的身高有低于父母身高的趋势;相反,父母是矮个子的,其子女的身高却往往有 高于父母身高的趋势。从全局来看,高、矮个子人的子女都有“回归 于一般人身高 的期望值。这就是统计学上“回归 的最初涵义。1 8 8 6 年,高尔顿在论文中正式提出 了“回归 的概念。经过他的学生皮尔逊多年的进一步发展后,这个出自于生物统计 学领域的概念,便被推广为一般统计方法论的重要概念。 回归分析就是用数理统计的方法,研究自然界变量之间存在的非确定的相互依赖 和制约关系,并把这种关系用数学表达式表达出来,其目的在于利用这些数学表达式 以及对这些表达式的精度估计,对未知变量做出预测或检验其变化,为决策服务。因 此从某种程度而言,回归分析也可以认为是对自然界中具有相关关系的变量进行简单 的反演。回归分析方法有着广泛的应用,例如在大坝变形监测中,可以用回归分析的方 法建立位移量与水位、水温等相关因素之间的数学函数关系,根据所建立的回归方程 分析变形的某些现象,并可预报在某一水位、水温下的变形量;在混合成本分解中,可 以用回归分析的方法建立总成本与产量之间的数学函数关系,并可预报下一年的总成 本。为了研究自变量x 和因变量y 之间的数值变化规律,人们往往从统计角度对回归 函数的形式作一些必要的、合理的假设,并确定了一些经验的回归方程函数形式。不 失一般性,设有m 个自变量一,x 2 ,x m ,因变l y 对,x 2 ,x m 的线性回归函数可写 为 y = a o + 口l + a 2 x 2 + + 口m x m ( 1 - 1 ) 在实际问题中,人们往往只能在x 取一组定值的条件下,得到y 的一组观测样本, 由于这组观测样本必然带有随机抽样误差孝,因此回归方程( 1 1 ) 可改写为 , 一 、 y2 a 0 + a l t l + a 2 薯2 + + 口m u2 1 , 2 ,以, 回归分析首先要建立回归方程,也就是利用因变量y 的观测值( y l ,y :,y 。) 和自变 电子科技大学硕十学位论文 量之值,x i 2 ,x i r ag = 1 , 2 ,以) 对回归参数口o ,a 1 ,口2 ,口。进行估计。目前在求回归 参数a 。,a ,a ,a 。时,通常认为用于求回归参数的因变量样本辫只存在偶然误差,而 忽略自变量之值,玉2 ,一,x 湘( f = 1 , 2 ,力) 可能存在的误差。 在管理研究中,对某一研究领域中模型以及假设的验证和应用,主要依靠数据的 收集和分析。而大量数据的分析处理,需要借助相应的统计技术方法。“回归分析” 悠久的历史,使其理论完美,计算工具齐全。对于进行定量分析研究的管理学研究者, 普通最小平方( o l s ) 表达式已经成为一种进行大范围经验性问题分析的熟悉的可信赖 的工具( w e s t e r n ,1 9 9 5 ) 。1 8 0 1 年意大利天文学家朱塞普皮亚齐发现了第一颗小行星一 谷神星,在4 0 天的跟踪观测后,谷神星运行至太阳背后。皮亚齐失去了谷神星的位置。 随后全世界的科学家通过皮亚齐的观测数据开始了寻找谷神星的行动。但是大多数的 计算都没有结果,只有当时年仅2 4 岁的高斯成功计算了谷神星的轨道,奥地利天文学 家海因里希奥尔伯斯在高斯计算出的轨道上重新发现了谷神星,从此高斯闻名世界。 他的这个最小二乘法发表在1 8 0 9 年的天体运动论中。法国科学家勒让德也于1 8 0 6 年独立发明最t 、- - 乘法。之后,最小二乘法被广泛应用,原因不外是最d x - - 乘法的解 释与人们的直观想象一致;同时该方法易于计算,有时计算用手工,其优越性在前计 算机时代是不言而喻的。尤其是当假设误差是正态分布时,它具有如无偏性与有效性 等优良性质;但是运用最小二乘法的条件比较高【2 】,如线性回归模型要求满足同方差 性、随机误差间两两不相关等条件,当需要进行回归系数的显著性推断时,通常还要 假设残差服从正态分布。在实际问题中,完全满足这些基本假设的情况并不多见,然 而一旦违背了某一项基本假设,那么在应用时就难以得到无偏的、有效的参数估计量。 再者,当y 的条件分布不是正态时,亦不宜用最小二乘法估计回归系数。经过变量变 换法的处理虽能解决部分问题,但由于各种变换法的规律难以掌握,对变换效果的估 计往往不准,有时甚至经多种尝试而终未见效。尤其是当处理的数据含有异常点的时 候,并且很可能不只一个存在。采用人为的修改异常点是缺乏说服力的,因为它们有 可能反映的是变量间的重要关系,不能轻易的将其舍弃,必须再进行奇异点有效性判 断。如果奇异点有效并且偏差较大,采用最二乘法所拟合的回归直线因“迁就”这个( 些) 离群值、强影响点而使整体的拟合结果产生不同程度的偏离,以致影响了稳定性。 对于最小二乘法的稳健性的问题早在1 8 世纪就已经引起了人们关注了。由于样本 观察值中所包含的野点( o u t l i e r ) 在这种模型下是很难被发现的,而异常点常常会加重尾 部分布,使得模型很难满足最小二乘法的g a u s s - - m a r k o v 假设,则对估计结果产生较大 的影响。许多著名的数学家如g a u s s 、l a p l a c e 和l e g e n d r e 等都指出对于一些带可疑数据 的样本观察值若用最小绝对值法比用最小二乘法估计会更好些。直到1 8 1 8 年,l a p l a c e 2 第一章绪论 证明了在简单的二维变量的回归模型中,如果模型的残差有方差盯2 和在中位数处的密 度值( o ) 满足关系【2 厂( 0 ) 】 o ,则最小绝对偏差估计就比最小二乘法估计有更小的渐 近方差,这一结果为今后大样本分位数回归统计量的研究铺平了道路。还有,大量的 宝贵数据仅仅只能得到一条回归曲线,而一条曲线所能提供的信息毕竟是有限的。所 以人们在使用回归分析时,也在不断地探索更新更好的方法,而条件更宽松、挖掘信 息更丰富者,当属分位数回归。 1 9 7 8 年k o e n k e r 矛i b a s s e t t 】最早提出了线性分位数回归的理论,但当时由于分位数 回归本身计算的复杂性,所以它没能像经典的回归分析那样迅速普及,但对它的理论研 究一直在不断的完善中。随着计算机技术的不断突破,分位数回归软件包现已是主流统 计软件r 、s a s 、s p s s 等的座上客了,分位数回归也就自然而然地成为经济、医学、教 育等领域的常用分析工具。 1 1 2 国外研究现状综述 目前国际上的研究可以分为两类,一类是分位数回归技术方法上的研究。m o s h e b u c h i n s k y ( 1 9 9 8 ) 5 】发表了一篇长达4 0 页的关于分位数回归的进展和指导实证研究的文 章,关于百分位数的半参数技术给出了指导。h o r o w i t zj o e ll a n ds o k b a el e e l 6 对一个 合成的分位数回归模型进行了非参数的估计。r o b e r tf e n g l ea n dj e f f r e yr r u s s e l l ( 1 9 9 8 ) 7 】提出条件自回归v a r 模型,简称为c a v r ( c o n d i t i o n a la u t o r e g r e s s i v ev a l u e a tr i s k ) ,c a v r 利用分位数回归方法估计模型参数。吴建南、b r e t s c h n e i d e r - 等( 2 0 0 2 ) 酬 用蒙特卡罗( m o n t ec a r l o ) 方法产生1 0 0 个随机数据集合来比较显著权重分析方法与分 位数回归的优劣;k o e n k e r r a n db a s s e t tg 【9 】采用百分位数回归方法进行异方差检验; a l a neg e l f a n d ,a t h a n a s i o sk o t t a sa n ds t e v e nn m a c e a c h e r n 1 0 】提出分位数回归中的贝 叶斯非参数模型。 另一类是应用分位数回归的研究。在此方面,l a n d a j o m a n u e l ,d e a n d r 6 s j a v i e ra n l o r c a p e d r o 1 1 】用分位数回归分析来衡量公司绩效;同样地,f a m a 和f r e n c h ( 1 9 9 2 ) u 2 j 在普通回归情况下得到的帐面市值比与股票收益率之间的显著正相关关系与分位数回 归下的结果也显著不同;w h i t t a k e r 和w 1 1 i t e h e a d 【1 3 】在利润的信用贷款记账方面应用该 技术进行分析;m o y i ns t a m 和g i l b e r tw b a s s e t tj r 【1 4 】用百分位数回归对大学新生 入学录取指数进行了分析;m o s h eb u c h i n s k y ( 1 9 9 4 ) 1 5 】用分位数回归方法研究了1 9 6 3 年 到1 9 8 7 年之间的美国工资结构的改变问题;m o s h eb u c h i n s k y ( 1 9 9 8 ) 1 6 】用分位数回归方 法研究了美国女性工资分布变化的机理;m u e l l e r ,r i c h a r de ( 1 9 9 8 ) t 1 7 】研究了加拿大公 电子科技人学硕十学位论文 共部门和私营部门的工资差距;b e u m j op a r k ( 2 0 0 2 ) 1 8 】基于分位数回归的方法检验了 股票市场收益的不对称性;e i d ee r i c 和m a r ks h o w a l t e r ( 1 9 9 8 ) 1 9 1 基于分位数回归方法研 究了学校质量对学生绩效的影响关系;c h c m o z h u k o v 、v l u m a n t s e v r2 0 0 1 ) 和b a s s e t t 等( 2 0 0 1 ) t 2 0 】将分位数回归应用于实证金融领域,尤其是将其和v a r 的计算联系起来,是 一种发展趋势;l e e s o k b a e 在研究功能控制时,用中位数回归进行了分析;d i c k e ya n d h e a t h e r 2 1 】用分位数回归分析了大不列颠地区收入不平等的现象。 1 1 3 国内研究现状综述 国内关于分位数回归的研究总体偏少。例如:刘伟、任允文【2 2 】采用t g e n g s h e n g 和 m i n ( 2 0 0 3 ) 提出的经验似然方法,基于一个新的方程对中值回归模型的参数进行统计推 断,数值模拟的结果表明,本文所得到的参数估计结果比g e n g s h e n g 和m i n ( 2 0 0 3 ) 的模拟 结果更精确;吴耀华【2 3 】讨论了线性模型中经验回归分位数过程的弱收敛性,在一些普 通的条件下,建立了其布郎桥收敛结果;刘瑞涛、蒋建成【2 4 】提出了用局部分位数回归 的方法来估计某投资组合的v a r 值。该方法可用于计算投资组合多持续期的v a r ,使 得人们可以了解到该投资组合在一定持续期内的动态风险;郑承利和陈灯塔( 2 0 0 6 ) 1 2 卵 重点借鉴f a m a 和m a c - - b e t h ( 1 9 7 3 ) 的截面研究方法,采用分位数回归,重新考察中国股 票市场截面收益率的风险定价因子。结果发现,分位数回归结果与普通最小二乘结果显 著不同,不同分位数下回归系数及其统计显著性都存在巨大差异。股票收益率与规模正 相关的规模效应显著,且高收益率部分的正规模效应更加强烈。帐面市值比效应在低收 益率部分正相关,高收益率阶段负相关。中间部分不显著;黎波、迟巍、余秋梅【2 6 】介 绍了两类对收入分布函数进行成因分解的半参数化方法:一类是l e m i e u x 及其合作者们 发展起来的权重重置法;另一类是m a c h a d o 和m a t a 首创的基于分位数回归的分解方法。 对整个收入分布进行分解与仅对某一收入分布差距的总结性描述量( 如基尼系数) 的分 解相比,前者在实证研究中有更大的价值。这一方法可以显示收入差距的变化主要集中 在哪一部分收入群体中( 如高收入或低收人群体) 。荀鹏程f 27 】等( 2 0 0 4 ) 对中位数回归模型 进行了介绍,并将其应用于北京市s a r s 发病预测中:季莘、陈峰、吴先萍( 1 9 9 9 ) 2 8 】用 百分位数回归对制订正常人群血压参考值进行了研究;岳昌君和刘燕萍 2 9 l 采用分位数 计量回归方法,对我国城镇不同群体的收入水平、收入差异、教育差异以及收入与教育 之间的关系进行了实证研究;尚磊、徐勇勇、张水平等【3 0 j 用百分位数对西安市0 1 8 岁 儿童青少年体块指数进行了回归分析。结果发现城乡男女生体块指数的发育规律不同, 女生比男生早,城市比农村早,计算的年龄别百分位数可作为i 临床应用的参考标准;朱 4 第一章绪论 平芳、朱先智【3 l 】尝试利用具有稳健性的分位点回归估计法,应用带惩罚的非参数分位 点回归模型研究企业各种水平的科技投入强度和r & d 投入强度与其规模之间的关系, 并对模型估计过程中可能出现的诸如异方差和内生性等问题进行了有效的处理。研究结 果表明“假设”对上海的制造企业不完全成立;葛玉好【3 2 】使用分位数分解方法对男女在工 资分布上的差异进行因素分解分析,发现女性在经验回报率和经验年限分布方面处于劣 势地位,在教育回报率和教育年限分布方面的境况并不差,甚至在教育回报率方面处于 优势地位;涂涛涛、张建华【3 3 】基于分位数回归法研究外商直接投资与技术外溢之间的 关系,研究结果表明:人力资本、投资环境的改善有利于f d i 的技术外溢,而市场竞争、 技术差距和经济开放度的提高则不利于f d i 的技术外溢;李晓华【3 4 】介绍了q j m p 分解对 j m p 方法缺陷的克服,然后用q j m p 方法分解工资分布的变动,发现:劳动力结构的变 动主要作用在工资分布的低端,减弱了与其同时作用但力量相反( 增加不平等) 的价格 变动的影响力。 1 2 本文框架 全文共分四章: 第一章为绪论,阐述百分位数回归方法产生的背景;综述国内外百分位数回归方 法研究的现状;本文框架。 第二章为百分位数回归的理论基础,介绍了百分位数的概念;百分位数的模型; 百分位数估计量的性质,即具有相合性和渐进正态性。 第三章将百分位数回归方法应用在财务管理中,通过对混合成本的分解和 o i l p l u s 公司取暖用燃油消耗的分布的模拟,分析最小二乘法与分位数回归的区别, 得到了比最小二乘法更为丰富的信息。 第四章为结论与展望,对全文进行总结,并指出本文研究的不足之处。 5 电子科技人学硕士学位论文 第二章百分位数回归方法的理论基础 2 1 百分位数回归方法介绍 2 1 1 百分位数回归的概念【1 】 对于任意实值随机变量】,它的所有性质都可以由y 的分布函数,即: ,( y ) = 只( y y ) 来刻画。对于任意的o f 1 ,定义随机变量y 的f 分位数函数q ( r ) 为: q ( f ) = i n f j ,:,( y ) f ( 2 1 ) 它完全刻画了随机变量】,的性质,可以看出存在比例为f 的部分小于分位数函数 q ( f ) ,而比例为1 一f 的部分位于分位数函数q ( f ) 之上。 对于任意的o f 1 ,定义“检验函数屏( “) 为: 岛( “) 2 ( f 一删) ) 甜 = 。兰。,茹 弘2 , 其中,f 。 o ) 为示性函数,由“检验函数”定义( 式2 2 ) 或图2 1 ( 注意:同线性方程y = 奴 比较,r 相当于直线的斜率后。可以看出,“检验函数”是分段函数,且岛( “) o 岛( “) = 岛( “) ( 7 1 ) u r o 图2 1 “检验函数”以0 ) 示意图 6 第二章百分位数回归方法的理论基础 为积分方便,“检验函数 p ,0 ) 可改写成: 成0 ) = ( f - - i ( 删) ) = fu 歹( o ) + ( f - - 1 ) ul ( u o ) ( 2 3 ) 由定义式( 2 3 ) ,当u 取y 一孝时,则有: 岛( 少- o = r ( y 孝) 址御) + ( f 一1 ) 甜沁删 ( 2 - 4 ) 则y 的f 分位数回归,就是找到孝,使e 肛( y - 善) 最小,即求满足下式的: m i n e p ,c v 一剑 在公式( 2 - 4 ) 两边同时取期望,积分得: m 。i 片n e p ,( y 一孝) 】= ( f - o l ( y 一手炒g ) + f r 一f 炒g ) ( 2 - 5 ) 再对公式( 2 5 ) 两边同时对孝求导得: o = ( 1 一r ) 卵g ) 一r f 扭g ) = f g ) ( 2 - 6 ) 因为分布函数f 是单调增函数,则集合 y :f ( 孝) = f ) 中的任意元素都满足条件,即 可能存在某个区间上的元素都满足使式( 2 - 4 ) 最小。而由定义式( 2 1 ) ,若令q ( r ) = 乡时, 则多是唯一的。 2 1 2 百分位数回归模型【3 5 1 百分位数回归是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数 ( 例如四分位、十分位、百分位等) 来得到被解释变量的条件分布的相应的分位数方 程。与传统的o l s 只得到均值方程相比,它可以更详细地描述变量的统计分布。 如果y 是连续性随机变量,则l ,的f 分位数回归就是找到孝,使e 必,一f ) 】达到最 小,即求满足下式的f : 卿e p ,一酬 其中当y 孝时,岛( 少- 孝) = f ( 少- 孝) ;当y 孝时,成( y 一孝) = ( f 1 ) ( y 一孝) ,f ( o ,1 ) 。 如果】,是离散性随机变量,则y 的f 分位数回归则是求满足: m 球i 掣n = 3 - p ,( ,3 , t z ;( r ) ) 的解p ) ,它的展开式为: 7 电子科技大学硕+ 学位论文 吣m e n 【- ,到胪耶m ,:y l x i 机酬 ( 2 - 7 ) 在式( 2 7 ) 中,y ,代表因变量的向量,薯代表自变量的向量,f 是要估计的分位数值, 是一个系数向量,这个模型的特点是将随着f 的变化而有所不同。f 可以取o 至r j l 之 间的任何值,然后依靠上式的线性规划估算出y 的相应分位数的回归系数。实际上, 最小绝对偏差法估计的值就是回归分位数在f = o 5 时的一个特例。因此,我们又称最 小绝对值法为中位数回归法( m e d i a nr e g r e s s i o n ) 。最小绝对值法适用于各类残差的分布 类型,特别适合于具有重尾分布或是在中位数附近有较大密度的分布( 女n c a u c h y 分布, l a p l a c e 分布) ,是一种较最d x - - 乘法更稳健,有效的回归分析方法。对于上述式( 1 1 ) 计量回归方程,传统上采用的是普通最小二乘法( o l s ) ,其回归结果的含义是在给定自 变量的条件下对因变量条件期望值的估计。这种回归方法隐含的假设是在不同分布点 上自变量对因变量的效果都是相同的,因此,回归系数被假定在整个y 的条件分布中 是不变的,这样就限制了对y 分布中一些重要特征的考察。分位数回归则是一种更一 般化的估计方法,其目的是观察分布中不同分位点上自变量的不同作用。 2 2 百分位数回归模型的拟合优度和置信区间 2 2 1 百分位数回归模型拟合优度的计算 与最d x - - 乘法估计模型时运用拟合优度作为评价指标的想法相类似,k o e n k e r r o g e ra n dj o s 6a f m a c h a d o ( 1 9 9 9 ) t 3 1 】提出了分位点回归意义上的拟合优度。它可用于 对模型的评价和显著性检验。 假设待估计的模型为: y f = x l l 屈+ 工;2 殷+ 孝 其中,屈:( p - q ) 1 ,2 :q 1 。 使用分位点回归法估计上述模型,得到: g ( f x ) = x :屈o ) + x :g ) 现在要检验假设:h 。:p ) - 0 。 构造检验统计量,记 矿( ) :窆岛( z 度一y ,胛) i = 1 8 第二章百分位数回归方法的理论基础 多p ) = 震礁a & 一夕) 旷( f ) 2 p i i l i e r e n - q i 岛( 乃一z ,届) = ! 显然有矿( f ) 矿( r ) ,记 尺:= 等小等艇( 0 ,1 ) 则o s 1 。越大,模型估计越好;越小,模型估计越差。 ( 2 7 ) 式的修正拟合优度是: 定- l - 是( 1 一r :) ( 2 - 8 ) 式子( 2 8 ) 中n 表示样本容量,k 表示参数个数。 分位点回归方法从1 9 7 8 年提出来后,无论从理论和实际应用方面都得到了快速的 发展。在运用分位点回归方法方面,人们已经平行地发展了各种非经典模型,如归并 因变量模型( c e n s o r i n g ) ,样本选择模型,二元离散选择模型( b i n a r yr e s p o n s e ) ,持续期 因变量数据模型( d u r a t i o n ) ,面板数据模型,时间序列模型,非线性模型,非参数模型 以及内生性问题等。对于非线性问题,数据建模时,常常碰到非线性问题,数据描述 图呈非直线的曲线形式,对此,我们可以将非线性问题转化为线性问题。若数据资料 的散点图曲线走势大致为y = a p 缸,则作变换:夕= l n y ,a = l n a ,于是要作的回归模 型即变为y = a + b x ,此时再应用上述线性方法得到系数a 与6 ,然后便可得到原方 程y = 口e 妇。如y = a + b l n x ,h a y = 口+ 如,l n y = 口+ 6l n x 等等,具体做法是首先进 行线性化处理,求得回归方程,然后再反推得到曲线方程。对于非线性问题的异常值, 通过上述思想把数据等效线性后,采用线性问题的稳健回归方法处理即可。 2 2 2 百分位数回归模型参数的可信区间 系数的协方差矩阵可用k o e n k e r & b a s s e t t ( 1 9 8 2 ) 3 6 1 提出的方法 c o v ( p ) - - r 2 - 1 r l r 2 一 这里,r 。= x 。渺x ,形是对角矩阵,其对角元素为l h 厶枞( 0 ) ;尺2 是设计矩阵 x x ;r j 为残差。 伪r2 定义为: 9 电子科技人学硕士学位论文 群斗蒜嚣躲 参数的可信区间可近似用t 分布原理方法。 陈健美、陈峰【3 7 】介绍了百分位数f 约b o o t s t r a px e 间估计。它是以原始数据为基础的模 拟抽样统计推断法,其基本思想是:在原始数据的范围内作有放回的再抽样,样本含量仍 为n ,原始数据中每个观察单位每次被抽到的概率相等,为1 n ,所得样本称为b o o t s t r a p 样 本。于是可得到参数口的估计值9 【6 j ,这样重复若干次,记为召。设b = 1 0 0 0 ,就得到该参 数的1 0 0 0 个估计值。当日( 6 j 的频数分布近似正态分布时,以其均数作为点估计,用正态原理 估计可信区间;当臼的频数分布为偏态时,以其中位数作为点估计,以上、下2 5 分位数 作为其9 5 可信限。b o o t s t r a p 法估计的误差是多少? b o o t s t r a p 统计量的抽样误差包含了两 个部分,一是原样本( 经验分布) 的抽样误差s f ;二是b o o t s t r a p 再抽样误差s 2 。当b 充分 大时,b o o t s t r a p 再抽样误差就趋于消失,b o o t s t r a p 估计的误差就接近抽样误差。召要取多 大? 据e f r o n 提出,b 的大小与原分布有关,一般取5 0 - - - 2 0 0 之间即可,但若原数据的变异较 大,则b 的取值相应增加。 2 3 百分位数回归估计量的性质 2 3 1 百分位数估计具有强相合性 性质1 当样本为n a 序列时,线性模型中回归分位数的估计具有强相合性。 为此,先介绍两个定义: 定义1 称随机变量x 。,x :,一,x 。是n a 的,如果对于集合 1 ,2 ,n ) 的任何两 个不相交的非空子集么,与4 ,都有 c o v ( 石( 五,i 4 ) ,五( ,j 4 ) ) o 其中z 与厶是任何两个使得协方差存在且对每个变元均非降( 或者同时对每个变元均 非升) 的函数,称随机变量序列x ;,j n 为m 序列。如果对于任何自然数n 2 都 是n a 序列的。 定义2 设线性系统模型为 y = z 屁+ z e ( 2 - 9 ) 其中x 为p 维已知向量,成为未知p 维回归系数,e 为l f f 不可观察的随机变量,则称 p ( u ) = p o + q ( u ) l o 第二章百分位数回归方法的理论基础 为( 2 9 ) 的回归分位数。此处q ( “) 表示e 的u 分位数。 对于模型( 2 9 ) ,在给定足尹的设计点列x 。,x :,一,工。后,设对应的y 观察值为 y ly :,一,y 。,则得到数据线性模型: 奶= 毫反+ x l r o e f ,f = 1 , 2 ,一,n 于是,可以构造q ) 的一个估计尾0 ) ,使其满i f = ( 2 - 9 ) : ) - , p u 【y ,- 薯矾) ) :磐丢见( 一t ) ( 2 - 1 0 ) j z l ,l o i 于是可以得到如下结论: 定理1 设o 0 ( 2 ) 记瓯= 毛z ,存在自然数m ,当月 聊时,s 。 o ,且 l i m d n 2 1 2 | o gn = 0 n - - + o o 其中彰= m ,虫a 如x ,又设o t l z 6 + ,则由( 2 - 1 0 ) 式所确定的尾强收敛于 ) 。 具体证明参见文献【2 3 ,3 8 】 性质2 在误差为平稳强多混合随机序列的条件下,线性模型中的回归分数的估计具有 强相合性。 定理2 设o ( 材 o ; ( i i ) 记瓯= n 五z ,存在自然数m ,当刀 m 时,s 。 o ,且记d := m s ,a s ,x x f l ;1 五有 三f 朋刃彬l o g n 0 x - 设0 a x l r o 6 o 是窗宽。我们采用极大经验 似然的方法来获得权重向量,即在约束( 2 1 1 ) 下使得经验似然n 2 。p ,g ) 取极大值。 用l a g r a n g o 乘子法可获得p ,b ) 为b ( x ) = 刀q l + a ( z x ) 毛( x 一墨) ,其中的力是数 据肛,z ) :1s f 门) 和x 的函数,它满足 喜苦掣羝= 。鲁l + 旯7 。( 墨一工) 蚝( x 一置) 。 则】,在给定的x = x 下的条件分布函数户( y x ) 关于y 单调,】,的条件分位数的局部经 验似然w n w 估计为 易( x ) k ( x z ) ,( r y ) f ( y lx ) = 立l f p , ( x ) k h ( z 一置) 不难看出o 户( y x ) 1 并且户( y x ) 关于y 单调,y 的条件分位数的局部经验似 然w n w 估计量包( 刁定义为 q p ( x ) = 甜 y r :p ( y x ) 2 p 专声。1 ( p x ) 以下给出证明: 记= 如2 轴,v o = l z e ( , , ) a u ,q = 扛:g g 卜o ) ,且g b ) 存在。我们给出如下条件: 丑 对z q o f o , z ) 1 ,f ( y , o ,对z 有二阶连续导数,( 工) 在连续且 1 2 第二章百分位数同归方法的理论基础 b i 对x q ,o f ( y x ) l ,r ( y x ) ,对x 有二阶连续导数,( x ) 在q p 连续且 为正。 b :k g ) 为具有紧支撑的密度函数,且对称有界。 忍当万一o o 时,有h 专o ,n h 2 专o o ,n h 5 寸0 注:b 2 中k g ) 紧支撑的条件是非本质的,只要尾部趋于。足够快即可,如标准正态分布密度。马中的 ,z 2 专o o 是保证夕x ) 是厂x ) 的相合估计,n l ? 寸。是保证磊p x ) 一f ( y x ) ) 的渐进 偏差为o 。 则有如下结论: ( 1 ) 如果条件局一岛满足,当,l 寸o o 时,有 届( 户( y x ) 一f ( y x ) ) 3 ( o ,仃2 ( y x ) ) 其中盯2 工) = v 。f ( y l x ) 1 一,x ) k g ”。 ( 2 ) 如果条件b l 一马满足,当刀j0 0 时,有 佩( 亘p ( x ) 一q p ( x ) ) 3 ( o o - 2 ( z ) ) 其中( x ) = 旷q p ( x ) z ) ( 厂2 ( g ,( x ) 工) ) 一= v o p ( 1 一p ) ( 厂2 ( g p ( 石) x ) g ( x ) ) 。1 结论的证明可以参见文献 4 0 ,4 1 。 可以用条件分位数g ,( x ) 进行同方差检验方澍删,下面给出证明。 对于非参数回归模型式( 1 1 ) 有下面等式成立 f ( y x ) = 忍 帮卜叫小卟k ( p ) ( 2 - 1 2 ) 其中名( ) 表示孝的分布函数,睡表示孝的p 一分位数。如果零假设风:盯( x ) :c ( c 为常数) 成立,由( 2 1 2 ) ,对五乇和0 岛岛 l ,可知下面等式成立 g p ( 五) 一郇( 而) = “( 五) 一“( 恐) ,g 功( x ) - q 愚( x ) = c ( 鲒( p 。) - q f ( p :) ) 帆m 陪掣h y = 乓陪掣 所以,由( 2 1 3 ) 知,当五,而为定值时,晖b ) 和g p ( 恐) 平行( 上下位移) f ( y x 1 ) i 珩( 左右位移) ;当月,岛为定值时,q p 。( x ) y f l l q p :( 工) 平行 1 3 ( 2 - 1 3 ) ,f ( y x 1 ) y f l ( 上下位移) 。 电子科技大学硕士学位论文 t h e 0 d n - 酬嗣n b 帅 j n 瞄l o r 珥 图2 2 条件分布函数图象图2 - 3 条件分位数图象 实线为x - - 0 0 2 ,虚线为x = 0 1 2 下的图象 以上两个图象给出了”( x ) = x ,仃b ) = o 1 ,石- - 0 0 2 和x - - 0 1 2 时】,的条件分布函数 和条件分位数图象。直观上可以用图象是否为平行曲线来判断模型是否为同方差。如 果条件分布函数,( j ,x ) 或条件分位数g 。( x ) 对于不同的x 值,函数的图象相互平行, 则表明方差仃( ) 为常数,即回归模型为同方差模型。同样由( 2 4 ) ,对于不同的p 值, 条件分位数q 。( 石) 的图象也相互平行。 2 4 百分位数回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论