投资组合优化模型_第1页
投资组合优化模型_第2页
投资组合优化模型_第3页
投资组合优化模型_第4页
投资组合优化模型_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、投资组合优化模型摘要长期以来,金融资产固有的风险和由此产生的收益一直是金融投资界十分关注的课题。随着经济的快速发展,市场上的新兴资产也是不断涌现,越来越多的企业、机构和个人等都用一部分资金用来投资,而投资方式的多样性决定了人们在投资过程中投资组合的多样性。而每一项投资在有其收益效果的同时也伴随着风险性,所以不同的投资组合方式将带来不同的效果。对于不同类型的投资者必然有不同的要求,从而适合不同的投资方式,所以意在建立在不同投资者的不同要求下应采用哪种投资方式的模型,使投资者能做出正确的选择。本文研究的主要是在没有风险的条件下,找出投资各类资产与收益之间的函数关系,合理规划有限的资金进行投资,以获

2、得最高的回报。对于问题一,根据收益表中所给的数据,我们首先建立二元线性回归模型来模拟收益U与x,y之间的关系,对于模型中的各项自变量前的系数估计量,利用spss软件来进行逐步回归分析。发现DW值为0.395,所以原模型的随机误差项违背了互相独立的基本假设的情况,即存在自相关性。为了处理数据间的自相关问题,运用了迭代法,先通过Excel进行数据的处理和修正,达到预定精度时停止迭代,再一次用spss软件来进行检验,发现DW值变为2.572,此时DW值落入无自相关性区域。在进一步对模型进行了改进后,拟合度为进行了残差分析和检验预测,这样预测出的结果更加准确、有效,希望能为投资者实践提供某种程度的科学

3、依据。对于问题二,根据问题一建立的模型和问题二中所给出的条件,确定目标函数,进行线性规划,用MATLAB软件来求得在资金固定的情况下,选择哪种投资方式能使达到利益最大化。最后,对模型的优缺点进行评价,指出了总收益与购买A 类资产x份数和B类资产y份数之间的关系模型的优点与不足之处,并对模型做出了适度的推广和优化。关键字:经济效益 回归模型 自相关 迭代法 线性规划 有效投资方法一、问题重述某金融机构选定了A,B两种投资品种,购买A类资产x份和B类资产y份的投资收益是U,经分析测算有如下收益表:UAB3.7255.4386.64117.451410.261710.7122512.5203513.

4、2302514.4402814.1473217.610046181204016.61254019.42405019.310024018.78025019.61301502117026022236270请解决以下问题:(1)确定U与x,y的关系;(2)若A的价格是每份120元,B的价格是每份80元,现有资金960万元,选定有效的投资方案以使收益最大。二、问题分析对于问题一,根据实际中投资学的相关原理和有关常识,我们知道在同等无风险的条件下,购买A类资产和购买B资产各自都会带来收益,因此,一般先确定U与x、y之间的关系,有利于我们在决定投资时,如何分配对A,B两类资产的投入资金的比重,这也是我们建

5、立模型首先要解决的难点。观察所给数据之间的大致关系来看,我们首先考虑建立回归模型,在进行数据分析时,不可能通过几个简单的假设就监理处了一个完美的数学模型,这就需要对现有的数据进行较为有效的筛选,在此次建模过程中我们一次进行了进行显著性分析,进行逐个剔除,消除误差项之间的自相关性,进一步优化后,得到最好的模型,再对结果分别进行预测和分析。对于问题二,这是一个如何配置资源的问题,在已知目标函数的前提下,用有限的资金来得到最大的利益。可以运用线性规划的相关知识来解决,列出所有已知条件,即约束条件,并利用MATlAB软件来进行求解,得到最优解,最后进行检验。三、模型假设1投资者总是追求较高的收益,即投

6、资者都是符合经济学中的“理性人”的假设。2. 在短时期内所给出的平均收益率不变,即保证所得数据在一定时期内的有效性。3. 假设题设中给的参数是准确值没有偏差。4. 存在无风险资产,即本文对A、B两类资产的投资都为无风险投资。5. 每种投资是否收益是相互独立的。6. 对收益率和风险的预测值是可信的四、符号说明U收益x,购买A类资产的份数y,购买B类资产的份数0、1、2分别为回归模型的常数项,自变量x、y前面的系数i第i个样本回归模型的随机误差项Ut第t个收益的回归估计xt第t个购买A类资产的样本份数yt第t个购买B类资产的样本份数五、理论背景1.多元线性回归一元线性回归是一个主要影响因素作为自变

7、量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。设y为因变量X1,X2Xk为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:Yi=0+1X1i+2X2i+kXki+i i=1,2,n其中 k为解释变量的数目,j(j=1,2,k)称为回归系数(regression coefficient)。上式也被称为总体回归函数的随机表达式。它的非随机表达式为E(YX1i,X2i,Xki,)=0+1X

8、1i+2X2i+kXkij也被称为偏回归系数(partial regression coefficient)建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之因的相关程度;(4)自变量应具有完整的统计数据,其预测值容易确定。2、自相关的概念 如果模型的随机误差项违背了互相独立的基本假设的情况,称为自相关性。对于模型Yi =0+1X1i+2X2

9、i+kXki+i i=1,2,n随机误差项互不相关的基本假设表现为:Cov(i,j)=0 ij,i,j=1,2,n如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了自相关性。在其他假设仍旧成立的条件下,序列相关即意味着E(i,j)!=03、自相关性的后果(1)参数估计量非有效(2)变量的显著性检验失去意义(3)模型的预测失效4、自相关性的检验杜宾-瓦森(Durbin-Watson)检验法该方法的假定条件是: (1)解释变量 X非随机; (2)随机误差项mi为一阶自回归形式: mi=rmi-1+ei (3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列

10、形式: Yi=b0+b1X1i+bkXki+gYi-1+mi (4)回归含有截距项;(5)没有缺失数据。 D.W.统计量5、具有自相关性模型的估计(1)广义最小二乘法 (2)一阶差分法(3)广义差分法(4)随机误差项相关系数r的估计科克伦-奥科特迭代法 首先,采用OLS法估计原模型 Yi=b0+b1Xi+mi 得到的随机误差项的“近似估计值”,并以之作为观测值采用OLS法估计下式 mi=r1mi-1+r2mi-2+rLmi-L+ei 得到r1,r2,rk,作为随机误差项的相关系数r1,r2,rk的第一次估计值。其次,将上述r1,r2,rk,带入以差分模型Yi-1Yi-1-iYi-1=0(1-1

11、-i)+i(Xi-1Xi-1-iXi-1)+i i=1,2,,n 在此,将0,1代回原模型,计算出原模型随机误差项的新的“近似估计值”,并以之作为模型i=1i-1+2i-2+ki-k+的样本观测值,采用OLS法估计该方程,得到r1,r2,rk作为相关系数r1,r2,rk的第二次估计值。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次r1,r2,rk的估计值之小于这一精度时,迭代终止。杜宾(Durbin)两步法该方法仍是先估计r1,r2,rk,再对差分模型进行估计。第一步,变换差分模型为下列形式:Yi=1Yi-1+lYi-l+0(1-1-k)+1(Xi-1Xi-1-kXi

12、-k)+i i=1,2,,n采用OLS法估计该方程,得到各Yj(j=i-1,i-2,,i-k)前的系数r1,r2,rk的估计值1,2,k。第二步,将估计的r1,r2,rk, 代入差分模型采用OLS法估计,得0(1-1-k),1的估计量,记为*0,*1。六、模型建立问题一:假定收益U与x、y之间存在线性关系,则可建立二元线性回归模型U=0+1*x+2*y+ 式中,U表示总的收益;x表示购买A类资产的份数;y表示购买类资产的份数;、分别表示回归方程的常数项、x和y前面的系数;表示随机误差项。问题二:由上一问得到的模型U=9.042+0.047x+0.19y后,求目标函数的最大值建立约束条件:120

13、x+80y9600000X0 Y0 式中,x、y表示的是整数。七、模型求解及优化1.问题一(1)根据数据资料定义变量U(收益)、x(A类资产的份数)、y(B类资产的份数),再将全部数据输入spss界面,建立数据文件。(2)选择U为因变量,以x、y为自变量,进行逐步回归;在Statistics对话框中选择Estimate、Model fit、Discriptives、Durbin-Watson;选择Plots对话框的残差直方图、残差正态概率图。并输出以ZRESID为X轴,以DPENDNT为Y轴的散点图;在Save对话框里选择保存未标准预测值、未标准预测值残差、标准预测值、标准预测值残差;Opti

14、ons对话框选项选择默认选项,各选项确认以后,交系统运行。(3)结果及分析描述统计表如下:Descriptive Statistics MeanStd. DeviationNU14.2315795.603377219x77.36842177.147917519y81.36842197.210659319表中显示各个变量的全部观测量的Mean(均值)、Std.Deviation(标准差)和观测量总数N。U的均值和标准差分别为14.231579、5.6033772,x的均值和标准差分别为77.368421、77.1479175,y的均值和标准差分别为81.368421、97.2106593。(4)

15、相关系数矩阵如下:Correlations UxyPearson CorrelationU1.000.852.725 x.8521.000.614 y.725.6141.000Sig. (1-tailed)U.000.000 x.000.003 y.000.003.NU191919 x191919 y191919表中显示了三个自变量两两间的Pearson相关系数,以及关于相关系数关系等于零的假设的单尾显著性检验概率。从表中看到因变量U(收益)与自变量x(A类资产的份数)、y(B类资产的份数)之间相关系数一次为0.852、0.725,反应它们之间有显著的相关关系,而可以看出在同等条件下,购买A类

16、资产相比购买B类资产的收益更大。(5)回归系数表如下:Coefficients(a) ModelUnstandardized CoefficientsStandardized CoefficientstSig. BStd. ErrorBetaBStd. Error1(Constant)9.445.995 9.492.000 x.062.009.8526.704.0002(Constant)9.042.912 9.911.000 x.047.011.6534.511.000 y.019.008.3252.244.039a Dependent Variable: U据表中数据费标准化系数B的数值可

17、以知道,逐步回归过程中先后建立的两个回归模型分别是:模型1:U=9.445+0.062*x模型2:U=9.042+0.047*x+0.019*y即0=9.042, 1=0.047, 2=0.019Std.Error(标准误)列显示的是各系数的估计标准误差。从模型中可以看到,购买类资产和购买类资产对收益都起到正影响,因为两个自变量前面的系数都为正数,这与假设分析一致,此投资为无风险投资。(6)回归模型概述表如下:Model Summary(c)ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.852(a

18、).726.7093.0207048 2.890(b).791.7652.7154146.395a Predictors: (Constant), xb Predictors: (Constant), x, yc Dependent Variable: U回归模型概述表中给出了第一个模型中因变量U与自变量x之间的相关系数R=0.852,说明变量U与x之间具有显著的线性关系。第二个模型中因变量U与x、之间的复相关系数R=0.890,反映了变量U与x、y之间具有高度线性关系。 对于第二个模型给出了杜宾-瓦特森检验DW=0.395,此时的dl=1.08,du=1.53,因为0DWdl,所以误差项1、

19、2n间存在正自相关。由于回归模型存在序列自相关性,在此,我们用迭代法来处理。 Ut=k0+k1xt+k2yt et=*et-1+ut令Ut=Ut-*Ut-1 xt=xt-*xt-1 yt=yt-*yt-1其中,上式中的自相关系数p是未知的,可以由DW值做出估计p=1-1/2*DW,计算后得出p的估计值为0.8025。于是原式变为Ut=0+1*xt+2*yt+ut(7)上式模型有独立随机误差项,它满足线性回归模型的基本假设,用Excel做出有变换后的数据,并录入spss界面进行检验由变换后的数据得出的回归模型概述表如下:Model Summary(c)ModelRR SquareAdjusted

20、 R SquareStd. Error of the EstimateDurbin-Watson1.635(a).403.3661.0569473 2.772(b).596.542.89757832.572a Predictors: (Constant), xtb Predictors: (Constant), xt, ytc Dependent Variable: Ut概述表中给出了第二个模型给出了杜宾-瓦特森检验DW=2.572,此时的dl=1.08,du=1.53,因为dlDW4-du,所以说明误差项1、2n间存在正自相关已经消除。同时,我们可以观察到修改后的回归模型的残差值也基本在水平

21、线y=0附近随机分布 在此时自相关回归中,回归预测值Ut不是用k0+k1*xt+k2*yt计算,而是用Ut= k0+*Ut-1+k1(xt-*xt-1)+ k2*(yt-*yt-1)在上式为我们最终建立的模型,式中我们取收益表中的最后一组数据作为xt-1和yt-1,即Ut= k0+*Ut-1+k1(xt-*xt-1)+ k2*(yt-*yt-1) =9.042+0.8025*22+0.047*(xt-0.8025*236)+0.019*(yt-0.8025*270) =13.678845+0.047*xt+0.019*ytt统计量值和t分布的双侧显著性概率Sig.皆远小于0.05,可以认为回归

22、系数是显著的。2.问题二:根据问题一得到的模型和给出的已知条件,可以得到目标函数: max U=13.678845+0.047*x+0.019*y约束条件: 120x+80y=0 y=0用MATLAB软件来求解线性规划的命令如下:c=-0.047 -0.019;A=120 80;b=9600000;Aeq=;beq=;lb=0;0;vb=;x,fval=linprog(c,A,b,Aeq,beq,lb,vb)结果:x = 1.0e+04 * 8.0000 0.0000fval = -3.7600e+03并运用MATLAB还可以求出该模型的图像 syms x y Ux=0:2:300;y=0:2

23、:300;U=13.678845+0.047*x+0.019*y;x,y=meshgrid(x,y);surf(x,y,U)可得在A的价格是每份120元,B的价格是每份80元,资金960万元的条件下,使收益最大时,应该将所有的资金960万元都用来买A类资产80000份,这是预计的最大收益是3773.679。八、模型检验模型检验主要是针对问题一所提出的模型进行检验。对回归系数的显著性检验,我们用的是t检验。t检验:在多元线性回归中,回归方程显著并不意味着美国自变量对U的影响显著,所以需要对每个变量进行显著性检验。如果某个自变量xj对作用不显著,那么在回归模型中,它的系数j就取值为零。因此,检验变

24、量是否显著,等价于检验假设H0j:j=0, j=1,2,p据此可以构造t统计量tj=cjj其中是回归标准差。当tjt/2 时,拒绝元假设H0j:j=0,认为j显著不为零,自变量xj对因变量y的线性效果显著;当tjt/2时,接受原假设H0j:j=0,认为j为零,自变量xj对因变量y的线性效果不显著。下图是回归系数表Coefficients(a) ModelUnstandardized CoefficientsStandardized CoefficientstSig. BStd. ErrorBetaBStd. Error1(Constant)9.445.995 9.492.000 x.062.0

25、09.8526.704.0002(Constant)9.042.912 9.911.000 x.047.011.6534.511.000 y.019.008.3252.244.039a Dependent Variable: U图中的Sig即显著性P值,由x的P0.000,由此可知此自变量x显著,y的P0.039,自变量y也显著。 由spss软件做出的残差统计表如下: Residuals Statistics(a) MinimumMaximumMeanStd. DeviationNPredicted Value2.9406046.0302493.7421671.024723018Std. Pr

26、edicted Value-.7822.233.0001.00018Standard Error of Predicted Value.227.761.335.15318Adjusted Predicted Value1.3340616.1220753.6650451.209254318Residual-1.40822211.8736107.0000000.843128018Std. Residual-1.5692.087.000.93918Stud. Residual-1.6212.185.0281.03218Deleted Residual-1.50406832.3974390.07712

27、201.091344218Stud. Deleted Residual-1.7252.556.0531.09618Mahal. Distance.13911.2801.8892.97718Cooks Distance.0001.710.132.39618Centered Leverage Value.008.664.111.17518a Dependent Variable: Ut 本表显示预测值(Predicted Value)、残差(Std. Predicted Value)、标准化预测值(Standard Error of Predicted Value)、标准化残差的最小值(Minim

28、um)、最大值(Maximum)、均值(Mean)、标准差(Std. Deviation)以及样本容量(N)。根据概率的3-原则,上图中标准化残差的绝对值的最大值为1.5693,说明样本数据中没有奇异数据,模型具有有效性。残差分布直方图和观测量累计概率P-P图如下:回归分析中,总是假设残差服从正态分布,残差分布直方图和观测量累计概率P-P图就是根据样本数据的计算结果显示残差分布的实际状况,然后对残差分布是否为正态的假设做出检验。从回归残差的直方图与附在图上的正态分布曲线相比较,可以认为残差不是很明显的服从正态分布。尽管这样,也不能盲目地否定残差服从正态分布的假设,因为我们用来进行的样本量太小,

29、样本容量仅为19.观测量累计概率图,也是用来比较残差分布于正态分布差异的图形。基于以上认识,从上图的散点分布状况来看,19个点大致散布于斜线附近,因此可以认为此次分布基本上是正态的。输出的图形中还有一个因变量的回归标准化残差图,如下所示:对于问题二最优解的检验由于x,y是正整数,且有约束条件120x+80y9600000,可知(x,y)的可行域为图中的三角形区域中的整数点集,又由模型一代入最后一组数据而得到的函数 U=13.678845+0.047*x+0.019*y,经变化可得到 y=(-0.047/0.019)*x+(13.678845-U)/0.019 故当上式的截距取到最小值时,U为最大,此时的x与y值便是最优投资组合。用MATLAB画出的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论