(完整版)多元统计分析课程设计终稿_第1页
(完整版)多元统计分析课程设计终稿_第2页
(完整版)多元统计分析课程设计终稿_第3页
(完整版)多元统计分析课程设计终稿_第4页
(完整版)多元统计分析课程设计终稿_第5页
免费预览已结束,剩余16页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用多元统计分析课程实验报告实验名称:利用回归法分析山东省农村居民收入的消费分配学生班级:统计学院统计 09010901 班学生姓名:王冬冬、王鹏、王莉、王璐指导老师:张艳丽完成日期:2011-12-102011-12-10一、实验内容本文通过分析研究更深一步了解山东省农村居民生活水平。实验中充分利用了回归分析、聚类分析等多种分析手段。先通过收入支出的时间序列模型的分析给出了从 2000 到 2009年的农村收入支出呈现的增长趋势,以及城乡之间的对比;然后利用聚类分析说明了收入支出的地区差异。然后利用回归分析建立了山东省农村居民收入与支出之间的模型,试图寻找出农村居民收入的消费分配现状,即单位

2、收入的支出方向问题。二、实验目的通过本实验主要想达到三个目的:1、利用山东省统计年鉴中有关农村居民收入支出的数据,结合多元统计方法,熟练掌握聚类分析和回归分析的原理及其基本步骤;2、希望通过本次实验充分掌握和运用多元统计分析的统计方法,能够利用基本的统计软件如 Eviews、Spss 等软件处理分析数据,并对结果作出合理的解释。3、了解近几年来山东省农村居民收入支出的基本状况,其中包括城乡差距问题和居民收入的消费分配问题,进而掌握山东省农村居民的基本生活状况,为我省经济的长远发展提供依据。三、实验方法背景和原理1.聚类分析的背景和原理1.聚类分析的定义聚类分析是统计学中研究“物以类聚”问题的多

3、元统计分析方法。聚类分析又称群分析,它是研究对样品或指标进行分类的一种多元统计方法。所谓的“类”,通俗地说就是相似元素的集合。2.聚类的方法分类聚类分析的内容十分丰富,按其聚类的方法可分为以下几种:系统聚类法、调优法、最优分割法、模糊聚类法、图论聚类法、聚类预报法。本文中应用的是系统聚类法:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相近性测度,这一过程一直继续直到所有对象归为一类为止。并类的过程可用一张谱系聚类图描述。3.系统聚类法的基本步骤(1)计算 n 个样品两两间的距离,得样品间的距离矩阵 D(0)。类与类之间的距离本文应用的是类平均法。所谓类平

4、均法就是:两类样品两两之间平方距离的平均作为类之间的距离,O1O即:Dpqdj米用这种类间距离的聚类方法,称为类平均法。npnqiGp,jGq(2).初始(第一步:i=1)n 个样本各自构成一类,类的个数 k=n,第 t 类 Gn)。此时类间的距离就是样品间的距离(即DD(0)。(3)对步骤 i 得到的距离矩阵 D(i1),合并类间距离最小的两类为一新类。X(t)(t=1,2,此时类的总个数k 减少 1 类,即 k=n-i+1.(4)计算新类与其他类的距离,得新的距离矩阵 D(0)。若合并后类的总个数 k 扔大于 1,重新步骤(3)和(4);直到类的总个数为 1 时转到步骤(5)。(5)画谱系

5、聚类图;(6)决定总类的个数及各类的成员。皿、回归分析的背景和原理1.回归分析的基本原理回归分析是研究两个或多个变量之间关系的统计分析方法,在实际问题中,因变量 y 往往不是只与一个变量有关,而是和多个变量XI,X2,L,xp有关,设y01X12X2LpXp(3.1)其中0,1,L,p是 p+1 个未知参数,0,称为回归常数,1,L,p称为回归系数,y 为被解释变量(因变量),而X1,X2,LXp是 p 个可以精确测量并可控制的一般变量,称为解释变量(自变量),是随机误差.称E(y)=01X12X2LpXp(3.2)为理论回归方程。对一个实际问题我们获的n 组观测数据(XiXaLxip;y,)

6、,i1,2,L,n,则线性回归模y01X112X12LpX1p1y201X212X22LpX2p2型(3.2)PJ表小为(3.3)Myp0凶12Xn2LpXnpp写成矩阵形式为yX(3.4)*吊011X11Xpy212OM,,MMM1Xn1Xnpynpn最小二乘原理就是求一个参数向量的估计使得回归的残差平方和函数 SSE()取得最小值SSE()(YX)(YX)由微分求极值法及矩阵微商有:得到正规方程组XXXY若XX非退化,则得的最小二乘解=(XX)1XY2的估计二至 Mnp12.模型的基本假定及检验为了方便进行模型的参数估计,做如下基本假定:1.解释变量是确定性变量,不是随机变量.并且要求笠E

7、(_J12XY2XXrank(X)=p+1n,它表明设计矩阵是满秩的.E(i)0.i1,2,L,n2.对随机误差项假定2,ij(i,j1,2,L,n)cov(i,j)0,ij这个假定称为高斯-马尔科夫条件。,C2、.八,3.正态分布的假定为iN(0,),i1,2,L,n1,2,L,n相互独立对于多元线性回归的矩阵形式这个条件可以表示为2、N(0,、)由此可以得到YN(X,2|n),其中In是单位阵。)为了验证是否能做到基本假定,所以需要做回归模型的显著性检验:1F 检验对多元回归方程的显著性检验就是要看自变量X!,X2,LXp从整体上对随机变量 y 是否构成 F 统计量相伴概率值间存在显著的线

8、性关系。2t 检验在多元回归中,回归方程显著并不意味着每个自变量对因变量的影响都显著,因此需要对每个系数进行显著性检验.故提出原假设H:i0(i1,2,L,p)由yNp1(,2(XX)1),记(XX)J(Cij),(i,j=0,1,2,L,p)则一22.E(i)i,var(i)Cii,iN(g),(i0,1,2,L,p)因此构造 t 统计重为%产,其中.Cii是标准回归差。在原假设成立时,统计量ti服从自由度为 n-p-1 的 t 分布。对于给定的显著性水平,查处双侧检验的临界值t/2。当tt/2(np1),或者 t 值所对应的相伴概率值p,就拒绝原假设,认为该系数对应的自变量与因变量之间存在

9、显著的线性关系。否则,就接受有明显的影响,故提出原假设H。:12LP0并且称MSR2的估计量,立时才会是的F 分布。SSR/PSSE/(np1)SSE-SSE-为均方回归和均方误差,他们都是误差项pnp1但两者的性质有差别。MSR 总是2得无偏有效估计量,而 MSFR 当原假设成2的有效估计量,则将趋于无穷。假设成立时统计量服从自由度(p,n-p-1)SSR,MSEi的方差p。若FF或pKufliAU*AA*-l4HiMflW(a2)a.DependentVariable:工资性纯收入表 22-2(b)家庭经营性纯收入与支出指标的回归分析结果CoefficientsaModelUnstanda

10、rdizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta8(Constant)2123.285525.7644.038.001交通和通讯消费2.9981.012.6082.962.010a.DependentVariable:家庭经营纯收入收益,即企业在销售货物、提供劳务以及让渡资产使用权等日常活动中所产生的收入,通常表现为现金流入、其他资产的增加或负债的减少。由表可知 P 值小于 0.05,认为家庭经营性收入与交通和通讯消费线性关系显著;由图可以很好看出他们之间成正相关。标准化后的回归方程 Y2(经营性收入)=0.608*x6

11、(交通通讯),增加一单位的交通通讯消费需要 0.608 个单位的经营性收入;增加一单位的经营性收入用于 0.608 个单位的交通通讯消费;经营性收入不是农民普遍的收入方式,因为需要一定的成本,并且收入高。他们的生活条件也相应较好,从而会增加享受消费,如度假旅游,购买手机等通讯设备。表 22-2(c)财产性纯收入与支出指标的回归分析结果CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta8(Constant)-15.13657.584-.263.796医疗保健消费.913.2

12、04.7574.481.000a.DependentVariable:财产纯收入(b)经营性收入(OperationalIncome)是指纳税人通过经常性的生产经营活动而取得的(c)财产性收入,指通过资本、技术和管理等要素与社会生产和生活活动所产生的收入。即家庭拥有的动产(如银行存款、有价证券)和不动产(如房屋、车辆、收藏品等)所获得的收入。包括出让财产使用权所获得的利息、租金、专利收入;财产营运所获得的红利收入、财产增值收益等。由表可知检验的 P 值为 0.000 认为财产性收入与医疗保健消费线性相关关系显著;同样图也能看出之间呈正相关。由表可以写出其标准化后的回归方程为 Y3(财产性纯收入

13、)=0.757*x5(医疗保健消费),可以这样解释,一单位的财产性收入的百分之 75.7 用于医疗保健消费,说明财产性收入的大部分用于医疗保健支出;同样支出一单位的医疗保健消费需要从财产性纯收入中支付 0.757 个单位。通过财产性收入的定义范围可以理解两者之间的关系,对于家庭比较富裕的农民来说,他们会有剩余的钱存入银行获得利息收入和出租房屋车辆等的收入。由于医疗保健不属于必须消费,所以在生活比较宽裕的情况下此种消费会随之提高,这一回归方程很符合现实情况。表 22-2(d)转移性纯收入与支出指标的回归分析结果CoefficientsaModelUnstandardizedCoefficient

14、sStandardizedCoefficientstSig.BStd.ErrorBeta8(Constant)145.81446.2213.155.007医疗保健消费.369.164.5032.256.039a.DependentVariable:转移性纯收入(d)转移性收入就是指国家、单位、社会团体对居民家庭的各种转移支付和居民家庭间的收入转移。包括政府对个人收入转移的离退休金、失业救济金、赔偿等;单位对个人收入转移的辞退金、保险索赔、住房公积金、家庭间的赠送和赡养等。由表可知检验的 P 值小于 0.05,认为转移性收入与医疗保健之间线性相关,通过图也可以看出之间存在正相关。标准化后的回归方

15、程为 Y4(转移性收入)=0.503*x5(医疗保健),这个很好解释了现实情况,很符合现实状况,转移性收入的获得者大都是退休老人,失业或者有疾病生理缺陷的群体,他们对身体健康相对重视,从而对医疗保健消费比较重视。综上,通过山东省农村居民收入的消费分配的回归分析,得出:山东省农村居民的收入主要流向了衣着消费和医疗保健消费,这说明农村居民的收入还主要用于生活基本消费,还无法像城镇居民那样享受更多的消费服务。从一侧面反映了山东省的城乡差距依然十分严峻,需要更多地关注农村居民的基本生活,提高农村居民的生活水平,刺激农村居民的消费能力,从而达到全省经济水平的全面提升。五、心得体会经过两周的努力,我们终于

16、完成了这篇实验报告的写作。作为统计专业的学生,这是我们第一次实质性地做有关自己专业的报告实践。过程虽然不是十分顺利,但却让我们受益匪浅。写作过程可谓是一波三折:在选择模型时选择哪个模型比较合适,在查找数据时数据的选择、以及整理都遇到了不小的问题。上交初稿之后,老师给我们提出了很多问题:论文结构问题;论文内容的组织问题以及模型建立的合理性问题等等。当时说实话,感觉很失败、很沮丧。最后我们大家还是相互鼓励,按照老师的要求一步一步地将自己的错误进行了更正,将实验报告完善起来。综合这次实践过程,我们学到了很多:首先,我们熟悉掌握了论文中几种模型的原理和处理方法,将自己的所学运用到了实践过程中;其次,通

17、过这次实验设计,我们对 EXCELSPS 故件以及 Eviews 等统计软件的操作和应用更加熟练,为以后的学习建立了良好的基础;再次,我们清楚的明白了想要做好一件事,仅仅一个人是不够的,这需要队友的配合。在一个团队之中,只有更好的配合好,才会做出更好成绩。参考文献1 沈黎华.影响居民家庭现金收入与支出的调研与研究J.商情教育经济研究,2008(06):59-60.2 刘东.我国农村居民消费结构研究一一基于扩展线性支出系统模型的计量分析J.黑龙江科技信息,2010(2):112-113.3 于洪彦,刘金星,许友传.吉林省农村居民收入结构对支出行为的影响一一基于吉林省 20032006 年抽样调查

18、的面板分析J.税务与经济,2009(1):1-6.附录-22009-22009 年山东省农村居民人均总收入状况地区济南市全年生活消费总支出1.食品消费支出2.衣着消费支出3.居住消费支出4.家庭设备、用品消费支出5.交通和通讯消费支出6.文化教育、娱乐消费支出7.医疗保健消费支出8.其他商品和服务消费支出4733.101686.30269.89925.32273.10746.71377.81405.4148.56青岛市淄博市5831.642124.22567.461054.79335.31724.42635.93287.65101.865170.681734.70398.231082.4231

19、0.54504.69587.83452.4999.78枣庄市东营市3753.451429.99295.11662.66259.90494.86274.14233.74103.054542.821593.74256.141016.09310.73646.01420.36252.7147.03烟台市4520.751724.56344.73812.20233.29464.59495.77363.9481.66潍坊市5239.961536.93344.261373.68296.65701.18562.46312.8C112.00济宁市泰安市3894.781430.97242.01803.15287.3

20、7424.09382.27261.0963.823869.581472.83254.91650.16294.33435.55484.51194.3382.96威海市5440.961827.96504.871297.89272.34545.68599.17312.0281.02日照市3859.431514.59367.56699.84204.89498.61337.07136.49100.38莱芜市4116.641594.53235.05751.98264.06451.03480.74298.3640.89临沂市3586.681352.67231.59767.91241.68428.10310.

21、12183.5271.09德州市2842.741203.38179.75557.08177.71345.94208.11132.1838.60聊城市滨州市3169.111206.23202.17523.23275.47334.35375.17198.4254.074016.971257.16201.441099.79192.69469.43405.20328.8762.39荷泽市3411.021392.24185.76653.51175.00354.52351.77218.6779.55(来源于 2010 年山东省统计年鉴)附录-12009-12009 年山东省农村居民人均总支出状况地区全年纯收入1.工资性纯收入2.家庭经营纯收入3.财产性纯收入4.转移性纯收入现金纯收入济南市7804.843483.543635.47415.05270.787214

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论