




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多元线性回归分析城镇居民消费性支出的情况信息与计算科学 2005级 陈 鹏 指导教师 曹正照 副教授摘要:本论文用多元回归的模型,回归方程的显著性检验以及回归系数的显著性检验的方法对城镇居民人均消费性支出与平均每人年可支配收入,食品支出,城镇居民人均住宅面积,就业人员获得集体单位报酬,就业人员获得国有单位报酬之间的关系进行了研究。结果显示,平均每人年可支配收入,食品支出对城镇居民人均消费性支出有显著性影响,并预测2008年的城镇居民家庭消费性支出。关键词:多元回归分析,F检验,T检验,城镇居民人均消费性支出Multiple linear regression analysis of consumption expenditure of urban residents of the situationChen Peng Information and Computational Science,Grade 2005Directed by Cao Zheng-zhao(Associate Prof)Abstract: In this paper, using multiple regression model, significant regression equation and regression coefficient test of significance test of the method of urban residents and per capita consumption expenditure per capita disposable income of the year, food expenditure, per capita housing area of urban residents for employment collective units was paid staff, employed to obtain the state-owned units for the relationship between the remuneration were studied. The results showed that the average annual disposable income, food expenditure per capita consumption of urban residents are spending significant impact And urban residents in 2008 household consumption expenditure to make a forecast aboutKeywords: Regression analysis,F test,T test,Of urban residents per capita consumption expenditure回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。本文利用线性回归分析的方法,从数量关系上来寻找城镇居民人均消费性支出、平均每人年可支配收入、食品支出、城镇居民人均住宅面积、就业人员获得集体单位报酬,就业人员获得国有单位报酬之间的相关关系,研究家庭消费性支出主要受哪些因素的影响。城镇居民家庭可支配收入是指被调查的城镇居民家庭在支付个人所得税、财产税及其他经常性转移支出后所余下的实际收入。城镇居民家庭消费性支出是指被调查的城镇居民家庭用于日常生活的全部支出,包括购买商品支出和文化生活、服务等非商品性支出。随着人民生活水平的提高,收入增加,消费性的支出也随之增加,在搜集了有关这方面的数据后,运用我学到的多元线性回归理论知识,分析尝试建立模型,着眼于消费需求,通过对城镇住户数据的深入分析,研究城镇居民的收入,消费现状,为政府部门了解民生提供可供参考的资料。1 多元线性回归的数学方法1.1 模型设因变量与个自变量之间有线性关系:(1)其中为随机变量且,称为随机误差1。称为多元线性回归的数学模型. 将n次观测数据代入上面的方程,可得:假定相互独立,且服从同一正态分布。则(2)可表示为: 1.2 回归系数的最小二乘估计假设由某种方法得到的估计值则的观测值可表示为,称为经验回归方程。这里是的估计值,仍称为残差或剩余。令为的估计值,即 类似于一元线性回归,对进行最小二乘估计是要选取 , 使 达到最小。故得: 即得正规方程组 从第一个方程中解出将代入后面p个方程化简得其中从中求出,再求出, 得经验回归方程1.3 回归方程的显著性检验(F检验)检验多元线性回归方程是否显著,就是检验与,中的某些自变量之间是否有较密切的线性关系。检验假设为:。如果被接受,则表明随机变量与,中的某些自变量之间的关系不显著,线性回归模型不合适。为回归平方和 为剩余平方和 为总平方和 =+当假设成立时,于是,可以利用F统计量对回归方程的总体显著性进行检验。对于给定到数据,计算出和,进而得到F的值,再由给定到显著性水平,查F分布表,得临界值。当时,则拒绝假设,认为在显著水平下,y对有显著的线性关系,也即回归方程是显著的;反之,则认为回归方程不显著.1.4 回归系数的显著性检验(T检验)在多元线性回归中,回归方程显著并不意味着每个自变量对y的影响都显著。因此要想从回归方程中剔除那些次要的、可有可无的变量,重新建立更为简单有效的回归方程。所以我们就要检验对y的影响是否显著。显然,如果某个自变量的作用不显著,那么在回归模型中,它的系数就可以取值为零。因此,检验变量是否显著,等价于检验假设 ,如果接受假设,则自变量对因变量不显著;如果拒绝假设,则自变量对因变量是显著的。当假设成立时,统计量服从自由度(n-p-1)的t分布。若,则拒绝假设,认为是重要的,应保留在回归方程中;若,则认为变量可以从回归方程中剔除。2 实例分析1978-2007年遵义市家庭消费性支出及其相关数据如下表(表一)年份y19782733251955.9251363519793053822196.6152263619803404012135.8354776319814294412576.5554975019824254612566.7059376419834644952766.9357977219845095792948.0269887619856416913368.07687103919867848643820.00827120019877909384168.4887812921988104611015499.43968152419891138147566511.261012161219901437172566611.051166183919911755213177412.811360199219922078256095613.4216012330199331323331117412.6720542658199442284035137212.6723363664199533674203169612.6428883962199634724382193115.0227754539199735714530189916.0032654858199835394605188217.0038415291199937524954199518.0042206091200039575214188819.5151286887200143835540188418.8454989053200246355863177825.86667710319200348406546194926.25910410832200453937526218926.83890713480200560988207231927.891261516264200664558943242828.0314566181732007776011340318931.10175482249221 模型的建立上表中y为城镇居民人均消费性支出(元),为平均每人年可支配收入(元),为食品支出(元),为城镇居民人均住宅面积(平方米),为就业人员获得集体单位报酬(元),为就业人员获得国有单位报酬(元)。假设关于消费性支出的回归方程为。22 模型的求解根据SPSS软件运算结果显示,可得回归方程中的回归系数如下表(表二)Unstandardized CoefficientsStandardized CoefficientstSig.95% Confidence Interval for BBStd. ErrorBetaLower BoundUpper Bound(Constant)292.965109.3592.6790.01367.259518.672x11.5230.1652.1209.2220.0001.1821.864x2-1.2510.327-0.502-3.8300.001-1.925-0.577x3-14.54814.653-0.055-0.9930.331-44.79115.694x4-0.1320.075-0.277-1.7570.092-0.2870.023x5-0.1250.070-0.339-1.7860.087-0.2690.019由上表数据结果显示,可以得到回归系数292.965,1.523,-1.251,-14.548,-0.132,-0.125,则关于的线性回归方程为根据SPSS13软件运行,可得到结果如下表(表三)模型摘要ModelRR SquareAdjusted R SquareStd. Error of the Estimate10.9970.9940.993182.28489根据上表数据显示,可得到复相关系数R=0.997,可决定系数为=0.994,说明回归方程具有高度的显著性。另外,做方差分析,见下表(表四)方差分析Model Sum of SquaresdfMean SquareFSig.1Regression133,511,192.691526,702,238.538803.6120.000Residual797,466.7762433,227.782Total134,308,659.46729选定=0.05,查2.62,803.6122.62,由此也可得出,方差分析也表明回归方程具有高度的显著性,说明整体上对有高度显著的影响。用SPSS软件作出各个自变量与因变量的关系点图,如下图一: 已经选定=0.05,根据表二结果显示,的t值绝对值小于,则说明自变量对显著性影响不明显,同理可得,自变量对显著性影响明显,根据图一中的5个关系点图也可以得出上述结论。本例中t值最小的一个变量为,对应的t值为0.993.从定性分析看,城镇居民人均住宅面积对城镇居民人均消费性支出的影响应该是小的。为了简化模型,首先剔除t值最小的一个变量,即的t值最小,首先剔除它,用其余的4个自变量作回归,计算结果如下表(表五)Unstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta(Constant)206.34765.9223.130.004x11.4710.1572.0479.3950x2-1.2020.323-0.482-3.7240.001x4-0.1180.074-0.247-1.60.122x5-0.1350.069-0.367-1.9560.062剔除后,其余的自变量的显著性都发生了不同的变化。用SPSS软件作出各个因变量与因变量的关系点图,如下图二:图一和图二做对比,两个自变量对的显著性进一步提高,而也出现了对具有显著性的趋势。但是根据表五,的t值绝对值小于仍然不显著,此时最小的t值为,因而进一步剔除。剔除后得出结果如下表(表六)Unstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta(Constant)202.16067.8152.9810.006x11.4470.1602.0139.0160.000x2-1.1040.326-0.443-3.3840.002x5-0.2260.040-0.615-5.6460.000剔除后,用SPSS软件作出各个因变量与因变量的关系点图,如下图三:图三与图二作比较,产生了对的显著性影响,且线性相关。同时由表六可以得出都大于,说明对因变量有显著性影响,回归系数通过了显著性检验。到此,可以得到最好的回归方程为。在本例中从不具有显著性转变到了具有显著性,这是由于自变量之间的相关性造成的。另外,根据表二可以得出的置信区间分别为(67.259,518.672),(1.182, 1.864),( -1.925, -0.577),( -44.791, 15.694),( -0.287, 0.023), (-0.269,0.019)。输出结果文件中残差统计结果表(表七)如下:Residuals Statistics(a) MinimumMaximumMeanStd. DeviationNPredicted Value312.58907,943.65582,699.86672,144.3700130Std. Predicted Value-1.1132.4450.0001.00030Standard Error of Predicted Value43.081118.95867.23820.04130Adjusted Predicted Value316.69828,058.30422,696.50032,151.2277430Residual-521.48700586.985170.00000181.6875030Std. Residual-2.7183.0590.0000.94730Stud. Residual-3.1483.6350.0081.09130Deleted Residual-699.81439828.726323.36640242.4292130Stud. Deleted Residual-3.9255.0820.0341.35030Mahal. Distance0.49510.1792.9002.46030Cooks Distance0.0001.3600.0980.28830Centered Leverage Value0.0170.3510.1000.08530其中列出了预测值,标准预测值,预测值标准差等指标的最小值,最大值,平均数,方差。输出多元线性回归方程的标准化残差直方图,可见服从分布3 结论本文利用多元线性回归分析了影响城镇居民人均消费性支出的几个重要因数,并成功的建立了模型,结论表明平均每人年可支配收入,食品支出和就业人员获得国有单位报酬对城镇居民人均消费性支出有影响。其中,对起到最大影响的是平均每人年可支配收入,说明增加人均可支配收入,可以促进居民的消费。并且可以预测到遵义市
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省芜湖市繁昌区2023-2024学年高一下学期第一次月考语文试题含参考答案
- 在线教育课程制作指南
- 公司内部培训计划制定与执行模板
- 标准化客户服务流程包
- 纪检工作案件管理课件
- 纪检业务培训课件
- 农业经济管理咨询与指导服务协议合同书
- 早教知识培训材料课件
- 2025年葡萄牙语等级考试资深写作能力试卷
- 早上好课件教学课件
- 公共管理研究方法 课件 第11、12章 定性比较分析、写作
- 融资入股合作协议
- 上门按摩项目创业计划书
- 模块三 环境感知技术
- 基本无害的计量经济学:实证研究者指南
- 锦联铝材自治区
- 2021起重设备安装工程施工及验收标准
- 中药制剂检验技术题库+参考答案
- 汽车美容(劳动)单元六-汽车电子设备安装课件
- DSM-V美国精神疾病诊断标准
- 井口工具课件
评论
0/150
提交评论