毕业论文_广东省农民收入影响因素的分析_第1页
毕业论文_广东省农民收入影响因素的分析_第2页
毕业论文_广东省农民收入影响因素的分析_第3页
毕业论文_广东省农民收入影响因素的分析_第4页
毕业论文_广东省农民收入影响因素的分析_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毕业论文I广东省农民收入影响因素的分析广东省农民收入影响因素的分析广东省农民收入影响因素的分析广东省农民收入影响因素的分析摘要摘要摘要摘要选取了广东农民人均生活消费品支出、耕地面积、农业劳动力、农民受教育程度这4个解释变量进行线性回归分析,分析了影响广东农民纯收入的因素,指出了广东农民人均纯收入较为显著的影响因素,并提出了相关的政策建议。关键词关键词关键词关键词线性回归回归分析逐步回归影响因素SAS统计软件THEGUANGDONGFARMERSRECEIVETHEINFLUENCEFACTORTHEANALYSISXUJIANQUANII(GRADE2006,COLLEGEOFSCIENCE,GUIZHOUUNIVERSITYFORNATIONALITIES)ABSTRACTSELECTEDTHEGUANGDONGFARMERAVERAGEPERPERSONLIFECONSUMABLEDISBURSEMENT,THECULTIVATEDAREA,THEAGRICULTURALLABORFORCE,THEFARMERHASBEENCARRIEDONTHEEDUCATIONLEVELTHESE4EXPLANATORYVARIABLETHELINEARITYREGRESSIONANALYSIS,ANALYZEDHASAFFECTEDTHEGUANGDONGFARMERNETINCOMETHEFACTOR,HADPOINTEDOUTTHEGUANGDONGFARMERAVERAGEPERPERSONNETINCOMEMOREREMARKABLEINFLUENCEFACTOR,ANDPUTFORWARDTHERELATEDPOLICYPROPOSALKEYWORDSLINEARREGRESSION;REGRESSIONANALYSIS;STEPWISEREGRESSION;THEEVAPORATIONQUANTITY;INFLUENCEFACTORSAS目目目目录录录录毕业论文III摘要IABSTRACTII前言1第一章广东省城乡收入差距现状分析111城乡居民收入差距的绝对数量不断扩大112城乡居民收入差距的相对比例不断增加3第二章回归分析方法理论知识介绍521回归分析的含义522线性回归模型及其假设条件523线性回归模型的参数估计624回归模型的诊断6第三章影响农民收入的指标选择931变量的选取932变量解释10第四章广东省农民收入影响的实证分析1141SAS程序的编辑1142变量之间线形回归及多重共线性诊断12421模型的显著性检验13422参数的显著性检验14423共线性判断1443最终模型的建立及分析15431模型的显著性检验15432系数的显著性检验16433残差的自相关性检验17434模型诊断18第五章结论21成果声明22致谢23注释24参考文献24贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析1前言前言前言前言总体而言,广东区域经济发展极不平衡,差异十分显著。省内区域经济差异在全国最为突出,大大高于其他省区和全国平均水平农民的增收问题历来都是各届政府高度关注的问题之一,农民收入的高低及稳定与否,不仅关系到农民的切身利益、农村社会的安定与农业的发展,更关系到我国小康社会的全面实现。随着我国经济社会的全面发展,工业领域取得了巨大成就,而农村却丧失了原有经济活力,城乡差距进一步扩大,大量的农民外出打工,农村、农民、农业面临着前所未有的严峻形势。新时期增加农民收入不仅是一个现实问题、经济问题,更是一个战略问题、政治问题。第一章第一章第一章第一章广东省城乡收入差距现状分析广东省城乡收入差距现状分析广东省城乡收入差距现状分析广东省城乡收入差距现状分析11城乡居民收入差距的绝对数量不断扩大城乡居民收入差距的绝对数量不断扩大城乡居民收入差距的绝对数量不断扩大城乡居民收入差距的绝对数量不断扩大地区居民收入差距本质上是一个经济发展问题。有学者认为,农民收入的构成仍然未能与经济增长推动力量的变化趋势相一致。广东省政府虽然出台了许多相关的惠农政策,但农民增收问题尚未根本解决,城乡差距进一步扩大,农民的增收问题依然严峻表1。表一广东城乡人均收入差距(19782008)年份城市居民人均可支配收入元农村人均纯收入元城乡收入差距元城乡收入差距指数1978412131932521888213197941633222721936118719804725727437198201721981560693253723532172198263145381792496616519837142039592318281801984818374253439303192198595412495314588119319861102095464355566202198713208966224658651991988158313808707744319621989208621955021131192181990230315104303126012221199127521811430616091224119923476701307652169052661993463238167478295760277199463670821815241855629219957438682699244739442761996815781318346497435256199785617134676950940224719988839683527145312542511999912592362893549699251200097615736544861070926720011041519376979664540276200211137203911917225292852003123804040545883258230520041362765436587926178312200514769944690491007945315200616015585079781093580315200717699305624041207526315200819732866399771333309308注数据来源于广东省统计年鉴2009;“城乡收入差距指数”以农村为1计算。从表1可以看出,从1979年城乡收入差距最低点的19361元到2008年的1333309元,相差1313948元,城乡收入的差距扩大了近68倍。这个数字比过去其他省份的城乡差距都大。19781985年城乡收入的平均差距为28316元;19861990年城乡收入的平均差距为87601元,较前一阶段差距增长了30936;19911995年城乡收入的平均差距为3132154元,较前一阶段增长了35754;而到了19962008年,城乡收入的平均差距则达到了7223503元,较前一阶段增长了23062。由此可见,城乡居民增长的幅度虽然有缩小的迹象,但是绝对差距在不断扩大。贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析3图一收入差距绝对数量变化图如图一所示,随着年份的增加,城乡居民收入差距也在大幅度增加,尤其从2000以来,几乎沿直线上升,城乡居民收入差距问题让人担忧。12城乡居民收入差距的相对比例不断增加城乡居民收入差距的相对比例不断增加城乡居民收入差距的相对比例不断增加城乡居民收入差距的相对比例不断增加从表1可以看出,城乡居民收入相对比例最低的是1982年,为1651,城乡收入相差24966元;城乡居民收入相对比例最高的是2005年,达到了3151,而且这个比例维持到2007年,2007年城乡收入相差1207526元。19781988年城乡居民的收入一直维持在21以内,其相对比例平均在188左右。自1989年开始,城乡居民的相对比例则一直保持在21以上,最高达到3151。世界银行1998年研究报告指出,36个国家的数据表明,城乡之间收入比率超过2的极为罕见,绝大多数国家农村收入为城市收入的2/3或更多一些。城乡居民收入差距的相对比例00511522533519751980198519901995200020052010年份相对比例系列1图二城乡居民收入差距相对比例图4正如图二所示,1975年以来,虽然其中城乡收入差距比例在某特定年份有所下降,但总体趋势在上升,从2003年以来比例值已经超过3,由此可见,广东省城乡居民收入差距的问题依然严峻。贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析5第二章第二章第二章第二章回归分析方法理论知识介绍回归分析方法理论知识介绍回归分析方法理论知识介绍回归分析方法理论知识介绍21回归分析的含义回归分析的含义回归分析的含义回归分析的含义回归分析是研究一个变量对另一个变量或者多个变量的依赖关系,其目的在于通过自变量的给定值,来预测因变量的平均值或某个特定值,具体而言,回归分析需要解决四个问题(1)构建因变量与自变量之间的回归模型,并依据样本观测值对回归模型中的参数进行估计,给出回归方程。(2)对回归方程中的参数和方程本身进行显著性检验。(3)评价自变量对因变量的贡献。(4)利用所求得的方回归方程对因变量进行预测,对自变量进行控制。22线性回归模型及其假设条件线性回归模型及其假设条件线性回归模型及其假设条件线性回归模型及其假设条件在回归分析中,因变量Y和自变量X之间的关系通常用以下带有条件期望的方程表示/XYEY其中,E(Y/X)为变量Y关于变量X的条件均值。为随机误差,则上式方程为Y关于X的总体回归模型。在回归分析中,由于E(Y/X)是变量X的函数,所以记E(Y/X)F(X)其中F(X)为X的某个函数,若函数F(X)只含一个变量,称为一元回归;若含有两个或两个以上的自变量则称为多元回归,若F(X)是X的线性函数,即F(X)PPXXXL22110其中,PL10,为未知参数,称为回归系数。当模型中有P个自变量PXXX,21L时称为P元线性回归模型,或者多元线性回归模型,其一般形式可表示为YPPXXXL22110在经典的线性回归分析中,一般有以下假定(1)随机误差项均值为0,即0E。(2)对每个I,随机误差项I的方差均为2,且各误差项之间相互独立,即6,2,1,0,NJIJICOVJIL,用矩阵表示为IE2,其中,I为N阶单位阵。(3)自变量是非随机的确定性变量。(4)自变量和误差项互不相关,即0,XCOV。(5)自变量之间不存在多重共线性,即矩阵X的秩RXP1N,也即矩阵X的列向量是互不相关的。(6)为进行假设检验,通常还进一步假定误差项服从均值为0,协方差为I2的多元正态分布,即N(0,I2)。23线性回归模型的参数估计线性回归模型的参数估计线性回归模型的参数估计线性回归模型的参数估计对于假定的回归模型YXB其中,NPNPPNXXXXXXXYYYYLMMMMLLM122111121111,,NPBMM2110,,其参数的最小二乘估计量(OLS)为YXXXB1,记BXY,则12PN。24回归模型的诊断回归模型的诊断回归模型的诊断回归模型的诊断在线性回归分析中,当对N组独立观测运用最小二乘法估计出总体回归方程中的参数后,总体回归方程的估计也即样本回归方程就可以用参数的估计值表示出来,即PPXXXY22110L在估计出了回归方程后,一个很自然的问题是,这个方程拟合好吗对于线性回归模型,因变量与自变量之间的关系是线性的吗方程中的每个自变量都对因变量有显著性影响吗换句话说回归方程中的参数都与0有显著性差异吗等等,这些问题正是回归诊断需要解决的。在回归分析中一般可以通过以下一些指标或者假设检验得到部分解决。贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析7(1)方程拟合优度。方程拟合好坏通常用拟合优度指标2R来反映。她被定义为SSTSSESSTSSRR12其中,2YYSSTI称为总离差平方和,2YYSSRI称为回归平方和,它表示来自自变量对总离差的贡献,2IIYYSSE称为残差平方和,它表示来自误差项对总离差的贡献,有SSTSSRSSE拟合优度2R表示,因变量的总离差平方和有多少能通过自变量予以解释。也就是说,不能由自变量来解释的部分为12R。显然2R越大,越接近于1表明拟合就越好。由于2R进行随着自变量个数的增加而增加,所以在多元回归的情况下,通常要对2R进行调整。调整后的2R用2ADJR表示,定义为IPNNRNSSTIPNSSERADJ1111122其中,当模型中不包含常数项时I0,当模型中包含常数项时I1。(2)自变量与因变量之间的线性关系的F检验。在线性回归分析中,一般假定回归方程有以下形式E(X)PPXXXL22110即E(Y)与P个自变量之间线性相关,但实际情况怎么样呢,这需要检验,记PSSRMSR称为回归均方和,1PNSSEMSE,称为误差均方和,定义1,PNPFMSEMSRF在给定的显著性水平下,如果由样本观测值计算的F值大于1,PNPF,则自变量与因变量之间的具有显著性的线性关系,否则,变量间不具有显著的关系。在SAS系统中,一般通过F值对应的概率值来判断变量之间的线性关系的显著性。若F值对应的概率值小于给定的显著性水平,则因变量与P个自变量存在显著的线性关系,否则线性关系不显著。(3)回归参数的显著性检验。在线性回归方程中,回归参数J表示在其他自变量保8持不变的情况下,自变量JX每变动一个单位,因变量Y的平均变动幅度,即JX的单位变动对因变量的影响程度。因此,检验回归参数J是否显著就至关重要,实际应用中通常作如下假设0,010JJHH由于,21XXBNB,记PPPPPPAAAAAAAAAXXLMOMMLL1011110001001则有PJANAVAREJJJJJJJJJ,2,1,0,22L,从而统计量PJPNTASTJJJJJ,2,1,0,1L当给定显著性水平为下,若由样本观测值计算的T值的绝对值大于12PNTA,则参数J与0有显著性差异,否则,参数与0没有显著性差异。在SAS系统中一般通过T值所对应的P值来判断回归参数与0是否有显著性差异。若T值所对应的P值小于给定的显著性水平,则回归参数J与0有显著性差异。(4)残差分析。残差分析是诊断回归模型拟合状况的又一种易行而有效的方法。关于回归模型中的误差项的假定是零均值、同方差、不相关和正态性,即,02NI。如果我们采用的回归模型对样本数据的拟合是良好的话,那么误差项I的估计量I,就应该反映I这种分布特性,记IIIIYYR,称为残差。因此JR应该近似服从,02N,从而标准化残差的估计量也应该近似服从标准化分布,即1,0NMSEREII一般来说,如果回归直线拟合得较好,则残差图中应有95的点在IE2和IE2的两条直线之间随机分布。贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析9第三章第三章第三章第三章影响农民收入的指标选择影响农民收入的指标选择影响农民收入的指标选择影响农民收入的指标选择31变量的选取变量的选取变量的选取变量的选取针对农民收入进行多元回归分析,选取了广东农民人均纯收入为因变量,以农民人均生活消费品支出、耕地面积、农业劳动力数量和农业劳动力受教育程度为自变量进行分析,并进行了相关分析,以尽可能减少共线性相关。本文使用农民人均纯收入、人均生活消费品支出、农作物耕种面积、农业劳动力和农民的受教育水平这5个变量(表二)。表二广东农民人均纯收入的变化因素(19882008)年份人均纯收入元人均生活消费品支出元农作物耕种面积(万亩)农业劳动力万人受教育程度()19888087068467806389156130211019899550287059832271158870233019901043039326385073516009023801991114306942408489091594302490199213076510602982313615415025101993167478139101771841146480297519942181521882007807991433403130199526992422550179571914319835101996318346258416815622143980383019973467692617658267251475204030199835271426831883107315078041201999362893264594789424153094418020003654482646027735351572074020200137697927033678682115664360502002391191282501720737155629458020034054582927357294581543414610200443658732407872119615249746302005469049370773722306153348462020065079783885976573851534534630102007562404420232654456153230463020086399774872966606461537764690注数据来源于广东省统计年鉴2009、广东省农村统计年鉴2009;32变量解释变量解释变量解释变量解释农民人均纯收入是农业部制定的农村经济收益分配统计报表中的“农民人均所得”。农民人均纯收入是反映农民生活水平和消费水平的重要指标,是模型中的因变量。增加农民收入不仅要增加农民的总收入,还要增加农民的人均纯收入。农民人均生活消费品支出在相当大的程度上反映了农村社会农民的消费水平和生活状况,当然这包含两个方面的含义一是农民消费水平自身的提高促进了消费支出的提高;二是物价水平的不断提高也可导致农民生活消费品支出的上升。耕地面积包括熟地、当年新开荒地、连续撂荒未满3年的土地和休闲地。作为农业生产的物质载体,土地是一项不可或缺的重要农业资源。耕地面积的多少,特别是常用耕地面积的多少,将在很大程度上影响农民收入的持续稳定增长,尤其广东省现处在一个农业密集型的产业现状。农业劳动力指能够参加和从事农业生产劳动的劳动力数量的总和,是直接从事农业劳动,并以土地耕种为其生活主要来源的实有劳动力。劳动力数量是指农村中已达到劳动年龄和虽未达到年龄或已超过劳动年龄但可以经常参加农业劳动的人数。本研究选取的是第一产业农业的劳动力人数。现代农业需要现代农民,而现代农民是具有一定文化素质的人,目前广东省农业科技成果转化率低,农业仍然以粗放型增长方式为主,农户对科技成果的运用能力较差,缺乏相应的经验、知识和技能,这都应归结到农民教育问题。教育能通过提高从事农业的家庭成员的劳动生产率,对农业收入的增长产生间接的促进作用。本研究采用每100个劳动者中受9年以上教育的人数来衡量农民的受教育水平。贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析11第四章第四章第四章第四章广东省农民收入影响的实证分析广东省农民收入影响的实证分析广东省农民收入影响的实证分析广东省农民收入影响的实证分析41SAS程序的编辑程序的编辑程序的编辑程序的编辑在分析广东农民人均纯收入问题上采用的是多元线性回归模型,并利用SAS系统对数据进行多因素的线性相关回归分析,即利用多个挑选出来的影响因素,通过多元线性回归的分析方法进行分析。所以用SAS的REG过程对数据进行处理。以变量INCOME代表人均纯收入,EXPENDITURE代表人均生活消费品支出,AREA代表农作物耕种面积,LABOR代表农业劳动力,DEGREE代表受教育程度,然后利用REG过程对变量EXPENDITURE、AREA、LABOR、DEGREE关于INCOME进行回归。SAS程序编辑如下DATAAAINPUTEXPENDITUREAREALABORDEGREEINCOMECARDS68467806389156130211080870870598322711588702330955029326385073516009023801043039424084890915943024901143061060298231361541502510130765139101771841146480297516747818820078079914334031302181522255017957191431983510269924258416815622143980383031834626176582672514752040303467692683188310731507804120352714264594789424153094418036289326460277353515720740203654482703367868211566436050376979282501720737155629458039119129273572945815434146104054581232407872119615249746304365873707737223061533484620469049388597657385153453463050797842023265445615323046305624044872966606461537764690639977PROCSTANDARDDATAAAOUTBBMEAN0STD1VAREXPENDITUREAREALABORDEGREEINCOMERUNPROCREGDATABBCORRMODELINCOMEEXPENDITUREAREALABORDEGREE/VIFCOLLINCOLLINOINTRUNPROCREGGRAPHICSDATABBMODELINCOMEEXPENDITUREAREALABORDEGREE/SELECTIONSTEPWISESLS005SLE005NOINTRDWSTBVIFPRUNPLOTSTUDENTPRUN42变量之间线形回归及多重共线性诊断变量之间线形回归及多重共线性诊断变量之间线形回归及多重共线性诊断变量之间线形回归及多重共线性诊断多重共线形是指在多元回归分析中的自变量之间存在的线性关系。在实践中,由于系数矩阵来自样本观测,所以自变量之间的完全共线性较少,但自变量之间的近似共线性却会很明显,当回归模型中存在高度共线性时,其估计量的稳定性却很差,也就是说对于不同的样本得到的参数估计值往往差别很大,从而造成检验失效,所以在进行多元线性回归分析时,判断和处理自变量间多重共线性非常重要。在以上程序中“PROCREGDATABBCORRMODELINCOMEEXPENDITUREAREALABORDEGREE/VIFCOLLINCOLLINOINTRUN”部分,PROCREG调用回归分析过程,并按MODEL语句给出的模型结构进行分析,其中选项CORR要求计算变量间的相关系数,VIF要求计算方差膨胀因子,而COLLIN和COLLINOINT则要求进行多重共线性诊断。其相关系数阵结果如下图三图三变量相关系数阵贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析13由此相关系数阵可以看出,EXPENGDITURE与INCOME高度正相关,相关系数达到了09957,而AREA和LABOR都与INCOME负相关,DEGREE与INCOME正相关,相关系数相对也较高,达到了08648。在自变量之间,EXPENDITURE与AREA和LABOR都是负相关,而EXPENDITURE与DEGREE正相关而AREA与其他变量基本都是负相关,虽然与LABOR为正相关,但相关性比较低,只为00222;LABOR与AREA很相似,LABOR与其他变量也是负相关,只与AREA较低的正相关性;而DEGREE与EXPENDITURE正相关,相关性相对较高,与AREA,LABOR都为负相关。再对回归结果进行分析,如下图四图四SAS线性回归结果根据上图可以初步建立模型如下REELABORAREAENDITUREEINCOMEDEG096180042360012490EXP9113301734163其中,为残差项。对于此模型,我们需要进行以下诊断。421模型的显著性检验由图一可以看出,模型的拟合优度为996402R,表示因变量可以有9964可以由自变量来解释,方程拟合还是比较充分。再观察自变量与因变量之间线性关系的F检验,在显著水平为005的F值为111980,其对应的概率P小于00001,远远小于005,所以因变量与自变量存在显著的线性关系。14422参数的显著性检验观察图三,在给定显著性水平为005下,常数项对应的概率P值为1,大于显著性水平005,与0没有显著性差异,所以常数项不能留在模型中。而四个自变量中,AREA对应T值的概率值为06685,大于005,与0没有显著性差异,也不能留在方程中。而变量EXPENDITURE,AREA,DEGREE对应T值的概率值分别为小于0001,00154,00040,都小于给定的显著性水平005,与0都有显著性差异,都通过T检验。通过以上分析和诊断,可以明白,AREA,LABOR与INCOME负相关,即增加AREA,LABOR的数量,INCOME反而减少,这与经济理论不符合,背离经济理论知识,与实际情况不符合。常数项对应的概率P值为1,大于显著性水平005,与0没有显著性差异,所以常数项不能留在模型中。变量AREA对应T值的概率值为06685,大于005,与0没有显著性差异,也不能留在方程中。423共线性判断再观察SAS程序输出的方差膨胀因子和共线性诊断图,如图五图五方差膨胀因子和共线性诊断图可以用条件指数(CONDITIONINDICES)K值来判断自变量之间的共线性,如果101K则可以认为自变量之间不存在共线性,如果3010K则认为自变量之间存在较强的多重共线性,如果30K,则认为存在高度的多重共线性。如图五所示,其中条件数K值都在(1,10)之间,所以自变量通过条件指数判断不存在多重共线性。但在变量EXPENDITURE,AREA,DEGREE上的方差比率分别是098127,060574,059951,都超过50,说明三变量之间存在共线性,需要去掉不重要的的因素。综合以上分析,初步所建模型不能用来分析广东农民收入的影响因素此问题,需要剔出变量AREA和常数项才进行回归分析,需要用逐步回归来进行选元。贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析1543最终模型的建立及分析最终模型的建立及分析最终模型的建立及分析最终模型的建立及分析用逐步回归来进行选元,其基本思想是首先在待选的4个变量中选择一个对因变量影响最大的自变量,这可以通过因变量与每一自变量进行回归得到的F值来判断。若最大的F值在给定的显著性水平下显著的,则该变量被选中,否则选元结束。第二步,在剩下的2个变量中,再选择一个变量加入到模型中,这可以通过偏F检验来判断。偏F统计量为3,1,1/11NFXXMSEXXSSRFJJ其中,/1XXSSRJ,11XSSRXXSSRJ,表示模型已存在变量1X的条件下新加入变量JX对因变量的贡献。若最大的偏F统计量在给定的显著性水平下是显著的,则对应的自变量被加入到模型中,否则不再加入其他变量,选元结束。第三步,对已在模型中的每个变量进行显著性检验。若检验不显著,则去掉该变量,再重复进行第二步和第三步,否则保留该变量,重复进行第二步和第三步,这一过程一直进行到待选的全部自变量根据给定的显著性水平没有一个再能被选入模型或排除出刚构成的回归模型为止。SAS程序中”PROCREGGRAPHICSDATABBMODELINCOMEEXPENDITUREAREALABORDEGREE/SELECTIONSTEPWISESLS005SLE005NOINTRDWSTBVIFPRUNPLOTSTUDENTPRUN”部分可实现逐步回归。其中选项“SELECTIONSTEPWISE”表示逐步回归(选元,并给出回归结果),“SLS005”表示变量保留在模型中的显著性水平为005,“SLE005”则表示变量选入到模型中的显著性水平为005,程序中MODEL过程不包含截距项。选项R要求输出每个观察值的预测值、残差、标准化残差、COOK的D统计量。PLOT语句要求绘制标准化残差与预测值的残差图。431模型的显著性检验程序输出最终结果如下图六、图七图六SAS逐步回归结果输出16图七模型显著性检验图对因变量INCOME进行逐步回归结果表明,第一步,变量EXPENDITURE被加入到模型中,说明三个自变量分别关于INCOME回归,其中,由EXPENDITURE与INCOME回归得到的F统计量最大对应的概率值小于00001,在显著性水平下通过检验,同时常数项也被剔出。第二步,分别把变量AREA,LABOR,DEGREE加入到刚建立的模型中,并分别计算其偏F检验值,结果表明DEGREE的偏F值最大其对应的概率值小于进入模型的显著性水平005,所以DEGREE别选入到模型中,此时模型中已有EXPENDITURE和DEGREE两个变量。第三步,对EXPENDITURE和DEGREE分别计算其偏F统计量值及其对应的概率(输出中没有体现),结果两个变量的偏F检验对应的概率值都小于保留在模型中的显著性水平005,因此两个变量都被保留下来。第四步,重复第二步和第三步,即把最后一个变量加入到模型中,发现AREA的偏F值对应的概率大于进入模型的显著性水平005(程序没有体现),所以AREA不能被加入到模型中。最终模型中拟合优度2R的值由09915增大到09945再增大到09964,而CP值也由216313减小到91012再减小到22022总趋势越来越小,说明模型拟合得非常好,并且越来越好,最终因变量有9964可以由3个自变量解释。说明用此模型来分析广东农民收入的影响因素是非常合适的。此时可以建立回归模型REELABORENDITUREINCOMEDEG092740043950EXP924880其中为残差项。可再对模型进行因变量与自变量显著性关系的F检验,而3个自变量对因变量的F检验值为165988,其对应的概率P值小于00001,远远小于005,说明自变量与因变量之间线性显著,用此线性回归模型来拟合是非常合适的。432系数的显著性检验如下程序结果输出图八贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析17图八系数显著性检验图图八给出了参数估计值以及参数与0是否有显著性差异的T检验,其中变量EXPENDITURE的参数估计值为092488,对应的概率值小于00001,小于显著性水平005,说明EXPENDITURED的系数与0有显著性差异。变量LABOR的参数估计值为004395,其对应的概率值为00069小于显著性水平005,说明LABOR的系数与0有显著性差异。变量DEGREE的参数估计值为009274,其对应的概率值为00023小于显著性水平005,说明DEGREE的系数与0有显著性差异。由此,说明整个模型的参数与0是有显著性差异的。其意义为分别每增加一单位的EXPENDITURED,LABOR,DEGREE可以分别增加092488,004395,009274单位的INCOME。433残差的自相关性检验(DW检验统计量)残差的自相关指的是误差项的当前值只与其自身前一期值之间的相关性。DW检验全称为杜宾瓦森检验,适用于一阶自相关的检验。DW检验在检验回归残差的自相关问题上应用较为广泛,该统计量用来检验回归方程中一阶自相关的存在。如果不存在自相关问题,DW值应趋近于2。若DW值为0,表明存在完全的正自相关,若DW值为4,则表明存在完全负自相关。如下图九所示图九DW检验图图九中,DW值为1796,比较接近2,所以,残差序列不明显存在正自相关性,为什么DW值不更接近2,这可能与观测值有异常点有关,所以我们需要进一步进行18模型诊断。434模型诊断(残差分析,强影响点分析,模型的拟合程度)图十残差图(1)残差分析残差分析是为了确认实验模型的三个假设是否成立A随机,正态B残差的常数方差C残差的平均值为零一般我们可以通过SAS输出结果的标准化残差及其残差图来观察分析,如图十,图十一所示,观测值所对应的点基本都落在(2,2)的水平带状区间之中,且不带有任何系统趋势,完全随机地分布在该带状之中,则说明采用的回归分析方程对样本数据的拟合是良好的。贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析19图十一残差散点图(2)强影响点分析通过观察,也发现了标准化残差中的第14个和第18个观测的标准化残差值分别为2026和2336,位于2到2这一区域之外,COOK的D统计量在第14个观测上的值也较大,为2664,而COOK的D统计量在第18个观测上的值较小,为0126,所以第14个观测可能是异常点,说明数据中2001年数据存在异常,通过对2001年广东农民收入状况的调查,2001年广东农民收入存在不利因素有三一是农民收入新的增长点少,劳力多耕地少的问题永远是一道难题。二是在入关前夕和国内许多农20产品价格仍高于国际市场价格的情况下,国家不可能再提高农产品收购价格。在农产品供过于求和消费量刚性较强的时期,市场价格也不可能有所提高。即农产品供过于求价格低迷的情况短期内难予解决。三是今年我国将加入,所有商品的关税都要逐渐下调,国外农产品进入的机会更多。农村居民短期内要承受的阵痛在所难免。所以此异常点出现也可以理解,完全合乎常理。(3)模型的拟合程度再用模型的拟合优度和拟合精度来分析下模型。拟合精度,即ROOTMSE,中文教材中的残差平方根。残差平方是总变异中无法用回归的协变量解释的部分。该数值越小,说明回归的效果越好。该数值越大,说明回归的效果越差。它的平方根意义相同。同时,其意义可以反映在回归假设检验的P值上。该数值越大,P值越大,该数值越小,P值越小。观察图七,拟合精度ROOTMSE的值为006326,所以模型拟合精度值非常小,回归效果非常好。而模型的拟合优度996402R,说明广东农民收入这个因变量有9964可以用人均生活消费品支出,农业劳动力,农民的受教育程度这三个自变量来解释,模型拟合得非常好。即INCOME092488EXPENDITURE004395LABOR009274DEGREE也就是说,分别每增加一单位的人均生活消费支出,农业劳动力,农民的受教育程度就可以分别增加092488,004395,009274单位的农民收入。贵州民族学院统计学专业毕业论文广东农民收入影响因数的分析21第五章第五章第五章第五章结论结论结论结论以上的数据研究和经济计量分析为本文提供了考察农民收入影响因素的实证依据,从前面的分析可以得出以下结论结论1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论