居民消费主要经济指标_第1页
居民消费主要经济指标_第2页
居民消费主要经济指标_第3页
居民消费主要经济指标_第4页
居民消费主要经济指标_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#数学实验作业:主成分分析法姓名:孙浩圣学号:200811910专业:应用数学主成分分析法处理居民消费主要经济指标问题主成分分析法是简化步骤的一种很常用的方法,本题中通过分析2006至2009年以来居民消费支出的数据,得出今年来居民消费水平状况以及主要消费方向。3.下表为国家2010年统计年鉴数据,请您根据表中数据(也可补充其他数据)建立居民消费支出的数学模型:居民消费支出本表按当年价格计算,单位:亿元指标2006200720082009居民消费支出82103・595609.8110594.5121129.9农村居民21261・324122.027495.028833.6食品类支出8735.79998.711581.711732.0衣着类支出1206.21392.61534.31667.3居住类支出3867.74415.85102.24916.7家庭设备、用品及服务类支出908.51073.51260.41468.7医疗保健类支出1405.71571.61880.92355.8交通和通信类支出2072.72364.02609.22889.3文教娱乐用品及服务类支出2190.32200.32278.52442.5银行中介服务消费支出303.1405.5505.4474.9保险服务消费支出103.8156.7186.7283.5其它支出467.6543.4555.6603.1城镇居民60842.271487.883099・592296・3食品类支出17725.221239.425568.627152.2衣着类支出5136.46100.16998.17785.8居住类支出10760.312306.114565.316165.7家庭设备、用品及服务类支出2839.33523.14152.44770.8医疗保健类支出5262.16156.57580.98867.4交通和通信类支出6533.97946.68505.910335.6文教娱乐用品及服务类支出6852.37781.28152.99046.9银行中介服务消费支出1397.21711.22132.91995.8保险服务消费支出988.91344.51528.81582.0其它支出3346.63379.03913.94594.0

根据上表我们可以简单的得出在居民消费中城镇支出要远高于农村支出,但无论是城镇支出还是农村支出都以食品类支出和居住类支出为主。只是细分起来又稍有不同,对此我们通过主成分分析法给以说明。一.基本原理主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个样本,每个样本共有p个变量描述,这样就构成了一个nXp阶的数据矩阵:r、r、xx….x11121pxx•…xX=21222p・・・…xx•…xn1n2np(1)如何从这么多变量的数据中抓住地理事物的内在规律性呢?当然是对这p维空间进行处理。为此需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使它们既能尽量多地反映原来较多指标所反映的信息,同时又是彼此独立的。那么,应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。如果记原来的变量指标为X,X,…,X,它们的综合指标——新变量指标12p为z,z,…,z(mWp)。贝I」12m上=lX+1X+…+1X11111221ppz=IX+IX+…+1XV22112222pp(2)z=1X+1X+…+1Xmm11m22mpp在(2)式中,系数打由下列原则来决定:z与z(iHj;i,j=l,2,…,m)相互无关;z;是X,X,^,X的一切线性组合中方差最大者;是与z不相关的X,X,…,X的所有线性组合中方差最大者;;z是与z,z,z都不相关的X,攵2,…,X的所有线性组合中方差最大者。12"这样决定的新变量指标z,z?,…,z分别称为原变量指标X,X,-,X的第一,第二,…,第m主成分。其中,z在总方差中占的比例最大,z,z,…:123z的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量X(j=1,2,…,p)在诸主成分z(i=1,2,…,m)上的载荷1(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是X,X,…,X的相关矩阵的m个较大的特征值所12p对应的特征向量。二.计算过程通过上述主成分分析基本原理知,我们可以把主成分分析计算步骤归纳如下1)计算相关系数矩阵frr...r'frr...r'11121prr…rR=21222p・・・・・・・・・・・・(3)Irrp1p2rpp在公式(3)中,r(i,j=1,2,…,p)为原来变量X与X的相关系数,其计算公式为ijij工(x-x)(x-X)(4)ijk-1(4)ijk-1因为R是实对称矩阵(即r=r),所以只需计算其上三角元素或下三角元ijji素即可。(2)计算特征值与特征向量首先解特征方程丨入I-RI=0求出特征值入(i=l,2,…,p),并使其按大小顺序排列,即.环2$…,鼻入p$°;然后分别求出对应于特征值入j的特征向量e(i=1,2,…,p)oP(3)计算主成分贡献率及累计贡献率一般取累计贡献率达85-95%的特征值入,入,…,入所对应的第一,第12m二,,第m(mWp)个王成分。(4)计算主成分载荷p(z,x)=尸e(i,k=12•……p)(5)kiykki由此可以进一步计算王成分得分:Z=11z21Z=11z21z12z221mz2m6)Jzz・・・z/n1n1nm三.SAS处理过程在此我们利用sas软件来处理数据,如下:3.1农村居民消费

年食品衣着居民家庭医疗父通文教银行保险其他合计份类类类设备保健通信娱乐中介服务208735.1206.3867.908.51405.2072.2190.303.1103.8467.62126067277731.3209998.1392.4415.1073.1571.23642200.405.5156.7543.4241207768563220115811534.5102.1260.1880.2609.2278.505.4186.7555.6274908.7324925520117321667.4916.1468.2355.2889.2442.474.9283.5603.12883093778353.6200.4100.0560.1810.0420.0660.0970.1030.0140.0040.02110687373291373115487018256882993200.4140.0570.1830.0440.0650.0980.0910.0160.0060.02210750573206150315200221581496527200.4210.0550.1850.0450.0680.0940.0820.0180.0060.0201082298035688414098978738279207200.4060.0570.1700.0500.0810.1000.0840.0160.0090.020109886825529377032067147832917图一(说明:图一为农村居民消费水平整理的数据以及标准化后的数据。)1)下图为在sas中导入数据后的分析图Nu限解II」關酬应嗣1憾型[ZlM区卿1风蒯I」!■CIOC0L1COUCCL4CCL5C1GC0L7C0U8.COLSC110C0L11PCR1PC■■INu限解II」關酬应嗣1憾型[ZlM区卿1风蒯I」!■CIOC0L1COUCCL4CCL5C1GC0L7C0U8.COLSC110C0L11PCR1PC■■I10.05G?(.T90』」门〕』工1:0.0D490.022Dli1.股喩WORKJMXFEJ可冈0.6564!r:2m\r'"0:5l97l1i-D.B238.^1

nil

nu-n.L0201:1.(Du0201:1.(『1」?」Mle«.MHond3E」?-

rn-R-.^ur3-n-_'unr_?0D一184165

olfolnr.343_K-.^uDD.n'.H.u5rn-nr.-rl¥nr.nbau^-y^d-d-2-EKT_U1.标准数据2)对标准化的数据进行处理,由公式(4)计算相关系数矩阵见下图

i-COLDi_C1Ii_C0L2_C0L31COJto.[iCO:■(CO-:([0_2\-(i-COLDi_C1Ii_C0L2_C0L31COJto.[iCO:■(CO-:([0_2\-((0.「1(0.「1(0.Ei1(0.]■-■(COEi(CO-?i(COnCO-1H00i-O.lllfliO.W10^-0.76M(.32界0.852MM-0.1151:MM-0.5988!-0J38Ei俪]fl.6238i皿川O.iDE0J1G3O.CUC■0.29B0.m\-0.105i.60^-0.33?1)1N1.C0K-0.8126i

0.8521iW1\i』mW.1-北込61-0.83S6i0.210.21-0.810.12MCN).9500i(胸i0■他-L4八■眦■0J88fi).4014:(0.913;-].a\-{•裁1-0.883(』肌(0.5661).95771・〕〔川0.G601L斶1i(.6601ii.mi-LM朕■(」11扛\(■灿■ia).3323(O.59OS-L5版4M0.343;■o.m-0.31?60.05300.2115叽川6-0.51190侧11伽-0.9052-0.73E0O.M0.3512

-0.^39i0.33A8

-l.GKO1CN1_C0L9iJ0.10i4i•(・帅—Mli:L4n221〔4川1-L8251叮汕10用58「〔川川CJL8CJL110.8235脚8-1.23(0[川5□⑶i0■伽i■L73801L3308i加-L45431CH■O.mi■[.H3i1』川3)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率如下可知,第一第二主成分的累计贡献率已高达92.34%,故只需求第一第二主成分即可。UtJ牛手和匚T自C才曰二土率tT羽二11■:卒、1_■-1■■__1_Z-Z_■■1「累积……话好I持征值6・1329632・1082310・5575O・55754-0247833-1824280-8S59O-92340・8423040・8423040・O7E6・0000O0a・0000□O□-OOOO□0□・OOOOO00・OOOOaOa-OOOO□Oa-OOOO□0□・OOOO□Oa・OOOO□—a.OOOO3.特征值与主成分贡献率(4)对于特征值入]=6.132963,X2=4.024733分别求出其特征向量ei,e2,并计算各变量在各主成分上的载荷得到主成分载荷矩阵如下JdPCR1PCR2co0・88841—!^―;L■io:i111111co-0・5554一口・8104Zco0・53950・6839co-0・3038-0・3325co0・9852-D・ieg1Zco0・9677U.0177co0・83320・7058co-0・60930.7506ZcoCi・2212-0・8925co0・3838-0・1BEE-COL10-0・3S450.7897-COL1104.主成分载荷由上表可知,第一主成分pcrl与colO,col4,col5,col9有较大的正相关与col3有较大的负相关;第二主成分prc2与col10有较大的正相关,与col1,col8有较大的负相关。比较符合实际,且简化了计算。

3.2城镇居民消费年食品衣着居民家庭医疗父通文教银行保险其他合计份类类类设备保健通信娱乐中介服务20177255136.107602839.5262.6533.6852.1397.988.93346.608406.24.33193262.220212396100.123063523.6156.7946.7781.1711.1344.3379714807.41.11562257.820255686998.145654152.7580.8505.8152.2132.1528.3913.830908.61.349999899.520271527785.161654770.8867.103359046.1995.15824594922909.28.784.6986.3200.2910.0840.1760.0460.0860.1070.1120.0220.0160.055106331422856667488391624964254005200.2970.0850.1720.0490.0860.1110.1080.0230.0180.0471071053311432831216847937807267200.3070.0840.1750.0490.0910.1020.0980.0250.0180.04710868721427596922735811667397099200.2940.0840.1750.0510.0960.1110.0980.0210.0170.04910918535715690759830262414774(说明:图二为城镇居民消费水平整理的数据以及标准化后的数据。)1)下图为在sas中导入数据后的分析图'I1.标准数据

2)对标准化的数据进行处理,由公式(4)计算相关系数矩阵见下图IIIIII-H--H-n--H--H--H--H-n"-H-n--H-TL'-QltaooIIIrn-JI-M.M-1—-U.L.uu—-M.M-rn--ML-uIrbS4jat-I—^^1JrT"rn-7—-UH-7—-H--UL-urn-H--H-n-M.y.H--K-1—1—7—-K-n-n-JI9Ln-M.HoJI4Qurn-HI—4OH--n--hu^7—Ab1—OQrnuFDJd—u—IIIJI.uun-i—i—-UH-Oun"-K-h-Illi2rn--K-od-JIi4-H-on"-K--uuiIIIIIIIII-H--H-n--H--H--H--H-n"-H-n--H-TL'-QltaooIIIrn-JI-M.M-1—-U.L.uu—-M.M-rn--ML-uIrbS4jat-I—^^1JrT"rn-7—-UH-7—-H--UL-urn-H--H-n-M.y.H--K-1—1—7—-K-n-n-JI9Ln-M.HoJI4Qurn-HI—4OH--n--hu^7—Ab1—OQrnuFDJd—u—IIIJI.uun-i—i—-UH-Oun"-K-h-Illi2rn--K-od-JIi4-H-on"-K--uuiIIIA—Qu^uooooQuoofM.UH-»h-r_H-D-n.u.uuJI-n-1—-MLKH-■"■叫・-Iln-n:vun-w・un-III-H--H-IIIIIlli'I」—4-U.H-7—1—-MLn-JIR-7—-M.M-n-■IIIII—I.rn.-Ln-.U.H—.UIL■■.1.AilL"-"4.4n.L-H-JI-u-H-n-JI-uulllHlll-l—『II_h-diQLJI-uJIOM-JIn-III-u-un-n--H--uu—-H-n--un-J—-H--H--H--u2「II714.n--urn--UH--H-1—-u-K-JI7—HI—nEuno-n-A—1—OH-rnj・u-I!!-JI_h--n.i-n.u.uu—-Un-3-JI9L■IJ-IJ-IJ]J■-IJ■_・-IJ«IJ-IJ■III9LodooAb1—mvi—4—^14"rn-.uu-uuOH-JIn£-n-_h"JI■■■—-'-■II7—-H-JIdiAl-K--UH-h"-H-m-H--H-JIod-.uu2-UH-i—AlgpulIII.^1-.^1-.1■-—■-■■—--—--—■-—■■—--H--H--0.88881J00J-0.8584-0.1183-0.50930.50660J14J0.5213-0.3081■u_111n-ndJI4-uu-H--K-n-]2OJ_uurn-r_umV1—rou—.u1—Ou-uuEH-.2-H--Mh-.Mu.un.L1—-n.H-JI_111rn--n.M--K-『IInuJInuIOu.m.HILIMh..m.^n—.UH—1HO-H--K-n.u-H-rn--UH--K--H.Ita-H.H".uu_h-H-14n.uod-nil-UH-4.447—Al_h-ZUUL?口Mu□□口UL1OL11"-u-u_u_u_u-u_u-u_u-u_u_u:r~ir~inbpbpbrupupbpkpbrbpb2.相关系数矩阵3)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率如下可知,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论