多元统计分析论文_第1页
多元统计分析论文_第2页
多元统计分析论文_第3页
多元统计分析论文_第4页
多元统计分析论文_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于各地区住宿业企业基本情况和经营

情况的统计分析班级:统计一班

姓名:

学号:

指导教师:图图-#E;値-90.2S

标准偽差.=93.359

N=31営业撤仪元)图-5客房收入均值=42.25

标淮俯年,=43.W1

N^31客房收入寮费收入餐费收入N=31图-7图-4、图-5、图-6、图-7分别表示的是年末从业人数、营业额、客房收入和餐费收入的频数直方图,分析方法和图-3相似,就不一一分析了,从上面几个图中可以看出,这几个变量都大致服从正态分布,但我国住宿业方面的发展还是很不平衡,无论是从这五个方面的哪一方面来看,都是数值小的占的比例较大。说明只有少数地区的住宿业可以达到发达水平,还有大部分地区需要加大力度来提高自己的收入水平。第三步、对数据进行因子分析:表-2相关矩阵法人企业(个)年末从业人数(人)营业额(亿元)客房收入餐费收入相关法人企业(个)1.000.964.932.891.945年末从业人数(人).9641.000.956.919.968营业额(亿元).932.9561.000.988.968客房收入.891.919.9881.000.923餐费收入.945.968.968.9231.000表-2为五个变量的相关矩阵,从表中的数据可以看出,各个变量同其他变量之间的相关性都很强。

表-3解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%14.78295.64895.6484.78295.64895.6482.1402.79598.4433.049.98299.4264.027.55099.9755.001.025100.000提取方法:主成份分析。表-3为解释的总方差,可以看到只要第一个成分就可以解释95.648%的信息,而且在合计列中只有第一个因子的特征值大于1,所以我提取了第一个变量因子并图-8为因子分析的碎石图,从图中可以明显的看到第一段的斜率很大,而后面就变得平缓了,也说明只要一个因子就能很好地解释所有的变量,说明我们只提取一个因子的做法是合理的。但由于只有一个因子,所以无法得到因子载荷矩阵和旋转的因子载荷矩阵,但可以有成分得分系数矩阵,由此可以算出因子得分。

表一4成份得分系数矩阵成份1法人企业(个).202年末从业人数(人).206营业额(亿元).207客房收入.202餐费收入.205提取方法:主成分分析法。旋转法:具有Kaiser标准化的正交旋转法。构成得分。表-4即为成分得分系数矩阵,从中可以得到因子在各变量上的系数,可以得到计算因子得分的函数:F二0.202X+0.206X+0.207X+0.202X+0.205X。2345图-9图-9为最后的因子得分,由于在保存子对话框中点了保存为新变量,所以在原数据中多了一列,即为根据表-4得到的因子得分。

第四步、对数据进行聚类分析(K-均值聚类,只选取了前三个变量):表-5初始聚类中心聚类123法人企业(个)161840922年末从业人数(人)302021420294364营业额(亿元)398.03.998.7表-6迭代历史记录a迭代聚类中心内的更改1231.00019558.7239865.7872.0005424.8936723.8623.0006141.92811952.2144.0003137.2007758.3295.000.000.000a.由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为.000。当前迭代为5。初始中心间的最小距离为90166.364。表-7最终聚类中心聚类123法人企业(个)1618307850年末从业人数(人)30202138464110936营业额(亿元)398.041.6169.5表-5、表-6、表-7分别为初始聚类中心、历史迭代记录和最终聚类中心。根据表-6可以看出第一类的聚类中心基本上没有什么改变。当初始聚类中心经过迭代,迭代到第五步的时候都已经变成了0.000,此时已经可以结束迭代,得到最终聚类中心,可以看出第一类的法人企业为1618个,年末从业人数为302021人,营业额为398.0亿元,第二类和第三类可以依次看出。

r迢谥出加際据±1]-EPSS弧tiEtZ帝拒箱皆I=1旦1・文样⑹弟砌丈喪獸出jSfc(D)摊帳①曲笊巴團形〔⑥旺用段触或附加由敢②fin(W]帮肪L日旦EraS'1?上」+B歯畀工囲张雀書帑15:可见:E曼工的BX1X2>3X4X5QCL1QCL21北京124016259B3D4.2UC-7DI2:51661.9B4372土津2222413333.315.812121433D.921733河北47568673E4.925.732.7230215.8QB784山百300506BG52.0£.』243220222.49B256333381IB40.919.118.6234E.63K56辻宁52358637B5.440.236722D174.53B177古牀2292335J27.1117VJ215113.075468黒走江2122509B2J.-116.2"LI9亠-23E5.S45129丄询町旳?21417FuRnFiv22975339G310江苏90C1231BB133.27L.4003:12250.4747^111ifif江11581550312SB.E1D7.6126.536416E.2B49I124285084254.723.725021237B.93CB513福逢£丨7665194.2工二44丄3420E.3237614辽丙3UU「屮.q42.322.43亠3411.1125715||匕99712UBB1B4.9Efi.7809310663.3643816河南922943B4刀FA^.74216571.97B1917Jj北5L60022J42亠21旺9.4旺U18咼m6718793?1D4.9■19.E■157222947.4522113广东30202117c二皿’10.0000020厂由jyy4yb/b4/.22J.U1H.81111Zbdt£±21長pj311560BB76.7A7.722.921TG24.3BB9922至有卞勺卞二71d巧?:Wf^Ti"-執牺盘国SPSSStatic.tc3处理阵已就蜻图-10由于在保存子对话框中点了保存为新变量,所以在原数据中多了两列,分别为案例的类别号和案例与其类别中心之间的距离,见图-10.可以看出广东为第一类,它的住宿业很发达,企业法人个数和营业额等都非常高;北京、上海、江苏、浙江、福建、山东、河南、湖南和四川为第三类,它们的住宿业相对比较发达;其他地区分为第二类,它们的住宿业比较落后,企业法人个数和营业额等都很低。表-8每个聚类中的案例数聚类11.000221.00039.000有效31.000缺失.000表-8为每个聚类的案例数,从中可以看出第一类中只有1个案例,第二类中有21个,第三类中有9个。

第五步、对数据做一下判别分析(先把广东、河北、上海挑出来不进行聚类,对其他的聚类之后再把这三个地区放进去判别):图T1表-9标准化的典型判别式函数系数函数12法人企业(个)-.462.536年末从业人数(人)1.321-2.325营业额(亿元).0812.070标准化的典型判别函数是由标准化的自变量通过Fisher判别法得到的,通过表-9可以得到标准化的典型判别函数,要得到标准化的典型判别得分,代入该函数的自变量必须是经过标准化的。

表-10典型判别式函数系数函数12法人企业(个)-.003.004年末从业人数(人).000.000营业额(亿元).003.074(常量)-3.7051.496非标准化系数表-10是未标准化的典型判别函数系数,由于可以将实测的样品观测值直接代入求出判别得分,所以该系数使用起来比标准化的系数要方便一些。由此表可知,两个Fisher判别函数分别为:=—3.705-0.003X+0.000X+0.003X,123=1.496+0.004X+0.000X+0.074X。123表-11分类函数系数案例的类别号123法人企业(个)-.025.000-.015年末从业人数(人).001.000.001营业额(亿元)-.010-.058-.165(常量)-44.712-2.601-12.662Fisher的线性判别式函数如表T1所示,案例的类别号栏中的每一列表示样品判入相应列的Bayes判别函数系数。在本例中,各类的Bayes判别函数如下:=—44.712—0.025X+0.001X—0.010X,TOC\o"1-5"\h\z123=-2.601+0.000X+0.000X—0.058X,123=—12.662—0.015X+0.001X—0.165X。123将各地区的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。表-12分类结果a案例的类别号预测组成员合计123

初始计数1400420120123001212未分组的案例2013%1100.0.0.0100.02.0100.0.0100.03.0.0100.0100.0未分组的案例66.7.033.3100.0a.已对初始分组案例中的100.0%个进行了正确分类。表-12为分类结果表,从中可以看出未分类的地区有两个应该分入第一类,有一个应该分入第三类。闊境L魅皿*[35霹1]-SP55Etatktin碍确Bt竝同〔日畏曲qfi&imw»(d沖颐&i国卷◎疾用岩蚌〔山昭加内割宙口凶相h舌!=1旦屈4申醫囱團H咱曲醫生冒毎①•忸36.Xd可见=13^曼的心阳QCMDl£1Di曰」D.21Jl2Dis22Di^321D25033■o.623aa■0JE97DDODDOOD2ID&1D7BEEE1144.4331.33234-1.07869O.QOCC60.000160.9E6511215g22-1.2S4G4-0220ESOOflCCOD.GS®2□31D381311七11-l■IL':L':_IILLLLLLLl-.LL':14也331.53357-1.06049ooocceooocce0999911524.233■E.14032■0.00602o.ooccoO.OJ1C8O.9EE911E峪7331.833?3■1J10650.00019o.ooco?09997417怕日33<I.6244B■097075oofltro□dtiei3□091671B22.9330.27033-0.061E3o.ooccoO.O^IE©O.9£ES11923.222-1.077940.35792ooocco0767290.232712D3J.6351.15^0■0.97967O.OOCOIO.OOOE©O.9SSCO217M?2.43047r:厂产rrrrrr099260rrr-r2215J33■0.499aE■0993H3DODDOOD07BD2□921EG23L022-3.403301.30671O.OOCCO0.99EE9O.OCOII2431A330.61847■1.G377DOOflCCO000161099&49257.622-2.279390/11025o.oocco0.96316□.01E642GIF?-m和Hliir炸rrrrrr「000023272.322-3.31324.1.15015O.OOCCO0.99579□.0CO2128M.022-1.992260.^031o.oocco0.979250.02076293273□.77047■220992OOflCCOO00C41□9EAEQ301'.1I2.52656l■11L注比一LLLLIlLLLLLl311631117.8A335-0.30384MOCCOoooccooocccoxl丨卜spsssirtsflcs-壯理誓吕吐塔图-12由于保存了变量,在原数据中多出了几列。其中,变量dis-1存放判别样品所属组别的值,变量dis1-1,dis2-1分别代表将地区各变量值代入第一个,第二个判别函数所得的判别分数,变量dis1-2、dis2-2,dis3-2分别代表地区分别属于第1类、第2类,第3类的Bayes后验概率值。结果表明,广东、河北、上海应分别放入第一类、第三类和第一类。结论:参考文献:方开泰,潘恩沛《聚类分析》地质出版社M.肯德尔【英】《多元分析》科学出版社于秀林,任雪松《多元统计分析》中国统计出版社《中国统计年鉴》2010附录18-4各地区限额以上住宿业企业基本情况和经营情况(2010年)地区法人企业(个)年末从业人数营业额(人)(亿元)#客房收入#餐费收入全国1571321081792797.81309.81143.9北京1240162596304.2149.791.2天津2222413333.315.812.1河北4756867964.925.732.7山西3885868652.822.424.3内蒙古3333811840.919.118.6辽宁5235863785.440.236.7吉林2292335027.111.712.9黑龙江2422609828.415.210.9上海57787962220.4126.565.6江苏906123186186.276.490.3浙江1158165091258.6107.6126.6安徽4285084254.723.725.0福建5217665194.238.944.4江西3804187

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论