多元统计分析实例汇总_第1页
多元统计分析实例汇总_第2页
多元统计分析实例汇总_第3页
多元统计分析实例汇总_第4页
多元统计分析实例汇总_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元统计分析实例院系:商学院学号:姓名:多元统计分析实例本文收集了 2012年31个省市自治区的农林牧渔和相关农业数据,通过对对 收集的数据进行比较分析对31个省市自治区进行分类.选取了 6个指标农业产值, 林业产值.牧业总产值,渔业总产值,农村居民家庭拥有生产性固定资产原值,农 村居民家庭经营耕地面积.数据如下表:农业总产值林业总广4牧业忠广,渔业云广,农村居民家庭拥甫生广性q166.2954.83154. 1612. 9S12767. 090. 5195.992.79105. 0161. 6617508. 571. 583095.2977.881747. 66177. 7417904. 8

2、31. 89847.4179.07298. 83S. 42S08. 382. 51171.797.76111S. S626. OS29盈9. 5910. 41539.65128.681621. 2361S. 7424997. 923. 781166. E898. 11130. 3634. 1424937. 868. 272315.64134. 51350. 6877. 9231507. 9113. 56171. 4S9. 5572. 5957. 454146. 130. 262966.7299.751226. 181235.414541. 031. 251229.36142.14549. 01

3、687. 0522747. 83Q.541867.64209. 51119. 73384. 4315134. 351. 891263.71256.45431. 28903. 3611821. 380. 731003.21228.91752. 68333. 069999. 311. 573960.62107.012235. 921267. 0719168. 141. 643958.95140.352255. 61SS. 412980. 721. 622488.06100.051334. 04626. 2310813. 131. 712651.69259.9714S8. 58279. 94E904

4、. 321. 222229.27222.741134. 14914. 058516. 720. 531724245.561072. 77331. 7411S51. 561. 37460.72137.85214. 14236. 2711387. 060. 83541.S143.48453. 944. 9912295. 741. 292764.9151. 522&9. 86163. 7713759. 171. 14864. 8654.19421. 5528. 2111957. 311. 181398.17225.33912. 9763.11020. 921. 653. 392. 5659. 020

5、. 2252935. 071. 891526. 2S58.44598. 7214. 6112273. 061. 52984 .四20.07231. 721.819436. 442. 72117.094.57137. 080. 5&21919. 341. 83240. 4&9.77105. 7213. 3624266. 193. 69167543.04435. 3715. 2635070. 315. 76江区 京津北西蒙宁林龙海苏江建西东南北南东西南庆川州南藏西肃海夏疆 地北天河山内辽吉黑上江浙安福江山河湖湖广广海重四贵ki西陕甘青宁新一.聚类法设定4个群聚,采用了系统聚类法.下表为spss分析

6、之后的结果.聚类表阶群集组合首次出现阶群集群集1群集2系数群集1群集2下一阶157226.38100132291715.218005322241974.09800741295392.69000652306079.75520661211120.902458742221528.7190311812623185.44460149122026914.251001910273135203.44300201142850321.121702212111365624.068002413525114687.756101714121169600.075802215818188500.814002116171920

7、4825.463002117514268125.1031302018323387465.457002619612425667.984092320527459235.01917102321817499195.4301516252214559258.8101411282356708176.88120192424511854998.386231228258101042394.6082102626381222229.5971825292715161396048.280002928151915098.014222430293153086204.55226273030136791755.63728290R

8、escaled Distance Cluster CombineC A S E 05Label Num +10152025-+内蒙 吉林 云南 江西 陕西 新疆 安徽5-+7-+25-+-+14-+ +-+27-+-+|31-+-+12-+-+|广西 辽宁 浙江 福建 重庆 贵州| 山西 甘肃 北京 青海 天津 上海 宁夏 西藏 海南 河北 四川 黑龙江 湖南 湖北 广东 江苏 山东 河南-+ +-+6-+|11-+|13-+|-+24-+|4-+-+|-+|-+|+|-+|9-+|-+-+|26-+|-+|-+|-+|8-+-+|-+-+|17+-+|10+|+3:河北14:山西15:内蒙2

9、6:辽宁17:吉林28:黑龙江29:上海110:江苏111:浙江112:安徽113:福建114:江西115:山东316:河南117:湖北118:湖南119:广东120:广西121:海南122:重庆123:四川124:贵州125:云南126:西藏427:陕西128:甘肃129:青海130:宁夏131:新疆2从SPSS分析结果可以得到,内蒙,吉林,黑龙江,新疆为第2族群,这一族群的 特点是农业收入可能不高,但是农民的固定资产,和耕地面积非常高,农民的富余 程度或者机械化程度较高;山东是第3族群,这一族群中六个指标都处于较高水平, 农林牧渔四项收入都处于较高水平而且农民富余;西藏处于第4族群,这是因

10、为, 西藏人员较少,自然条件恶劣,可使用耕地少,但是,由于国家的扶持,农民的固定 资产较多,农民相对而言比较富足;大多数省份属于第1族群,这一族群的特点在 于六项指标都没有较为突出的一项,或者农林牧渔收入的本来就少,或者是农民 的虽然比较辛苦,总体的农业收入较高,但是农民的收入水平比较低,固定资产较 少.三.判别法X 1,X2, X3, X4, X5, X6分别代表农业产值,林业产值.牧业总产值,渔业总产 值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积.分析案例处理摘要末加权案例N百分比有效31100.0排除的缺失或越界组代码0.0至少一个缺失判别变量0.0缺失或越界组代码还

11、有至少一 个缺失判别变量0.0合计0.0合计31100.0实验结果分析:组统计量Average Linkage (Between Groups)有效的N (列表状态)均值标准差未加权的已加权的1农业总产值1463.89001062.034862525.000林业总产值118.576887.020522525.000牧业总产值830.3664671.104402525.000渔业总产值291.4128346.719022525.000农村居民家庭拥有生产性固定 资产原值14432.34005287.929502525.000农村居民家庭经营耕地面积1.5496.884842525.0002农业总

12、产值1582.2975543.9285144.000林业总产值93.350037.7113144.000牧业总产值1021.3175372.8825544.000渔业总产值38.350027.4906744.000农村居民家庭拥有生产性固定 资产原值30226.41754233.7783944.000农村居民家庭经营耕地面积9.49753.3062644.000311农业总产值3960.6200.a11.000林业总产值107.0100.a11.000牧业总产值2285.9200.a11.000渔业总产值1267.0700.a11.000农村居民家庭拥有生产性固定 资产原值19168.1400

13、.a11.000农村居民家庭经营耕地面积1.6400.a11.0004农业总产值53.3900.a11.000林业总产值2.5600.a11.000牧业总产值59.0200.a11.000渔业总产值.2200.a11.000农村居民家庭拥有生产性固定 资产原值52935.0700.a11.000农村居民家庭经营耕地面积1.8900.a11.000从表上可以看出,组均值之间差值很大.各个分组,在6项指标上均值有较明 显的差异.组均值的均等性的检验Wilks 的 LambdaFdf1df2Sig.农业总产值.7732.640327.070林业总产值.928.699327.561牧业总产值.8012

14、.238327.107渔业总产值.6914.019327.017农村居民家庭拥有生产性固定 资产原值.25326.538327.000组均值的均等性的检验Wilks 的 LambdaFdf1df2Sig.农业总产值.7732.640327.070林业总产值.928.699327.561牧业总产值.8012.238327.107渔业总产值.6914.019327.017农村居民家庭拥有生产性固定 资产原值.25326.538327.000农村居民家庭经营耕地面积.19038.263327.000由表中可以知道,13456指标之间的sig值较小,2指标sig值有0.561较大, 不过仍说明接受原假

15、设,各指标族群间差异较大.汇聚的组内矩阵农业总产值林业总产值牧业总产值渔业总产值相关性农业总产值1.000.449.895.400林业总产值.4491.000.489.481牧业总产值.895.4891.000.294渔业总产值.400.481.2941.000农村居民家庭拥有生产性固定 资产原值-.093-.262-.052-.040农村居民家庭经营耕地面积.056-.033.181-.104汇聚的组内矩阵农村居民家庭拥 有生产性固定资 产原值农村居民家庭经 营耕地面积相关性农业总产值-.093.056林业总产值-.262-.033牧业总产值-.052.181渔业总产值-.040-.104农

16、村居民家庭拥有生产性固定 资产原值1.000.326农村居民家庭经营耕地面积.3261.000从表中可以知道,检验结果P值0.05,此时,说明协方差矩阵相等,可以进 行bayes检验.Fisher分析法协方差矩阵的均等性的箱式检验对数行列式AverageLinkage (Between Groups)秩对数行列式1661.1252.a.b3.C.b4.c.b汇聚的组内662.351打印的行列式的秩和自然对数是组协方差 矩阵的秩和自然对数。典型判别式函数摘要特征值函数特征值方差的%累积%正则相关性14.874a64.264.2.91122.084a27.491.6.8223.638a8.4100

17、.0.624由表中看出,函数1,2的特征值达到0.911,0.822比较大,对判别的贡献大.标准化的典型判别式函数系数函数123农业总产值.500-.196.000林业总产值.234.164-.742牧业总产值-.639.143.649渔业总产值-.185-.130.869农村居民家庭拥有生产性 固定资产原值.3701.022.071农村居民家庭经营耕地面 积.865-.676.051典型判别式函数系数函数123农业总产值.000.000.000林业总产值.003.002-.009牧业总产值.000.000.001渔业总产值.000.000.003农村居民家庭拥有生产性固 定资产原值.000.

18、000.000农村居民家庭经营耕地面积.626-.489.037(常量)-2.928-2.269-.975典型判别式函数系数函数123农业总产值.000.000.000林业总产值.003.002-.009牧业总产值.000.000.001渔业总产值.000.000.003农村居民家庭拥有生产性固 定资产原值.000.000.000农村居民家庭经营耕地面积.626-.489.037(常量)-2.928-2.269-.975非标准化系数由表中可知,3个Fisher判别函数分别为:y =2.928 + 0.003X + 0.626Xy = 2.269 + +0.002X 0.489X226y3 =

19、0.975 0.009X 2 + 0.01X 3 + 0.03 X 4 + 0.037 X 6农村居民家庭拥有生产性固定资产原值对判别数据所属群体无用.结构矩阵函数123农村居民家庭经营耕地 面积.909*-.319.126农村居民家庭拥有生产 性固定资产原值.585.775*.213林业总产值-.068-.162*-.027渔业总产值-.164-.059.695*农业总产值-.026-.179.591*牧业总产值.007-.166.547*判别变量和标准化典型判别式函数之间的汇聚组间相关 性按函数内相关性的绝对大小排序的变量。*.每个变量和任意判别式函数间最大的绝对相关性该表是原始变量与典型

20、变量(标准化的典型判别函数)的相关系数,相关系数的绝对值越大,说明原始变量与这个判别函数的相关性越强.从表中可以看出相关 性较强.符合较好.组质心处的函数AverageLinkage(BetweenGroups)函数1231-.859-.159-.17025.184-.860.0853-1.262.1624.05842.0137.257-.144在组均值处评估的非标准化典型判别式函数由上表可知各类别重心的位置,通过计算观测值与各重心的距离,距离最小的即为该观测值的分类.贝叶斯分析法分类函数系数Average Linkage (Between Groups)1234农业总产值.003.006.0

21、02.003林业总产值.029.042-.010.051牧业总产值-.003-.009.002-.004渔业总产值-.002-.004.010-.006农村居民家庭拥有生产性 固定资产原值.001.001.001.002农村居民家庭经营耕地面 积.1534.286-.100-1.675(常量)-8.418-38.180-20.732-61.646分类函数系数Average Linkage (Between Groups)该表为贝叶斯函数判别函数的取值,从图中可以知道三类贝叶斯函数.y = 0.03x + 0.029x - 0.03x - 0.002x + 0.001x + 0.153x - 8

22、.418 TOC o 1-5 h z 第一类.1123451第一类.y = 0.06x + 0.42x -0.009x -0.004x + 0.004x + 4.286x -38.18第一类;2123456第二类.y = 0.02x -0.010 x + 0.002x + 0.010 x + 0.001x -1.x - 20.732第一类;3123456第四类.y = 0.003x + 0.051x -0.004x -0.006x + 0.002x -1.675x - 61.646第四类.4123456将各样品的自变量值代入上述4个Bayes判别函数,得到函数值。比较函数值,哪 个函数值比较大

23、就可以判断该样品判入哪一类.判别结果检验按照案例顺序的统计量案例数最高组P(Dd | G=g)实际组预测组Pdf初始111.6843211.9453311.7243411.3903522.9613611.1173722.5333822.0133911.17231013*.58531111.21931211.97531311.98031411.699315331.00031611.90031711.31331811.77331911.46832011.86832111.74232211.94932311.67232411.91032511.268326441.00032711.92932811.

24、56832911.52633011.18233122.0303*.错误分类的案例分类结果aAverageLinkage(BetweenGroups)预测组成员123初始计数12401204030014000%96.0.04.02.0100.0.03.0.0100.0从上图可以看出本次判别分析的结果比较贴近,只有第10统计量在分布上出现不同.从总体而言,判别效果较好.3.主成分分析通过SPSS主成分统计分析,得到如下数据.公因子方差初始提取农业总产值1.000.874林业总产值1.000.528牧业总产值1.000.882渔业总产值1.000.543农村居民家庭拥有生产性固定 资产原值1.000

25、.706农村居民家庭经营耕地面积1.000.781提取方法:主成份分析。解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%12.72845.46345.4632.72845.46321.58526.42271.8861.58526.4223.67611.26483.1504.60910.14993.2995.3315.51598.8146.0711.186100.000提取方法:主成份分析。角牟释的总方差成份提取平方和载入旋F转平方和载入累积%合计方差的%累积%145.4632.62443.74043.740271.8861.68928.14671.886提取方法:主成份分析。从以上表可以知道,成分七的特征值都1,并且解释了71.886%的方差,达到了主成分分析的要求.所以只要提取两个因子即可满足要求.其他因子不予以提取.得到以下数据.成份矩阵a成份12农业总产值.875.330林业总产值.720-.097牧业总产值.836.428渔业总产值.724-.138农村居民家庭拥有生产性固定 资产原值-.428.723农村居民家庭经营耕地面积-.194.862提取方法:主成分分析法。a.已提取了 2个成份。F = 0.875X + 0.72X + 0.836X + 0.724X - 0.42

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论