版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、对我国30个省市自治区农村居民生活水平作聚类分析
1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、
消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农
村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、衣村
居民家庭人均纯收入、耕地面积及农村就业人数。现从2010年的调查资料中
抽取30个样木,指标数据如下:
农产品农村居农村居农村私
农村住农村居耕地面
价格指民生活民家庭营企业
宅投资民消费积2008
地区数(.1-.消费支人均纯就业人
(亿水平(万公
出合计收入数(万
元)(元)顷)
=100)(元)(元)人)
北京98.2793.04128869254.813262231.7153.9
天津103.0348.3178144936.710075441.18.0
河北99.70441.7538673844.959586317.380.9
山西100.43168.7145003663.947364055.851.7
内蒙古99.8333.1744864460.855307147.218.4
辽宁102.90162.0557394489.569084085.399.5
吉林103.7771.6546634147.462375534.621.2
黑龙江98.07126.4545364391.2621111830.142.8
上海102.232.121360910210.513978244.0258.4
江苏99.92284.5581966542.991184763.8569.8
浙江100.25513.7598788928.9113031920.9398.3
安徽99.08412.4844474013.352855730.2105.9
福建98.04176.3568795498.374271330.1113.1
江西96.81236.5343973911.657892827.1173.2
山东101.23566.9057334807.269907515.3273.6
河南99.07729.4740613682.255247926.4137.7
湖北96.30210.0647584090.858324664.166.4
湖南90.61298.4145134310.456223789.4104.5
广东94.95337.4458805515.678902830.7124.4
广西89.25248.8035613455.345434217.589.0
海南101.9126.2238463446.25275727.55.3
重庆88.9980.1236523624.652772235.936.7675
四川96.94456.1047483897.550875947.4140.3
贵州96.11137.2229262852.534724485.325.4
云南96.50158.9736033398.339526072.141.3
陕西95.83151.7936833793.841054050.31.7
甘肃100.2297.3329752942.034254658.822.0
青海94.6163.6336843863542.710.511.4
宁夏99.3929.51389446751107.143.616.7
新疆92.8779.3535903457.946434124.618.7
数据来源:《中国统计年鉴2010》.
2、将数据进行标准化变换:
农村
农村居农村居耕地农村私
宅
农产品住农村居
民生活民家庭面积营企业
资
价格指投民消费
地区消费支人均纯2008就业人
数(上年1亿水平
出合计(万数1万
元
=100),(元)
(元)(元)公顷)人)
北京0.09-0.672.822.532.37-1.360.37
天津1.33-0.910.920.151.30-1.29-0.78
河北0.471.24-0.56-0.46-0.070.84-0.21
山西0.65-0.25-0.33-0.56-0.480.02-0.44
内蒙古0.50-0.99-0.33-0.12-0.211.15-0.70
辽宁1.30-0.290.14-0.100.250.03-0.06
吉林1.52-0.78-0.26-0.290.020.56-0.68
黑龙江0.04-0.48-0.31-0.150.012.84-0.51
上海1.12-1.163.093.062.60-1.361.20
江苏0.520.38L061.040.980.283.66
浙江0.611.641.692.351.71-0.752.31
安徽0.301.08-0.35-0.36-0.300.63-0.01
福建0.04-0.210.570.460.42-0.970.05
江西-0.280.12-0.36-0.42-0.13-0.420.52
山东0.861.930.140.080.271.281.32
河’南0.302.82-0.49-0.55-0.221.430.24
湖北-0.42-0.03-0.23-0.32-0.110.24-0.32
湖南-1.890.46-0.32-0.20-0.18-0.07-0.02
广东-0.770.670.190.470.57-0.420.14
广西-2.240.19-0.68-0.67-0.540.08-0.14
海南1.04-1.03-0.57-0.68-0.30-1.18-0.81
重庆-2.31-0.74-0.64-0.58-0.30-0.64-0.56
四川-0.251.32-0.23-0.43-0.360.710.26
贵州-0.46-0.42-0.92-1.00-0.900.18-0.65
云南-0.36-0.31-0.66-0.70-0.740.75-0.52
陕西-0.54-0.34-0.63-0.48-0.690.02-0.83
甘肃0.60-0.64-0.90-0.96-0.920.24-0.67
青海-0.85-0.83-0.63-0.45-1.88-1.44-0.76
宁夏0.39-1.01-0.550.00-1.69-1.43-0.71
新疆-1.30-0.74-0.67-0.67-0.510.05-0.70
3、用K-均值聚类法对样本进行分类如下:
聚类成员
案例号地区聚类距离
1北京11069.19
2天津23060.35
3河北3920.65
4ill西41506.42
5内蒙古3577.12
6辽宁22453.89
7吉林31487.95
8黑龙江35006.41
9上海12094.38
10江苏22853.42
11浙江13015.14
12安徽31204.49
13福建21612.46
14江西41880.40
15U东32088.55
16河南31282.27
17湖北32230.15
18湖南42053.35
19r东21119.98
20广西41412.14
21海南42541.05
22直庆41423.51
23四川31138.14
21贵州12025.41
25云南32196.63
26陕西41127.91
27甘肃42123.67
28青海44568.60
29字夏44247.12
30新疆41360.50
分四类的情况下,最终分类结果如下:
第一类:北京、上海、浙江。
第二类:天津、、辽宁、、福建、甘肃、江苏、广东。
第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四
川、云南。
第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。
从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,
第二类属于中等水平,第三类、第四类属于较低水平。
二、判别分析
针对以上分类结果进行判别分析。其中将新疆作作为待判样本。判别结果如下:
案例数目实际组预测组P
1110.998
2220.575
3330.997
4440.361
5330.836
6220.234
7330.787
8330.097
9110.521
10220.439
11110.486
12330.992
13220.739
14440.415
15330.244
16330.406
17330.387
18440.421
19220.333
20440.95
21410.285
22440.453
23330.951
24440.337
2534**0.278
26440.632
27410.278
28440.222
29440.124
30440.981
**.错误分类的案例
从上可知,只有一个地区判别组和原组不同,回弋率为96%。
下面对新疆进行判别:
已知判别函数系数和组质心处函数如下:
标准化的典型判别式函数系数
函数
123
农产品价格指数0.180.3980.394
农村住宅投资0.4930.687-0.197
农村居民价格水
0.0870.3620.243
平
生活消费支出1.0040.094-0.817
人均纯收入0.381-0.2820.565
耕地面积-0.0411.019-0.235
就业人数-0.631-0.7420.802
组质心处的函数
函数
组号123
110.678-0.369-0.628
21.747-0.7511.175
3-0.9621.899-0.032
4-2.595-1.177-0.306
判别函数分别为:Yl=0.18xl+0.493x2+0.087x3+1.004x4+0.381x5-0.041x6-0.631x7
丫2=0.398x1+0.687x2+0.362x3+0.094x4-0.282x5+1.019x6-0.742x7
丫3=0.394x1-0.197x2+0.243x3-0.817x4+0.565x5-0.235x6+0.802x7
将西藏的指标数据代入函数得:Yl=-1.08671
Y2=-0.62213
丫3bo.84188
计算丫值与不同类别均值之间的距离分别为:01=138.5182756
02=12.11433124
D3=7.027544292
D4=2.869979346
经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。
三,因子分析:
分析数据在上表的基础上去掉两个耕地面积和农村固定资产投资两个指标。
经SPSS软件分析结果如下:
(1)各指标的相关系数阵:
CorrelationMatrix
农产品价农村居庭人均
格指数民消费消费支出纯收入业就业人数
Correlation农产品价格指数1.000.356.296.351.187
农村居民消费.3561.000.968.922.584
消费支出.296.9681.000.864.625
庭人均纯收入.351.922.8641.000.578
业就业人数.187.584.625.5781.000
从中可以看出,大部分指标的相关系数都比较高,各变量之间的线性关系较明确,
能够从中提取公共因子,适合因子分子。
(2)检验:
KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasureofSampling
Adequacy..701
BartlettsTestofApprox.Chi-Square145.585
Sphericitydf10
Sig..000
由上表可知:巴特利特球度检验统计量的观测值为145.585.相应的概率p接近为
0.如果显著性水平a为0.05,由于显著性水平小于0.05,拒绝零假设,认为相关
系数矩阵与单位阵有显著差异,同时,K0M值为0.701,根据Kaiser给出的度量标
准可知原有变量适合进行因子分析
(3)各指标的贡献率如下表:
Communalities
InitialE>:traction
农产品价格指数1.000.979
农村居民消费1.000.938
消费支出1.000.923
庭人均纯收入1.000.878
业就业人数1.000.598
ExtractionMethod:PrincipalComponentAnalysis.
从中可以看出,各个指标的贡献率都在百分之五十之上比较高。
TotalVarianceExplained
hitialBoenviluesExtractionSumsofSquaredLoadingsRotationSumso<SquaredLoadings
%Of%Of%Of
ComponentTotalVarianceCumulative%TotalVarianceCumulatee%TotalVarianceCumulath/e%
13.44968.97368.9733.44968.97368.9733.20063.99763997
2.86717.34086.313.86717.34086.3131.11622.31586313
3.52610.51796.830
4.1402.79699.626
5.019.374100.000
ExtractionMethod:PrineoalConponentAnaf/sis.
从上表中可以看出,第一个因子的特征根为3.449.解释原有五个变量总方差的
68%,累积方差贡献率为68.973虬第二个因子的特征根为0.863,解释原有变量
总方差17.34%,累计方差贡献率为86.313%。
(4)碎石图:
ScreePlot
(5)因子载荷阵如下:
ComponentMatri火
Component
12
农产品价格指数.446.883
农村居民消费.967-.052
消费支出.952-.125
家庭人均纯收入.936-.039
就业人数.729-.258
ExtractionMethod:PrineipalComponentAnalysis,
a.2componentsextracted.
由上表可知,各指标在第一个因子上的载荷比较高,说明第一个因子很重要;
第二个因子与原有变量的相关性较小,它对原有变量的解释作用不显著。为便于
对各因子进行命名,虎因子载荷阵实施正交旋转。
旋转之后的因子载荷阵:
RotatedComponentMatri文
Component
12
农产品价格指数.150.978
农村居民消费.936.251
消费支出.944.177
家庭人均纯收入.902.253
就业人数.773-.019
ExtractionMethod:PrineipalComponentAnalysis.
RotationMethod:VarimaxwithKaiserNormalization.
a.Rotationconvergedin3iterations.
(6)从上表可见,每个因子只有几个指标的因子载荷较大,因此可根据上表进
行分类。将五个指标按高载荷分成两类:
品载荷指标意义
农村居民消费水平
1农村生活消费支出收支因子
农村居民家庭人均收入
2农产品价格指数价格因子
四,主成分分析:
(1)各指标间的相关系数矩阵如下表所示:
CorrelationMatrix
农产品价农村居庭人均
格指数民消费消费支出纯收入业就业人数
Correlation农产品价格指数1.000.356.296.351.187
农村居民消费.3561.0C0.968.922.584
消费支出.296.9681.000.864.625
庭人均纯收入.351.922.8641.000.578
业就业人数.187.584.625.5781.000
可以看到有些指标之间的相关性较强,如果直接进行综合分析会造成信息重叠,
所以用主成分分析将多个指标化成几个不相关的综合指标。
(2)求相关矩阵的特征值和特征向量:
特征根方差贡献率累计贡献率
13.44968.97368.973
20.86717.3486.313
30.52610.51796.83
40.142.79699.626
50.0190.374100
从上表可知,前两个特征值累计贡献率已达86.3:3%。说明前两个主成分基本包
含了全部指标具有的信息。因此,取前两个特征值,并计算相应的特征向量:
(3)由上述因子分子的因子载荷阵计算主:成分的特征向量阵为:
compoent
12
农产品价格指数0.1351121.018454
农村居民消费水平0.280371-0.059977
消费支出0.276022-0.144175
家庭人均年纯收入0.271383-0.044983
就业人数0.211366-0.297578
所以,前两个主成分为:
第一个主成分:F1=O.135112X1+0.280371X2+0.276022X3+0.271383X4+0.211366X5
第二个主成分:F2=l.018454X1-0.059977X2-0.144175X3-0.044983X4-0.297578X5
在第一主成分中第二、三、四个指标的系数较大,这三个指标起主要作用,刻划了农
居民的收入支出状况的综合指标。
在第二主成分中,第一个指标系数较大,是农产品价格水平指标。
(4)因子得分:
ComponentScoreCoefficientMatrix
Component
12
农产品价格指数-.1931.009
农村居民消费.285.031
消费支出.307-.051
家庭人均纯收入.272.041
就业人数.293-.218
ExbactionMethod;PrincipalComponentAnalysis.
RotationMethod:VarimaxwithKaiserNormalization.
ComponentScores.
根据上表写出以下因子得分函数:
Fl=-0.193农产品价格指数+0.285农村居民消费+0.307消费支出+0.272家庭
人均纯收入+0.293就业人数
F2=l.009农产品价格指数+0.031农村居民消费-0.051消费支出+0.041家庭人
均纯收入-0.218就业人数
(5)综合评价:以两个因子的方差贡献率为权数,综合评价模型为:
Z=0.63997F1+0.22315F2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 61300-3-50:2025 FR Fibre optic interconnecting devices and passive components - Basic test and measurement procedures - Part 3-50: Examinations and measurements - Crosst
- 【正版授权】 IEC 61811-1:2015/AMD1:2025 EN Amendment 1 - Electromechanical telecom elementary relays of assessed quality - Part 1: Generic specification and blank detail specification
- 可爱风中小学开学安全第一课
- 制药厂安全工程课件
- 制度安全培训心得课件
- 制图基本知识课件
- 工程兵知识课件
- 燃气、电气设备检查管理制度模版(三篇)
- 运输安全生产监督检查制度
- 成本控制与优化策略在联合治疗中应用
- 纺织服装电线电缆施工合同
- DB11∕T 493.3-2022 道路交通管理设施设置规范 第3部分:道路交通信号灯
- 第17课 辛亥革命与中华民国的建立(课件)-【中职专用】《中国历史》魅力课堂教学三件套(高教版2023•基础模块)
- 期末考试-公共财政概论-章节习题
- 广东省广州市番禺区祈福英语实验学校2020-2021学年八年级上学期期中数学试题
- 蜡疗操作评分标准
- 2023广东高职高考英语真题卷附答案解析
- 心理学导论学习通超星课后章节答案期末考试题库2023年
- 牛津版小学英语教材梳理
- 侦查学的重点
- GB/T 1355-2021小麦粉
评论
0/150
提交评论