多元统计分析与统计软件实验指导书-实验三-判别分析_第1页
多元统计分析与统计软件实验指导书-实验三-判别分析_第2页
多元统计分析与统计软件实验指导书-实验三-判别分析_第3页
多元统计分析与统计软件实验指导书-实验三-判别分析_第4页
多元统计分析与统计软件实验指导书-实验三-判别分析_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验三判别分析

【实验目的】

1.通过上机操作使学生掌握判另1分析方法在SPSS软件中的实现。

2.要求学生重点掌握该方法的用途,能正确解释软件处理的结果。

【实验性质】

必修,根底层次

【实验仪器及软件】

计算机及SPSS软件

【实验内容】

学会判别分析的根本操作,熟悉各对话窗口,对输出的分析结果进行解读并给出分析结论。

【实验学时】

4学时

【实验考前须知】

1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。

2.遇到各种难以处理的问题,请询问指导教师。

3.为保证计算机的平安,上机过程中非经指导教师和实验室管理人员1可意,禁止使用移动

存储器。

4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验

室管理人员同意。

5.上机时间,禁止使用计算机从事与课程无关的工作。

【实验例题】为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差

平方和聚类方法将30个省、市、自治区.分为二种类型。试建立判别函数,判定广东、西

藏分别属于哪个收入类型。判别指标及原始数据见表1。

表L1991年30个省、市、自治区城镇居民月平均收人数据表

单位:元/人

x.:人均生活费收入X6:人均各种奖金、超额工资(国有+集体)

X2:人均国有经济单位职工工资X7:人均各种津贴(国有+集体)

X3:人均来源了国有经济单位标准工资XH:人均从工作单位得到的其他收入

X,:人均集体所有制工资收入X〉个体劳动者收入

X5:人均集体所有制职工标准工资

地区x

XiX2X34x5X6x7X8X9

类序

1北京170.03110.259.768.384.4926.8016.4411.90.41

2天津141.5582.5850.9813.49.3321.3012.369.211.05

3河北119.4083.3353.3911.07.5217.3011.7912.00.70

4上海194.53107.860.2415.68.8831.0021.0111.80.16

5山东130.4686.2152.3015.910.520.6112.149.610.47

G6湖北119.2985.4153.0213.18.4413.8716.478.380.51

7广西134.4698.6148.188.904.3421.4926.1213.64.56

8海南143.7999.9745.606.301.5618.6729.4911.83.82

9四川128.0574.9650.1313.99.6216.1410.1814.51.21

10云南127.4193.5450.5710.55.8719.4121.2012.60.90

11新赧122.96101.469.706.303.8611.3018.965.624.62

1山西102.4971.7247.729.426.9613.127.96.660.61

2内蒙古106.1476.2746.199.656.279.65520.106.970.96

3吉林104.9372.9944.6013.79.019.43520.616.651.68

4黑龙江103.3462.9942.9511.17.418.34210.196.452.68

5江西98.08969.4543.0411.47.9510.5916.507.691.08

G:6河南104.1272.2347.319.486.4313.1410.438.301.11

7贵州108.4980.7947.526.063.4213.6916.538.372.85

8陕西113.9975.650.885.213.8612.949.4926.771.27

9甘肃114.0684.3152.787.815.4410.8216.433.791.19

10青海108.8080.4150.457.274.078.37118.985.950.83

11宁熨115.9688.2151.858.815.6313.9522.654.750.97

1辽宁128.4668.9143.4122.415.313.8812.429.011.41

2江苏135.2473.1844.5423.915.222.389.66113.91.19

3浙江162.5380.1145.9924.313.929.5410.9013.03.47

G

4安徽111.7771.U743.6419.412.blb.689.6987.UZ0.b3

5福建139.0979.0944.1918.510.520.2316.477.673.08

6湖南124.0084.6644.0513.57.4719.1120.4910.31.76

待1广东211.301M.041.4433.211.2■18.7230.7714.911.1

判2西藏175.93163.857.894.223.3717.8182.3215.70.00

贝叶斯判别的SPSS操作方法:

1.建立数据文件

2.单击AnalyzefClassify-*Discriminant,翻开DiscriminantAnalysis判别分析对话框如图1所

示:

图1DiscriminantAnalysis判别分析对话框

3.从对话框左侧的变量列表中选中进行判别分析的有关变量xl〜x9进入Independents框,作为判

别分析的根底数据变量。

从对话框左侧的变量列表中选分组变量Group进入GroupingVariable框,并点击DefineRange..

钮,在翻开的DiscriminantAnalysis:DefineRange对话框中,定义判别原始数据的类别数,由于原

始数据分为3类,那么在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。

选择后点击Continue按钮返回DiscriminantAnalysis主对话框。

图2DefineRange对话框

4、选择分析方法

◊Enterindependenttogether所有变量全部参与判别分析(系统默认)。本例选择此项。

◊Usestepwisemethod采用逐步判别法自动筛选变量。

单击该项时Method按钮激活,翻开StepwiseMethod对话框如图3所示,从中可进一步选择

判别分析方法。

图3StepwiseMethod对话框

<Method栏,选择变量的统计量方法

VVilks'lambda(默认)按统计量Wilks入最小值选择变量;

Unexplainedvariance:按照所有组方差之和最小值选择变量;

Mahalanobis'distance:按照相邻两组的最大马氏距离选择变量;

SmalkstFratio:按组间最小F值比的最大值选择变量;

Rao'sV按照统计量RaoV最大值选择变量。

令Criteria选择逐步回归的标准(略)选择系统默认项。

5.单击Statistics按钮,翻开Statistics对话框如图4所示,从中指定输出的统计量。

<Descriptives描述统计量栏

Means-各类中各自变量的均值,标准差stdDev和各自变量总样本的均值和标准差(本例

选择)。

UnivariateANOV•一对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分

析结果(本例选择),

Box、M-对各类的协方差矩阵相等的假设进行检验(本例选择)。

图4Statistics对话框

令Functioncoefficients选择输出判别函数系数

Fisherh^s给出贝叶斯判别函数系数(本例选择)

Unstandardized给出未标准化的典型判别(也称典那么判别)系数(费舍尔判别函数)。

<Matrices栏选择给出的自变量系数矩阵

Within-groupscorrelation合并类内相关系数矩阵(本例选择)

VVithin-groupscovariance合并类内协方差矩阵(本例选择)

Scparate-groupscovariance各类内协方差矩阵(本例选择)

Totalcovariance总协方差矩阵(本例选择)

6.单击Classify按钮,翻开Classify对话框如图5所示:

图5Classify对话框

令PriorProbabilities栏.选择先验概率。

Allgroupsequal各类先验概率相等(系统默认);

Computefromgroupssizes各类的先验概率与其样本量成正比.(本例选择)

<UseCovarianceMatrix栏,选择使用的协方差矩阵

Within-groups-使用合并类内协方差矩阵进行分类(系统默认)(本例选择)

Separate-groups-使用各类协方差矩阵进行分类

<Display栏,选择生成到输出窗口中的分类结果

Casewiseresults输出每个观测量包括判别分数实际类预测类(根据判别函数求得的分类结果)

和后验概率等。

Summarytable输出分类的小结给出正确分类观测量数(原始类和根据判别函数计算的预测类

相同)和错分观测量数和错分率(本例选择)。

Leave-one-outclassification输出交互验证结果。

令Plots栏,要求输出的统计图

Combined-groups生成一张包括各类的散点图(本例选择〕;

Separate-groups每类生成一个散点图;

Territorialmap根据生成的函数值把各观测值分到各组的区域图。(本例选择)

6.单击Save按钮,翻开Save对话框,见图6.

图6Save对话框

令Predictedgroupmembership建立一个新变量,系统根据判别分数,把观测量按后验概率最大

指派所属的类;(本例选择J

令Discriminantscore建立说明判别得分的新变量,该得分是由未标准化的典那么判别函数计

算。(本例选择)

<Probabilitiesofgroupmembership建立新变量说明观测量属于某一类的概率。有m类,对一

个观测量就会给出m个概率值,因此建立m个新变量。(本例选择)

全部选择完成后,点击OK,得到输出结果如下:

AnalysisCaseProcessingSummary分类样本综述

UnweightedCasesNPercent

Valid2893.3

ExcludedMissingorout-of-rangegroupcodes

26.7

Atleastonemissingdiscriminatingvariable

0.0

Bothmissingorout-of-rangegroupcodesand

0.0

atleastonemissingdiscriminatingvariable

Total26.7

Total30100.0

GroupStatistics各类统计分析

MeanStd.DeviationValidN(listwise)

分类

均值标准差有效样本数

UnweightedWeighted

1人均生活费收入(元/人)139.266423.351251111.000

人均国有经济单位职工工资93.091811.388291111.000

人均来源于国有经济单位标准工资53.98826.805301111.000

人均集体所有制工资收入11.20733.449371111.000

人均集体所有制职工标准工资6.76452.896851111.000

人均各种奖金、超额工资(国有+集体)19.80825.556001111.000

人均各种津贴(国有+集体)17.83276.233051111.000

均从工作单位得到的其他收入11.00182.561351111.000

个体劳动者收入1.67361.745281111.000

2人均生活费收入(元/人)107.30995.566411111.000

人均国有经济单位职工工资75.90647.172331111.000

人均来源于国有经济单位标准工资47.75363.420901111.000

人均集体所有制工资收入9.08272.459001111.000

人均集体所有制职工标准工资6.04091.772661111.000

人均各种奖金、超额工资(国有+集体)11.27752.153231111.000

人均各种津贴(国有+集体)15.43755.110231111.000

均从工作单位得到的其他收入6.57731.383501111.000

个体劳动者收入1.3845.734281111.000

3人均生活费收入(元/人)133.515017.1164266.000

人均国有经济单位职工工资76.17006.0628066.000

人均来源于国有经济单位标准工资44.3033.9182566.000

人均集体所有制工资收入20.33334.0903166.000

人均集体所有制职工标准工资12.47833.0459266.000

人均各种奖金、超额工资(国有+集体)20.30335.3934466.000

人均各种津贴(国有+集体)13.27324.3472266.000

均从工作单位得到的其他收入10.15002.8090766.000

个体劳动者收入1.92331.1163166.000

"Total人均生活贽收入(元/人)125.479622.225492828.000

人均国有经济单位职工工资82.714312.090032828.000

人均来源于国有经济单位标准工资49.46366.090332828.000

人均集体所有制工资收入12.32825.365462828.000

人均集体所有制职工标准工资7.70463.541432828.000

人均各种奖金、超额工资(国有+集体)16.56306.108832828.000

人均各种津贴(国有+集体)15.91475.541042828.000

均从工作单位得到的其他收入9.08112.985132828.000

个体劳动者收入1.61361.266012828.000

TestsofEqualityofGroupMeans每个变量各类均值相等的检验

Wilks'LambdaFdfldf2Sig.

人均生活费收入(元/人).54210.567225.000

人均国有经济单位职工工资.50612.226225.000

人均来源于国有经济单位标准工资.5838.923225.001

人均集体所有制工资收入.33824.429225.000

人均集体所有制职工标准工资.47813.672225.000

人均各种奖金、超额工资(国有+集体).49712.664225.000

人均各种津贴(国有•+集体).8981.425225.259

均从工作单位得到的其他收入.51611.715225.000

个体劳动者收入.972.354225.705

PooledWithin-GroupsMatrices(a)合并类内协方差阵和相关矩阵

人均来人均集人均各

人均国源于国人均集体所有种奖金、人均各

人均生活有经济有经济体所有制职工超额工和津贴人均从工作个体学

费收入(元单位职单位标制工资标准工资(国有(国有+单位得到的动者比

/人)工工资准工资收入资+集体)集体)其他收入入

Covaria人均生活费收入(元/

289.10192.21524.6949.270-.43864.10615.8289.298-1.15

nee人)

人均国有经济单位职

92.21579.80623.013-13.984-14.10418.99931.151-2.2292.38

工工资

人均来源于国有经济

24.69423.01323.374-3.496-2.0631.925-1.878-5.027-.05

单位标准工资

人均集体所有制工资

9.270-13.984-3.49610.5247.8773.113-7.1581.660-1.67

收入

人均集体所有制职工

-.438-14.104-2.0637.8776.469.484-7.895,665-1.61

标准工资

人均各种奖金、超额工

64.10618.9991.9253.113.48420.020.3984.724-.78

资(国有+集体)

人均各种津贴(国有+

15.82831.151-1.878-7.158-7.895.39829.766-.7042.84

集体)

均从工作单位得到的

9.298-2.229-5.0271.660.6654.724-.7044.968-.02

其他收入

个体劳动者收入-1.1582.386-.052-1.670-1.611-.7822.849-.0201.68

Correlat人均生活费收入(元/1.000.607.300.168-.010.843.171.245-.05

ion人)

人均国有经济单位职

.6071.000,533-.483-.621.475.639-.112.20

工工资

人均来源于•国有经济

.300.5331.000-.223-.168.089-.071-.466-.00

单位标准工资

人均集体所有制工资

.168-.483-.2231.000.955.214-.404,230-.39

收入

人均集体所有制职工

-.010-.621-.168.9551.000.043-.569.117-.48

标准工资

人均各种奖金、超额工

.843.475.089.214.0431.000.016.474-.13

资(国有+集体)

人均各种津贴(国有十

.171.639-.071-.404-.569.0161.000-.058.40

集体)

均从工作单位得到的

.245-.112-.466.230,117.474-.0581.000-.00

其他收入

个体劳动者收入-.053.206-.008-.397-.488-.135.402-.0071.00

aThecovariancematrixhas25degreesoffreedom.

CovarianceMatrices(a)类内协方差矩阵和总协方差阵

人均来人均集

人均生源于国人均集体所有人均各种均从工作

活费收人均国有有经济体所有制职工奖金、超额人均各种单位得到个体劳

分入(元/经济单位单位标制工资标准工工资(国有津贴(国的其他收动者收

类人)职工工资准工资收入资+集体)有+集体)入入

1人均生活费收入

545.281179.03037.98513.286-1.453116.97635.80813.315-10.859

(元/人)

人均国有经济单

179.030129.69335.643-18.802-20.62033.02346.461-2.1685.263

位职工工资

人均来源于国有

经济单位标准工37.98535.64346.312-3.559-1.186-.665-6.736-10.545.482

人均集体所有制

13.286-18.802-3.55911.8989.5605.957-12.6991.012-4.445

工资收入

人均集体所有制

-1.453-20.620-1.1869.5608.3921.919-14.117-.005-3.647

职工标准工资

人均各种奖金、超

额工资(国有+集116.97633.023-.6655.9571.91930.8695.4156.027-3.897

体)

人均各种津贴(国

35.80846.461-6.736-12.699-14.1175.41538.8511.9946.789

有+集体)

均从工作单位得

13.315-2.168-10.5451.012-.0056.0271.9946.560-.697

到的其他收入

个体劳动者收入-10.8595.263.482-4.445-3.647-3.8976.789-.6973.046

2人均生活费收入

30.98532.28116.743-8.701-6.4253.9118.151-4.843-.269

(元/人)

人均国有经济单

32.28151.44220.556-9.294-7.4985.98021.768-5.232-1.357

位职工工资

人均来源干国有

经济单位标准工16.74320.55611.703-6.005-4.1723.0252.431-2.925-.978

人均集体所有制

-8.701-9.294-6.0056.0474.231-2.4192.394.261.004

工资收入

人均集体所有制

-6.425-7.498-4.1724.2313.142-1.380.196.155-.106

职工标准工资

人均各种奖金、超

额工资(国有+集3.9115.9803.025-2.419-1.3804.636-2.436.506-.145

体)

人均各种津贴(国

8.15121.7682.4312.394.196-2.43626.114-2.255-.323

有+集体)

均从工作单位得

-4.843-5.232-2.925.261.155.506-2.2551.914.307

到的其他收入

个体劳动者收入-.269-1.357-.978,004-.106-.145-.323.307.539

3人均生活费收入

292.97238.45114.01337.17813.56778.758-8.77629.54716.466

(元/人)

人均国有经济单

38.45136.7582.665-13.730-14.28616.99019.2973.6584.120

位职工工资

人均来源于国有

经济单位标准工14.0132.665.8431.649.4004.905-.7831.806.732

人均集体所有制

37.178-13.7301.64916.73111.8028.488-15.1805.753.532

工资收入

人均集体所有制

13.567-14.286.40011.8029.2781.340-11.6323.026-.549

职工标准工资

人均各种奖金、超

额工资(国有+集78.75816.9904.9058.4881.34029.089-3.96710.5564.171

体)

人均各种津贴(国

-8.77619.297-.783-15.180-11.632-3.96718.898-2.9981.312

有+集体)

均从工作单位得

29.5473.6581.8065.7533.02610.556-2.9987.891.680

到的其他收入

个体劳动者收入16.4664.120.732,532-.5494.1711.312.6801.246

Tbt人均生活费收入

493.973182.38251.72240.60615.154123.39024.24539.8411.513

al(元/人)

人均国有经济单

182.382146.16952.685-20.328-19.36240.53242.11811.4472.648

位职工工资

人均来源于国有

经济单位标准工51.72252.68537.092-12.222-7.9587.1575.158-.595-.133

人均集体所有制

40.606-20.328-12.22228.78818.41415.043-11.5725.872-.720

工资收入

人均集体所有制

15.154-19.362-7.95818.41412.5426.755-10.5232.711-1.031

职工标准工资

人均各种奖金、超

额工资(国有+集123.39040.5327.15715.0436.75537.3181.73713.194.106

体)

人均各种津贴(国

24.24542.1185.158-11.572-10.5231.73730.703.7082.548

有+集体)

均从工作单位得

39.84111.447-.5955.8722.71113.194.7088.911.335

到的其他收入

个体劳动者收入1.5132.648-.133-.720-1.031.1062.548.3351.603

aThetotalcovariancematrixhas27degreesoffreedom.

Box'sTestofEqualityofCovarianceMatrices协方差矩阵相等的检验

LogDeterminants

Log

分类RankDeterminant

1914.087

291.573

3.(a).(b)

Pooledwithin-groups915.603

Theranksandnaturallogarithmsofdeterminantsprintedarethoseofthegroupcovariancematrices,

aRank<6

bloofewcasestobenon-singular

TestResults(a)检验结果

Box'sM195.630

FApprox.2.155

dfl45

df21314.073

Sig..000

Testsnullhypothesisofequalpopulationcovariancematrices.

aSomecovariancematricesaresingularandtheusualprocedurewillnotwork.Thenon-singulargroupswillbetested

againsttheirownpooledwithin-groupscovariancematrix.Thelogofitsdeterminantis17.611.

注意,检验没有通过,即各类的协方差相等的假设在显著性水平下是不成立的。

SummaryofCanonicalDiscriminantFunctions典型判别函数综述

Eigenvalues特征值

Canonical

FunctionEigenvalue%ofVarianceCumulative%Correlation

15.082(a)60.760.7.914

23.296(a)39.3100.0.876

aFirst2canonicaldiscriminantfunctionswereusedintheanalysis.

只有两个判别函数,所以特征值只有两个。判别函数的特征值越大,说明函数越具有区别判断力。

最后一列表示是典那么相关系数,是组间平方和与总平方和之比的平方根,表示判别函数分数与组别间

的关联程度。

Wilks'Lambda判别函数检验

lestofFunction(s)Wilks'LambdaChi-squaredfSig.

1through2.03868.52318.000

13330.6118.000

上表中”[through2〃表示两个判别函数的平均数在三个类间的差异情况,P值为0.000表示差异

到达显著水平。

判别函数的Wilks'Lambda值可以通过特征值计算:

判别函数1和判别函数2的Wilks'Lambda值为

判别函数2的Wilks'Lambda值为一--=——-——=0.233

(1+丸2)(14-3.296)

“2”表示在排除了第一个判别函数后,第二个判别函数在三个组别间的差异情况,P值=0.000

表示差异函数2也到达显著水平,

StandardizedCanonicalDiscriminantFunctionCoefficients标准化典型判别函数(系统默认结

果)

Function

12

人均生活费收入(元/人)-.515.214

人均国有经济单位职工工资3.3811.050

人均来源于国有经济单位标准工资-1.109.244

人均集体所有制工资收入2.446-3.031

人均集体所有制职工标准工资-.8343.313

人均各种奖金、超额工资(国有.+集体)-1.227-.456

人均各种津贴(国有+集体)-1.817.186

均从工作单位得到的其他收入.3631.004

个体劳动者收入.474.079

StructureMatrix结构矩阵:

Function

12

人均集体所有制工资收入.545(*)-.366

人均各种奖金、超额工资(国力+集体).415(*).204

人均集体所有制职工标准工资.386(*)-.320

均从工作单位得到的其他收入.360(*).291

人均生活费收入(元/人),344(*).271

个体劳动者收入.075(*)-.004

人均国有经济单位职工工资.128.521(*)

人均来源于国有经济单位标准工资-.021.465(*)

人均各种津贴(国有+集体)-.029.182(*)

Pooledwithin-groupscorrelationsbetweendiscriminatingvariablesandstandardizedcanonicaldiscriminantfunctions

Variablesorderedbyabsolutesizeofcorrelationwithinfunction.

*Largestabsolutecorrelationbetweeneachvariableandanydiscriminantfunction

结构矩阵是变量和标准化典型判别函数的组内相关矩阵。

FunctionsatGroupCentroids类中心坐标(非标准化典型判别下的类中心)

Function

分类12

1.7412.047

2-2.418-.870

33.074-2.159

Unstandardizedcanonicaldiscriminantfunctionsevaluatedatgroupmeans

ClassificationStatist心分类分析(输出贝叶斯判别结果)

ClassificationProcessingSummary综述表

Processed

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论