《统计软件》期末报告_第1页
《统计软件》期末报告_第2页
《统计软件》期末报告_第3页
《统计软件》期末报告_第4页
《统计软件》期末报告_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

得分

《统计软件》

期末课程总结报告

课程名称:统计软件

学期:201A2014—1

学院:应用数学学院

专业:]0级统计专业

姓名:何飞官

学号:1017030020

日期:2013.11.14

统计软件应用数学学院10级统计班

10级《统计软件》课程总结要求

一、根据自己出勤和学习效果,客观给出自己的课程评分;

(20分)(按与老师综合评分的一致性评分)

自评分:

二、给出学习本课程内容的简要总结、学习体会和特别事例;

(40分)

答:学了九周,从未曾旷课,基本都坐前面,能跟上老师的脚步,偶尔

会请病假,只是回家之后自己没有多加练习,因为我1、3、5要上班,2、

4满课,周六一天的四级课,还有各槿工作,但是我从来不因各种理由逃课,

只要可以我都六点多起床,争取七点半过去,因为一般课室开门都在七点

半到七点四十分,我要坐前面,因为后面听不清,容易开小差,每节课我

都能跟上老师的脚步,就是记不住,不太熟练。

内容的简要总结:sas软件的了解,每个组成的使用,还有数据集

的建立,临时数据集和永久数据集,SAS/ASSIST.SAS/INSIGHT.SAS/分析

家的应用、描述性统计分析的解读,统计绘图的读解、数学里面解释拆分

数据的各种数学方法在sas软件的使用:因子分析、主成分分析、判别分

析、聚类分析、方差分析等等。在学完sas和spss软件之后,个人觉得spss

软件的操作会相对简单许多,而sas软件需要编程和C语言的功底,字符

的灵活运用,相对于spss来说,相对的难,当然功能也会比其强大一些。

所学实例操作演练(部分):

统计软件应用数学学院10级统计班

1、SAS/ASSIST应用的操作过程

陂方案⑹国口般帮助的

一・昌女电图阿H夫①。

.1Users'[开MU菜单'程序'SAS

:0节1”,行7列:1字数型竺@拼写检查单位空

统计软件应用数学学院10级统计班

<X)xl1&(g)任务®®I3(X)帮助也)

▼□Q御文。•

铝SAS/ASS1ST:SujuiaryStatistics<0ntitled>

卜able:|-REQUIRED-〔Subsetdata:|NO

[Columns:]-REQU1RED-

[class:]-HOIE-

[Outputtable:|-NOIE-

□Numberofnonnissingvalues□Variance

□Numberofmissingvalues□Standarddeviation

□Miniaim□Standarderroroftheaean

□Maxinun□CoefficientofvarialIon

□Range□Skewness

□Sum□Kurtosis

□Mean

[AdditionalOptions]

国输出-(无标题)]口日志-(无标题)|团编辑器二^题1||^SAS/ASSIST:S.

喀理器

?e■WPS文档泳儿-京歌争阳教*1-25

oO各种截图

2、聚类分析

命2J大X①V

-DATACULTURE;

INPUTAREA$DXBZCZBZWMBZ鲍.

CARDS;

北京9.3030.558.70天津4.6729.388.92

河北0.9624.6915.21山西1.3829.2411.30

内蒙1.4825.4715.39辽宁2.6032.328.81

吉林2.1526.3110.49黑龙江2.1428.4610.87

上海6.5331.5911.04江苏1.4726.4317.23

浙江1.1723.7417.46安徽0.8819.9724.43

福建1.2316.8715.63江西0.9918.8416.22

山东0.9825.1816.87河南0.8526.5516.15

湖北1.5723.1615.79湖南1.1422.5712.10

广东1.3423.0410.45广西0.7919.1410.61

海南1.2422.5313.97四川0.9621.6516.24

贵州0.7814.6524.27云南0.8113.8525.44

西藏0.573.85<14.43陕西1.6724.3617.62

甘肃1.1016.8527.93青海1.4917.7621.70

宁夏1.6120.2722.06新疆1.8520.6612.75

RUM

-PROCACECLUSOUT=ACEP=0.04MOPRINT:

-PROCCLUSTERDATA=ACEOUTTREE=TREEMETHOD=MEDIANCCCPSEUDO.

IDAREA;

RUN.

-PROCTREEDATA=TREEOUT=HEVRAPHICSHAXIS=AXIA1HORIZONTAL;

RUN

-3-

统计软件应用数学学院10级统计班

幽幻V

SAS系统2013年05月13日星期一上午10时41分54秒1

TheCLUSTERProcedure

MedianHierarchicalClusterAnalysis

EigenvaluesoftheCovarianceMatrixeJ-1MdskHouse试用群

型?|★(500人群)兴趣爱好-其融

EigenvalueDifferenceProportionCumulative

1105.15317870.9368570.71040.7104.冒1聊天“◎空间X应用

234.21632225.5637620.23120.9415

38.6525608.6525600.05851.0000瘦脸搜道(646271773)10:43:52

40.0000000.0000000.00001.0000

50.0000000.0000000.00001.0000你几岁了还上课

6-0.000000-0.00001.0000u8718986-范亚楠(274024181)10:44:0C

点到那页就卡了

Root-Mean-SquareTotal-SampIeStandardDeviation4.966925

U8787484+沫小汐(879315191)10:44:02

Root-Mean-SquareDistanceBetweenObservations17.20593我老婆是讲师!!!

u87727244^文姣<li*eniiao525@qa,com〉

ClusterHistory老子是去讲课

MedianU8787484+沫小沙(879315191)10:44:1C

--ClustersJoined---FREQSPRSQRSQERSQCCCPSFPST2Dist嗯嗯!I

贡州

29南瘦脸搜道(646271773)10:4422

甘肃20.00031.001320.0884

28W海

山东

27河20.0003.9991240.0975

南•哦忘记了你是僵尸

浙江0.0004

26陕2.9991190.1036

西

湖南20.0004.9991140.1128,我要重启电脑先

25广

24河北20.0004.9981130.1129

CL30.0006.99810570.118

.27

AgA沙直•日后西巴

注意:SAS软件很多程序里都有一个不可缺少的步骤,没

了它很多方法没办法使用,如数据库、永久数据集、临时

数据集、分析家、统计绘图等等,那个步骤就是把源文件

放进我们在课室使用的电脑里面的一个命名为"V8”的文

件夹里,并知道路线,因为没有这一部很多东西都没办法

操作,它就显得非常重要。因为我在我的电脑里找这个一

个类似V8的同样功能的文件夹找了三个小时,因为没有方

法。

三、给出3〜5个本课程具体应用实例(包括知识点的掌握;不同统计方法

的实际操作过程和结果解读;数据、程序、结果和解读)。

(40分)

统计软件应用数学学院10级统计班

1、因子分析的运用:

因子分析法解析洛杉矶的社会经济情况

2005年洛杉矶的12各地区的5项社会经济指标,包括:人口总数xl、

教育程度x2、就业人数x3、服务业人数x4、中等房价x5.我将使用因子分

析法对洛杉矶地区的社会经济状况进行分析。

数据集:

POPSCHOOLEMPLOYSERVICESHOUSE

1570012.8250027025000

2100010.96001010000

334008.81000109000

4380013.6170014025000

5400012.8160014025000

682008.326006012000

7120011.44001016000

8910011.533006014000

9990012.5340018018000

10960013.7360039025000

1196009.633008012000

12940011.4400010013000

sas程序的编写:

procfactordata=sasuser.chartl56n=2rotate=varimaxout=out831;

varPOPSCHOOLEMPLOYSERVICESHOUSE;

procfactordata=sassuser.chartl56n=2priors=smcrotate=varimax;

varPOPSCHOOLEMPLOYSERVICESHOUSE;

procfactordata=sasuser.chartl56n=2method=mlheyhoodrotate=varimax;

统计软件应用数学学院10级统计班

varPOPSCHOOLEMPLOYSERVICESHOUSE;

procplot;

plotfactor2*factorl=alphabet;

run;

结果程序的显示与分析:

EigenvaluesoftheCorrelationMatrix:Total=5Average=1

EigenvaIueDifferenceProportionCumuIative

1

22.873313591.076653500.57470.5747

31.796660091.581823210.35930.9340

40.214836890.114902830.04300.9770

50.099934050.084678680.02000.9969

0.015255370.00311.0000

2factorswillberetainedbytheNFACTORcriterion.

SAS系统2012年08月2。日星期一下午06

TheFACTORProcedure

InitialFactorMethod:PrincipalComponents

FactorPattern

FactorlFactor2

POPPOP0.580960.80642

SCHOOLSCHOOL0.76704-0.54476

EMPLOYEMPLOY0.672430.72605

SERVICESSERVICES0.93239-0.10431

HOUSEHOUSE0.79116-0.55818

VarianceExplainedbyEachFactor

Factor!Factor2

2.87331361.7966601

FinalCommunalityEstimates:Total=4.689974

POPSCHOOLEMPLOYSERVICESHOUSE

0.987826290.885105550.979305830.880235620.93750041

从上面图所示的分析结果中,首先输出的是关于原始变量的简单统计量,

包括均值和方差;然后输出了原始变量之间的相关性矩阵。通过观察发现,

统计软件应用数学学院10级统计班

有些变量之间存在较大程度的相关性(如POP和EMPLOY的相关性为

0.97245),所以做因子分析是有必要的。

从图中所示是根据相关矩阵计算的特征值以及方差贡献率。根据方

差贡献率,可以确定应当选择的公因子数目。由于前两个特征值的贡献率

分别为0.5747和0.3593,二者的累计贡献率达到93.4%,已经可以反映原

始数据绝大部分的信息,因此只选择前两个公共因子进行分析。

数据为本文中模型的因子模式阵,这是用公因子预报原始变量的回

归系数。第一公因子在所有的5个变量上都有正的较大的载荷,可见这个

因子能够反映不同地区的综合发展水平;第二公因子在人口、就业上的载

荷较大,因此第二个公因子可以在一定程度上反映不同地区的人口规模。

输出结果还给出了公因子解释能力的估计,如上图所示,这里

给出了公因子对每一个原始变量的解释能力的量度,是用原始变量对公因

子的副相关系数平方(取值为。〜1)来计算的。CommunalityEstimate是这

些复相关系数平方都比较大,所以可以认为两个公因子可以很好地解释原

始变量中的信息。

统计软件应用数学学院10级统计班

SAS系统2012年08月20日星期一下午0K时44分35秒

TheFACTORProcedure

InitialFactorMethod:MaximumLikelihood

PriorCommunalityEstimates:SMC

POPSCHOOLEMPLOYSERVICESHOUSE

0.968591600.822285140.969180820.785724400.84701921

PreIiminaryEigenvalues:Total=76.1165859Average=15.2233172

EigenvalueDifferenceProportionCumulative

ooOAQOoA9

oQouuo.h

163.701008650,6462895o145nn34

—uu

213.054713112,7270798onn43n127

VV-—

30.32763930.6749199ooo4co*O1—

-ouu

4-0.34728050.2722202oAooonno

5-0.6195007-uoluu

2factorswi11beretainedbytheNFACTORcriterion.

IterationCriterionRidgeChangeCommunalities

10.34312210.00000.04711.000000.806720.950580.793480.89412

20.30721780.00000.03071.000000.808210.960230.810480.92480

30.30678600.00000.00631.000000.811490.959480.816770.92023

40.30673730.00000.00221.000000.809850.859630.814980.92241

输出一(无标超)

PreliminaryEigenvalues:Total=76.1165859Average=15.2233172A

EigenvalueDifferenceProportionCunulalive

1G3.701008650.64628950.83690.8369

213.054719112.72707980.17151.0084

30.32763930.67491990.00431.0127

4-0.34728050.2722202-0.004g1.0081

5-0.6195007-0.00811.0000

2factorswi11beretainedbytheNFACTORcriterion.

dg

IterationCriterioneChangeCommunalIties

Roiooo

10,3431221oooo0.04711.000000.806720.350580.793480.89412

20.3072178oooo0.03071.000000.808210.960230.810480.92480

30.3067860oooo-0.00631.000000.811490.359480.816770.92023

40.3067373u0.00221.000000.809850.959630.814980.92241

统计软件应用数学学院10级统计班

己标题)

Convergencecriterionsatisfied.

SignificanceTestsBasedon12Observations

Pr>

TestDFChi-SquareChiSq

HO:Nocommonfactors1054.2517<.0001

HA:Atleastonecommonfactor

HO:2Factorsaresufficient12.19820.1382

HA:Morefactorsareneeded

Chi-SquarewithoutBartlett'sCorrection3.3740530

Akaike'sInformationCriterion1.3740530

Schwarz'sBayesianCriterion0.8891463

TuckerandLewis'sReliabilityCoefficient0.7292200

TheFACTORProcedure

InitialFactorMethod:MaximumLikeIihood

FactorPattern

FactorlFactor2

POPPOP1.000000.00000

SCHOOLSCHOOL0.009750.90003

EMPLOYEMPLOY0.972450.11797

SERVICESSERVICES0.438870.78930

HOUSEHOUSE0.022410.95989

VarianceExp1ainedbyEachFactor

FactorWeightedUnweighted

Factorl24.43297072.13886057

Factor219.78531432.36835294

FinalCommunalityEstimatesandVariableWeights

TotalCommunality:Weighted=44.218285Unweighted=4.507214

VariableCommunalityWeight

POP1.00000000Infty

SCHOOL0.810144895.2682940

EMPLOY0.9595714224.7246669

目日志-(无标题)团编辑器一无标题11^1CHART156.sas...

统计软件应用数学学院10级统计班

TheFACTORProcedure

RotationMethod:Varimax

0rthogonaITransformationMatrix

12

10.021340.99977

20.99977-0.02134

RotatedFactorPattern

FactorlFactor2

POPPOP0.021340.99977

SCHOOLSCHOOL0.90003-0.00946

EMPLOYEMPLOY0.138690.96971

SERVICESSERVICES0.798490.42193

HOUSEHOUSE0.960150.00193

VarianceExpIainedbyEachFactor

FactortteightedUnweighted

Factorl20.00233992.38921346

Factor224.21594512.11800005

TheFACTORProcedure

RotationMethod:Varimax

FinalCommunalityEstimatesandVariableWeights

TotalCommunality:Weighted=44.218285Unweighted=4.507214

VariableCommuna1ityWeight

POP1.00000000Infty

SCHOOL0.810144895.2682940

EMPLOY0.9595714224.7246669

SERVICES0.815603485.4256462

HOUSE0.9218937212.7996793

统计软件应用数学学院10级统计班

输出的是因子旋转的结果(只显示了旋转阵和旋转后的因子载荷阵)。

从因子旋转的结果可以看出,各原始变量在Factor1和Factor2两个因子上

载荷数值的差距。

由因子载荷可以看出,Facto”与HOUSE、SCHOOL、SERVICES3个

变量的正相关性都比较强,载荷达到了0.79以上。而Factor2与POP和

EMPLOY两个变量的正相关性比较强,载荷达到了0.97以上。

通过分析可知,第一因子反映了房价、教育水平、服务业人数,这些

与发达程度有关,因此可以把公因子Factorl命名为”发达程度“因子;第

二因子反映了人口和就业情况,这些与城市规模有关,因此可以把公因子

Factor2命名为"城市规模“因子。

对提取出来的公因子进行实际意义的命名之后,还可以根据标准化的

得分系数来计算各个观测记录在这两个公因子上的得分。

结论与建议:

因子得分显示排在前3位的地区分别是地区10、地区1、地区4,也就

是说他们的社会经济发展状况相对比较好。

我们可以向这三个地区教育经济模式学习,提高地区的经济情况。

2、判别分析

判别分析解释中国94年的经济发展

对全国30个省市自治区1994年影响各地区经济增长差异的制度变量:XI-经济增长率

(%)>X2-非国有化水平(%)、X3-开放度(%)>X4-市场化程度(%)作判别分析。

统计软件应用数学学院10级统计班

类别序号地区X1x2x3x4

1辽宁11.257.2513.4773.41

2河北14.967.197.8972.33

3天津14.364.7419.4172.33

4北京13.555.6320.5977.33

5山东16.275.5111.0672.08

组6上海14.357.633.0077.35

7浙江20.083.9415.9989.50

8福建21.868.0339.4271.90

9广东19.078.3183.0380.75

10广西16.057.1112.5760.91

11海南11.949.9730.7069.20

12黑龙江8.730.7215.4160.25

13吉林14.337.6512.9566.42

14内蒙古10.134.637.6862.96

15山西9.156.3310.3066.01

16河南13.865.234.6964.24

17湖北15.355.626.0654.74

第18湖南11.055.558.0267.47

组19江西18.062.856.4058.83

20甘肃10.430.014.6160.26

21宁夏8.229.286.1150.71

22四川11.462.885.3161.49

23云南11.628.579.0868.47

24贵州8.430.236.0355.55

25青海8.215.968.0440.26

26新疆10.924.758.3446.01

27西藏15.621.4428.6246.01

28江苏16.580.058.8173.04

待判样

29安徽20.681.245.3760.43

30陕西8.642.068.8856.37

sas程序的编写:

procdiscrimdata=sasuser.examp58listerrcrosslisterr;

varxl-x4;

classg;

run;

结果显示和分析:

统计软件应用数学学院10级统计班

分组水平信息及联合协方差矩阵信息

TheDISCRIMProcedure

30

TotalSampleSize4DFTotal29

Variables3DFWithinClasses27

CIassesDFBetweenClasses2

NumberofObservationsRead38

NumberofObservationsUsed30

ClassLevelInformation

VariablePrior

吝NameFrequencyWe1ghtProportionProbabi1ity

1_11111.00000.3666670.333333

2-216

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论