




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
得分
《统计软件》
期末课程总结报告
课程名称:统计软件
学期:201A2014—1
学院:应用数学学院
专业:]0级统计专业
姓名:何飞官
学号:1017030020
日期:2013.11.14
统计软件应用数学学院10级统计班
10级《统计软件》课程总结要求
一、根据自己出勤和学习效果,客观给出自己的课程评分;
(20分)(按与老师综合评分的一致性评分)
自评分:
二、给出学习本课程内容的简要总结、学习体会和特别事例;
(40分)
答:学了九周,从未曾旷课,基本都坐前面,能跟上老师的脚步,偶尔
会请病假,只是回家之后自己没有多加练习,因为我1、3、5要上班,2、
4满课,周六一天的四级课,还有各槿工作,但是我从来不因各种理由逃课,
只要可以我都六点多起床,争取七点半过去,因为一般课室开门都在七点
半到七点四十分,我要坐前面,因为后面听不清,容易开小差,每节课我
都能跟上老师的脚步,就是记不住,不太熟练。
内容的简要总结:sas软件的了解,每个组成的使用,还有数据集
的建立,临时数据集和永久数据集,SAS/ASSIST.SAS/INSIGHT.SAS/分析
家的应用、描述性统计分析的解读,统计绘图的读解、数学里面解释拆分
数据的各种数学方法在sas软件的使用:因子分析、主成分分析、判别分
析、聚类分析、方差分析等等。在学完sas和spss软件之后,个人觉得spss
软件的操作会相对简单许多,而sas软件需要编程和C语言的功底,字符
的灵活运用,相对于spss来说,相对的难,当然功能也会比其强大一些。
所学实例操作演练(部分):
统计软件应用数学学院10级统计班
1、SAS/ASSIST应用的操作过程
陂方案⑹国口般帮助的
一・昌女电图阿H夫①。
.1Users'[开MU菜单'程序'SAS
:0节1”,行7列:1字数型竺@拼写检查单位空
统计软件应用数学学院10级统计班
<X)xl1&(g)任务®®I3(X)帮助也)
▼□Q御文。•
铝SAS/ASS1ST:SujuiaryStatistics<0ntitled>
卜able:|-REQUIRED-〔Subsetdata:|NO
[Columns:]-REQU1RED-
[class:]-HOIE-
[Outputtable:|-NOIE-
□Numberofnonnissingvalues□Variance
□Numberofmissingvalues□Standarddeviation
□Miniaim□Standarderroroftheaean
□Maxinun□CoefficientofvarialIon
□Range□Skewness
□Sum□Kurtosis
□Mean
[AdditionalOptions]
国输出-(无标题)]口日志-(无标题)|团编辑器二^题1||^SAS/ASSIST:S.
喀理器
?e■WPS文档泳儿-京歌争阳教*1-25
oO各种截图
2、聚类分析
命2J大X①V
-DATACULTURE;
INPUTAREA$DXBZCZBZWMBZ鲍.
CARDS;
北京9.3030.558.70天津4.6729.388.92
河北0.9624.6915.21山西1.3829.2411.30
内蒙1.4825.4715.39辽宁2.6032.328.81
吉林2.1526.3110.49黑龙江2.1428.4610.87
上海6.5331.5911.04江苏1.4726.4317.23
浙江1.1723.7417.46安徽0.8819.9724.43
福建1.2316.8715.63江西0.9918.8416.22
山东0.9825.1816.87河南0.8526.5516.15
湖北1.5723.1615.79湖南1.1422.5712.10
广东1.3423.0410.45广西0.7919.1410.61
海南1.2422.5313.97四川0.9621.6516.24
贵州0.7814.6524.27云南0.8113.8525.44
西藏0.573.85<14.43陕西1.6724.3617.62
甘肃1.1016.8527.93青海1.4917.7621.70
宁夏1.6120.2722.06新疆1.8520.6612.75
RUM
-PROCACECLUSOUT=ACEP=0.04MOPRINT:
-PROCCLUSTERDATA=ACEOUTTREE=TREEMETHOD=MEDIANCCCPSEUDO.
IDAREA;
RUN.
-PROCTREEDATA=TREEOUT=HEVRAPHICSHAXIS=AXIA1HORIZONTAL;
RUN
-3-
统计软件应用数学学院10级统计班
幽幻V
SAS系统2013年05月13日星期一上午10时41分54秒1
TheCLUSTERProcedure
MedianHierarchicalClusterAnalysis
EigenvaluesoftheCovarianceMatrixeJ-1MdskHouse试用群
型?|★(500人群)兴趣爱好-其融
EigenvalueDifferenceProportionCumulative
1105.15317870.9368570.71040.7104.冒1聊天“◎空间X应用
234.21632225.5637620.23120.9415
38.6525608.6525600.05851.0000瘦脸搜道(646271773)10:43:52
40.0000000.0000000.00001.0000
50.0000000.0000000.00001.0000你几岁了还上课
6-0.000000-0.00001.0000u8718986-范亚楠(274024181)10:44:0C
点到那页就卡了
Root-Mean-SquareTotal-SampIeStandardDeviation4.966925
U8787484+沫小汐(879315191)10:44:02
Root-Mean-SquareDistanceBetweenObservations17.20593我老婆是讲师!!!
u87727244^文姣<li*eniiao525@qa,com〉
ClusterHistory老子是去讲课
MedianU8787484+沫小沙(879315191)10:44:1C
--ClustersJoined---FREQSPRSQRSQERSQCCCPSFPST2Dist嗯嗯!I
云
贡州
29南瘦脸搜道(646271773)10:4422
甘肃20.00031.001320.0884
28W海
山东
27河20.0003.9991240.0975
南•哦忘记了你是僵尸
浙江0.0004
26陕2.9991190.1036
西
湖南20.0004.9991140.1128,我要重启电脑先
25广
东
24河北20.0004.9981130.1129
CL30.0006.99810570.118
.27
AgA沙直•日后西巴
注意:SAS软件很多程序里都有一个不可缺少的步骤,没
了它很多方法没办法使用,如数据库、永久数据集、临时
数据集、分析家、统计绘图等等,那个步骤就是把源文件
放进我们在课室使用的电脑里面的一个命名为"V8”的文
件夹里,并知道路线,因为没有这一部很多东西都没办法
操作,它就显得非常重要。因为我在我的电脑里找这个一
个类似V8的同样功能的文件夹找了三个小时,因为没有方
法。
三、给出3〜5个本课程具体应用实例(包括知识点的掌握;不同统计方法
的实际操作过程和结果解读;数据、程序、结果和解读)。
(40分)
统计软件应用数学学院10级统计班
1、因子分析的运用:
因子分析法解析洛杉矶的社会经济情况
2005年洛杉矶的12各地区的5项社会经济指标,包括:人口总数xl、
教育程度x2、就业人数x3、服务业人数x4、中等房价x5.我将使用因子分
析法对洛杉矶地区的社会经济状况进行分析。
数据集:
POPSCHOOLEMPLOYSERVICESHOUSE
1570012.8250027025000
2100010.96001010000
334008.81000109000
4380013.6170014025000
5400012.8160014025000
682008.326006012000
7120011.44001016000
8910011.533006014000
9990012.5340018018000
10960013.7360039025000
1196009.633008012000
12940011.4400010013000
sas程序的编写:
procfactordata=sasuser.chartl56n=2rotate=varimaxout=out831;
varPOPSCHOOLEMPLOYSERVICESHOUSE;
procfactordata=sassuser.chartl56n=2priors=smcrotate=varimax;
varPOPSCHOOLEMPLOYSERVICESHOUSE;
procfactordata=sasuser.chartl56n=2method=mlheyhoodrotate=varimax;
统计软件应用数学学院10级统计班
varPOPSCHOOLEMPLOYSERVICESHOUSE;
procplot;
plotfactor2*factorl=alphabet;
run;
结果程序的显示与分析:
EigenvaluesoftheCorrelationMatrix:Total=5Average=1
EigenvaIueDifferenceProportionCumuIative
1
22.873313591.076653500.57470.5747
31.796660091.581823210.35930.9340
40.214836890.114902830.04300.9770
50.099934050.084678680.02000.9969
0.015255370.00311.0000
2factorswillberetainedbytheNFACTORcriterion.
SAS系统2012年08月2。日星期一下午06
TheFACTORProcedure
InitialFactorMethod:PrincipalComponents
FactorPattern
FactorlFactor2
POPPOP0.580960.80642
SCHOOLSCHOOL0.76704-0.54476
EMPLOYEMPLOY0.672430.72605
SERVICESSERVICES0.93239-0.10431
HOUSEHOUSE0.79116-0.55818
VarianceExplainedbyEachFactor
Factor!Factor2
2.87331361.7966601
FinalCommunalityEstimates:Total=4.689974
POPSCHOOLEMPLOYSERVICESHOUSE
0.987826290.885105550.979305830.880235620.93750041
从上面图所示的分析结果中,首先输出的是关于原始变量的简单统计量,
包括均值和方差;然后输出了原始变量之间的相关性矩阵。通过观察发现,
统计软件应用数学学院10级统计班
有些变量之间存在较大程度的相关性(如POP和EMPLOY的相关性为
0.97245),所以做因子分析是有必要的。
从图中所示是根据相关矩阵计算的特征值以及方差贡献率。根据方
差贡献率,可以确定应当选择的公因子数目。由于前两个特征值的贡献率
分别为0.5747和0.3593,二者的累计贡献率达到93.4%,已经可以反映原
始数据绝大部分的信息,因此只选择前两个公共因子进行分析。
数据为本文中模型的因子模式阵,这是用公因子预报原始变量的回
归系数。第一公因子在所有的5个变量上都有正的较大的载荷,可见这个
因子能够反映不同地区的综合发展水平;第二公因子在人口、就业上的载
荷较大,因此第二个公因子可以在一定程度上反映不同地区的人口规模。
输出结果还给出了公因子解释能力的估计,如上图所示,这里
给出了公因子对每一个原始变量的解释能力的量度,是用原始变量对公因
子的副相关系数平方(取值为。〜1)来计算的。CommunalityEstimate是这
些复相关系数平方都比较大,所以可以认为两个公因子可以很好地解释原
始变量中的信息。
统计软件应用数学学院10级统计班
SAS系统2012年08月20日星期一下午0K时44分35秒
TheFACTORProcedure
InitialFactorMethod:MaximumLikelihood
PriorCommunalityEstimates:SMC
POPSCHOOLEMPLOYSERVICESHOUSE
0.968591600.822285140.969180820.785724400.84701921
PreIiminaryEigenvalues:Total=76.1165859Average=15.2233172
EigenvalueDifferenceProportionCumulative
ooOAQOoA9
oQouuo.h
163.701008650,6462895o145nn34
—
—uu
213.054713112,7270798onn43n127
VV-—
30.32763930.6749199ooo4co*O1—
-ouu
4-0.34728050.2722202oAooonno
5-0.6195007-uoluu
2factorswi11beretainedbytheNFACTORcriterion.
IterationCriterionRidgeChangeCommunalities
10.34312210.00000.04711.000000.806720.950580.793480.89412
20.30721780.00000.03071.000000.808210.960230.810480.92480
30.30678600.00000.00631.000000.811490.959480.816770.92023
40.30673730.00000.00221.000000.809850.859630.814980.92241
输出一(无标超)
PreliminaryEigenvalues:Total=76.1165859Average=15.2233172A
EigenvalueDifferenceProportionCunulalive
1G3.701008650.64628950.83690.8369
213.054719112.72707980.17151.0084
30.32763930.67491990.00431.0127
4-0.34728050.2722202-0.004g1.0081
5-0.6195007-0.00811.0000
2factorswi11beretainedbytheNFACTORcriterion.
dg
IterationCriterioneChangeCommunalIties
Roiooo
10,3431221oooo0.04711.000000.806720.350580.793480.89412
20.3072178oooo0.03071.000000.808210.960230.810480.92480
30.3067860oooo-0.00631.000000.811490.359480.816770.92023
40.3067373u0.00221.000000.809850.959630.814980.92241
统计软件应用数学学院10级统计班
己标题)
Convergencecriterionsatisfied.
SignificanceTestsBasedon12Observations
Pr>
TestDFChi-SquareChiSq
HO:Nocommonfactors1054.2517<.0001
HA:Atleastonecommonfactor
HO:2Factorsaresufficient12.19820.1382
HA:Morefactorsareneeded
Chi-SquarewithoutBartlett'sCorrection3.3740530
Akaike'sInformationCriterion1.3740530
Schwarz'sBayesianCriterion0.8891463
TuckerandLewis'sReliabilityCoefficient0.7292200
TheFACTORProcedure
InitialFactorMethod:MaximumLikeIihood
FactorPattern
FactorlFactor2
POPPOP1.000000.00000
SCHOOLSCHOOL0.009750.90003
EMPLOYEMPLOY0.972450.11797
SERVICESSERVICES0.438870.78930
HOUSEHOUSE0.022410.95989
VarianceExp1ainedbyEachFactor
FactorWeightedUnweighted
Factorl24.43297072.13886057
Factor219.78531432.36835294
FinalCommunalityEstimatesandVariableWeights
TotalCommunality:Weighted=44.218285Unweighted=4.507214
VariableCommunalityWeight
POP1.00000000Infty
SCHOOL0.810144895.2682940
EMPLOY0.9595714224.7246669
目日志-(无标题)团编辑器一无标题11^1CHART156.sas...
统计软件应用数学学院10级统计班
TheFACTORProcedure
RotationMethod:Varimax
0rthogonaITransformationMatrix
12
10.021340.99977
20.99977-0.02134
RotatedFactorPattern
FactorlFactor2
POPPOP0.021340.99977
SCHOOLSCHOOL0.90003-0.00946
EMPLOYEMPLOY0.138690.96971
SERVICESSERVICES0.798490.42193
HOUSEHOUSE0.960150.00193
VarianceExpIainedbyEachFactor
FactortteightedUnweighted
Factorl20.00233992.38921346
Factor224.21594512.11800005
TheFACTORProcedure
RotationMethod:Varimax
FinalCommunalityEstimatesandVariableWeights
TotalCommunality:Weighted=44.218285Unweighted=4.507214
VariableCommuna1ityWeight
POP1.00000000Infty
SCHOOL0.810144895.2682940
EMPLOY0.9595714224.7246669
SERVICES0.815603485.4256462
HOUSE0.9218937212.7996793
统计软件应用数学学院10级统计班
输出的是因子旋转的结果(只显示了旋转阵和旋转后的因子载荷阵)。
从因子旋转的结果可以看出,各原始变量在Factor1和Factor2两个因子上
载荷数值的差距。
由因子载荷可以看出,Facto”与HOUSE、SCHOOL、SERVICES3个
变量的正相关性都比较强,载荷达到了0.79以上。而Factor2与POP和
EMPLOY两个变量的正相关性比较强,载荷达到了0.97以上。
通过分析可知,第一因子反映了房价、教育水平、服务业人数,这些
与发达程度有关,因此可以把公因子Factorl命名为”发达程度“因子;第
二因子反映了人口和就业情况,这些与城市规模有关,因此可以把公因子
Factor2命名为"城市规模“因子。
对提取出来的公因子进行实际意义的命名之后,还可以根据标准化的
得分系数来计算各个观测记录在这两个公因子上的得分。
结论与建议:
因子得分显示排在前3位的地区分别是地区10、地区1、地区4,也就
是说他们的社会经济发展状况相对比较好。
我们可以向这三个地区教育经济模式学习,提高地区的经济情况。
2、判别分析
判别分析解释中国94年的经济发展
对全国30个省市自治区1994年影响各地区经济增长差异的制度变量:XI-经济增长率
(%)>X2-非国有化水平(%)、X3-开放度(%)>X4-市场化程度(%)作判别分析。
统计软件应用数学学院10级统计班
类别序号地区X1x2x3x4
1辽宁11.257.2513.4773.41
2河北14.967.197.8972.33
3天津14.364.7419.4172.33
4北京13.555.6320.5977.33
5山东16.275.5111.0672.08
组6上海14.357.633.0077.35
7浙江20.083.9415.9989.50
8福建21.868.0339.4271.90
9广东19.078.3183.0380.75
10广西16.057.1112.5760.91
11海南11.949.9730.7069.20
12黑龙江8.730.7215.4160.25
13吉林14.337.6512.9566.42
14内蒙古10.134.637.6862.96
15山西9.156.3310.3066.01
16河南13.865.234.6964.24
17湖北15.355.626.0654.74
第18湖南11.055.558.0267.47
二
组19江西18.062.856.4058.83
20甘肃10.430.014.6160.26
21宁夏8.229.286.1150.71
22四川11.462.885.3161.49
23云南11.628.579.0868.47
24贵州8.430.236.0355.55
25青海8.215.968.0440.26
26新疆10.924.758.3446.01
27西藏15.621.4428.6246.01
28江苏16.580.058.8173.04
待判样
29安徽20.681.245.3760.43
品
30陕西8.642.068.8856.37
sas程序的编写:
procdiscrimdata=sasuser.examp58listerrcrosslisterr;
varxl-x4;
classg;
run;
结果显示和分析:
统计软件应用数学学院10级统计班
分组水平信息及联合协方差矩阵信息
TheDISCRIMProcedure
30
TotalSampleSize4DFTotal29
Variables3DFWithinClasses27
CIassesDFBetweenClasses2
NumberofObservationsRead38
NumberofObservationsUsed30
ClassLevelInformation
VariablePrior
吝NameFrequencyWe1ghtProportionProbabi1ity
1_11111.00000.3666670.333333
2-216
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025江苏淮安生物工程高等职业学校公开招聘13人模拟试卷附答案详解(典型题)
- 2025吉林扶余市博物馆选调解说员4人模拟试卷及答案详解(名校卷)
- 2025年甘肃省兰州市公安局城关分局招聘警务辅助人员30人模拟试卷及完整答案详解一套
- 2025广西南宁市青秀区应急管理局招聘2人模拟试卷及答案详解(易错题)
- 2025恒丰银行成都分行春季校园招聘考前自测高频考点模拟试题及答案详解(名师系列)
- 2025广东农信社校园招聘考前自测高频考点模拟试题参考答案详解
- 2025地勘中心(中国非矿)成员单位招聘地勘中心内蒙古总队招聘13人考前自测高频考点模拟试题及答案详解(夺冠)
- 2025江苏镇江市丹阳市教育系统校园招聘事业编制教师13人(徐州考点)模拟试卷(含答案详解)
- 2025广东东莞东坑镇松实东中招聘镇聘教师27人模拟试卷及一套答案详解
- 2025江苏常州市钟楼区卫生健康局下属事业单位招聘卫技人员7人考前自测高频考点模拟试题及一套完整答案详解
- 2025版静脉输液治疗实践指南
- 骨科术后并发肺栓塞护理
- 2025年融媒体中心招聘考试笔试试题(60题)含答案
- 社区工作者网格员考试题库及答案
- 快乐主义伦理学课件
- 运筹学:原理、工具及应用肖勇波习题答案(可编辑)
- 医废处置人员院感培训
- 学堂在线 军事理论 章节测试答案
- 长期留置导尿的并发症及管理
- 投资者关系管理与投资者策略
- 民国时期农村管理制度
评论
0/150
提交评论