高级统计学实验教程.doc_第1页
高级统计学实验教程.doc_第2页
高级统计学实验教程.doc_第3页
高级统计学实验教程.doc_第4页
高级统计学实验教程.doc_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高级统计学实验教程 (初稿)编著 葛虹 哈尔滨工业大学管理学院 2007年12月目 录第一节 回归分析的SPSS实现3第二节 Logistic回归步骤以及SPSS实现7第三节 聚类分析的SPSS实现9第四节 判别分析的SPSS实现11第五节 主成分分析的SPSS实现16第六节 因子分析的SPSS实现19附表1 32对夫妻身高数据24附表2 金融机构监管数据25附表3 我国各地区2005年社会发展数据26第一节 回归分析的SPSS实现案例:考察32对夫妻的身高情况,建立丈夫与妻子身高之间的数量关系(见附表1)。第一步:建立数据文件第二步:观察散点图(Graphs Scatter)选择“Simple”,点击“Define” 将“Heightofhus”放进“Y Axis”,将“Heightofwife”放进“X Axis”点击“OK”第三步:建立回归方程(Analyze Regression Linear)将“Heightofhus”放进“Dependent”,将“Heightofwife”放进“Independent”,再点击“Statistics” 选择“Estimates”、“Model fit”和“Confidence intervals”,再点击“Continue”去选择“Plots”将“ZPRED”放入“X”,将“ZRESID”放入“Y”,同时选择“Normal probability plot”,再点击“Continue”图4 点击“Options”图5 对“Include constant in equation”进行选择,点击“Continue”,再点击“OK”完成执行过程第四步:结果解释 由于“R Square”仅为0.407,所以该线性模型不足以解释夫妻之间的身高关系。方差分析结果表明:模型是显著的。回归模型可以写成: Heightofhus=42.760+0.803*HeightofwifeT检验结果表明:斜率是显著的,而常数项不显著(从而在进行回归时,可以不包含常数项)P-P图和残差图表明:误差的独立、等方差性和正态性基本成立。第二节 Logistic回归步骤以及SPSS实现案例:(数据见附表2)Detecting ailing financial and business establishments is an important function of audit and control. Table 1 gives some of the operating financial ratios of 33 firms that went bankrupt after 2 years and 33 that remained solvent during the same period. Three financial ratios were available for each firm: 第一步:建立数据文件第二步:Logistic回归(Analyze Regression Binary Logistic)将“倒闭情况”放入“Dependent”,将“保留收入比”“利税前收入比”“销售比”放入“Covariates”,再点击“Options”。可选择“At last step”和“Include constant in model”,点击“Continue”,再点击“OK”完成执行过程。第三步:结果解释表中的“R Square”较大,说明模型的解释能力较强建立的模型分别对33个倒闭单元和33个没有倒闭单元中的32个进行了正确划分;总分辨率为97%。 Logistic 回归模型是:第i个金融机构有偿付能力的概率为但Wald检验表明:常数项、“保留收入比”和“销售比”的系数都不够显著,有必要对模型中的自变量进一步进行选择。第三节 聚类分析的SPSS实现案例:将2005年我国15个地区社会发展情况进行分类(见附表3中的前15个数据)。第一步:建立数据文件第二步:系统聚类分析(Analyze Classify Hierarchical cluster)将所有变量放入“Variables”,将“region”放入“Label cases by”,再点击“Plots”。选择“Dendrogram”,再点击“Continue”。点击“Method”。在此选择系统聚类方法中的一种。在“Continue”以及“OK”完成执行过程。第三步:结果解释如果将其分为两类,则上海、北京为一类;其他各地区为一类。若将其分为三类,则上海、北京为一类;浙江、江苏、天津为一类;其他各地区为一类。第四节 判别分析的SPSS实现案例:利用第二节金融监管数据,对其进行判别分析(见附表2)。第一步:建立数据文件第二步:判别分析过程(Analyze Classify Discrimnant)将组变量“倒闭情况”放入“Grouping Variable”。点击“Define Range”。将0放入“Minimum”,将1放入“Maximum”。再点击“Continue”。将所有变量放入“Independents”,再点击“Statistics”。点击“Means”“Univariate ANOVAs”“Boxs”“Fishers”“Within-groups correlation”,再点击“Continue”和“Classify”。点击“Compute from group sizes”“Summary table”“Leave one out classification”,再点击“Continue”和“OK”完成执行过程。第三步:结果解释说明:1. 每组均值应有显著的差异; 2. 每组方差不应有显著的差异注:检验对于每个变量各组是否有显著的差异,由检验结果可以看出各变量均有显著的可判别性。说明:由该表可以观察变量间的共线性,共线性的存在会导致联合判别的误差。Boxs Test of Equality of Covariance Matrices注:协方差阵行列式的值反映协方差阵的相近程度,若利用Bayes判别,这两类协方差阵行列式的值越接近越好。注:这是协方差阵相等的Boxs检验,由检验结果可知:两组的协方差阵显著地不相等。因此,最好使用Fisher判别法或Logistic判别。Summary of Canonical Discriminant Functions注:这部分是利用Fisher判别法的分析结果。第一个判别函数的判别效率是100%。注:Wilks检验各组均值是否相等,由检验结果可知:各组均值有显著的差异,因此,利用这样的样本建立判别函数是有效的。Fisher判别函数: (标准化)注:结构矩阵给出了每个变量与第一Fisher判别函数的相关系数。由表可以看出“保留收入比”的判别能力最强,其次是“利税前收入比”,再次是“销售比”。Fisher判别函数:注:这是将各组样本投影后每组的重心。Classification Statistics(Bayes方法的分类结果)注:每一组的先验概率Bayes判别函数:注:利用Bayes判别函数对原始样本的重新分类和交叉验证结果第五节 主成分分析的SPSS实现案例:利用我国各地区2005年社会发展数据,进行主成分分析(见附表3)。 第一步:建立数据文件第二步:执行主成分分析(Analyze Data Reduction Factor)将所有变量放入“Variables”,点击“Descriptives”。选择“Univariate descriptives”,再点击“Continue”。点击“Scores”。选择“Display factor score coefficient matrix”,再点击“Continue”和“OK”完成执行过程。第三步:结果解释注:该表是相关系数阵说明:前两个主成分从“人均GDP”中抽取出95.9的信息;从“新增固定资产净值”中抽取出85%的信息,这也是抽取信息最少的指标。注:由特征值大于1原则,本次分析保留了两个主成分,且累计贡献率达91.72% 。注:本表给出了标准化原始变量与两个主成分近似线性关系的系数。如:标准化的GDP0.866-0.456注:该表给出的是标准化主成分的系数。如:标准化=0.246标准化“GDP”+0.224标准化“新增固定资产净值”+0.252标准化“城镇收入”+0.262标准化“农村收入”+0.19标准化“高校数”+0.074标准化“卫生机构”1第一主成分的表达式:2. 第二主成分的表达式:3与标准化“GDP”的相关系数:0.246 与标准化“高校数”的相关系数:0.19第六节 因子分析的SPSS实现案例:利用我国各地区2005年社会发展数据,进行因子分析(见附表3)。第一步:建立数据文件第二步:执行主成分分析(Analyze Data Reduction Factor)将所有变量放入“Variables”,点击“Descriptives”。选择“Univariate descriptives”,再点击“Continue”。点击“Rotation”。选择“Varimax”,在点击“Continue”。点击“Scores”。选择“Display factor score coefficient matrix”,再点击“Continue”和“OK”完成执行过程。第三步:解释结果注:共同度表。即: 注:该表是由主成分分析法得到的因子载荷阵的初始阵,即:标准化GDP=标准化“新增固定资产”= 标准化“城镇收入”= 标准化“农村收入”= 标准化“高校数”= 标准化“卫生机构”=注:(1)这是经过正交旋转后的因子载荷阵,即:标准化GDP=标准化“新增固定资产”= 标准化“城镇收入”= 标准化“农村收入”= 标准化“高校数”= 标准化“卫生机构”=(2)由此载荷阵可以对因子进行命名:收入因子 发展保障因子注:该表是正交旋转矩阵注:该表给出每个因子关于标准原始变量的系数,如: 附表1 32对夫妻身高数据numheightofhusheightofwifenumheightofhusheightofwife1186175171681672180168181831743160154191881734186166201661645163162211801636172152221761637192179231851718170163241691619174172251821671019117026162160111821702716916512178147281761671318116529180175141681623015715715162154311701721618816632186181附表2 金融机构监管数据倒闭保留收入比利税前收入比销售比经营良好保留收入比利税前收入比销售比10-62.8-89.51.714316.41.3203.3-3.51.1147161.930-120.8-103.22.51-3.342.740-18.1-28.81.113520.81.950-3.8-50.60.9146.712.60.960-61.2-56.21.7120.812.52.470-20.3-17.4113323.61.580-194.5-25.80.5126.110.42.19020.8-4.31168.613.81.6100-106.1-22.91.5137.333.43.5110-39.4-35.71.215923.15.5120-164.1-17.71.3149.623.81.9130-308.9-65.80.8112.571.81407.2-22.62137.334.11.5150-118.3-34.21.5135.34.20.9160-185.9-2806.7149.525.12.6170-34.6-19.43.4118.113.54180-27.96.31.3131.415.71.9190-48.26.81.6121.5-14.41200-49.2-17.20.318.55.81.5210-19.2-36.70.8140.65.81.8220-18.1-6.50.9134.626.41.8230-98-20.81.7119.926.72.3240-129-14.21.3117.412.61.3250-4-15.82.1154.714.61.7260-8.7-36.32.8153.520.61.1270-59.2-12.82.1135.926.42280-13.1-17.60.9139.430.51.9290-381.61.2153.17.11.9300-57.90.70.8139.813.81.2310-8.8-9.10.9159.572320-64.7-40.1116.320.41330-11.44.80.9121.7-7.81.6附表3 我国各地区2005年社会发展数据region人均GDP新增固定资产城镇可支配收入农村纯收入高校数卫生机构beijing33825731703.617652.957346.26774818tianjing2678270719.212638.555579.87422472hebei11133091982.49107.093481.648618046shanxi941129.8888.78913.912890.66599430mongolia12332221622.69136.792988.87337629liaoniang143343923679107.553690.217614925jilin1006996985.78690.623263.99448755heilongjiang10899901098.18272.513221.27628326shanghai38895862195.118645.038247.77582526jiangshu712318.575276.2911415324zhejiang20726552715.616293.776659.956812555anhui663517.21081.38470.682640.96819197fujian1403851867.512321.314450.36537934jiangxi710874.2977.88619.663128.896710669shangdon

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论