数据分析期末试题与答案_第1页
数据分析期末试题与答案_第2页
数据分析期末试题与答案_第3页
数据分析期末试题与答案_第4页
数据分析期末试题与答案_第5页
已阅读5页,还剩2页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

千里之行,始于足下让知识带有温度。第第2页/共2页精品文档推荐数据分析期末试题与答案数据分析期末试题及答案

一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的办法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分)

解:

1.通过分离绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系

上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采纳曲线估量,得出

表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系

上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。

上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系

x)为横轴,地区平均寿命(y)为纵轴的散点图,上图是以疫苗接种率(x3)的三次方(3

3

由图可知,他们之间呈正线性关系

所以可以采纳如下的线性回归办法分析。

2.线性回归

先用强行进入的方式建立如下线性方程

设Y=β0+β1*(Xi1)+β2*Xi2+β3*

X+εii=1.2(24)

3i

其中εi(i=1.2……22)互相自立,都听从正态分布N(0,σ^2)且假设其等于方差

R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。

建立总体性的假设检验

提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零

得如下方差分析表

上表是方差分析SAS输出结果。由表知,采纳的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,否决原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。

做自立性的假设检验得出参数估量表

2=β3=0:H1:β1、β2、β3不全为零

由表知,

β1=33.014,β1=0.072,β2=0.169,β3=0.178,以β1=0.072为例,表示当

成人识字率(x2),一岁儿童疫苗接种率(x3)不变时,,人均GDP(x1)每增强一个单

位,平均寿命(y)就增强0.072个单位。

基于以上结果得出年平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫

苗接种率(x3)之间有显著性的线性关系有回归方程

Y=33.014+0.072*X1+0.169*X2+0.178*X3

β1、β2、β3对应得p值分离为0.000,0.000,0.002,对应的概率p值都小于0.05,

表示它们的单独性的假设检验没通过,即该模型是最优的,所以不用采纳逐步回

归的方式分析。

对原始数据举行残差分析

未标准化的残差RES_1

-7.53964

-3.57019

-3.42221

-2.89835

-2.30455

-2.17263

-2.05862

-1.37142

-1.17048

-.43890

-.17260

-.03190

.94655

1.42896

1.61252

1.61590

2.10139

3.01856

3.02571

3.49808

4.60737

5.29645

以X1为横轴,RES_1为纵轴画出如下散点图

由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。

同理可以得出RES_1与X2、X3的散点图,

由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。

由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。

误差项的正态性检验

数据(RES_1)标准化残差ZRES_1

由图可以看出,散点图近似的在一条直线附近,则可以认为数据来自正太分布总体

二、诊断发觉运营不良的金融企业是审计核查的一项重要功能,审计核查的分类失败会导致灾害性的后果。下表列出了66家公司的部分运营财务比率,其中33家在2年后破产Y=0,另外33家在同期保持偿付能力(Y=1)。请用变量X1(未分

配利润/总资产),X2(税前利润/总资产)和X3(销售额/总资产)拟合一个Logistic回归模型,并按照模型给出实际意义的分析,数据见财务比率.sav(25分)。解:

整体性的假设检验提出假设性检验

H0:回归系数iβ=0(i=1,2,3),H1:不都为0建立logistic模型:

)}

0{1}

0{ln(

=-=YpYp=3

213210XXXββββ+++

上表显示了logistic分析的初始阶段方程中惟独常数项时的错判矩阵,其中33家在2年后破产(y=0),但模型均预测为错误,正确率为0%,另外33家在同期保持偿付能力(Y=1),正确率为100%,所以模型总的预测正确率为50%。

由上表得知,假如变量X1(未分配利润/总资产

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论