Chapter11相关与回归分析PPT课件_第1页
Chapter11相关与回归分析PPT课件_第2页
Chapter11相关与回归分析PPT课件_第3页
Chapter11相关与回归分析PPT课件_第4页
Chapter11相关与回归分析PPT课件_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1页/共97页第2页/共97页三、相关系数的显著性检验三、相关系数的显著性检验第3页/共97页第4页/共97页称 y 是 x 的函数,记为y = f (x),其中 x 称为自变量,y 称为因变量。n两变量函数关系在图形上表现为各观测点落在一条线上 第5页/共97页第6页/共97页变化有一定规律,则称 y 与x 之间有相关关系。n两变量相关关系在图两变量相关关系在图形上表现为各观测形上表现为各观测点点分布在线的周围分布在线的周围第7页/共97页第8页/共97页关系可能转化为函数关系或用函数关系来描述。第9页/共97页第10页/共97页第11页/共97页。 第12页/共97页第13页/共97页相

2、关关系的图示第14页/共97页第15页/共97页20304050809556516.815.615.014.814.230例:30家企业按产品产量分组的平均单位产品成本第16页/共97页例:30家企业按产品产量和单位产品成本分组2030405080181615144413213113214491079556530第17页/共97页相关关系的图示(散点图scatter diagram)第18页/共97页散点图(例题分析)【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年该银行贷款额平稳增长,但不良贷款额也有较大提高,给银行业务

3、发展带来较大压力。为弄清不良贷款形成的原因,以便找出控制不良贷款的办法,现利用银行有关业务数据进行相关分析。下面是该银行所属25家分行2002年的有关业务数据。 第19页/共97页散点图(例题分析)第20页/共97页散点图(例题分析) 不良贷款与贷款余额的散点图024681012140100200300400贷款余额不良贷款不良贷款与贷款项目个数的散点图02468101214010203040贷款项目个数不良贷款不良贷款与固定资产投资额的散点图02468101214050100150200固定资产投资额不良贷款 不 良 贷 款 与 累 计 应 收 贷 款 的 散 点 图024681 01 21

4、 401 02 03 0累 计 应 收 贷 款不良贷款第21页/共97页r。第22页/共97页第23页/共97页1. 第24页/共97页相关系数(取值及其意义)第25页/共97页第26页/共97页 我国人均国民收入与人均消费金额数据我国人均国民收入与人均消费金额数据 单位单位: :元元年份年份人均人均国民收入国民收入人均人均消费金额消费金额年份年份人均人均国民收入国民收入人均人均消费金额消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.9724926728932940645151319881989199

5、01991199219931068.81169.21250.71429.51725.92099.56436907138039471148第27页/共97页第28页/共97页第29页/共97页用例数据计算出该商业银行不良贷款、贷款余额、应收贷款、贷款项目、固定资产投资额之间的相关系数如下:第30页/共97页三、三、第31页/共97页 第32页/共97页 用例数据第33页/共97页相关系数的显著性检验(例题分析)【例】对用例数据大型商业银行不良贷款与贷款余额之间的相关系数进行显著性检()1.提出假设:H0: ;H1: 02.计算检验的统计量第34页/共97页相关系数的显著性检验(例题分析)对前述例

6、某大型商业银行各相关系数计算检验统计量数据如下,同学们可以自行检验和分析第35页/共97页第36页/共97页第37页/共97页regression model第38页/共97页第39页/共97页第40页/共97页因变量y y与自变量x x之间为线性关系第41页/共97页归系数。为随机误差项,又称随机干扰项,表示除能用 x 和 y 之间线性关系解释的因素外的其他随机因素对 y 的影响。第42页/共97页第43页/共97页estimated regression equation估计的y的期望值,是估计的回归直线在y轴上的截距,是当 x=0 时 y的期望值,是直线的斜率,表示x每变动一个单位时,y

7、的平均变动值第44页/共97页与实际数据的误差比其他任何直线都小第45页/共97页最小二乘法(图示)第46页/共97页n从 的计算公式可以看出其分母大于0。 的正负取决于分子,且分子与相关系数r的分子相同。 0时,表示x每增加一个单位y值平均增加的数量,即x与y正相关; 0时,表示x每增加一个单位y值平均减少的数量,即x与y负相关。第47页/共97页第48页/共97页020040060080010001200140005001000150020002500人均消费与人均国民收入的回归人均消费与人均国民收入的回归第49页/共97页【例】对求某大型商业银行不良贷款对贷款余额的回归方程第50页/共9

8、7页不良贷款对贷款余额回归方程的图示不良贷款对贷款余额的回归直线不良贷款对贷款余额的回归直线-2024681012140100200300400贷款余额不良贷款第51页/共97页用Excel进行回归分析第1步:选择“工具”下拉菜单第2步:选择“数据分析”选项第3步:在分析工具中选择“回归”,然后选择“确定”第4步:当对话框出现时 在“Y值输入区域”方框内键入Y的数据区域 在“X值输入区域”方框内键入X的数据区域 在“置信度”选项中给出所需的数值 在“输出选项”中选择输出区域 在“残差”分析选项中选择所需的选项第52页/共97页第53页/共97页为SST)可由各观测值与均值离差的平方和来表示,即

9、:第54页/共97页离差平方和的分解(图示)xyy离差分解图第55页/共97页第56页/共97页 从上图可以看出,在总变差平方和(SST)中回归离差平方和(SSR)的比例越大,回归直线拟合越好。第57页/共97页coefficient of determination判定系数越接近于1判定系数越接近于rr20,说明回归方程拟合越差判定系数等于相关系数的平方,即r2(r)2第58页/共97页或者说在取值的变动中,有99.74%是由所决定的。第59页/共97页判定系数r2 (举例)【例】对计算某大型商业银行不良贷款额对贷款余额回归的判定系数意义:在不良贷款额的变差中有71.16%可以由不良贷款与贷

10、款余额之间的线性关系来解释,或者说在不良贷款额的变动中,有71.16%是由贷款余额所决定的。可见不良贷款与贷款余额之间有较强的线性关系 。第60页/共97页(standard error of estimate) 估计标准误差是对回归模型随机误差项 的标准差 的估计,即观察值与回归估计值离差平方和的均方根,是在排除了x对y的线性影响后对因变量y随机波动大小的一个估计量。 反映观察值在回归直线周围的分散程度和回归方程对因变量代表性的大小,其数值越大说明代表性越小。也反映用估计的回归方程预测y时预测误差的大小,其数值越大说明预测误差越大。 可从另一个角度说明回归直线的拟合程度。 计算公式为第61页

11、/共97页(举例)【例】第62页/共97页第63页/共97页 在根据样本数据拟合回归方程时,首先假设变量x和y之间存在线性关系,这种假设是否成立必须经过检验才能证实。 回归分析中的显著性检验包括两方面内容:第64页/共97页 是检验自变量与因变量之间线性关系是否显著。 方法是将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验分析二者之间的差别是否显著回归均方(MSR):回归离差平方和(SSR)除以相应的自由度(自变量的个数p) 残差均方(MSE):残差平方和(SSE)除以相应的自由度(n-p-1)如果差别显著,两个变量之间存在线性关系如果差别不显著,两个变量之间不存在线性关系第65页

12、/共97页回归方程线性关系的显著性检验(检验的步骤)1.提出假设:H0:两变量之间的线性关系不显著 H1:两变量之间的线性关系显著2.计算检验统计量F其中,F(1,n-2)表示第一自由度为1,第二自由度为n-2的F分布。3. 确定显著性水平 ,并根据分子自由度1和分母自由度n-2查F分布表找出临界值F 4. 作出决策:若F F ,拒绝H0;若FF(1,25-2)=4.84 拒绝H0,说明贷款余额x与不良贷款y之间存在显著的线性关系,即回归方程线性关系显著。第67页/共97页线性关系的显著性检验 (方差分析表) 第68页/共97页 1 1不果也一定显著。但在多元回归分析中两种检验的意义不同。第6

13、9页/共97页第70页/共97页 第71页/共97页回归系数的检验(例题分析)【例】对例数据建立的回归方程的回归系数进行显著性检验( )1. 提出假设H0: 1 = 0 H1: 1 0 2. 计算检验的统计量第72页/共97页回归系数的检验(例题分析)P 值的应用第73页/共97页第74页/共97页第75页/共97页第76页/共97页y 的平均值的点估计在前面某大型商业银行的例子中,假如要估计贷款余额为100亿元时所有分行不良贷款的平均值,就是平均值的点估计。根据估计的回归方程得第77页/共97页y 的个别值的点估计 利用估计的回归方程,对于自变量x的一个给定值 x0 ,求出因变量 y 的一个

14、个别值的估计值 ,就是个别值的点估计 比如,在前面某大型商业银行的例子中,如果只是想知道贷款余额为亿元的那个分行(这里是编号为10的那个分行)的不良贷款是多少,则属于个别值的点估计。根据估计的回归方程得第78页/共97页点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计。区间估计是对于自变量x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间。区间估计有两种类型 置信区间估计(confidence interval estimate) 预测区间估计(prediction interval estimate)第79页/共97页置信区间估计利用估计的回归方

15、程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间 ,这一估计区间称为置信区间(confidence interval) E(y0) 在1- 置信水平下的置信区间为第80页/共97页置信区间估计(例题分析)【例】在前面某大型商业银行的例子中,求出贷款余额为100亿元时,不良贷款95%的置信区间 解:根据前面的计算结果,已知n=25,sy=,t,贷款余额为100亿元时不良贷款平均值的点估计值为,置信区间为即当贷款余额为100亿元时,所有分行不良贷款的平均值在亿元到亿元之间。第81页/共97页预测区间估计利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量

16、 y 的一个个别值的估计区间,这一区间称为预测区间(prediction interval) y0在1- 置信水平下的预测区间为第82页/共97页预测区间估计(例题分析)【例】在前面某大型商业银行的例子中,求出贷款余额为亿元的那个分行不良贷款 95%的预测区间 解:根据前面的计算结果,已知n=25,sy=, t,贷款余额为亿元时不良贷款点估计值为,预测区间为即贷款余额为亿元的那个分行不良贷款的预测区间在亿元到亿元之间。 第83页/共97页因此用于预测的x0与 x 的差异程度越大预测精度越差第84页/共97页第85页/共97页相关、回归分析举例x2y21996199719981999200024

17、30323438111514162057690010241156144412122519625640026445044854476015876第86页/共97页相关、回归分析举例第87页/共97页第88页/共97页1) 提出假设:H0: ; H1: 02) 计算检验统计量3) 根据显著性水平 ,查t分布表得临界值 t(n-2)=t 由于t=5.3099t,所以拒绝H0,接受H1,即说明居民人均收入与商品销售额之间的相关关系显著。第89页/共97页求一元线性回归方程,解释回归系数的意义第90页/共97页计算判定系数,并解释其意义r2(0.9507)2 说明在商品销售额的总变差中有可以由人均收入与商品销售额之间的线性关系来解释,或者说,在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论