




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
、 应用 回归分析 部分课后习题答案 第一章 回归分析概述 量间统计关系和函数关系的区别是什么? 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。 归分析与相关分析的联系与区别是什么? 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 量 在被解释的特殊地位。在相关分析中,变量 研究变量 y 与变 量 在回归分析中,因变量 变量 回归分析不仅可以揭示变量 可以由回归方程进行预测和控制。 归模型中随机误差项 的意义是什么? 答: 为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究 y与 x1, 关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。 性回归模型的基本假设是什么? 答:线性回归模型的基本假设有: 非随机的,常数。 E(i)=0 i=1,2 . i,j)= 2 np. 归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题? 答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。应注意的问题有:在选择变量时要注意与一些专门领域的专家合作,不要认为一个回归模型所涉及的变量越多越好,回归变量的确定工作并不能一次完成,需要反复试算,最终找出最合适的一些变量。 1 集,整理数据包括哪些内容? 答 ;常用的样本数据分为时间序列数据和横截面数据,因而数据收集的方法主要有按时间顺序统计 数据和在同一时间截面上统计数据,在数据的收集中,样本容量的多少一般要与设置的解释变量数目相配套。而数据的整理不仅要把一些变量数据进行折算差分甚至把数据对数化,标准化等有时还需注意剔除个别特别大或特别小的“野值”。 造回归理论模型的基本依据是什么? 答:选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,并将由散点图显示的变量间的函数关系作为理论模型的数学形式。对同一问题我们可以采用不同的形式进行计算机模拟,对不同的模拟结果,选择较好的一个作为理 论模型。 什么要对回归模型进行检验? 答:我们建立回归模型的目的是为了应用它来研究经济问题,但如果马上就用这个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。 归模型有那几个方面的应用? 答:回归模型的应用方面主要有:经济变量的因素分析和进行经济预测。 什么强调运用回归分析研究经济问题要定性分析和定量分析相结合? 答:在回归模型的运用中,我们还强调定性分析和定量分析相结合。这是因为数理统计方法只 是从事物外在的数量表面上去研究问题,不涉及事物质的规定性,单纯的表面上的数量关系是否反映事物的本质?这本质究竟如何?必须依靠专门的学科研究才能下定论,所以,在经济问题的研究中,我们不能仅凭样本数据估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确应用。 2 第二章 一元线性回归 答:( 1)散点图为: ( 2) x 与 y 之间大致呈线性关系。 ( 3)设回归方程为01 1 = 12217()y n x yx n x01 2 0 7 3 1 17 可 得 回 归 方 程 为 ( 4) 22 11 ()n - 2 2 11 ( ( ) )n - 2 = 2 2 22213 ( 10- ( - 1 + 7 1 ) ) ( 10- ( - 1 + 7 2 ) ) ( 20- ( - 1 + 7 3 ) )( 20- ( - 1 + 7 4 ) ) ( 40- ( - 1 + 7 5 ) ) 1 1 6 9 0 4 9 3 631 1 0 / 3 3 1 3 3 0 6 . 13 ( 5)由于 211( , ) 1112()/ 服从自由度为 t 分布。因而 1/2()| | ( 2 ) 1t n 也即:1 / 2 1 1 / 2()x x x xp t =1 可得1 119 5 % 3 3 3 333 的 置 信 度 为 的 置 信 区 间 为 ( 7+ 即为:( 2 2001 ( )( , ( ) ) 0 0 0 02221 ( ) 1 ( )()x x x n L 服从自由度为 t 分布。因而 00/22| | ( 2 ) 11 ( )t 即 220 / 2 0 0 / 21 ( ) 1 ( )( ) 1x x x t n L 可得1 9 5 % 7 . 7 7 , 5 . 7 7 的 置 信 度 为 的 置 信 区 间 为 ( ) ( 6) x 与 y 的决定系数22 121()4 9 0 / 6 0 0 0 . 8 1 7() 4 ( 7) x 平方和 方 F 显著性 组间 (组合) 100 线性项 加权的 056 偏差 326 组内 总数 由于 (1, 3),拒绝0H,说明回归方程显著, x 与 y 有显著的线性关系。 ( 8) 112/其中 22 21111 ()22i y 7 1 0 2 13 . 6 61 333303 /2 /23 接受原假设 01: 0,H 认为 1 显著不为 0,因变量 y 对自变量 x 的一元线性回归成立。 ( 9)相关系数 1211( ) ( )( ) ( )x y x y y x y y= 7 0 7 0 . 9 0 41 0 6 0 0 6 0r 小于表中 1% 的相应值同时大于表中 5% 的相应值, x 与 y 有显著的线性关系 . (10) 序号 x y y e 1 1 10 6 4 2 2 10 13 3 20 20 0 4 4 20 27 5 40 34 6 残差图为: 5 从图上看,残差是围绕 e=0 随机波动,从而模型的基本假定是满足的。 ( 11)当广告费0x=元时,销售收入0 2 8 万 元 , 95%置 信 度 为 的 置 信 区 间近 似 为 ,即( 答: ( 1) 散点图为: ( 2) x 6 与 y 之间大致呈线性关系。 ( 3) 设回归方程为01 1 = 1221( 2 6 3 7 0 2 1 7 1 7 ) 0 . 0 0 3 6( 7 1 0 4 3 0 0 5 8 0 6 4 4 0 )()y n x yx n x 01 2 . 8 5 0 . 0 0 3 6 7 6 2 0 . 1 0 6 8 0 . 1 0 6 8 0 . 0 0 3 6 可 得 回 归 方 程 为 (4) 22 11 ()n - 2 2 11 ( ( ) )n - 2 = 5) 由于 211( , ) 1112()/ 服从自由度为 t 分布。因而 1/2()| | ( 2 ) 1t n 也即:1 / 2 1 1 / 2()x x x xp t =1 可得1 95% 的 置 信 度 为 的 置 信 区 间 为 0 . 4 8 0 1 / 1 2 9 7 8 6 0 0 . 4 8 0 1 / 1 2 9 7 8 6 0( 即为:( 2 2001 ( )( , ( ) ) 7 0 0 0 02221 ( ) 1 ( )()x x x n L 服从自由度为 t 分布。因而 00/22| | ( 2 ) 11 ( )t 即 220 / 2 0 0 / 21 ( ) 1 ( )( ) 1x x x t n L 可得1 9 5 % 0 . 3 5 6 7 , 0 . 5 7 0 3 的 置 信 度 为 的 置 信 区 间 为 ( ) (6)x 与 y 的决定系数 22 121()()7) x 平方和 方 F 显著性 组间 (组合) 168 线性项 加权的 027 偏差 315 内 总数 由于 (1, 9),拒绝0H,说明回归方程显著, x 与 y 有显著的线性关系。 (8) 112/其中 22 21111 ()22i y 0 . 0 0 3 6 1 2 9 7 8 6 08 . 5 4 20 . 0 4 8 0 1/2 /28 2 8 接受原假设 01: 0,H 认为 1 显著不为 0,因变量 y 对自变量 x 的一元线性回归成立。 (9) 相关系数 1211( ) ( )( ) ( )x y x y y x y y= 4653 0 . 9 4 8 91 2 9 7 8 6 0 1 8 . 5 2 5 r 小于表中 1% 的相应值同时大于表中 5% 的相应值, x 与 y 有显著的线性关系 . (10) 序号 x y y e 1 825 3 5 215 1 1070 4 550 2 480 1 920 3 1350 325 670 3 0 1215 5 图上看,残差是围绕 e=0 随机波动,从而模型的基 本假定是满足的。 (11)001 0 0 0 3 . 7x新 保 单 时 , 需 要 加 班 的 时 间 为 y 小 时 。 ( 12)0 0 / 2 0 0y ( 2 ) 1y t n h 的 置 信 概 率 为 1- 的 置 信 区 间 精 确 为, 即为( 近似置信区间为:0 2y ,即( 9 ( 13) 可得置信水平为 1- 的 置 信 区 间 为0 / 2 0 0( 2 )y t n h ,即为( . 1)散点图为: 可以用直线回归描述 y 与 x 之间的关系 . (2)回 归方程为 : 1 2 1 1 2 . 6 2 9 3 . 3 1 4 (3) 10 从图上可看出,检验误差项服从正态分布。 11 第三章 多元线性回归 :( 1)用 出 y, x2, 相关性 y x1 x2 关性 y 556 724 556 113 731 547 724 547 y . 008 048 . 127 008 009 051 . N y 10 10 10 10 0 10 10 10 0 10 10 10 0 10 10 10 所以 r = (2) 所以三元线性回归方程为 系数 a 模型 非标准化系数 标准系数 t B 的 置信区间 相关性 共线性统计量 B 标准 误差 试用版 下限 上限 零阶 偏 部分 容差 (常量 ) 096 385 100 556 350 535 049 731 444 277 284 724 212 a. 因变量 : y 模型汇总 12 ( 3) 由于决定系数 R=( 4) 型 平方和 方 F 1 回归 015a 残差 总计 a. 预测变量 : (常量 ), b. 因变量 : y 因为 F= P=是因为如果样本再小,利用残差就很难对自相关的存在性作出比较正确的判断; : (1) 系数 a 模型 非标准化系数 标准系数 t B 标准 误差 试用版 1 (常量 ) 242 000 x 002 000 a. 因变量 : y 2) 模型汇总 b 模型 R R 方 调整 R 方 标准 估计的误差 998 09744 a. 预测变量 : (常量 ), x。 b. 因变量 : y 18 查 以 那么 XX+近奇异的程度小得多,考虑到变量的量纲问题,先对数据作标准化,为了计算方便,标准化后的设计阵 仍然用 X 表示,定义为 1 X X I X y ,称为 的岭回归估计,其中 k 称为岭参数。 k 有哪几种主要方法? 答:选择岭参数的几种常用方法有 答:用岭回归方法来选择变量应遵从的原则有: 们假定设计矩阵 X 已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小,我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量。 2.当 k 值较小时标准化岭回归系数的绝对值并不是很小,但是不稳定,随着 k 的增 加迅速趋于零。像这样的岭回归系数不稳定 ,震动趋于零的自变量,我们也可以予以删除。 果有若干个岭回归系数不稳定,究竟去掉几个,去掉哪几个,这并无一般原则可循,这需根据去掉某个变量后重新进行岭回归分析的效果来确定。 章习题 9 的数据,逐步回归的结果只保留了 3 个自变量 y 对这 3个自变量做岭回归分析? 答: 问题,分别用普通最小二乘和岭回归建立 第二产业增加值 第三产业增加值 二元线性回归,解释所得到的回归系数? 答 : F K K _ _ _ _ 14 05000 10000 15000 20000 25000 30000 35000 40000 45000 50000 55000 60000 65000 70000 75000 80000 85000 90000 95000 15 系数 a 模型 非标准化系数 标准系数 t B 标准 误差 试用版 1 (常量 ) 000 第二产业增加值 151 000 第三产业增加值 244 017 a. 因变量 : F K K _ _ _ _ 01000 02000 03000 04000 05000 06000 07000 08000 09000 10000 * k = * E 10 09 20320345 16 F in ) B/) 合 表 及 图 形 可 知 , 用 普 通 最 小 二 乘 法 得 到 的 回 归 方 程 为23y 4 3 5 2 . 8 5 9 1 . 4 3 8 0 . 6 7 9 =显不合理。 从岭参数图来看,岭参数 参数已基本稳定,再参照复决定系数 ,当 k=决定系数 2R =然很大,固用 k=回归得到的未标准化的岭回归方程为 23y = 3 9 8 0 . 2 4 7 9 + 1 . 0 9 0 6 1 x 1 . 2 2 6 7 x。 年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,为弄清 楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法,表 该银行所属 25 家分行 2002 年的有关业务数据。 ( 1) 计算 y 与其余四个变量的简单相关系数。 ( 2) 建立不良贷款 y 对 4 个自变量的线性回归方程,所得的回归系数是否合理? ( 3) 分析回归模型的共线性。 ( 4) 采用后退法和逐步回归法选择变量,所得回归方程的回归系数是否合理,是否还存在共线性? ( 5) 建立不良贷款 y 对 4 个自变量的岭回归。 ( 6) 对第 4 步剔除变量后的回归方程再做岭回归。 ( 7) 某研究人员希望做 y 对各项贷款余额,本年累计应收贷款 量的回归,你认为这种做是否可行,如果可行应该如何做? 相关性 17 不良贷款 y 各项贷款余额 年累计应收到款款项目个数 年固定资产投资额 关性 不良贷款 y 844 700 各项贷款余额 844 679 780 本年累计应收到款 732 586 贷款项目个数 700 586 747 本年固定资产投资 额 519 472 (单侧) 不良贷款 y . 000 004 各项贷款余额 000 . 000 本年累计应收到款 000 009 贷款项目个数 000 001 . 本年固定资产投资额 004 009 N 不良贷款 y 25 25 25 25 25 各项贷款余额 5 25 25 25 25 本年累计应收到款 5 25 25 25 25 贷款项目个数 5 25 25 25 25 本年固定资产投资额 5 25 25 25 25 系数 a 模型 非标准化系数 标准系数 t 共线性统计量 B 标准 误差 试用版 容差 (常量 ) 782 206 各项贷款余额 040 891 001 年累计应收到款 148 260 075 18 贷款项目个数 015 034 863 年固定资产投资额 015 067 a. 因变量 : 不良贷款 y 共线性诊断 a 模型 维数 特征值 条件索引 方差比例 (常量 ) 各项贷款余额 年累计应收到款 款项目个数 年固定资产投资额 1 1 01 01 00 2 68 02 09 3 16 66 13 4 00 20 72 5 15 12 05 a. 因变量 : 不良贷款 y 后退法得 系数 a 模型 非标准化系数 标准系数 t B 标准 误差 试用版 1 (常量 ) 782 206 各项贷款余额 040 891 001 本年累计应收到款 148 260 075 贷款项目个数 015 034 863 本年固定资产投资额 015 067 2 (常量 ) 711 186 各项贷款余额 041 914 000 本年累计应收到款 149 261 066 本年固定资产投资额 014 058 3 (常量 ) 697 531 19 各项贷款余额 050 000 本年固定资产投资额 015 044 a. 因变量 : 不良贷款 y 逐步回归得 系数 a 模型 非标准化系数 标准系数 t B 标准 误差 试用版 1 (常量 ) 723 263 各项贷款余额 038 844 000 2 (常量 ) 697 531 各项贷款余额 050 000 本年固定资产投资额 015 044 a. 因变量 : 不良贷款 y F
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年护士临床技能测试试题及答案
- 精准备考2025年文化概论试题及答案
- 提升记忆力的学习策略执业医师考试试题及答案
- 行政管理中中华文化的核心价值试题及答案
- 中国文化概论与环境保护的关系试题及答案
- 药品管理法对药师考试的影响试题及答案
- 行政管理2025年研究方法试题及答案
- 2025年自考行政管理社会服务创新试题答案
- 正确认识执业药师的考试试题及答案
- 2025年执业药师的综合素质培养试题及答案
- 四川省资阳市乐至县2025年三年级数学第二学期期末达标检测试题含解析
- 2025-2030中国城市规划行业深度分析及发展前景与发展战略研究报告
- 2025年全国焊工作业人员职业技能理论考试练习题库(900题)含答案
- 道岔区无砟轨道我国高速铁路道岔区采用的无砟轨道主要有长枕埋
- 《行政法与行政诉讼法》课件各章节内容-第二十六章 行政赔偿及诉讼
- 【9物一模】2025年安徽省合肥市45中(橡树湾)中考一模物理试卷
- 计算机系统规划与管理考试内容试题及答案
- 药店质量负责人聘用合同范例二零二五年
- 反三违安全知识培训课件
- 短视频营销实践试题及答案
- 安置房转让正式合同范本
评论
0/150
提交评论