




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 1回归分析的基本思想及其初步应用 二 随机误差与线性回归模型 一 复习回顾 1 线性回归模型 y bx a e 其中a和b为模型的未知参数 e称为随机误差 1 确定变量 2 作散点图 判断相关关系 3 设回归方程 4 求回归方程 5 根据回归方程作出预报 2 线性回归分析的基本步骤 3 线性相关关系强弱的判断 相关系数r1 相关系数r 2 相关系数r的性质 1 r 1 2 正相关 负相关 3 r 越接近于1 x与y相关程度越强 r 越接近于0 x与y相关程度越弱 例1从某大学中随机选取8名女大学生 其身高和体重数据如表1 1所示 求根据一名女大学生的身高预报她的体重的回归方程 并预报一名身高为172cm的女大学生的体重 案例1 女大学生的身高与体重 解 1 选取身高为自变量x 体重为因变量y 作散点图 2 由散点图知道身高和体重有比较好的线性相关关系 因此可以用线性回归方程刻画它们之间的关系 3 从散点图还看到 样本点散布在某一条直线的附近 而不是在一条直线上 所以不能用一次函数y bx a描述它们关系 思考 有些时候 样本数据中难免混有错误数据 通过何种方法把它剔除 1 残差分析与残差图的定义 然后 我们可以通过残差来判断模型拟合的效果 判断原始数据中是否存在可疑数据 这方面的分析工作称为残差分析 我们可以利用图形来分析残差特性 作图时纵坐标为残差 横坐标可以选为样本编号 或身高数据 或体重估计值等 这样作出的图形称为残差图 数据点和它在回归直线上相应位置的差异是随机误差的效应 称为残差 注意 1 残差分析步骤 1 计算每组数据的残差 即样本值减预测值 2 画残差图 纵坐标为残差 横坐标为自变量 3 分析残差图 4 找异常值 2 残差图的制作 坐标纵轴为残差变量 横轴可以有不同的选择 横轴为编号 可以考察残差与编号次序之间的关系 常用于调查数据错误 横轴为解释变量 可以考察残差与解释变量的关系 常用于研究模型是否有改进的余地 下表列出了女大学生身高和体重的原始数据以及相应的残差数据 残差图 注意 残差图的作用 1 发现原始数据中的可疑数据 问题数据2 判断模型的适用性 若模型选择的正确 残差图中的点应该比较均匀地落在以横轴为中心的水平的带状区域中带状区域的宽度越窄 说明模型拟合精度越高 回归方程的预报精度越高 说明选用的模型较合适 2 用相关指数r2来刻画回归的效果 注意 1 取值范围在 0 1 之间 即0 r2 1 2 在线性回归模型中 相关指数r2表示解析变量x对预报变量y变化的贡献率 代表自变量刻画预报变量的能力 r2反映回归直线的拟合程度 是度量模型拟合效果的一种指标 3 r2的值越大 说明残差平方和越小 模型拟合效果越好r2的值越小 说明残差平方和越大 模型拟合效果越好4 r2 1 说明回归方程拟合的越好 表示解析变量x和预报变量y的线性相关性越强 r2 0 说明回归方程拟合的越差5 如果某组数据可能采取几种不同回归方程进行回归分析 则可以通过比较r2的值来做出选择 即选取r2较大的模型作为这组数据的模型 6 判定系数等于相关系数的平方 即r2 r 2 注 本例中r2 0 64 表示解析变量x对预报变量y约贡献了64 即 可以叙述为 身高解析了64 的体重变化 而随机误差贡献了剩余的36 所以 身高对体重的效应比随机误差的效应大得多 练习 关于x与y有如下数据 为了对x y两个变量进行统计分析 现有以下两种线性模型 y 6 5x 17 5 y 7x 17 试比较哪一个模型拟合的效果更好 一 用身高预报体重时 需要注意下列问题 这些问题也使用于其他问题 涉及到统计的一些思想 模型适用的总体 模型的时间性 样本的取值范围对模型的影响 模型预报结果的正确理解 小结 二 建立回归模型的基本步骤为 1 确定变量 2 制作散点图 观察是否相关 3 确定回归方程的类型 线性回归 指数回归 对数回归等 4 利用公式确定回归参数 5 利用残差分析回归是否合理或模型是否合适 三 回归分析的一般方法 1 利用散点图观察两个变量是否线性相关2 利用残差来判断模型拟合的效果 残差分析 利用残差图来分析数据 对可疑数据 残差较大的数据 进行重新调查 有错误就更正 然后重新利用回归模型拟合 如果没有错误 则需要找其他原因 例1在一段时间内 某中商品的价格x元和需求量y件之间的一组数据为 求出y对的回归直线方程 并说明拟合效果的好坏 解 例1在一段时间内 某中商品的价格x元和需求量y件之间的一组数据为 求出y对的回归直线方程 并说明拟合效果的好坏 解 列出残差表为 0 994 因而 拟合效果较好 0 0 3 0 4 0 1 0 2 4 6 2 6 0 4 2 4 4 4 练习假设关于某设备的使用年限x和所支出的维修费用y 万元 有如下的统计资料 若由资料知 y对x呈线性相关关系 试求 1 线性回归方程的回归系数 2 求残差平方和 3 求相关系数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉字视觉联想反思课件
- 汉字甲课件教学课件
- 海南省省直辖县级行政单位琼海市2024-2025学年八年级下学期7月期末考试数学试卷(含答案)
- 2024-2025学年辽宁省鞍山市铁西区人教版四年级下册期末考试数学试卷(含答案)
- 汉字基本知识培训心得
- 房屋代持协议书4篇
- 通讯网络互联网行业前瞻报告
- 2025合同的订立与履行
- DB46-T 546-2021 非公路用旅游观光车安全管理与服务规范
- 2024年秋新北师大版数学一年级上册教学课件 第四单元 10以内数加与减 第11课时 做个加法表
- 2025小学道德与法治教师课标考试模拟试卷附参考答案 (三套)
- 中国卒中患者高血压管理专家共识(2024)解读
- 小艇行业跨境出海战略研究报告
- 三会一课培训内容
- GB/T 45309-2025企业采购物资分类编码指南
- 膜性肾病护理进展
- 销售过程管理培训课件
- 医院医保智能审核与规则解释
- 篮球裁判员手册
- 电焊工安全用电培训
- 安宁疗护服务规范
评论
0/150
提交评论