



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
用心 爱心 专心1 回归分析的基本思想及其初步应用知识梳理回归分析的基本思想及其初步应用知识梳理 一 线性回归方程的确定 如果一组具有相关关系的数据 1122 nn x yxyxyA A A 作出散点图大致分布在一 条直线附近 那么我们称这样的变量之间的关系为线性相关关系 也称一元线性相关 这条 直线就是回归直线 记为 y bxa 那么如何求得参数ab和使得各点与此直线的距离的平方和为最小 即如何求得线性回归方 程呢 在所求回归直线方程 y bxa 中 当x取 i x时 ii ybxa 与实际收集到的数据 i y之 间的偏差为 iiii yyybxa 偏差的平方为 22 iiii yyybxa 如图 1 即 2 1 n ii i Qybxa 来刻画出n个点与回归直线在整体上的偏差的平方和 显 然 Q 取最小值时的 a b的值就是我们所求的 1 2 1 n ii i n i i xxyy b xx 1 2 2 1 n ii i n i i x ynxy xnx aybx 其中 ii x y为样本数据 11 nn ii ii xx yy nn 为样本平均数 x y称为样本点 中心 且所求线性回归直线经过样本点中心 如图 2 所示 当回归直线斜率0b 时 为线性正相关 0b 时为线性负相关 应注意 这个最小距离不是通常所指的各数据的点 ii x y到直线的距离 而是各数 据点 ii x y沿平行 y 轴方向到直线的距离 如图 1 所示 A o A A A ybxa y x A y x图 2 ybxa A i y y i x x A A A i y 2 ii yy A o 图 1 用心 爱心 专心2 对于上面参数ab和的求法原理及方法是简单的 但是运算量较大 需要将 2 1 n ii i Qybxa 展开 再合并 然后配方整理 从而求得 a b 例如 当 a b m n取怎样实数时 22 anbmk 的值为最小 显然当 am bn 时最小值为k 像这样配方求最值的方法是经常用到的 线性回归方程 y bxa 中的参数 b a就是这样求出的 教材中用了添项法较为简捷的求出了截距 a和斜率b 分别是使 2 1 n ii i Qyx 取最小值时 的值 求得 1 2 1 n ii i n i i xxyy xx yx 的值 请同学们体会其解法 线性回归方程的确定是进行回归分析的基础 二 回归分析 是对具有相关关系的两个变量进行统计分析的一种常用方法 线性相关关系的强弱 两个变量之间线性相关关系的样本相关系数 1 22 11 n ii i nn ii ii xxyy r xxyy 衡量线性相 性关系的强弱 由于分子与斜率b的分子一样 因此 当0r 时 两个变量正相关 当 0r 时两个变量负相关 当r的绝对值接近 表明两个变量的线性相关性很强 当r的 绝对值接近 表明两个变量之间几乎不存在线性相关关系 规定当0 75r 时 我们认 为两个变量有很强的线性相关关系 解释变量与随机误差对预报精度的影响以及残差分析 1 有关概念 线性回归模型 2 0 ybxae E eD e 其中a和b为模型的未知参数 x称为解释变量 y称为预报变量 e是y与 y bxa 之间的误差 e叫随机误差 随机误差的估计值为 i iiii eyyybxa 图 3 A A i xo A y ybxa A i y x i y iii eyy A 用心 爱心 专心3 ie 称为相应于样本点 ii x y的残差 如图 2 随机误差的方差估计值A 2 衡量回归方程的预报精度 由于随机误差的均值 1 1 n i i E ee n 0 因此 可以用随机误差的方差估计值A 22 1 1 2 n i i e n 1 2n Q a b 其中 2n 残差平方和为 2 1 n ii i Q a byy 衡量回归方程的预报精度 显然 A 2 越小 预报精度越高 3 通过残差分析判断模型拟合效果 由 i iiii eyyybxa 计算出残差 1e 2e ne 然后选取横坐标 为编号 或解释变量或预报变量 纵坐标为残差作出残差图 通过图形分析 如果 样本点的残差较大 就要分析样本数据的采集是否有错误 另一方面 可以通过残 差点分布的水平带状区域的宽窄 说明模型拟合效果 反映回归方程的预报精度 3 相关指数 2 R反应模型的拟合效果 2 2 1 2 1 1 n ii i n ii i yy R yy 22 11 2 1 nn iiii ii n ii i yyyy yy 1 变量理解 2 1 n ii i yy 为总偏差平方和 表示解释变量和随机误差产生的总的效应 2 1 n ii i yy 为残差平方和 表示了随机误差效应 22 11 nn iiii ii yyyy 表示了解释变量效应 模型拟合效果 2 1 2 1 n ii i n ii i yy yy 反映了随机误差对预报变量 总效应 的贡献率 用心 爱心 专心4 2 2 1 2 1 1 n ii i n ii i yy R yy 反映了解释变量对预报变量 总效应 的贡献率 因此 2 R越接近 即 2 1 2 1 n ii i n ii i yy yy 越接近 0 表示回归的效果越好 即解释变量和预报变量的线性相关性越强 三 非线性回归的问题转化为线性回归问题 1 作散点图确定曲线模型 根据收集的数据作散点图 如图 可见两个变量不呈线性相关关系 而是 分布在某一条指数函数曲线 2 1 c x yc e 的 周围 也可以认为样本点集中在某二次 曲线 2 34 yc xc 的附近 2 非线性转化为线性 这时通过对数变换把指数关系 2 1 c x yc e 变为线性关系 21 lnzc xc 通过换元把二次函数 2 34 yc xc 关系变换为 线性关系 34 yc tc 在这两种情况下就可以利用线性回归模型 建立y和 x之间的非线性回归方程了 3 比较两种模型的拟合效果 对于给定的样本点 1122 nn x yxyxyA A A 可以通过转换后的对应数表作散点图来确定线性回归的拟合情况 判断选 用哪一种
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025深圳市民办学校教师聘用合同书范本
- 2025江苏南通市川姜镇招聘人力资源和社会保障基层公共服务平台工作人员4人模拟试卷及答案详解(全优)
- 2025年甘肃省张掖市(甘州区)博物馆讲解员招聘考前自测高频考点模拟试题及答案详解(夺冠系列)
- 2025个人二手车买卖合同模板
- 2025贵州省文化和旅游厅所属事业单位第十三届人博会引进人才3人模拟试卷及答案详解(有一套)
- 2025年甘肃交通职业技术学院考核招聘急需紧缺专业人才模拟试卷附答案详解(完整版)
- 2025年甘肃财贸职业学院考核招聘博士研究生模拟试卷及答案详解一套
- 2025河南民航发展投资集团有限公司招聘28人考前自测高频考点模拟试题有完整答案详解
- 2025广西大岭乡储备村“两委”后备人才80人模拟试卷及答案详解(历年真题)
- 2025年枣庄市妇幼保健院公开招聘备案制工作人员(23人)考前自测高频考点模拟试题及答案详解(网校专用)
- 电子元器件的焊接知识大全
- 专业技术人员年度考核情况登记表
- (2024年)羊水栓塞完整版pptx
- GB/T 33285.2-2024皮革和毛皮烷基酚及烷基酚聚氧乙烯醚的测定第2部分:间接法
- 非法侵入住宅谅解书范本
- (高清版)TDT 1071-2022 园地分等定级规程
- 救助管理机构护送服务规范
- 薪酬管理体系建设中的公务员薪酬和绩效奖金
- 胸部保养知识讲座
- 【浙江湖州移动公司行政管理调查报告3100字】
- 中耳炎的护理查房
评论
0/150
提交评论