已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 1回归分析的基本思想及其初步应用 确定性关系 非确定性关系 函数关系 相关关系 函数关系是非常明确的关系 相关关系却是一种变化的 回归分析 regressionanalysis 是相关关系的一种分析方法 它是对具有相关关系的两个变量进行统计分析一般步骤为 画散点图 求回归方程 预报 决策 这种方法称为回归分析 例1 从某大学中随机选取8名女大学生 其身高和体重数据如表所示 求 根据大学生的身高预报她的体重 的回归方程 并预报一名172cm的女大学生的体重 解 选取身高为自变量x 体重为因变量y 画散点图 画散点图 一 回归直线方程 从图可以看出 样本点的分布有比较好的线性关系 因此可以用线性回归方程来刻画它们之间的关系 0 849x 85 712 求回归方程 0 849x 85 712 预报 决策 事实上 从散点图可以看出 样本点并不是分布在这条直线上 而是分布在它的两边 所以严格来说 bx a不是真正的表示它们之间的关系 这时我们把身高和体重的关系做一下调整来模拟回归关系 y bx a e e其中a和b为模型的未知参数 e称为随机误差 如何产生的 0 849x 85 712 二 线性回归分析 身高X cm 体重y kg 饮食习惯 运动习惯 测量误差 线性回归模型y bx a e与我们了的一次函数模型不同之处在于多了一个随机误差e y的值有它们一起决定 解释变量x 预报变量y 随机误差e 随机误差e的估计值 残差 残差 一般地 对于样本点它们的随机误差为其估计值为 称为相应于点的残差 0 849x 85 712 下面表格列出了女大学生身高和体重的原始数据以及相应的残差数据 几点说明 第一个样本点和第6个样本点的残差比较大 需要确认在采集过程中是否有人为的错误 如果数据采集有错误 就予以纠正 然后再重新利用线性回归模型拟合数据 如果数据采集没有错误 则需要寻找其他的原因 另外 残差点比较均匀地落在水平的带状区域中 说明选用的模型计较合适 这样的带状区域的宽度越窄 说明模型拟合精度越高 回归方程的预报精度越高 如何发现数据中的错误 如何衡量随机模型的拟合效果 在上面的例子中我们假设体重与身高没有关系 即 体重都为 则 她们身高 体重的散点图应该在一条水平直线上 事实上 每个人的体重和45 5kg之间存在差别 把所有的这种效应利用总体偏差平方和合并成一个数 总体偏差平方和 解释变量 随机误差 我们现在要弄清楚这个总的效应中 有多少来自解释变量 有多少来自随机误差 即 哪一个效应起决定性作用 为了回归的准确和计算的方便我们引入残差平方和 residualsumofsquares 它代表随机误差的效应 求出了随机误差的效应后 我们就比较容易得到解释变量的效应了 同学们知道怎样求吗 解释变量的效应 总体偏差平方和 残差平方和 回归平方和 regressionsunofsquares 0 849x 85 712 你会计算上面的总体偏差平方和 残差平方和 回归平方和吗 354 128 361 225 639 有了这些评估效应的方法 我们就可以利用它们来刻画总体效应 事实上 为了将我们的计算简化 我们又引入相关指数R2来刻画回归的效果 残差平方和 总体偏差平方和 显然 当R2的值越大 说明残差所占的比例越小 回归效果约好 反之 回归效果越差 一般的 当R2越接近于1 说明解释变量和预报变量之间的相关性越强 如果同一个问题 采用不同的回归方法分析 我们可以通过选择R2大的来作为回归模型 你会计算上面的总体偏差平方和 残差平方和 回归平方和吗 354 128 361 225 639 研究两变量是否相关的方法 1 利用散点图观察两个变量是否线性相关 2 利用残差来刻画回归的效果 残差分析 利用残差图来分析数据 对可疑数据 残差较大的数据 进行重新调查 有错误就更正 然后重新利用回归模型拟合 如果没有错误 则需要找其他原因 如果同一个问题 采用不同的回归方法分析 我们可以通过选择R2大的来作为回归模型 3 利用相关指数R2来刻画回归的效果 建立回归方程的一般步骤 1 确定变量 2 制作散点图 观察是否相关 3 确定回归方程的类型 线性回归 指数回归 对数回归等 4 利用公式确定回归参数 5 利用残差分析回归是否合理或模型是否合适 例2一只红蛉虫的产卵数y与温度x有关 现收集了7组数据 请建立y与x建德回归方程 解 1 制作散点图 2 观察模拟 样本点不能直接利用线性回归 根据我们的函数知识 它应该是一个指数模型 y c1ec2x其中c1c2为参数或二次函数模型 根据对数回归知识我们知道 令z lny将其变换到样本点的分布直线z a bx z 0272x 3 843 会求着条直线吗 则 y e0 272x 3 843 2 我们认为样本点集中在某二次函数y c3x2 c4附近 c3c4为参数 则 令t x2则 y c5t c6其中c5c6为参数 y 0 367t 202 54 不适合
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东广州城建职业学院清远校区项目经理、现场建设工程师招聘5人模拟试卷附答案解析
- 2025年度专利审查协作天津中心博士后科研工作站分站博士后研究人员招聘1人备考题库附答案解析
- 2026年质量员之土建质量专业管理实务考试题库200道附答案【基础题】
- 2025中山市科学技术协会所属事业单位招聘事业单位人员1人笔试模拟试卷附答案解析
- 2025四川省第十二地质大队下半年考核招聘工作人员6人模拟试卷带答案解析
- 2026四川广元市第一人民医院非在编工作人员自主招聘28人(第一批)备考题库带答案解析
- 2026年度水利部黄河水利委员会事业单位招聘高校毕业生265名备考题库带答案解析
- 2026陕西省面向北京师范大学招录选调生笔试备考试卷带答案解析
- 2025四川省第五地质大队下半年考核招聘工作人员16人参考题库带答案解析
- 2025年河北承德市工会系统招聘社会工作岗位人员17名笔试模拟试卷带答案解析
- 抖音企业号操作文档最新版
- YC/T 145.2-2012烟用香精相对密度的测定
- RB/T 120-2015能源管理体系食品企业认证要求
- GB/T 5709-1997纺织品非织造布术语
- GB/T 16823.3-2010紧固件扭矩-夹紧力试验
- 1-《祖国祖国我们爱你》课件音乐
- 量子信息与量子计算课件
- 小学道德与法治一年级集体备课记录表(一年级)
- 外伤性脑梗死临床分析
- 原材料检验不合格评估报告
- 分子生物学第八章真核基因表达调控课件
评论
0/150
提交评论