




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2019/6/13,郑平正 制作,3.1回归分析的基本思想及其初步应用(一),高二数学 选修2-3,2019/6/13,郑平正 制作,复习 一 变量之间的关系 1 确定性的函数关系 2 不确定性的相关关系: 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系,相关关系是一种非确定的关系,2019/6/13,郑平正 制作,.,年龄,脂肪,23,9.5,27,17.8,39,21.2,41,25.9,45,49,27.5,26.3,50,28.2,53,29.6,54,30.2,56,31.4,57,30.8,年龄,脂肪,58,33.5,60,35.2,61,34.6,如上的一组数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗?,二 线性回归分析的步骤 :,2019/6/13,郑平正 制作,下面我们以年龄为横轴, 脂肪含量为纵轴建立直 角坐标系,作出各个点, 称该图为散点图。,如图:,O,20,25,30,35,40,45,50,55,60,65,年龄,脂肪含量,5,10,15,20,25,30,35,40,1 画散点图,将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量 的一组数据的图形,这样的图像叫散点图,2019/6/13,郑平正 制作,从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成正相关。 但有的两个变量的相关,如下图所示:,如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越 少。 作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗1升汽油所行使的 平均路程,称它们成负相关.,注:可考虑让学生思考书P77的思考.,O,(1)正相关,负相关,2019/6/13,郑平正 制作,我们再观察它的图像发现这些点大致分布在一条直线附 近,像这样,如果散点图中点的分布从整体上看大致在 一条直线附近,我们就称这两个变量之间具有线性相 关关系,这条直线叫做回归直线,该直线叫回归方程。,那么,我们该怎样来求出这个回归方程? 请同学们展开讨论,能得出哪些具体的方案?,20,25,30,35,40,45,50,55,60,65,年龄,脂肪含量,0,5,10,15,20,25,30,35,40,(2) 线性相关,2019/6/13,郑平正 制作,我们上面给出的几种方案可靠性都不是很强, 人们经过长期的实践与研究,已经找到了 计算回归方程的斜率与截距的一般公式:,以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。(参看如书P80),2 回归方程的求解,线性回归分析的步骤 :,1、画散点图,4、用回归直线方程进行预报,3、求回归直线方程,2、求,最小二乘估计公式 :,称为样本点的中心。,三 描述两个变量之间线性相关关系的强弱的相关系数,r,课前检测: 假设关于某设备的使用年限x和所支出的维修费用 y(万元),有如下的统计资料。,若由资料知,y对x呈线性相关关系。试求: (1)线性回归方程 的回归系数 ; ()估计使用年限为10年时,维修费用是多少?,使用年限为10年时,维修费用是:12.38万元,2008年5月,中共中央国务院关于加强青少年体育、增强青少年体质的意见指出城市超重和肥胖青少年的比例明显增加.“身高标准体重”该指标对于学生形成正确的身体形态观具有非常直观的教育作用. “身高标准体重”从何而来?我们怎样去研究?,创设情境:,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,求根据女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。,问题呈现:女大学生的身高与体重,解; 1.由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y,3.回归方程:,2. 散点图;,4.本例中, r=0.7980.75这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的。,探究: 身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?,答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg。,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,女大学生的身高与体重,我们可以用下面的线性回归模型来表示: y=bx+a+e, (3) 其中a和b为模型的未知参数,e称为随机误差。,在线性回归模型(4)中,随机误差e的方差 越小,通过回归直线 (5)预报真实值y的精度越高。,随机误差是引起预报值 与真实值y之间的误差的原因之一,其大小取决于随机误差的方差。,另一方面,由于公式(1)和(2)中 和 为截距和斜率的估计值,它们与真实值a和b之间也存在误差,这种误差是引起预报值与真实值y之间误差的另一个原因。,假设 1:身高和随机误差的不同不会对体重产生任何影响,,怎样研究随机误差?,假设2:随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图 中所有的点将完全落在回归直线上。,怎样研究随机误差?,例如,编号为6的女大学生,计算随机误差的效应(残差)为:,如何衡量预报的精度?,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。,如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。,学以致用:,1、 在对两个变量,进行线性回归分析时有下列步骤: 对所求出的回归方程作出解释,收集数据( , ) 求线性回归方程,求相关系数,根据所搜集的数据绘制散点图如果根据可靠性要求能够作出变量,具有线性相关结论,则在下列操作顺序中正确的是 ( ) ,学以致用:,2、对于相关指数 ,下列说法正确的是( ),、 的取植越小,模型拟合效果越好 、 的取值可以是任意大,且 取值越大拟合效果越好 、 的取值越接近,模型拟合效果越好 、以上答案都不对,学以致用:,3、甲、乙、丙,丁四位同学各自对,两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:,则哪位同学的实验结果体现,两变量有更强的线性相关性 甲
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商超快消品合同范本5篇
- 2025企业短期用工聘用合同
- 第一课 电脑动画制作初探说课稿-2025-2026学年初中信息技术冀教版八年级全一册-冀教版
- 第六课 珍惜婚姻关系说课稿-2025-2026学年高中政治统编版2019选择性必修2法律与生活-统编版2019
- 2025电商平台产品代理合同合同协议书范本
- 2025年共同投资合作合同范本
- 精液的稀释说课稿-2025-2026学年中职专业课-畜禽繁殖与改良-畜牧类-农林牧渔大类
- 2025南京市房屋租赁合同范本
- 5. 分组实验测透镜的焦距说课稿-2025-2026学年高中物理教科版选修2-3-教科版2004
- 施工质量监督管理的实施说课稿-2025-2026学年中职专业课-建筑施工组织与管理-建筑类-土木建筑大类
- 危重患者皮肤管理课件
- 2025年国防教育知识竞赛试题(附答案)
- 工伤受伤经过简述如何写
- 银行现金取款申请书
- 人事外包招聘代理合同
- 数字经济学-课件 第3章 数字技术
- AI引领时尚设计新潮-个性化需求的新一代解决方案
- 高二数学直线倾斜角与斜率同步练习题
- 2024-2030年全球及中国热障涂层(TBC)行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 大轻质泡沫混凝土研究报告
- 室内装修工程质量保障措施方案
评论
0/150
提交评论