版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
4.3.1课时1相关关系与回归直线方程1.结合实例,了解两个变量之间的相关关系的含义,知道线性相关关系及正相关、负相关、散点图等概念.2.结合具体实例,了解一元线性回归模型的概念及最小二乘法原理,掌握回归直线方程的求法.3.结合直线方程的性质,了解回归直线方程的性质及了解模型参数的统计意义,会用回归模型对实际问题进行预测.一、相关关系
自行选择标准,将下列变量之间的关系分为两类,并分别阐述每一类中变量关系的特点:(1)圆的面积S与半径r之间的关系;(2)16岁学生的体重
与身高h之间的关系;(3)商品销售量Q与销售价格P之间的关系;(4)匀速运动的物体,其运动的路程S与时间t之间的关系;(5)平均学习时间t与学习成绩f之间的关系;(6)科技创新能力y与人才培养近亲繁殖率x之间的关系.
思考S=πr2S=vt我们研究的很多问题中,两个变量之间经常存在着相互影响、相互依赖的关系.这些关系常见的有两类,一类是变量之间的关系具有确定性,当一个变量确定后,另一个变量就确定了.(1)圆的面积S与半径r之间的关系;(4)匀速运动的物体,其运动的路程S与时间t之间的关系;S=πr2S=vt1.变量之间具有确定性:如(1)(4)是明确的函数关系.(2)16岁学生的体重
与身高h之间的关系;(3)商品销售量Q与销售价格P之间的关系;(5)平均学习时间t与学习成绩f之间的关系;(6)科技创新能力y与人才培养近亲繁殖率x之间的关系.
另一类是变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性2.变量之间有一定关系,但不能互相确定商品的销售价格P越低,买这种商品的人可能会越多,从而会导致销售量Q增长,但同样的销售价格可能会有不同的销售量;例如,一般情况下,已知一名16岁学生的身高h,不能确定其体重w,但身高越高的人体重可能越重,不过同样身高的人体重往往存在差异;平均学习时间t越长,学习成绩f可能越好,但学习时间相同不能确保学习成绩相同;人才培养近亲繁殖率x越大,科技创新能力y可能越弱,但繁殖率确定时,创新能力并不是确定的;这些两个变量之间的关系,统计学上都称为相关关系.怎样从统计数据中确定与描述两个变量之间的相关关系呢?下面我们借助一个实例来进行说明.已知某班级学生数学成绩与物理成绩的对应表如下:从上表中,想直接观察出数学成绩与物理成绩之间是否存在相关关系等,是有一定困难的.数学88827989927879568366617468777880物理87916686887991539377626962587968数学51589873758469767143748270756563物理50658279599859877642759146688355为此,我们可以对数据进行整理,比如在保持成绩配对的方式不变的前提下,将数据按照数学成绩从小到大的顺序排列,如下表所示.从表中可以看出,当数学成绩增加时,物理成绩大致也是增加的.数学43515658616365666869707173747475物理42505365665583776259467679697559数学75767778787979808282838488899298物理68875879796691689191939887868882我们还可以根据给定数据作出图像来进行直观判断这样作出来的图称为散点图,从散点图上也可得出数学成绩增加时物理成绩大致也增加的结论.
例如,以数学成绩为横坐标,物理成绩为纵坐标,则可以在平面直角坐标系中将每一对数据都表示出来,如右图所示,在右图中可以作出直线,使得该班级学生数学成绩与物理成绩构成的点分布在直线上或直线的两侧,且都在直线附近,这就提示我们,数学成绩与物理成绩之间是有相关关系的,而且在容许一定误差的前提下,可以用一次函数来描述它们之间的关系.一般地,如果收集到了变量
和变量
的对数据(简称为成对数据),如下表所示.此时,如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.则在平面直角坐标系
中描出点
,
,就可以得到这
对数据的散点图,如果由变量的成对数据、散点图或直观经验可知,
变量与变量
之间的关系可以近似地用一次函数来刻画,则称
与
线性相关,序号123变量变量为此,我们可以对数据进行整理,比如在保持成绩配对的方式不变的前提下,将数据按照数学成绩从小到大的顺序排列,如下表所示.前面所提到的班级学生的数学成绩与物理成绩是线性相关的,而且是
相关.正数学43515658616365666869707173747475物理42505365665583776259467679697559数学75767778787979808282838488899298物理68875879796691689191939887868882这些变量之间的关系看成线性相关,则16岁学生的体重
与身高h、平均学习时间t与学习成绩f
都是
相关的,而商品销售量Q与销售价格P、科技创新能力y与人才培养近亲繁殖率x都是
相关的.
自行选择标准,将下列变量之间的关系分为两类,并分别阐述每一类中变量关系的特点:(1)圆的面积S与半径r之间的关系;(2)16岁学生的体重
与身高h之间的关系;(3)商品销售量Q与销售价格P之间的关系;(4)匀速运动的物体,其运动的路程S与时间t之间的关系;(5)平均学习时间t与学习成绩f之间的关系;(6)科技创新能力y与人才培养近亲繁殖率x之间的关系.
正负思考
正相关、负相关在日常生活中也经常使用.例如,“反腐败、转作风,事关民心所向,事关党的生死存亡,历史和实践表明,反腐的力度与民心的聚合度正相关”,这就说明,反腐的力度越大,民心的聚合度就越有可能更强;“网络谣言的危害性与公众判断能力负相关”已经成为一项共识,这就意味着,公众媒介素养越高,网络谣言的危害性越有可能更小.(1)作出这些成对数据的散点图,直观地判断污染指数y与x是否线性相关.如果是,进一步判断是正相关还是负相关.二、回归直线方程可作出散点图如右图所示,第x
年1234567污染指数
y
6.15.24.54.73.83.43.1可以看出,y与x之间的关系可近似地用一次函数表示,而且随着时间x的增加,污染指数y大致是减少的,因此y与x线性相关,而且是负相关的.某地区从某一年开始进行了环境污染整治,得到了如下数据:思考(2)在知道y与x线性相关的前提下,你能找出近似描述y与x之间关系的一次函数表达式吗?根据所得到的关系式,你能估计出该地区第8年的污染指数吗?某地区从某一年开始进行了环境污染整治,得到了如下数据:第x
年1234567污染指数
y
6.15.24.54.73.83.43.1为了找出近似描述y与x之间关系的一次函数表达式,我们可先在右图中作出一条直线,使得成对数据构成的点分布在直线的附近,思考(2)在知道y与x线性相关的前提下,你能找出近似描述y与x之间关系的一次函数表达式吗?根据所得到的关系式,你能估计出该地区第8年的污染指数吗?例如,通过点(1,6)和(7,3)的直线就满足条件,如右图所示,根据已知的两点就可以得出所要的函数关系式更进一步,代入x=8,就能得到第8年污染指数的估计值y=2.5.现在这一条是不是“最好”的直线呢?用什么样的标准来衡量好还是不好呢?当然,类似的直线我们可以找出很多条(从而也可以得到很多个一次函数关系式).这也可以用右图来表示,图中橙色的点就是预测值对应的点,误差的绝对值就是蓝色的点与相应的橙色的点之间的距离.注意到函数表达式y=-0.5x+6.5确定之后,我们不仅可以算出x=8的值,而且还可以算出x=1,2,3,…,7的值,也可以得到已知数据的实际值(也称为观测值)与预测值之间的误差(一般称为残差),如下表所示.第x年1234567污染指数y6.15.24.54.73.83.43.1预测值65.554.543.53误差0.1-0.3-0.50.2-0.2-0.10.1统计学意义上“最好”的直线,指的是所有误差平方和最小的直线,可以证明,对于上述污染指数与时间的数据,误差平方和最小的直线为这称为y关于x的回归直线方程,其中
读作“y估”,表示y的估计值.这个方程,可以得到第8年的污染指数估计值为-0.475×8+6.3=2.5.一般地,已知变量x与y的n对成对数据(xi,yi),i=1,2,3,…,n.任意给定一个一次函数y=bx+a,对每一个已知的xi
,由直线方程可以得到一个估计值如果一次函数
能使残差平方和即取得最小值,则称为y关于x的回归直线方程(对应的直线称为回归直线).因为是使得平方和最小,所以其中涉及的方法称为最小二乘法.可以证明,给定两个变量y与x的一组数据之后,回归直线方程总是存在的,而且其中,
称为回归系数,它实际上也就是回归直线方程的斜率,回归直线方程确定之后,就可用于预测.需要注意的是,上述公式中,
指的是的平均数,即类似地,是的平均数,即另外,由计算公式可以看出,回归系数
的计算并不容易,实际计算过程中,我们可以通过列表的方法逐步进行计算.(2)在知道y与x线性相关的前提下,你能找出近似描述y与x之间关系的一次函数表达式吗?某地区从某一年开始进行了环境污染整治,得到了如下数据:第x
年1234567污染指数
y
6.15.24.54.73.83.43.1可以首先算得接着列表如下.思考从而可知因此所以y关于x的回归直线方程为三、回归直线方程的性质这说明回归直线一定过点一次函数
的单调性当然是由
的符号决定的,函数递增的充要条件是>0,这说明:
y与x正相关的充要条件是>0;
y与x负相关的充要条件是<0.将代入
后,整理可得例1:如果某位同学10次考试的物理成绩y与数学成绩x如下表所示.已知y与x线性相关:(1)判断是正相关还是负相关;根据数据做出散点图,如右图所示.图上可以直观地看出,y与x正相关.将每个x的值都减去80可得-4,2,-8,7,13,-2,9,-14,1,-4,首先计算与.这些数的平均数为0,因此将每个y的值都减去80可得0,7,-5,6,20,-1,13,-12,5,-3这些数的平均数为3,因此例1:如果某位同学10次考试的物理成绩y与数学成绩x如下表所示.已知y与x线性相关:(2)求出y关于x的回归直线方程;通过列表计算可得例1:如果某位同学10次考试的物理成绩y与数学成绩x如下表所示.已知y与x线性相关:(2)求出y关于x的回归直线方程;因此回归直线方程为C1.某制衣品牌为使成衣尺寸更精准,选择了10名志愿者,对其身高(单位:cm
)和臂展(单位:cm
)进行了测量,这10名志愿者身高和臂展的折线图如图所示.已知这10名志愿者身高的平均值为176cm,根据这10名志愿者的数据求得臂展u关于身高v的线性回归方程
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高职第二学年(纺织工程技术)纺织品质量控制综合测试试题及答案
- 2025年高职设施农业与装备(大棚种植技术)试题及答案
- 2025年中职第二学年(物流服务与管理)物流园区运营试题及答案
- 2025年高职(水利水电建筑工程)水电站建设综合测试题及答案
- 2025年高职(软件技术)Web后端开发基础阶段测试题及答案
- 2025年高职第二学年(现代殡葬技术与管理)殡葬设备维护试题及答案
- 2025年中职人工智能技术应用(机器学习入门)试题及答案
- 2025年大学(会计学)审计学进阶阶段测试题及评分标准
- 2025年大学本科二年级(家政学)家庭理财基础测试题及答案
- 2025年中职第二学年(生态环境保护)生态环境调查实操测试卷
- 弘扬工匠精神培训课件
- 辽宁省大连市滨城高中联盟2026届高三上学期12月期中Ⅱ考试 数学
- 2026年住院医师规培(超声医学科)试题及答案
- 2025年中职酒店管理(酒店管理基础)试题及答案
- 北京广播电视台招聘笔试题库2026
- 2025江西省中赣投勘察设计有限公司招聘6人笔试重点试题及答案解析
- VESDA课件教学课件
- TCCSAS 060-2025 涉氢建筑物及容器泄爆设计方法
- 雨课堂学堂在线学堂云《工程伦理( 北林)》单元测试考核答案
- 2025年西藏自治区公务员面试结构化真题汇编试卷(含答案)
- 2025及未来5年轴功率监测器项目投资价值分析报告
评论
0/150
提交评论