版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人教A版选择性必修第三册8.2一元线性回归模型及其应用第八章
成对数据的统计分析1.样本相关系数:2.相关系数的性质:①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.②|r|≤1;③当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.知识回顾1.了解一元线性回归模型及随机误差、残差、决定系数R2的概念;2.了解最小二乘法的思想方法,会求经验回归方程,并用回归方程进行预报;3.会用残差分析判断线性回归模型的拟合效果.学习目标自学指导阅读课本105--112页,完成以下问题:问题1一元线性回归模型及经验回归方程。问题2线性回归分析。生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如下表所示.编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关.r≈0.886思考1根据数据,父子的身高之间的关系可以用函数模型刻画吗?若用x表示父亲身高,Y表示儿子身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为教师点拨一元线性回归模型我们称(1)式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.模型中的Y也是随机变量.如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.思考2结合具体实例解释产生模型(1)中随机误差项的原因吗?在研究儿子身高与父亲身高的关系时,产生随机误差e的原因有:(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等;(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差;(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似也是产生随机误差e的原因.在一元线性回归模型y=bx+a+e中,随机误差e产生的原因有:1.所用的确定性函数不恰当引起的误差;2.忽略了某些因素的影响;3.存在观测误差.教师点拨练习若某地财政收入x与支出y满足一元线性回归模型y=bx+a+e(单元:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过多少?解:因为财政收入x与支出y满足一元线性回归模型y=bx+a+e,其中b=0.7,a=3,所以得到
y=0.7x+3+e,当x=10时,得y=0.7×10+3+e=10+e,而|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出预计不会超过10.5亿元.小组互助2.在一元线性回归模型(1)中,参数b的含义是什么?解:参数b的含义:解释变量x对响应变量Y的均值的影响,变量x每增加1个单位,响应变量Y的均值将增加b个单位.探究利用散点图找出一条直线,使各散点在整体上与此直线尽可能接近.我们将
称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,利用公式(2)求得的
叫做b,a的最小二乘估计.这里的“二乘”是平方的意思.教师点拨经验回归方程编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182小组互助练习
(1)在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y关于x的经验回归方程为(
)A8.95商店名称ABCDE销售额x/千万元35679利润额y/百万元23345例1
某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:(1)画出销售额和利润额的散点图;(2)计算利润额y对销售额x的经验回归直线方程.小组互助∴所求经验回归方程为解法1:(2)商店名称ABCDE销售额x/千万元35679利润额y/百万元23345∴所求经验回归方程为解法2:(2)商店名称ABCDE销售额x/千万元35679利润额y/百万元23345小组互助变式1
随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大,某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如下表:x3035404550y18141085(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?并指出y与x是正相关还是负相关.(2)①求出y关于x的经验回归方程;②若该通信公司在一个类似于试点的城市中将这款流量包的价格定为25元/月,请用所求的经验回归方程预测该市一个月内购买该流量包的人数能否超过20万人.∴估计女儿的身高为168cm左右.2.假如女儿身高y(单位:cm)关于父亲身高x(单位:cm)的经验回归方程为
已知父亲身高为175cm,请估计女儿的身高.x123456y021334例2
已知x与y之间的几组数据如下表:则y对x的经验回归直线必过点__________.小组互助父亲身高x/cm174176176176178儿子身高y/cm175175176177177C变式2为了解儿子身高与其父亲身高的关系,随机抽取5对身高数据如下:则y对x的经验回归直线方程为().小组互助求经验回归方程的步骤:小组互助思考
已知儿子身高关于父亲身高x的经验回归方程为
如果一位父亲的身高为176cm,他儿子长大成人后的身高一定是177cm吗?为什么?经验回归方程
其斜率可以解释为父亲身高每增加1cm,其儿子身高平均增加0.839cm.对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的)称为预测值,观测值减去预测值称为残差.父亲身高为172cm,其儿子身高的观测值为y6=176(cm),预测值为残差为176-173.265=2.735(cm).编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182教师点拨残差分析编号父亲身高/cm儿子身高观测值/cm儿子身高预测值/cm残差/cm1174176174.9431.0572170176171.5874.4133173170174.104-4.1044169170170.748-0.7485182185181.6553.3456172176173.2652.7357180178179.977-1.9778172174173.2650.7359168170169.9090.09110166168168.231-0.23111182178181.655-3.65512173172174.104-2.1041316416566.553-1.55314180182179.9772.023残差表:残差图:012345-1-2-3-4-5160165170175180185残差/cm父亲身高/cm••••••••••••••
一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.残差比较均匀地分布在横轴的两边.说明残差比较符合一元线性回归模型的假定,是均值为0、方差为σ2的随机变量的观测值.可见,通过观察残差图可以直观判断模型是否满足一元线性回归模型的假设.思考观察下列四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?通过观察发现,图(4)的残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内.所以在四幅残差图中,只有图(4)满足一元线性回归模型对随机误差的假设.问题人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程.编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.95(3)成对样本数据呈现出明显的非线性相关的特征.修改模型:散点更趋向于落在中间下凸且递减的某条曲线附近.非线性经验回归函数,其中c1,c2是待定参数.(5)通过残差来比较这两个经验回归方程对数据刻画的好坏.R2越大,表示残差平方和越小,即模型的拟合效果越好;
R2越小,表示残差平方和越大,即模型的拟合效果越差.教师点拨决定系数R2R2越接近1,则线性回归刻画的效果越好.回归平方和总偏差平方和0≤R2≤1在一元线性回归模型中R2=r2.小组互助练习
在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的决定系数R2如下,其中拟合效果最好的模型是(
)A.模型1 B.模型2 C.模型3 D.模型4模型模型1模型2模型3模型4R20.980.800.500.25A例3
已知某种商品的单价x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753求y关于x的经验回归方程,并说明回归模型拟合效果的好坏.小组互助列残差表如下:129.77.45.12.800.3-0.4-0.10.24.62.6-0.4-2.4-4.4故回归模型的拟合效果很好.x1416182022y1210753小组互助变式3
关于x与y有如下数据:有如下的两个线性模型,试比较哪一个拟合效果更好.x24568y3040605070在使用经验回归
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 足浴城顾客服务协议2026版
- 2026年科学健身与运动损伤预防讲座安排
- 投资者关系风险管理合同2026
- 2026年健康管理与体重管理结合
- 2026年少数民族医药院内制剂开发与管理
- 2026年运输企业安全奖惩制度与实施细则
- 线上乒乓球培训课程合作协议
- 供应链流程优化与供应链金融协议
- 2026年物业保安门岗管理规范与操作细则
- 肝细胞癌根治性切除术后肝内复发:多维度解析与防控策略
- 2026年度青岛市市属事业单位公开遴选工作人员(51人)考试备考试题及答案解析
- 2025年船舶电机推进系统故障诊断技术
- 2026年湖北名校联盟高三联考英语试题(含答案解析)
- 新疆乌鲁木齐市2026届九年级中考模拟冲刺(一)数学试卷(含答案)
- 2026北京市地质矿产勘查院所属事业单位招聘36人备考题库及答案详解1套
- 20KV及以下配电网工程预算定额(及定额解释)
- 基于市场法的非上市银行股权评估全解
- 喷涂厂厂管理制度
- 网络安全设备巡检报告
- 汉密顿焦虑量表【范本模板】
- 2023湖南高考历史真题
评论
0/150
提交评论