




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精§1回归分析学习目标重点难点1.会用最小二乘法求线性回归直线方程.2.会求相关系数,并用其判断相关程度.3.会进行可线性化的回归分析,拟合函数.并根据拟合程度调整函数关系。重点:利用所给数据求线性回归直线方程.难点:函数模型的选取和确立以及函数的拟合.1.回归分析(1)函数关系是一种确定性的关系,而相关关系是一种非确定性关系.回归分析是对具有相关关系的两个变量进行统计分析的常用方法.(2)线性回归直线方程y=a+bx中,b=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n,)(xi-\x\to(x))2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)2i-n\x\to(x)2),a=eq\x\to(y)-beq\x\to(x)。预习交流1线性回归直线方程y=a+bx与一次函数y=a+kx有何区别?提示:一次函数y=a+kx是y与x的确定关系,给x一个值,y有唯一确定的值与之对应,而线性回归直线方程是y与x的相关关系的近似反映,两个数据x,y组成的点(x,y)可能适合线性回归直线方程,也可能不适合.2.相关系数假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数r的计算公式为:r=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n,)(xi-\x\to(x))2·\i\su(i=1,n,)(yi-\x\to(y))2))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\r(\i\su(i=1,n,x)2i-n\x\to(x)2)\r(\i\su(i=1,n,y)2i-n\x\to(y)2)).变量之间相关系数r的取值范围为[-1,1],|r|值越大,误差Q越小,变量之间的线性相关程度越高,|r|值越接近于0,Q越大,变量之间的线性相关程度越低.当r>0时,b>0,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量正相关;当r<0时,b<0,一个变量增加,另一个变量有减少的趋势,称两个变量负相关;当r=0时,称两个变量线性不相关.预习交流2如何由样本的相关系数r=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n,)(xi-\x\to(x))2·\i\su(i=1,n,)(yi-\x\to(y))2))判定两变量的相关性?提示:当r>0时,表明两个变量正相关,当r<0时,表示两个变量负相关,r的绝对值越接近于1,表明两个变量线性相关性越强;r的绝对值越接近于0,表明两变量之间几乎不存在线性相关关系,通常当|r|>0。75时,认为两个变量有很强的线性相关关系.3.可线性化的回归分析通过变换先将非线性函数转化成线性函数,利用最小二乘法得到线性回归方程,再通过相应变换得到非线性回归方程.预习交流3如何将函数y=aebx转化为线性函数?提示:先对y=aebx两边取对数得lny=lna+bx.若记u=lny,c=lnA.则u=c+bx,就把函数y=aebx转化成了线性函数u=c+bx.一、线性回归方程的求法某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:汞含量x246810消光系数y64138205285360(1)作散点图;(2)如果y与x之间具有线性相关关系,求线性回归方程.思路分析:求线性回归方程必须先对两个变量进行相关性判断,若两个变量存在较大的相关性,则可利用公式求线性回归方程的系数;若两个变量不具备相关关系,则求线性回归方程将变得毫无意义.解:(1)散点图如图.(2)由散点图可知,y与x呈相关关系,设线性回归方程为:y=bx+A.经计算,得eq\x\to(x)=6,eq\x\to(y)=210。4,eq\o(∑,\s\up6(5),\s\do4(i=1))xeq\o\al(2,i)=220,eq\o(∑,\s\up6(5),\s\do4(i=1))xiyi=7790.∴b=eq\f(7790-5×6×210。4,220-5×62)=36。95,a=210。4-36.95×6=-11。3。∴线性回归方程为:y=36。95x-11.3.已知两个变量x和y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都是t,则下列说法正确的是().A.l1与l2一定有公共点(s,t) B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行 D.l1与l2必定重合答案:A解析:由于回归直线y=bx+a恒过(eq\x\to(x),eq\x\to(y))点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).作出散点图可直观地判断两个变量的相关关系.线性回归直线方程y=bx+a一定过样本中心(eq\x\to(x),eq\x\to(y)).二、相关系数及相关性检验现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试中的数学成绩(y),数据如下表:学生号12345678910x12010811710410311010410599108y84648468696869465771试问:这10名学生的两次数学考试成绩是否具有显著性线性相关关系?思路分析:先利用相关系数计算公式r=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\r((\i\su(i=1,n,x)2i-n\x\to(x)2)(\i\su(i=1,n,y)2i-n\x\to(y)2)))计算出r,当|r|越接近于1时,两个变量越具有很强的线性关系.解:由题意得:eq\x\to(x)=eq\f(1,10)(120+108+…+99+108)=107.8,eq\x\to(y)=eq\f(1,10)(84+64+…+57+71)=68,eq\i\su(i=1,10,x)2i=1202+1082+…+992+1082=116584,eq\i\su(i=1,10,y)2i=842+642+…+572+712=47384,eq\i\su(i=1,n,x)iyi=120×84+108×64+…+108×71=73796,∴r=eq\f(73796-10×107。8×68,\r((116584-10×107。82)·(47384-10×682)))≈0。7506。∵0。7506接近于1,∴两次数学考试成绩有显著性线性相关关系.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短.必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x(0。01%)104180190177147134150191204121y/min100200210185155135170205235125(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求线性回归方程.(3)预测当钢水含碳量为160个0。01%时,应冶炼多少分钟?解:(1)列出下表,并用科学计算器进行计算:i12345678910xi104180190177147134150191204121yi100200210185155135170205235125xiyi10400360003990032745227851809025500391554794015125eq\x\to(x)=159。8,eq\x\to(y)=172,eq\o(∑,\s\up6(10),\s\do4(i=1))xeq\o\al(2,)i=265448,eq\o(∑,\s\up6(10),\s\do4(i=1))yeq\o\al(2,)i=312350,eq\o(∑,\s\up6(10),\s\do4(i=1))xiyi=287640于是r=eq\f(\o(∑,\s\up6(10),\s\do4(i=1))xiyi-10\x\to(x)\x\to(y),\r((\o(∑,\s\up6(10),\s\do4(i=1))x\o\al(2,i)-10\x\to(x)2)(\o(∑,\s\up6(10),\s\do4(i=1))y\o\al(2,i)-10\x\to(y)2)))≈0.9906.∵0.9906非常接近于1,∴y与x具有显著的线性相关关系.(2)设所求的线性回归方程为y=bx+a,其中a,b的值使Q=eq\o(∑,\s\up6(10),\s\do4(i=1))(yi-bxi-a)2的值最小.b=eq\f(\o(∑,\s\up6(10),\s\do4(i=1))xiyi-10\x\to(x)\x\to(y),\o(∑,\s\up6(10),\s\do4(i=1))x\o\al(2,i)-10\x\to(x)2)≈1.267,a=eq\x\to(y)-beq\x\to(x)≈-30。47,即所求的线性回归方程为y=1。267x-30。47。(3)当x=160时,y=1.267×160-30.47≈172,即大约冶炼172min.如果两个变量不具备线性相关关系或者线性相关关系不显著,即使求出线性回归方程也无意义,用于估计和测量的结果也是不可信的.1.在下列各量与量之间的关系中是相关关系的是().①正方体的体积与棱长之间的关系;②一块农田的小麦的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的收入与支出之间的关系;⑤某家庭用水量与水费之间的关系.A.②③ B.③④ C.④⑤ D.②③④答案:D解析:①⑤属于函数关系,②③④属于相关关系.2.在建立两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数r如下,其中拟合得最好的模型为().A.模型1的相关指数r为0。75 B.模型2的相关指数r为0。90C.模型3的相关指数r为0.25 D.模型4的相关指数r为0.55答案:B解析:相关指数|r|的值越大,说明模型的拟合效果越好.3.对有线性相关关系的两个变量建立的回归直线方程y=a+bx中,回归系数b().A.可以小于0 B.大于0 C.能等于0 D.答案:A解析:因为b=0时,则r=0,这时不具有线性相关关系,但b可以大于0也可以小于0。4.某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系:x24568y3040605070若y与x之间是线性相关关系,若实际销售额不低于82。5万元,则广告费支出最少是______万元.答案:10解析:由已知eq\x\to(x)=5,eq\x\to(y)=50,eq\i\su(i=1,5,x)2i=145,eq\i\su(i=1,5,y)2i=13500,eq\i\su(i=1,n,x)iyi=1380,∴b=eq\f(1380-5×5×50,145-5×25)=6。5。∴a=eq\x\to(y)-beq\x\to(x)=17.5。∴回归直线方程为y=6.5x+17.5.∴由y≥82.5,即6。5x+17。5≥82.5,解得x≥10。故广告费支出最少是10万元.5.有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化,下面是实验中记录的数据。机床运转的速度(转/秒)每小时生产二级品的数量(个)851281491611(1)作出散点图.(2)求出机床运转的速度x与每小时生产的二级品数量y的回归直线方程.(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?解:(1)散点图如下:(2)易求
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络新质生产力
- 公司经营借款合同范例
- 丰田回购合同范例
- 2025年应届生实习总结模版
- 办公室文员个人工作总结模版
- 医疗专业人士的隐形知识能力培训项目
- 东莞拆迁合同范例
- 人文关怀在医疗改革中的角色
- 医疗人文关怀在患者陪伴服务中的体现
- 一百八十多万购车合同范例
- 详解 强基计划
- 餐饮场所消防安全培训
- 乡村卫生室服务一体化管理工作制度
- 制作自然发酵酸奶的方法
- 《肖申克的救赎》中英双语剧本
- 护士长管理能力培训讲义课件
- 第六章电力系统自动低频减载装置
- 2022年黑龙江省乡村医生招聘笔试试题及答案解析
- 济南市海绵城市建设建筑与小区改造项目案例-山东省经济技术开发中心宿舍-2
- 辩护词贪污罪、受贿罪
- 术后1月 省中乳腺breast-q量表附有答案
评论
0/150
提交评论