版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
4.3.1.2相关系数与非线性回归第四章1.结合具体实例,了解样本相关系数的统计含义.2.了解非线性回归的概念,会将非线性相关关系转化为线性相关关系.通过散点图可以判断两个变量之间有无相关关系,但散点图不能准确反映变量之间的关系强度.因此,需要引入一个统计量――相关系数.一般地,对n个成对观测数据(x1,y1),(x2,y2),…,(xn,yn),我们用{xi}表示数据x1,
x2,…,
xn;
{yi}表示数据y1,
y2,…,
yn.用
分别表示{xi}与{yi}的均值.用
分别表示{xi}与{yi}的标准差.记则当sxsy≠0时,我们称
为变量x与变量y的相关系数.注意,相关系数也可以这样计算:下图分别是{xi}和{yi}之间正相关和负相关的例子,其中样本量都是50.相关系数rxy=0.4相关系数rxy=0.8相关系数rxy=0.95相关系数rxy=-0.4相关系数rxy=-0.8相关系数rxy=-0.95相关系数具有以下性质:(3)|r|=1的充要条件是成对数据构成的点都在回归直线上.(1)y与x正相关的充要条件是r>0,y与x负相关的充要条件是r<0.(2)|r|≤1当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱.统计经验告诉我们,当rxy>0.8时,y有随着x的增加而增加的趋势,这时我们认为{xi}和{yi}是高度正相关的;当rxy<-0.8时,y有随着x的增加而减少的趋势,这时我们称{xi}和{yi}是高度负相关的.例1互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关性强弱进行判断.(若|r|>0.8,则可认为y与x有较强的线性相关关系)日期1日2日3日4日5日外卖甲日接单:x(百单)529811外卖乙日接单:y(百单)2310515解:问题:人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程.以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图.编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.95在左图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份,利用一元线性回归模型来刻画世界纪录和世界纪录产生年份之间的关系.根据最小二乘法,由表中的数据得到经验回归方程为:将经验回归直线叠加到散点图,得到下图:①追问1:从图中可以看到,经验回归方程①较好地刻画了散点的变化趋势.请再仔细观察图形,你能看出其中存在的问题吗?追问1:从图中可以看到,经验回归方程①较好地刻画了散点的变化趋势.请再仔细观察图形,你能看出其中存在的问题吗?以经验回归直线为参照,可以发现经验回归方程的不足之处,以及散点的更为精细的分布特征,例如,第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方.这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.仔细观察上图,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近。追问2:你能对模型进行修改,以使其更好地反映散点的分布特征吗?回顾已有的函数知识,可以发现函数y=-lnx的图象具有类似的形状特征.注意到100m短跑的第一个世界纪录产生于1896年,因此可以认为散点是集中在曲线y=f(t)=c1+c2ln(t-1895)的周围,其中c1、c2为未知参数,且c2<0.y=f(t)=c1+c2ln(t-1895)这是一个非线性经验回归函数,如何利用成对数据估计参数c1、c2令x=ln(t-1895),则Y=c2x+c1编号12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29记录/s11.8010.6010.4010.3010.2010.1010.009.95对数据进行变化可得下表:得到散点图如下:*由表中的数据得到经验回归方程为:经验回归方程(*)对于成对数据具有非常好的拟合精度.将x=ln(t-1895)代入:
上述y与x的关系,因为不再是线性相关关系,所以称为非线性相关关系,所得到的方程称为非线性回归方程(也简称为回归方程).常见非线性模型及其线性化的方法(1)指数函数y=αeβx(α>0)β>0β<0处理方法:两边取自然对数,得lny=lnα+βx,令y´=lny,x´=lnx,则y´=lnα+βx´归纳总结(2)幂函数y=αxβ(α>0)β>0β<0(3)对数函数y=α+βlogax0<β<1β>1-1<β<0β<-1处理方法:两边取自然对数,得lny=lnα+βlnx,令y´=lny,x´=lnx,则y´=lnα+βx´.处理方法:令x´=logax,则y´=α+βx´.根据本节课所学,回答下列问题:1.线性相关系数r的公式是什么?r有哪些性质?2.非线性模型如何转化为线性模型?1.甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性做试验,并用回归分析方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖南省湘西州重点中学2025-2026学年高中毕业班第二次诊断性检侧(物理试题文)试题含解析
- 陕西省安康市汉滨2025-2026学年初三物理试题中考模拟试题含解析
- 黑龙江省哈尔滨市双城区2026年初三年级期末调研考试(数学试题)试卷含解析
- 海南省琼中学县2025-2026学年初三第一次适应性测试数学试题含解析
- 广东省梅州市大埔县市级名校2025-2026学年初三一模数学试题(海淀一模)试卷含解析
- 患者入院护理伦理决策
- 国税教育培训制度
- 导游教育培训制度
- 四大事务所绩效考核制度
- 医疗机构审计制度
- 车间安全生产检查记录表
- 2025年机关事业单位工勤技能岗位等级考核试题机关工勤等级考试附答案
- 2025年湖北省烟草专卖局(公司)招聘206人笔试参考题库附带答案详解
- 2025年安徽省综合类事业单位招聘考试公共基础知识真题试卷及参考答案
- 生活垃圾收集人员培训管理方案
- 薪资核定及管理办法
- 劳动课自制沙拉课件
- 药膳养生鸡汤培训课件
- 监狱辅警面试题目及答案
- 十五五特殊教育发展提升行动计划
- 医院运营数据统计分析
评论
0/150
提交评论