版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
会计学111回归分析的基本思想及其初步应用PPT课件选修1-2——统计案例引入线性回归模型y=bx+a+e了解模型中随机误差项e产生的原因了解相关指数R2
和模型拟合的效果之间的关系了解残差图的作用利用线性回归模型解决一类非线性回归问题正确理解分析方法与结果
比《必修3》中“回归”增加的内容数学3——统计画散点图了解最小二乘法的思想求回归直线方程y=bx+a用回归直线方程解决应用问题第1页/共39页
1.两个变量间的相关关系
自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.(正相关、负相关)
相关关系与函数关系的异同点:
相关关系函数相同点不同点对具有相关关系的两个变量进行统计分析的方法叫回归分析.
均是指两个变量的关系
非确定关系
确定的关系一、复习回顾:第2页/共39页复习回顾
2.研究两个变量间的相关关系的方法和步骤(1)、画散点图,并判断二者之间是否有线性关系;
(3)、预报和决策。(2)、建立并求出回归直线方程;
其中第3页/共39页
3.求线性回归方程的步骤:复习回顾(1)计算平均数(2)计算与的积,求(3)计算(4)将上述有关结果代入公式,求b、a,写出回归直线方程.第4页/共39页例1
从某大学中随机选取8名女大学生,其身高和体重数据如表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重。第5页/共39页(1)、画散点图,并判断二者之间是否有线性关系;
(2)、建立并求出回归直线方程;
(3)、预报和决策。第6页/共39页练习:假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料。使用年限x23456维修费用y2.23.85.56.57.0若由资料知,y对x呈线性相关关系。试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?第7页/共39页解:(1)由已知数据制成表格。12345合计23456202.23.85.56.57.0254.411.422.032.542.0112.34916253690所以有(2)当x=10时,第8页/共39页4、思考:
1、身高为172cm的女大学生的体重一定是60.316kg吗?
2、为什么根据得到的一次函数求出的结论不一定是实际值?产生误差的原因是什么?第9页/共39页二、新课:
1、从散点图中可以看出,样本点散布在某一条直线的附近,而不是一条直线,所以不能用一次函数y=bx+a来描述它们之间的关系。这时我们可以用下列回归模型
y=bx+a+e来表示。我们把自变量x称作解释变量,因变量y称作预报变量,e称作随机误差第10页/共39页
2、函数模型y=bx+a与线性回归模型y=bx+a+e的关系:(1)、线性回归模型y=bx+a与我们熟悉的一次函数模型的不同之处是增加了随机误差e,因为变量y的值由自变量x和随机误差e共同确定。即自变量x只解释部分y的变化。(2)、当线性回归模型:y=bx+a+e理想化时,即所在的遗传因素一样、所有的生活方式一样、所有的测量都没有误差……,此时e=0,线性回归模型就变成了函数模型。因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式。第11页/共39页
3、在实际应用中,我们用回归方程中的来估计线性回归模型中的,由于,所以也是一个估计值。对于样本点而言,它们的随机误差分别为:其估计值为:称估计值为相应点的残差第12页/共39页
4、当我们求出回归直线方程后,可以通过残差来判断模型拟合程度的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析。从两个方面说明:(1)、残差图(以例1为例)对照女大学生的身高和体重的原始数据,结合求出的回归直线方程,求出相应的残差数据编号12345678身高165165157170175165155170体重4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382第13页/共39页根据表格中的数据,以样本编号为横坐标,残差值为纵坐标,做出散点图(这样的散点图称作残差图)①、若残差点比较均匀地落在水平的带状区域中,说明选用模型较好,且带状区的宽度越窄,说明拟合精度越高,回归方程的预报精度越高。②、若个别点的残差较大,要考虑采集样本的过程中是否有人为错误。第14页/共39页(2)、相关指数R2越大,模型的拟合效果越好第15页/共39页
5、建立回归模型的基本步骤:(1)、确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)、画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系);(3)、确定回归模型,按一定的规则求出回归方程;(4)、得出结果后进行残差分析。第16页/共39页例1
一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据列于表中:编号12345678910零件数x/个102030405060708090100加工时间y/分626875818995102108115122(1)、建立零件为解释变量,加工时间为预报变量的回归模型,并计算残差。(2)、你认为这个模型能较好地刻化画零件数和加工时间的关系吗?第17页/共39页(1)、画散点图;
建立并求出回归直线方程;
可知变量之间具有线性关系第18页/共39页编号12345678910残差0.39-0.290.03-0.650.67-0.010.31-0.37-0.050.27残差数据如下表:(2)、画残差图;
由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好,但需请注意,第4、第5个样本点残差较大,需确认采集样本时是否有人为错误。第19页/共39页例2
在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:价格x/个1416182022需求量y/分5650434137求出y对x的回归方程,并说明拟合效果。第20页/共39页(1)、画散点图;
可知变量之间具有线性关系建立并求出回归直线方程;
第21页/共39页对于y对x的回归直线方程;
列表:
1.2-0.1-2.40.3110.64.6-2.4-4.4-8.4所以:
相关指数:
因为0.964很接近1,所以该模型的拟合效果很好。
第22页/共39页练习:关于x和y,有如下的统计资料。x24568y3040605070对于x、y两个变量进行统计分析,现有以下两种线性模型:甲:乙:试比较哪一个模型拟合效果更好?第23页/共39页1、利用残差图和相关指数都能够评价回归模型的拟合效果,它们各有自己的特点:(1)、利用残差图可以直观展示拟合效果,而且还可以发现样本数据中的可疑数据。
说明:(2)、相关指数是指把对拟合的评价转化为数值大小的判断,易于量化处理并且能在数量上表现解释变量对于预报变量变化的贡献率。第24页/共39页2、在使用回归方程进行预报时要注意:(1)、回归方程只适用于我们所研究的样本的总体;
说明:(4)、不能期望回归方程得到的预报值就是预报的精确值。(2)、我们建立的回归方程一般具有时间性;(3)、样本取值的范围会影响回归方程的适用范围;第25页/共39页案例3
一只红铃虫的产卵数y和温度x有关。现收集了7组观测数据列于表中:(1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。(2)你所建立的模型中温度在多大程度上解释了产卵数的变化?温度xoC21232527293235产卵数y/个711212466115325非线性回归问题第26页/共39页假设线性回归方程为:ŷ=bx+a选模型由计算器得:线性回归方程为y=19.87x-463.73
相关指数R2=r2≈0.8642=0.7464估计参数
解:选取气温为解释变量x,产卵数为预报变量y。选变量所以,二次函数模型中温度解释了74.64%的产卵数变化。探索新知画散点图050100150200250300350036912151821242730333639方案1分析和预测当x=28时,y=19.87×28-463.73≈93一元线性模型第27页/共39页奇怪?结合数据可以看出,随着自变量的增加,因变量也随之增加,气温为28℃是估计产卵数应该低于66,但是从推算的结果来看93比66多了27个,是什么原因造成的?模型不好?第28页/共39页编号1234567残差53.4617.72-12.02-48.78-46.5-57.1193.28残差数据如下表:画残差图;
第29页/共39页
y=bx2+a变换y=bt+a非线性关系线性关系方案2问题1选用y=bx2+a,还是y=bx2+cx+a?问题3
产卵数气温问题2如何求a、b?合作探究
t=x2二次函数模型第30页/共39页方案2解答平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a温度21232527293235温度的平方t44152962572984110241225产卵数y/个711212466115325作散点图,并由计算器得:y和t之间的线性回归方程为y=0.367t-202.543,相关指数R2=0.802将t=x2代入线性回归方程得:
y=0.367x2-202.543当x=28时,y=0.367×282-202.54≈85,且R2=0.802,所以,二次函数模型中温度解释了80.2%的产卵数变化。t第31页/共39页问题2
变换y=bx+a非线性关系线性关系问题1如何选取指数函数的底?产卵数气温指数函数模型方案3合作探究对数第32页/共39页方案3解答温度xoC21232527293235z=lny1.9462.3983.0453.1784.1904.7455.784产卵数y/个711212466115325xz当x=28oC时,y≈44,指数回归模型中温度解释了98.5%的产卵数的变化由计算器得:z关于x的线性回归方程为
对数变换:在中两边取常用对数得令,则就转换为z=bx+a.相关指数R2=0.98第33页/共
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025浙江永嘉县水务集团有限公司面向社会公开招聘劳务派遣人员24人笔试参考题库附带答案详解
- 当大队委员的演讲稿
- 演讲稿的基本写法和特点
- 2026年江西工业职业技术学院单招综合素质考试题库带答案详解
- 心态演讲稿初中生
- 中班劳动教案11篇
- 企业生产流程与质量控制规范
- 大学生备课演讲稿
- 2026年福建华南女子职业学院单招职业技能考试题库与答案详解
- 2025年原材料入库单模板
- 1.5 制作小磁针 课件(内嵌视频)-2025-2026学年科学三年级下册教科版
- 中医基础理论整体观念
- 2026年汽车发动机故障诊断与维修题库
- 2026年包头轻工职业技术学院单招职业适应性测试题库附答案详解(巩固)
- 广东省珠海市金湾区2026年初中学业水平第二次模拟考试化学试卷附答案
- 2026贵阳市工业投资有限公司管培生招聘98人笔试参考题库及答案解析
- 广西壮族自治区玉林市、贵港市等市2026届高中毕业班高三年级1月份适应性测试物理含答案
- 腋嗅知识培训课件
- 2026年苏教版五年级英语上册期末真题和答案
- 医疗行业商业秘密保护典型案例评析与启示
- 中学生用电安全 课件
评论
0/150
提交评论