选修2-3回归分析的基本思想及其初步应用(精华)课件_第1页
选修2-3回归分析的基本思想及其初步应用(精华)课件_第2页
选修2-3回归分析的基本思想及其初步应用(精华)课件_第3页
选修2-3回归分析的基本思想及其初步应用(精华)课件_第4页
选修2-3回归分析的基本思想及其初步应用(精华)课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.1回归分析的基本思想及其初步应用高二数学选修2-33.1回归分析的基本思想及其初步应用高二数学选修2-3问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施化肥量x15202530354045水稻产量y330345365405445450455复习变量之间的两种关系问题1:正方形的面积y与正方形的边长x之间y=x2确定1020304050500450400350300·······施化肥量x15202530354045水稻产量y330345365405445450455xy施化肥量水稻产量102030自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1、定义:1):相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2):自变量取值一定时,因变量的取值带有一定随机性的两

现实生活中存在着大量的相关关系。

如:人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入。等等探索:水稻产量y与施肥量x之间大致有何规律?现实生活中存在着大量的相关关系。探索:水稻产量y与施肥量x1020304050500450400350300·······发现:图中各点,大致分布在某条直线附近。探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?施化肥量x15202530354045水稻产量y330345365405445450455xy散点图施化肥量水稻产量102030探究对于一组具有线性相关关系的数据我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:称为样本点的中心。探究对于一组具有线性相关关系的数据我们知道其回归方程的截距和1、所求直线方程叫做回归直线方程;相应的直线叫做回归直线。2、对两个变量进行的线性分析叫做线性回归分析。1、回归直线方程1、所求直线方程叫做回归直线方程;2、对两个变量进行的线性分2、求回归直线方程的步骤:(3)代入公式(4)写出直线方程为y=bx+a,即为所求的回归直线方程。^2、求回归直线方程的步骤:(3)代入公式(4)写出直线方程为例1、观察两相关量得如下数据:x-1-2-3-4-553421y-9-7-5-3-115379求两变量间的回归方程.解:列表:i12345678910xi-1-2-3-4-553421yi-9-7-5-3-115379xiyi9141512551512149例1、观察两相关量得如下数据:x-1-2-3-4-55342所求回归直线方程为所求回归直线方程为

假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落在回归直线上。这些点散布在回归直线附近。那么,数据点和它在回归直线上相应位置的差异

是随机误差的效应,称为残差。假设随机误差对体重没有影响,也就是说,体重仅受身表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382(一)我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。3、残差分析:表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据残差图的制作及作用1、坐标纵轴为残差变量,横轴可以有不同的选择;2、若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;3、对于远离横轴的点,要特别注意。身高与体重残差图异常点错误数据模型问题残差图的制作及作用身高与体重残差图异常点错误数据表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382(一)我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。3、残差分析:(二)表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据例2在一段时间内,某中商品的价格x元和需求量Y件之间的一组数据为:求出Y对的回归直线方程,并说明拟合效果的好坏。价格x1416182022需求量Y1210753列出残差表为0.994因而,拟合效果较好。00.3-0.4-0.10.24.62.6-0.4-2.4-4.4例2在一段时间内,某中商品的价格x元和需求量Y件之间的例3关于x与y有如下数据:

有如下的两个线性模型:(1);(2)试比较哪一个拟合效果更好。x24568y3040605070例3关于x与y有如下数据:x24568y304060507、一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量。(2)画出确定好的解析变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)。(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a).(4)按一定规则估计回归方程中的参数(如最小二乘法)。(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。7、一般地,建立回归模型的基本步骤为:(1)确定研究对象,明什么是回归分析?

(内容)从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度什么是回归分析?

(内容)从一组样本数据出发,回归分析与相关分析的区别相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制

回归分析与相关分析的区别相关分析中,变量x变量y处于例3、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系。如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出刚的时间)的一列数据,如下表所示:x(0.01%)104180190177147134150191204121y(min)100200210185155135170205235125(1)y与x是否具有线性相关关系;(2)如果具有线性相关关系,求回归直线方程;(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?例3、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响如何描述两个变量之间线性相关关系的强弱?

在《数学3》中,我们学习了用相关系数r来衡量两个变量之间线性相关关系的方法。相关系数rr>0正相关;r<0负相关。通常,r>0.75或r<-0.75认为两个变量有很强的相关性.如何描述两个变量之间线性相关关系的强弱?在《数学相关关系的测度

(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加相关关系的测度

(相关系数取值及其意义)-1.0+1.00-(1)列出下表,并计算i12345678910xi104180190177147134150191204121yi100200210185155135170205235125xiyi10400360003990032745227851809025500391554794015125故,钢水含碳量与冶炼时间具有很强线性相关性(1)列出下表,并计算i12345678910xi10418所以回归直线的方程为=1.267x-30.51(3)当x=160时,1.267.160-30.51=172(2)设所求的回归方程为所以回归直线的方程为=1.267x-30.51(3)当x3.1回归分析的基本思想及其初步应用高二数学选修2-33.1回归分析的基本思想及其初步应用高二数学选修2-3问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施化肥量x15202530354045水稻产量y330345365405445450455复习变量之间的两种关系问题1:正方形的面积y与正方形的边长x之间y=x2确定1020304050500450400350300·······施化肥量x15202530354045水稻产量y330345365405445450455xy施化肥量水稻产量102030自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1、定义:1):相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2):自变量取值一定时,因变量的取值带有一定随机性的两

现实生活中存在着大量的相关关系。

如:人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入。等等探索:水稻产量y与施肥量x之间大致有何规律?现实生活中存在着大量的相关关系。探索:水稻产量y与施肥量x1020304050500450400350300·······发现:图中各点,大致分布在某条直线附近。探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?施化肥量x15202530354045水稻产量y330345365405445450455xy散点图施化肥量水稻产量102030探究对于一组具有线性相关关系的数据我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:称为样本点的中心。探究对于一组具有线性相关关系的数据我们知道其回归方程的截距和1、所求直线方程叫做回归直线方程;相应的直线叫做回归直线。2、对两个变量进行的线性分析叫做线性回归分析。1、回归直线方程1、所求直线方程叫做回归直线方程;2、对两个变量进行的线性分2、求回归直线方程的步骤:(3)代入公式(4)写出直线方程为y=bx+a,即为所求的回归直线方程。^2、求回归直线方程的步骤:(3)代入公式(4)写出直线方程为例1、观察两相关量得如下数据:x-1-2-3-4-553421y-9-7-5-3-115379求两变量间的回归方程.解:列表:i12345678910xi-1-2-3-4-553421yi-9-7-5-3-115379xiyi9141512551512149例1、观察两相关量得如下数据:x-1-2-3-4-55342所求回归直线方程为所求回归直线方程为

假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落在回归直线上。这些点散布在回归直线附近。那么,数据点和它在回归直线上相应位置的差异

是随机误差的效应,称为残差。假设随机误差对体重没有影响,也就是说,体重仅受身表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382(一)我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。3、残差分析:表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据残差图的制作及作用1、坐标纵轴为残差变量,横轴可以有不同的选择;2、若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;3、对于远离横轴的点,要特别注意。身高与体重残差图异常点错误数据模型问题残差图的制作及作用身高与体重残差图异常点错误数据表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382(一)我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。3、残差分析:(二)表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据例2在一段时间内,某中商品的价格x元和需求量Y件之间的一组数据为:求出Y对的回归直线方程,并说明拟合效果的好坏。价格x1416182022需求量Y1210753列出残差表为0.994因而,拟合效果较好。00.3-0.4-0.10.24.62.6-0.4-2.4-4.4例2在一段时间内,某中商品的价格x元和需求量Y件之间的例3关于x与y有如下数据:

有如下的两个线性模型:(1);(2)试比较哪一个拟合效果更好。x24568y3040605070例3关于x与y有如下数据:x24568y304060507、一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量。(2)画出确定好的解析变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)。(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a).(4)按一定规则估计回归方程中的参数(如最小二乘法)。(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。7、一般地,建立回归模型的基本步骤为:(1)确定研究对象,明什么是回归分析?

(内容)从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度什么是回归分析?

(内容)从一组样本数据出发,回归分析与相关分析的区别相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论