版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、对回归分析的熟悉、体会和思考市第一中学潘峰一、教材分析1 .容编排散点图、最小二乘估计的根本思想、最小二乘估计的计算公式、建立回归方程并进行预报等回归分析的局部容在?数学 3 必修?中已经出现过.在此根底上,本章通过现实生活中遇到的问 题“女大学生身高和体重的关系进一步讨论一元线性回归模型,分析产生模型中随机误差项的原因, 并从相关系数的角度研究了两个变量间线性相关关系的强弱,从而让学生了解在什么情况下可以考 虑使用线性回归模型.教材介绍了一元线性回归模型的残差平方和分解的思想,从而给出相关指数 的含义,即相关指数越大,模型拟合的效果越好.从残差分析的角度研究所选用的回归模型是否合 适,引导学
2、生初步体会检验模型的思想.为提升学生解决应用问题的水平,教材还强调了用解释变 量自变量估计预报变量因变量时需要注意的问题这点总结得非常的好,帮助学生思考, 总结建立回归模型的根本步骤.作为线性回归模型的一个应用,教材还给出了一个处理非线性相关 关系的例子,并通过相关指数比拟不同模型对同一样本数据集的拟合效果.这里所涉及的非线性相 关关系可以通过变换转化成线性相关关系,从而可以用线性回归模型进行研究.这个例子没有增加 难度,但能开阔学生的思路,使学生了解虽然任何数据对都可以用线性回归模型来拟合,但其拟合 的效果并不一定最好,可以探讨用其他形式的回归模型来拟合观测数据.2 .学习价值:.数理统计已
3、成为人们的常识,它几乎渗透到每一学科中,哪里有试验,哪里有数据,哪里就少不了数理统计,不懂数理统计,就无法应付大量信息;.现代社会是信息社会,学会搜集、测量、评价信息做出决策是一个人成功必备的素质.3 .教材处理的优点:.总以一些生动活泼的、丰富的实际情境引入,激发学生的兴趣和学习激情;.以恰时恰点的问题引导学生思考,培养问题意识,孕育创新精神;这点对我们教师的思考也是一种帮助.螺旋上升地安排核心概念和数学思想,增强数学思想方法的渗透与概括;4 4.对高等知识点到即止,强调类比、推广、特殊化、化归等思想方法的运用,开阔视野,提升数 学思维水平,培育理性精神.4 .重点和难点重点:了解线性回归模
4、型与函数模型的差异;了解判断刻画模型拟合效果的方法一相关指数和残差分析.难点:解释残差变量的含义;了解偏差平方和分解的思想.5 .目标定位:.了解随机误差、残差、残差分析等概念;明确掌握相关关系,回归方程,散点图等定义;.了解回归分析的根本思想,会求回归直线方程,并会用回归直线方程进行预报;.掌握建立回归模型的一般步骤;4 4).会用残差分析、判断线性回归模型的拟合效果;.了解相关系数、会用相关系数判断相关关系的强弱;5 .方法指引:.对于回归分析只通过案例了解方法即可,不管是线性回归方程或者非线性回归方程,都只是模拟而已,是不确定中确实定性;.了解最小乘法的思想方法,理解回归方程与一般函数的
5、差异与联系;.会用书中介绍的方法搜集资料、分析资料,感兴趣的同学可从互联网上查询相关资料.二、教材中的要点精析:1 .相关关系:自然界中,大量存在着一些变量,它们之间相互联系、相互依存,关系密切.大致 分为两类:一类是函数关系,又叫确定性关系;一类是相关关系,又叫不确定性关系、统计相关关 系.2 .回归分析:是对具有相关关系的两变量进行统计分析的一种常用方法.通俗地讲,回归分析就 是寻找相关关系中非确定性关系的某种确定性.其步骤为画散点图,求回归直线方程,并用回归直 线方程进行预报.3 .回归函数,也叫回归方程.形如y bx a的散点图的各个点大致分布在一条直线附近,这种分析就叫线性回归分析,
6、直线方程叫做回归直线方程.不是形如 y bx a的回归方程,我们称之为非线性回归方程,具体选择何种类型,由经验判断,再分析残差是否异常,确定选择的好与坏.回归直线:对于一组线性相关关系的数据,其回归直线方程的斜率 b和截距a的最小乘法估计公式分别为:(Xi x)(y y)_b J-L,(1)a y bx, (2)(Xi x)2 i 11 n1 n其中x Xi, y - y (x, y)称为样本点的中央,回归直线过样本点的中央. n i 1n i 1线性回归模型:与函数关系不同,在回归模型y bx a e中的y的值是由x和随机因素e共同确定的,即x只能解释局部y的变化,因此把x称为解释变量,把y
7、称为预报变量,其中 a和b为模型 的未知参数,e是y与bx a之间的误差.通常e为随机变量,称为随机误差,它的均值Ey bx a. 线性回归模型的完整表达式为:y bx a e ,其中随机误差e的方差 越小,通过回归直线预报真实值的精确度越高.随机误差e是引起预报值y与真实值y之间误差的原因之一,其大小取决于随机误差e的方差.再者由于公式(1)、(2)中的a和b分别为截距和斜率的估计值,与真实值a和b之间也有误差,这也是引起预报值y与真实值y之间误差的另一个原因.4.残差分析由于随机误差是随机变量,因此可以通过这个变量的数字特征来刻画它的一些总体特征.均值是反 映随机变量取值平均水平的数字特征
8、,方差反映随机变量集中于均值程度的数字特征,而随机误差 的均值0,因此可以用方差来衡量随机误差的大小.为了衡量预报的精度,需要估计e的值,通过样本方差来估计总体方差.解决问题的途径是通过样本的估计值e来估计s的值.根据截距和斜率的估计公式(1)、(2),可以建立回归方程 y bx a,其中b是b的估计量,a是 a的估计量.对于样本点而言,相应于它们的随机误差为e ,其估计值为e ,称为相应于数据点的残差.类比样本方差估计总体方差的思想,可用 x作为x的估计量,其中x是由公式(1)、(2)n给出的,(y yj2成为残差平方和.可以用残差平方和衡量回归方程的预报精度.通常残差平i 1方和越小,预报
9、精度越高.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差e,e2,L ,en来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计等,这样作出的图形称为残差图.5 .散点图表示相关关系的两个变量的一组数据,作为点的坐标,在直角坐标系中描出来得到的图形叫散点图.散点图使相关关系具有直观性.6 .回归分析的解题规律:a在解具体问题过程中,通常是先进行相关检验,通过检验确认两个变量具有线性相关关系时,再求其
10、线性回归方程;b相关性检验有几种方法,教材用的是相关系数 r和相关指数R2,两者在教材中具有平方关系在只有一个解释变量的线性模型中R2恰好等于相关系数r的平方.当r 0时,说明两个变量正相关;当r 0时,说明两个变量负相关.当 r越接近于1,表示相关程度越好,说明两个变量的线性相关性越强,r越接近于0,表示相关程度越差,说明两个变量之间几乎不存在线性相关关系;同样R2取值越大,意味着残差平方和越小,模型的拟和效果越好,回归方程的预报精度越高.在线性回归模型中,R2表示解释变量对于预报变量变化的奉献率,R2越接近1,表示回归的效果越好.c相关程度的强弱,除相关系数的大小之外,与选取的数据个数多少
11、有关,还有一个问题是显著性临界值的选取,教材中点到即止,没有往下交待;d回归分析计算量大,现在一般用计算机解决,学习中只要求明白原理即可;e教材中直接选取对数变换是选取比拟简单的函数演示而已,还可以做其他函数模拟;f回归分析中,通常先观察散点图,假设分布在一条直线附近,经验证线性相关,那么选一次函数,否那么选取其他函数模拟;g判断两个变量的相关程度通常有:其一相关系数,相关系数r的绝对值越接近于1,相关程度越高;相关指数 R2,与r类似,R2的值越大残差平方和越小,拟合越精确.h判断模拟精确的尺度为:R2 或残差平方和的大小.7 .建立回归模型的一般的根本步骤:确定研究对象,明确哪个变量是解释
12、变量,哪个变量是预报变量;画出确定好的解释变量和预报变量的散点图,观察它们之间的关系如是否存在线性关系等;y bx a;由经验确定回归方程的类型如观察到的数据呈现性关系,那么选用线性回归方程 按一定规那么估计回归方程中的参数如最小二乘法或残差呈现不随机的规律性等得出的结果后分析残差图是否有异常个别数据对应残差过大, 等,假设存在异常,那么检查数据是否有误,或模型是否适宜等.例1.10只狗的血球体积及红血球的测量值如下454246484235584039506.536.309.257.506.995.909.496.206.557.72典型例题血球体积,mm , y 红血球数,百万画出上表的散点
13、图;2求出回归直线并且画出图形3假设血球体积为49mm,预测红血球数大约是多少?解:1见下列图要学会运用计算机技术辅助我们数学学习,增强直观上的效果,这里要求学生会运用简单的excel作出散点图,并直接通过计算机拟合出回归直线,具体步骤见本文最后的附录09876543210 1数球血红010203040506070血球体积设回归直线为y bx a,利用公式1、2计算得 b 0.1597, a 0.1364所以所求回归直线的方程为y = 0.1597x + 0.1364 ,图形如下数球血红09876543210球体积(3)由(2)中求出的回归直线方程,把 x 49代入,
14、得y 7.9617 (百万),计算结果说明,当血球体积为49mm时,红血球数大约为 7.9617百万.实战演练1.某种产品外表进行腐蚀性试验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间 t(s) 5101520304050607090120深度 y(m) 610101316171923252946(1)试求腐蚀深度y对时间t的回归直线方程;(2)预测腐蚀时间为80 s时产品腐蚀的深度大约是 多少 解:(1)经计算可得 b 0.3043, a 5.3444故所求的回归直线方程为y = 0.3043x + 5.3444(2)由(1)求出的回归直线方程,把 x 80代入,易得y 29.688
15、4( m),计算结果说明,当腐蚀80 s时产品腐蚀深度大约为 29.6884 m8 .非线性回归:在散点图中样本点并没有分布在某个带壮区域,因此两个变量不呈线性相关关系,不能直接用线性回归方程来建立两个变量之间的关系.当回归方程不是形如y bx a时,称之为非线性回归方程.在一般情况下,比拟两个模型的残差比拟困难,原因是在某些样本点上一个模型的残差的绝对值比 另一个模型的小,而另一些样本点的情况那么相反.这是可以通过比拟两个模型的残差平方和的大小 来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好.两个模型拟合效果的比拟步骤:对于给定的样本点,两个含有未知参数的模型y gec2和y q
16、x2 C4其中C1,C2,C3,C4是未知参数.可按如下步骤来比拟它们的拟合效果:(1)(2)C x g . 2分别建立对应与两个模型的回归万程y e 与yC3 x C4,其中这里的Ci ,5,口为的;(1)(2)可以分别计算两个回归方程的残差S 与S ,比拟两个模型的残差的绝对值,绝对值小的拟合n(1)n(2)2 .2.的效果好;也可以分别计算两个回归方程的残差平方和(y y )和 (y y ),残差平i 1i 1方和小的模型拟合的效果好;三、结束语在统计中,回归分析是应用很广的.在中学,要讨论回归方程的求法,这局部容属于统计中对回归系数的估计;另一局部是,判断回归方程是否有意义,这属于假设
17、检验.在中学的教学中,首先要让学生理解这里讨论的相关关系和过去学的函数关系的区别,这很重要.在估计问题中,应要求学生自己探索回归直线的求法(事实上,通过老师启发学生可以给出许多方法).在统计中,重要的是寻找好的方法,而不是套用公式计算.从历史上看,拉普拉斯、欧拉等许多大数学家都曾为寻找这一直线而努力,他们的做法并不成功.后来,由勒让德、高斯提出了最小二乘法.套用公式计算回归系数,对学生来说并不困难.但这里应该让学生体会到,数学中介绍的方法是前人经过长期探索才得到的.体会在统计中寻找方法的重要.作为老师应该清楚,之所以用最小二乘法,是由于这样得到的估计量,在许多标准下是好的.而这些标准我们在中学无法讲授.另外,根据实际问题的需要,完全可以用别的方法,例如,把误差的平方改为误差的绝对值,或把误差改为求点到直线的距离等等.人们现在正是这样做的.不应该让学生错误地以为最小二乘法是绝对的、永远是最优的.应该让学生关注方程的意义和合理性.可以通过例子,提示回归系数计算的不合理性:比如,如果在圆上取一组点,仍可套用公式,用这组点的坐标得到一个回归直线方程,这样的直线显然是没意义的.以上就是我个人对人教 A版教材选修1-2中的回归分析容的一些熟悉、体会和一些小小思考:缺乏之处希望各位老师指
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年机械系统中动力源的创新设计
- 2026年使用Python优化产品售价分析流程
- 新能源汽车充电桩建设项目实施方案
- 装修施工现场内墙漆质量控制方案
- 虚拟电厂通信与数据安全保障方案
- 2026年智慧城市建设中的软件与硬件结合
- 地下管网城市生命线改造项目可行性研究报告
- 2026广东广州市中山大学孙逸仙纪念医院药学部工程岗位招聘1人备考题库及答案详解参考
- 2026四川省内江市农业科学院考核招聘事业单位6人备考题库及参考答案详解(满分必刷)
- 2026安徽六安市叶集区就业见习基地及见习岗位29人备考题库(第一批)及参考答案详解(突破训练)
- 天津市十二区重点学校2026年高三毕业班联考(一)思想政治试题(含答案)
- 2026届高考写作指导:比喻类材料作文审题建模思维训练(以T8联考作文题“顶端优势”为例)
- 100以内看图写数专项练习题(每日一练共5 份)
- 《高等学校足球运动本科专业建设指南(试行)》
- 业务订单管理制度及流程
- 2026年宁波城市职业技术学院单招综合素质考试题库附答案详解
- 安全隐患规范依据查询手册(2025版)
- 2025年鞍钢校招线下笔试面试及答案
- 2026年精神残疾评测试题
- (二模)遵义市2026届高三年级第二次适应性考试英语试卷(含标准答案解析)
- 灌云国盈新能源科技有限公司新能源压块生产项目环评
评论
0/150
提交评论