版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章统计案例 1.1回归分析的基本思想及其初步应用,【阅读教材】 根据下面的知识结构图阅读教材,进一步掌握线性回归分析方法,了解判断线性回归模型的拟合效果的方法,初步认识解决非线性回归问题的方法.,【知识链接】 1.回归分析 回归分析是对具有不确定性关系的两个变量进行统计分析的一种方法. 2.线性回归分析步骤 基本步骤为画散点图,求线性回归方程,用线性回归方程进行预报.,主题一:回归分析的相关概念 【自主认知】 1.一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:,在平面直角坐标系中作出散点图.,提示:散点图如图,2.从散点图中判断x和y之间是
2、否具有相关关系. 提示:点分布在一条直线附近,所以有相关关系. 3.若转速为10转/秒,能否预测机器每小时生产有缺陷的零件件数? 提示:可以.根据散点图作出一条直线,求出直线方程后可预测.,根据以上探究,完成以下填空. 1.相关关系与函数关系 相关关系是一种非确定性关系,_是对具有相关关系的两个 变量进行统计分析的一种常用方法,函数关系是一种_关系.,回归分析,确定性,2.在线性回归模型y=bx+a+e中,最小二乘估计 和 就是未知参数a和b的最好估计,其计算公式如下: 其中, 另外,_称为样本点的中心,回归直线一定过样本点中心.,【合作探究】 1.线性回归模型是函数关系吗? 提示:y=bx+
3、a+e与函数关系不同,在回归模型中,y的值由x和随机误差e共同确定,即x只能解释部分y的变化.因此有时我们把x称为解释变量,把y称为预报变量.,2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么? 提示:不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等. 3.回归模型y=bx+a+e中e是什么,它有怎样的作用? 提示:e是随机误差.它的主要作用是提供选择模型的准则以及在模型合理的情况下探求最佳估计值a,b的工具.,【过关小练】 1.下列有关回归直线方程 =
4、x+ 的叙述: 反映 与x之间的函数关系;反映y与x之间的函数关系; 表示 与x之间的不确定关系;表示最接近y与x之间真实关系的一条直线. 其中正确的是( ) A. B. C. D.,【解析】选D. = x+ 表示 与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系.故选D.,2.设变量y对x的线性回归方程为 =2-2.5x,则变量x每增加一个单位时,y平均() A.增加2.5个单位 B.增加2个单位 C.减少2.5个单位 D.减少2个单位 【解析】选C.回归直线的斜率 =-2.5,表示x每增加一个单位,y平均减少2.5个单位.,主题二:线性回归分析 【自
5、主认知】 1.在进行回归分析时由样本数据一般为什么先作出散点图? 提示:作散点图的意义在于能直观明了地观察两变量间到底存在怎样的关系,从而确定回归模型. 2.得到线性回归模型后为何要进行残差分析,其作用是什么? 提示:得到线性回归模型后进行残差分析,可以判断原始数据中是否存在可疑数据,并检验模型的拟合效果,以便更准确地进行预报.,根据以上探究,完成以下填空. 刻画回归效果的形式 (1)残差分析: 残差图:作图时纵坐标为_,横坐标可以选为_,或 _,或_等,这样作出的图形称为残差图. 残差分析:残差点比较_地落在水平的带状区域中,说明选用 的模型比较合适,这样的带状区域的宽度_,说明模型拟合精度
6、 越高,回归方程的预报精度越高.,残差,样本编号,身高数据,体重估计值,均匀,越窄,(2)残差平方和:,越小,(3)相关指数R2:,解释,预报,接近,【合作探究】 1.要确定回归方程,需确定的量是什么? 提示:要确定回归方程,关键是确定 和 的值. 2.相关指数R2的作用是什么? 提示:利用相关指数R2可以刻画数据拟合效果的好坏.在线性回归模型中,R2的值越接近1,说明残差平方和越小,即说明模型的拟合效果越好.,【拓展延伸】非线性回归分析 (1)非线性相关关系:样本点分布在某一条曲线的周围,而不是一条直线附近,我们就称这两个变量之间不具有线性相关关系而是非线性相关关系.,(2)非线性回归方程线
7、性化 y=axn(其中a,x,y均为正值)(幂函数型函数) lgy=lga+nlgx,令u=lgy,v=lgx,b=lga, 则u=nv+b,图象为一直线. y=cax(a0,c0)(指数型函数) lgy=xlga+lgc,令u=lgy,b=lgc,d=lga, 则u=dx+b,图象为一直线.,【过关小练】 1.有下列数据:,下列四个函数中,模拟效果最好的为() A.y=32x-1 B.y=log2x C.y=3x D.y=x2 【解析】选A.当x=1,2,3时,分别代入求y值,离y最近的值模拟效果最好,知A模拟效果最好.,2.已知方程 =0.85x-85.7是根据女大学生的身高预报体重的回归
8、 方程,其中x, 的单位分别是cm,kg,则该方程在样本(165,57)处的残差是. 【解析】当x=165时, =0.85165-85.7=54.55,所以方程在样本(165,57)处的残差是57-54.55=2.45. 答案:2.45,【拓展延伸】 1.对非线性回归分析的认识 在大量的实际问题中,研究的两个变量不一定都呈线性相关关系,它们之间可能呈指数关系或对数关系或二次函数关系等非线性关系,可以通过变换(选择恰当的函数)化为线性关系得到回归直线方程,再通过相应变换得到非线性回归方程. 2.判断残差图异常的两个依据 (1)个别数据对应残差过大. (2)残差呈现不随机的规律性.,【归纳总结】
9、对线性回归分析的四点说明 (1)由线性回归方程给出的是一个预报值而非精确值. (2)随机误差的主要来源 线性回归模型与真实情况引起的误差; 省略了一些因素的影响产生的误差; 观测与计算产生的误差.,(3)残差分析是回归分析的一种方法. (4)用相关指数R2来刻画回归效果.R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.,类型一:回归分析的概念 【典例1】(1)有下列说法:线性回归分析就是由样本点去寻找一条 直线,使之贴近这些样本点的数学方法;利用样本点的散点图可以 直观判断两个变量的关系是否可以用线性关系表示;通过回归方程 = x+ ,可以
10、估计和观测变量的取值和变化趋势;因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性分析.其中正确命题的个数是() A.1B.2C.3D.4,(2)某产品的广告费用x与销售额y的统计数据如下表,根据上表可得回归方程 = x+ 中的 为9.4,据此模型预报广告费用为6万元时销售额为() A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元,【解题指南】(1)根据相关概念及其性质逐一判断得出结论. (2)利用回归直线方程过定点( )求解.,【解析】(1)选C.反映的正是最小二乘法思想,故正确.反映的 是画散点图的作用,也正确.解释的是回归方程 = x+ 的作用,
11、故也正确.是不正确的,在求线性回归方程之前必须进行相关性分 析,以体现两变量的关系. (2)选B.易求得 =3.5, =42,则将(3.5,42)代入 = x+ 中得: 42=9.43.5+ ,即 =9.1,则 =9.4x+9.1,所以当广告费用为6万元时销售额为9.46+9.1=65.5(万元).,【规律总结】回归分析的四个关注点 (1)收集数据:随机抽取样本,确定数据,形成样本点. (2)画散点图:由样本点形成散点图,判断是否具有线性相关关系. (3)求回归直线方程:若线性相关,由最小二乘法确定回归直线方程. (4)看趋势:由回归方程观察变量的取值及变化趋势.,【巩固训练】关于变量y与x之
12、间的回归直线方程叙述正确的 是() A.表示y与x之间的一种确定性关系 B.表示y与x之间的相关关系 C.表示y与x之间的最真实的关系 D.表示y与x之间真实关系的一种效果最好的拟合 【解析】选D.回归直线方程能最大可能地反映y与x之间的真实关系,故选项D正确.,【补偿训练】下列说法正确的有() 回归方程适用于一切样本和总体; 回归方程一般都有时间性; 样本取值的范围会影响回归方程的适用范围; 回归方程得到的预报值是预报变量的精确值. A. B. C. D.,【解析】选C.回归方程只适用于我们研究的样本和总体.我们所建立的回归方程一般都有时间性.样本取值的范围会影响回归方程的适用范围.回归方程
13、得到的预报值是预报变量可能取值的平均值,并非精确值,故正确.,类型二:线性回归分析 【典例2】已知某商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:,(1)画出y关于x的散点图. (2)求出回归直线方程. 【解题指南】正确利用求线性回归方程的步骤解答.,【解析】(1)画散点图:,【延伸探究】 1.(改变问法)若本题条件不变,计算R2的值,并说明回归模型拟合程度的好坏.,【解析】 回归模型拟合效果很好.,2.(改变问法)在本题条件不变的情况下,画出残差图. 【解析】,【规律总结】建立回归模型的一般步骤,【拓展延伸】残差图的分析方法 (1)残差图的纵坐标为残差,横坐标通常可以是样本编号
14、、解释变量或预报变量等,残差图是一种散点图. (2)残差散点图中的残差点比较均匀地落在水平的带状区域中,并且沿水平方向散点的分布规律相同,说明残差是随机的,所选择的回归模型建模是合理的,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.(关键词:残差点比较均匀地落在水平带状区域中),【补偿训练】甲、乙、丙、丁4位同学各自对A,B两变量做回归分析, 分别得到散点图与残差平方和 如下表:,哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度 高?() A.甲 B.乙 C.丙 D.丁 【解析】选D.从散点图上来看,丁同学的散点图中的点更加近似在一条直线附近;从残差平方和来看
15、,丁同学的最小,说明拟合精度最高.,类型三:非线性回归分析 【典例3】在一次抽样调查中测得样本的5个样本点,数据如下表:,求y与x之间的回归方程. 【解题指南】先画散点图,再选择合适的回归方程求解.本题样本点不是线性相关的,因而可通过代换转化为线性相关的两个变量来求解.,【解析】画出散点图,如图所示,观察可知y与x近似是反比例函数关系.设y= (k0),令t= ,则y=kt. 可得到y关于t的数据如下表:,画出散点图如图所示,观察可知t和y有较强的线性相关性,因此可利用线性回归模型进行拟合,列表如下:,所以 =4.134 4t+0.791 7, 所以y与x之间的回归方程是,【规律总结】非线性回
16、归方程的求法 (1)作散点图:根据原始数据(x,y)作出散点图. (2)选择函数模型:根据散点图选择恰当的拟合函数. (3)变换:作恰当的变换,将其转化成线性函数,求线性回归方程. (4)还原:在(3)的基础上通过相应变换,即可得非线性回归方程.,【拓展延伸】常见的非线性回归模型转化为线性回归模型的方法,【巩固训练】(2015全国卷)某公司为确定下一年度投入某种产品 的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年 利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1, 2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,(1)根据散点图判断,
17、y=a+bx与y=c+d 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.,(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果 回答下列问题: 年宣传费x=49时,年销售量及年利润的预报值是多少? 年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u 的斜率和截距的最小二乘估计分别为:,【解题指南】(1)将相应的点代入到y=a+bx与y=c+d 中进行验 证.(2)令w= ,先建立y关于w的线性回归方程,再确定y关于x的回归方程.(3)将x=49代入到(2)中y关于x的回归方程求解.,【解析】(1)由散点图可以判断,y=c+d 适宜作为年销售量y关于年宣传费x的回归方程类型. (2)令w= ,先建立y关于w的线性回归方程. 所以y关于w的线性回归方程为 =100.6+68w,因此y关于x的回归 方程为 =100.6+68 .,(3)由(2)知,当x=49时,年销售量y的预报值 =100.6+68 =576.6, 年利润z的预报值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 债务承担合同
- 做账实操-生物质颗粒加工厂的账务处理及成本核算
- 2026年人参皂甙行业分析报告及未来发展趋势报告
- 2026年机场业行业分析报告及未来发展趋势报告
- 2026年维C银翘片行业分析报告及未来发展趋势报告
- 2026年城市综合体开发行业分析报告及未来发展趋势报告
- 2026年儿童智能陪伴机器人行业分析报告及未来发展趋势报告
- 2026年发酵乳行业分析报告及未来发展趋势报告
- 2026年超声产科监护仪行业分析报告及未来发展趋势报告
- 2026年骨胶行业分析报告及未来发展趋势报告
- 急诊科运用PDCA循环降低急诊危重患者院内转运风险品管圈QCC专案结题
- 学位英语4000词(开放大学)
- GB/T 9799-2024金属及其他无机覆盖层钢铁上经过处理的锌电镀层
- 中医是怎样治疗动脉硬化的
- 产品漏装改善报告
- 悬挑式卸料平台监理实施细则
- 铸件(原材料)材质报告
- 提货申请单表
- 脑与认知科学概论PPT(第2版)完整全套教学课件
- 【初中化学】中国化学家-李寿恒
- 生管指导手册(什么是PMC)
评论
0/150
提交评论