高中数学第一章统计案例1.1回归分析的基本思想及初步应用知识点精析新人教A版_第1页
高中数学第一章统计案例1.1回归分析的基本思想及初步应用知识点精析新人教A版_第2页
高中数学第一章统计案例1.1回归分析的基本思想及初步应用知识点精析新人教A版_第3页
高中数学第一章统计案例1.1回归分析的基本思想及初步应用知识点精析新人教A版_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高中数学第一章统计案例1.1回归分析的基本思想及初步应用知识点精析新人教A版选修12一.知识要点,学习目标1 .如果一组具有相关关系的数据(为,必),(乂2,y2),(4,yn),作出散点图大致分布在一条直线附近,那么我们称这样的变量之间的关系为线性相关关系(也称一元线性相关),这条直线就是回归直线,记为?bxa.2 .在所求回归直线方程?bxa中,当x取xi时,yibxia与实际收集到的数据yi之间的偏差为22yiyiyi(bxa),偏差的平万为(yiyi)yi(bxa)n即以Q(yibxia)2来刻画出n个点与回归直线在整体上偏差的平方和,显然Q取最小彳1时的a,b的i1值就是我们所求的。

2、应注意,这个最小距离不是通常所指的各数据的点(xi,y)到直线的距离,而是各数据点(xi,yi)沿平行y轴方向到直线的距离xiyi nxyi 1n-222x nxi 1n_(xx)(yiy)i1n_(xx)2i1aybx这就是我们所要求的公式(无特殊要求时以此公式求回归方程中的a、b)._1n_1n其中(x,yi)为样本数据,xxi,y-yi为样本平均数,(x,y)称为样本点中心,且所求线性nini回归直线经过样本点中心点(如图2所示).当回归直线斜率b0时,为线性正相关,b0时为线性负相关.线性回归分析:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.前面我们给出了线性回归方程

3、,这里我们主要结合教材分析一元线性回归问题.1 .以散点图分析线性相关关系,散点图是较粗略地分析和判断两个具有相关关系的变量是否线性相关的问题,如果是线性相关的,我们可以求其线性回归方程,如果不是线性向相关的,即使求得线性回归方程,也是无效的;也就是说不能对一些数据进行分析判断,不能应用它解决和解释一些实际问题.2 .以相关系数分析线性相关关系的强弱两个变量之间的相关关系的样本相关系数:n(Xx)(yiy)r;i1可衡量是否线性相关,以及线性相性关系的强弱.由于分子与线性回归nn2 2(XX)(yiy)i1i1方程中的斜率b的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当r0时,

4、两个变量正相关;当r0时两个变量负相关.当r的绝对值接近1,表明两个变量的线性相关性很强;当r的绝对值接近0,表明两个变量之间几乎不存在线性相关关系.规定当r0.75时,我们认为两个变量有很强的线性相关关系.3 .解释变量与随机误差对预报精度的影响以及残差分析(1)有关概念由于样本数据点与一元线性回归方程?bxa上的点还有一定的差距,这说明了另外的一个因素随机误差e的影响.于是有线性回归模型ybxae其中a和b为模型的未知参数;x称为解释变量,y称为预报变量;e是y与?bxa之间的误差,e叫随机误差。随机误差的估计值为:gyiyiyibxiaei称为相应于样本点(xi,yi)的残差(如图3).

5、(2)通过残差分析判断模型拟合效果八AA.叫由eiyiyiyibxia计算出残差e,e,,en,然后选取横坐标为编号、或解释变量或预报p8图1.1 5),说明模型拟合效变量,纵坐标为残差作出残差图.通过图形分析,如果样本点的残差较大,就要分析样本数据的采集是否有错误;另一方面,可以通过残差点分布的水平带状区域的宽窄(如教材果,反映回归方程的预报精度.4.相关指数R2反应模型的拟合效果n_nR2 1(yi yi)i 1n 2(yi y)i 1/一、22(yiy)(yiyi)i1i1n_/12(yiy)i1(1)变量剖析理解:总偏差平方和(yiy)2,表示解释变量和随机误差产生的总的效应;i1n残

6、差平方和(yiyi)2,表示了随机误差效应;i1n_n其差(yiy)2(yiyi)2,表示了解释变量效应i1i1(2)模型拟合效果n(yiyi)2残差平方和占总偏差平方和的百分比,反映了随机误差对预报变量(总效应)的贡献率,2(yiy)i1显然这个数值越大,模型的拟合效果越差.解释变量效应占总偏差平方和的百分比R2n(yii 1 n(yii 12yi)反映了解释变量对预报变量(总效应)的贡y)2n(yiyi)2献率;因此,R2越接近1(即-越接近0),表示回归的效果越好,即解释变量和预报变量的线2(yiy)i1性相关性越强.四.非线性回归的问题转化为线性回归问题(1)作散点图确定曲线模型根据收集的数据作散点图(如图4),可见两个变量不呈线性相关关系.而是分布在某一条指数函数曲线ygec2'的周围,也可以认为样本点集中在某二次曲线yqx2C4的附近.(2)非线性转化为线性这时通过对数变换把指数关系yjec2"变为线性关系zc2xIng;通过换元把二次函数yc3x2c4关系变换为线性关系yc3tc4.在这两种情况下就可以利用线性回归模型,建立y和x之间的非线性回归方程了.(3)比较两种模型的拟合效果对于给定的样本点i可以通过转换后的对应数表作散点图来确定线性回归的拟合情况,判断选用哪一种曲线模型较为合适;ii可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论