概率论与数理统计A.ppt_第1页
概率论与数理统计A.ppt_第2页
概率论与数理统计A.ppt_第3页
概率论与数理统计A.ppt_第4页
概率论与数理统计A.ppt_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9.1 回归分析的概念 9.2 一元线性回归 9.3 可线性化的一元非线性回归 9.4 单因素试验方差分析 回归分析及方差分析 Ch9 1 “回归” 一词的历史渊源 “回归”一词最早由Francis Galton引入。 十九世纪,英国生物学家兼统计学家高尔顿研究发现: 其中x表示父亲身高, y 表示成年儿子的身高(单位:英 寸,1英寸=2.54厘米)。这表明子代的平均高度有向中心 回归的意思,使得一段时间内人的身高相对稳定。之后回 归分析的思想渗透到了数理统计的其它分支中。 2 9.1回归分析的基本概念 变量之间的关系 确定性关系 非确定性关系(相关关系) 3 对变量间统计依赖关系的考察主要是通过相关分析 (correlation analysis)或回归分析(regression analysis) 来完成的。 对于相关关系,虽然不能求出变量之间精确的函数关系式, 但是通过大量的观测数据,可以发现它们之间存在一定的 统计规律性。 4 回归分析是研究一个变量关于另一个(些)变量的具体依 赖关系的计算方法和理论。 分为:一元线性回归、多元线性回归、可线性化的非线性归 (双曲线、指数、对数、二次、幂函数等) 5 基本方法 考察随机变量Y与普通变量x之间的相关关系. 例1.在农业生产中小麦的亩产量Y与所施肥料量x有一定关系, 在一定范围内,若施肥量大,亩产也较高。 问题: Y是怎样依赖施肥料量x的变化的。 问题的特征:x是普通变量, Y是随机变量. 处理方法:按数理统计处理问题的方法。 6 (1) 先进行一些试验, 分别取不同的值 Y也得到 个相应观察值 得到n对数据对,称为样本数据点 (2) 散点图 Y x o 7 (3) 寻找Y与x的数量关系:其中 一般地, , 8 例1 合金的强度y (10 7Pa) 与合金中碳的含 量x (%) 有关。为研究两个变量间的关系。 首先是收集数据,我们把收集到的数据记为 (xi,yi),i=1,2,n。本例中,我们收集到12组 数据,列于表1中 进行回归分析首先是回归函数形式的选择。 当只有一个自变量时,通常可采用画散点图 的方法进行选择。 9 表1 合金钢强度y与碳含量x的数据 序号x(%)y (10 7Pa) 序号x(%)y (10 7Pa) 10.1042.070.1649.0 20.1143.080.1753.0 30.1245.090.1850.0 40.1345.0100.2055.0 50.1445.0110.2155.0 60.1547.5120.2360.0 10 为找出两个量 间存在的回归函 数的形式,可以 画一张图:把每 一对数(xi,yi)看成 直角坐标系中的 一个点,在图上 画出n个点,称这 张图为散点图, 见右图。 11 从散点图我们发现12个点基本在一条直线附近,这说明两 个变量之间有一个线性相关关系,这个相关关系可以表示 为 这便是y关于x的一元线性回归的数据结构式。通常假定 在对未知参数作区间估计或假设检验时,还需要假定误 差服从正态分布,即 显然假定(2)比假定(1)强 12 由于 0, 1均未知,需要我们从收集到的数据(xi,yi), i=1,2,n,出发进行估计。在收集数据时,我们一般要求 观察独立地进行, 即假定y1, y2, yn,相互独立。综合上述诸项假定, 我们可以给出最简单、常用的一元线性回归的数学模型: 13 9.2 一元线性回归 1. 本节考虑的模型是 其中都是未知参数,为回归系数, 分别是直线 的截距和斜率。 称 为Y关于x的经验回归函数 。 方程 称为Y关于x的经验线性回归方程,或经验回归方程, 其相应的图形称为经验回归直线。 此模型称为一元线性回归模型,基于此种模型的统计分析称为 一元线性回归分析. 14 2. 下面用最小二乘法来求 对于自变量x和因变量y的n对观察值 的最小二乘估计 其中是对观察时的随机误差. 的估计。 15 使得 成立的 和 称为 和 的最小二乘估计。 16 于是得方程组 17 解得 , 记 于是 18 例9.2.1设某化学过程的得率Y与该过程的温度x有关.现 作了10次测量,其数据如下表所示. x/ 38434954606671778288 y/%20.420.922.523.024.224.326.226.628.028.9 解 故 于是得线性回归方程 19 由此给出回归方程为: 例2 使用例1种合金钢强度和碳含量数据求回归 方程。 解 20 , . 21 残差 显然 残差的平方和 定理9.2.2 是 的无偏估计。 22 例:求出例9.2.1中误差方差 的无偏估计 解例9.2.1中已求出 所以 23 定理9.2.3对对一元线线性回归归模型(9.2.3),若进一步假 定随机误差,则有 (1). (2) RSS与和 相互独立. 24 4 回归方程的显著性检验 在使用回归方程作进一步的分析以前,首先应对回归 方程是否有意义进行判断。 如果1=0,那么不管x如何变化,E(y)不随x的变化作 线性变化,那么这时求得的一元线性回归方程就没有 意义,称回归方程不显著。如果10,E(y)随x的变 化作线性变化,称回归方程是显著的。 综上,对回归方程是否有意义作判断就是要作如下的 显著性检验:H0:1=0 vs H1: 10 拒绝H0表示回归方程是显著的。 25 需要检验 假设 方法: 26 t检验法 27 例9.2.3 试说明例9.2.1中的线性回归效果是否显著 解要在水平 下检验如下假设 故 查表知 因为 24.12603.3554, 所以拒绝,线性回归效果是显著的. 28 5.回归系数的置信区间 的置信水平为 的置信区间为 例 9.2.4 求例9.2.1中回归系数 的置信水平为95%的置信区间. 解 29 如果经检验,回归方程的线性回归效果是显著的,那么 就可以用已经获得的回归方程 进行预测. 6. 预测 所谓预测(或称预报),就是以一定的置信水平预测与 对应的 的取值范围. 称为 的置信水平为 的预测区间,也称为置信区间. 30 方法通过适当的变量变换,化成一元线性 回归问题进行分析处理. 两边取对数 9.3、可化为一元线性回归的问题 31 , , 曲线变换变换后的线性式 1双曲函数 2幂函数 3指数函数 4对数函数 5倒指数函数 6S型曲线 32 配曲线的一般方法是: 33 例9.3.1一只红铃虫的产卵数Y和温度x有关.经观测获 得 一组红铃 虫产卵数与温度的数据如下表所示.试求Y关于x的回 归方程. 编号 1234567 温度x/21232527293235 产卵数y711212466115325 34 解1.根据这组数据画出散点图. 2.选择模型 作变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论