统计学课件第八章相关与回归分析.ppt_第1页
统计学课件第八章相关与回归分析.ppt_第2页
统计学课件第八章相关与回归分析.ppt_第3页
统计学课件第八章相关与回归分析.ppt_第4页
统计学课件第八章相关与回归分析.ppt_第5页
免费预览已结束,剩余91页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课件 1 统计学概论内容 第一章统计总论第二章统计调查第三章统计数据的整理与显示第四章统计指标第五章统计指数第六章时间序列分析第七章抽样推断第八章相关与回归分析第九章统计预测第十章统计的综合评价 课件 2 第一节相关分析概述 第三节简单线性回归模型 第二节等级相关与品质相关 第四节多元线性回归模型 第十章相关与回归 课件 3 联系与相互影响是普遍的现象 事物相互间关系的质的解释 自然的 社会的 经济的 心理的 事物相互间关系的量的分析 两变量或多变量间的数量关系 在可以解释的质的关系基础上进行相关分析和回归分析 课件 4 相关分析的意义 第一节相关分析概述 社会经济现象中 一些现象与另一些现象之间往往存在着依存关系 当我们用变量来反映这些现象的的特征时 便表现为变量之间的依存关系 在分析变量的依存关系时 我们把变量分为两种 自变量 因变量 引起其他变量发生变化的量 受自变量的影响发生对应变化的量 课件 5 现象之间的相互关系 可以概括为两种不同的类型 一 函数关系 二 相关关系 例如 家庭收入决定消费支出 收入的变化必然引起消费支出的变化 这两个变量中收入是自变量 而消费支出则是因变量 课件 6 函数关系可以用一个确定的公式 即函数式 来表示 或 Y F X 课件 7 例2 根据消费理论 商品需求量Q与商品价格P 居民收入I之间具有相关关系 相关关系可用统计模型 或 Y F X 式中 为影响Y的除X外的其他随机因素 课件 8 相关关系的种类 1 按相关关系涉及变量的多少可分为 课件 9 相关关系的种类 2 按相关关系形式可分为 课件 10 相关关系的种类 3 按相关的方向可分为 课件 11 线性正相关 课件 12 线性负相关 非线性相关 课件 13 无 不 相关 课件 14 相关关系的种类 4 按相关关系的密切程度分为 完全相关因变量完全随自变量变动而变动 存在着严格的依存关系 即变量间的关系为函数关系 不完全相关变量之间存在着不严格的依存关系 即因变量的变动除了受自变量变动的影响外 还受其他因素的影响 它是相关关系的主要表现形式 完全不相关自变量与因变量彼此独立 互不影响 其数量变化毫无联系 课件 15 1 确定现象之间有无相关关系 以及相关关系的表现形态 2 确定相关关系的密切程度 3 确定相关关系的数字模型 并进行参数估计和拟合优度检验 4 回归预测 并分析估计标准误差 相关分析的主要内容包括 课件 16 相关关系的测定 定性分析是依据研究者的理论知识和实践经验 对客观现象之间是否存在相关关系 以及何种关系作出判断 定量分析在定性分析的基础上 通过编制相关表 绘制相关图 计算相关系数与判定系数等方法 来判断现象之间相关的方向 形态及密切程度 课件 17 相关关系的测定 相关表将两个变量伴随变动结果编成一张统计表 即相关表 单变量分组相关表只对其中一个变量分组 单变量分组相关表对两个变量同时分组 课件 18 简单相关表适用于所观察的样本单位数较少 不需要分组的情况 分组相关表适用于所观察的样本单位数较多 标志变异又较复杂 需要分组的情况 两种相关表的适用范围 课件 19 八个同类工业企业的月产量与生产费用 简单相关表 课件 20 20个同类工业企业固定资产原值与平均每昼夜产量 分组相关表 课件 21 相关关系的测定 相关图将变量之间的伴随变动绘于坐标图上所形成的统计图 又称散点图 简单相关图根据未分组资料的原始数据直接绘制的相关图 分组相关图根据分组资料绘制的相关图 课件 22 正相关 负相关 曲线相关 不相关 用直角坐标系的x轴代表自变量 y轴代表因变量 将两个变量间相对应的变量值用坐标点的形式描绘出来 用以表明相关点分布状况的图形 相关关系的测定 相关图的绘制 课件 23 X Y 统计学 第十章相关与回归 课件 24 相关系数在直线相关的条件下 用以反映两变量间线性相关密切程度的统计指标 用r表示 其基本算法是英国统计学家皮尔逊所创的乘积动差法 简称积差法 相关关系的测定 课件 25 相关系数r的取值范围 1 r 1 0 r 1表示存在不同程度线性相关 r 0 4为低度线性相关 0 4 r 0 7为显著性线性相关 0 7 r 1 0为高度显著性线性相关 r 0为正相关 r 0为负相关 r 0表示不存在线性关系 r 1表示完全线性相关 课件 26 课件 27 例 计算工业总产值与能源消耗量之间的相关系数资料 结论 工业总产值与能源消耗量之间存在高度的正相关关系 能源消耗量x的变化能够解释工业总产值y变化的95 2 相关系数的计算 课件 28 相关系数的统计检验 根据样本的相关系数 在一定的置信度水平下 总体的相关系数将在什么范围内 计算相关系数的样本 是否来自并无相关的总体 对这些的问题的研究 就是我们所要回答的相关系数的统计推断问题 课件 29 线性相关的显著性检验 相关系数的显著性检验 t检验法 提出假设 目的 检验总体两变量间线性相关性是否显著 步骤 构造检验统计量 课件 30 相关系数的显著性检验 t检验法 根据给定的显著性水平 确定临界值 计算检验统计量并做出决策 步骤 检验统计量落入拒绝域中 故拒绝原假设 接受备择假设 即可以认为 明显地不等于零 相关关系是显著的 课件 32 当成立时 则统计量 课件 33 相关关系不等于因果关系 相关系数只度量变量间的线性关系 因此 弱相关不一定表明变量间没有关系 极端值可能影响相关系数 注意相关关系成立的数据范围 警惕虚假相关 使用相关系数时应注意的问题 课件 34 第二节等级相关与品质相关 由于社会经济现象的复杂性 有许多情形难以以精确数字形成统计数列 而只能根据主观判断 评定等级 依次排列 如对事态轻重 才智高低 艺术水平等的评价 都只能依据评判者的知识 经验 感受 有关规则等 作出相对大小的等级评定 等级相关是定序尺度的变量之间的相关关系 等级相关系数的计算 该公式是由斯皮尔曼提出的 故也称为斯皮尔曼等级相关系数 课件 35 等级相关 见书例 课件 36 回归 退回regression 1877年弗朗西斯 高尔顿爵士遗传学研究回归线 第三节简单线性回归模型 课件 37 回归分析法产生的历史 回归分析法 由著名的英国生物学家 统计学家高尔顿 F Gallton 达尔文的表弟所创 早年 高尔顿致力于化学和遗传学领域的研究 他研究父亲们的身高与儿子们的身高之间的关系时 建立了回归分析法 课件 38 父亲们的身高与儿子们的身高之间关系的研究 1889年F Gallton和他的朋友K Pearson收集了上千个家庭的身高 臂长和腿长的记录企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式下图是根据1078个家庭的调查所作的散点图 略图 回归分析法产生的历史 课件 39 回归分析法产生的历史 课件 40 从图上虽可看出 个子高的父亲确有生出个子高的儿子的倾向 同样地 个子低的父亲确有生出个子低的儿子的倾向 得到的具体规律如下 如此以来 高的伸进了天 低的缩入了地 他百思不得其解 同时又发现某人种的平均身高是相当稳定的 最后得到结论 儿子们的身高回复于全体男子的平均身高 即 回归 见1889年F Gallton的论文 普用回归定律 后人将此种方法普遍用于寻找变量之间的规律 回归分析法产生的历史 课件 41 第三节简单线性回归模型 回归分析是通过一个变量x或一些变量 x1 x2 x3 的变化解释另一变量y的变化 即根据相关关系的数量表达式 回归方程式 与给定的自变量x 揭示因变量y在数量上的平均变化和求得因变量的预测值的统计分析方法 回归方程是反映自变量和因变量之间数学联系的表达式 回归模型是某一类回归方程的总称 课件 42 自变量 independentvariable 解释变量 给定的或可以控制的 用来解释 预测应变量的变量 因变量 dependentvariable 响应变量 由自变量来解释其变化的变量 X Y 课件 43 回归分析的内容和步骤 1 根据理论和对问题的分析判断 区分自变量和因变量 2 设法找出适合的数学方程式 即回归模型 描述变量间的关系 3 对回归模型进行统计检验 4 统计检验通过后 利用回归模型 根据解释变量去估计 预测因变量 课件 44 回归分析的分类 根据变量的多少分为 简单回归 只有一个自变量和一个因变量的回归 多元回归 自变量数目在两个或两个以上 根据建立的回归模型形式分为 线性回归 从所拟合的回归模型来看 一变量表现为其它变量的线性组合 非线性回归 从所拟合的回归模型来看 一变量表现为其它变量的非线性组合 课件 45 回归分析与相关分析 理论和方法具有一致性 无相关就无回归 相关程度越高 回归越好 相关系数和回归系数方向一致 可以互相推算 联系 课件 46 相关分析中x与y对等 回归分析中x与y要确定自变量和因变量 相关分析中x y均为随机变量 回归分析中只有y为随机变量 相关分析测定相关程度和方向 回归分析用回归模型进行预测和控制 回归分析与相关分析 区别 课件 47 简单线性回归模型 指根据成对的两个变量的数值 配合直线方程式 根据自变量的变动 来推算因变量发展变动趋势的方法 其模型为 其中 Yi表示因变量Y在总体中某一个具体的观察值 Xi表示在研究总体中自变量X的具体观察数值 A与B是参数 称为回归系数 i是一个随机变量 其平均数为0 方差为 2 总体回归模型 课件 48 总体一元线性回归模型 误差项 假定 E 0 总体一元线性回归方程 课件 49 简单线性回归模型的假设 1 正态性假定当确定某一个Xi时 相应的Y就有许多Yi值与之对应 Yi是一个随机变量 这些Yi构成一个在X取值为Xi条件下的条件分布 并假设其服从正态分布 2 同方差假定假定所有Yi这一条件分布的方差是相等的 3 线性假定假定所有Yi这一条件分布的平均数位于一条直线上 这条直线为Yi A BX 4 独立性假定假定Yi之间是独立的 也就是说抽样时 Y的值在每取一个X值的条件分布相互独立 课件 50 一元线性回归模型的假定 课件 51 在实际应用中 我们对X和Y所代表的总体往往不可能全面的观察和了解 而只能从中抽取部分资料作为样本 并通过样本提供的信息来认识总体 找出总体回归模型的估计式 其估计式的方程式可写为 简单线性回归模型 其中 a b和ei分别为A B及 i的估计量 由于抽样的随机性 使样本回归线不可能与总体回归完全重合 从而会出现样本回归函数高估或低估总体回归函数的情况 我们能做的就是设法使样本回归函数尽可能接近总体回归函数 也就是说要使回归方程参数的估计值a b尽量接近总体真实参数A B 样本回归模型 课件 52 一元线性回归方程的几何意义 回归直线的拟合 课件 53 总体一元线性回归方程 样本一元线性回归方程 以样本统计量估计总体参数 截距a表示在没有自变量x的影响时 其它各种因素对因变量y的平均影响 回归系数b表明自变量x每变动一个单位 因变量y平均变动b个单位 课件 54 课件 55 残差 Residual e 课件 56 一元线性回归方程中参数a b的确定 最小平方法 课件 57 整理得到由两个关于a b的二元一次方程组成的方程组 进一步整理 有 课件 59 分析 因为工业总产值与能源消耗量之间存在高度正相关关系 所以可以拟合工业总产值对能源消耗量的线性回归方程 例 建立工业总产值对能源消耗量的线性回归方程资料 课件 60 即线性回归方程为 计算结果表明 在其他条件不变时 能源消耗量每增加一个单位 十万吨 工业总产值将增加0 7961个单位 亿元 课件 61 最小二乘法估计的优良性质 课件 62 b与r的关系 课件 63 回归模型的检验 1 拟合优度检验确定回归直线后 需要评价这一直线方程是否有效地反映了这两变量之间的关系 评价回归方程配合好坏的一个主要指标是判定系数 或称确定系数 2 判定系数是相关系数的平方 用表示 用来衡量回归方程对y的解释程度 判定系数取值范围 越接近于1 表明x与y之间的相关性越强 越接近于0 表明两个变量之间几乎没有直线相关关系 课件 64 误差平方和 回归平方和 总离差平方和 课件 65 总偏差 回归偏差 剩余偏差 r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释 r的符号同b 数量关系及意义 课件 66 判定系数与相关系数的关系 课件 67 课件 68 判定系数与相关系数的区别 判定系数无方向性 相关系数则有方向 其方向与样本回归系数b相同 判定系数说明变量值的总离差平方和中可以用回归线来解释的比例 相关系数只说明两变量间关联程度及方向 相关系数有夸大变量间相关程度的倾向 因而判定系数是更好的度量值 课件 69 Lyy U Q 总离差平方和 回归平方和 误差平方和 课件 70 回归分析中我们最关心的是 X与Y是否有真正的相关关系 即 课件 71 回归系数的检验 提出假设 确定检验统计量 给定显著性水平 确定临界值 确定原假设的拒绝规则 计算检验统计量并做出决策 课件 72 统计理论已经证明 课件 73 课件 74 课件 75 课件 76 课件 77 检验统计量落入拒绝域中 故拒绝原假设 接受备择假设 即可以认为b明显地不等于零 X与Y是显著的 课件 78 F检验是基于F分布进行的 是方差分析内容之一 均方回归 均方误差 课件 79 当 1 0时 SSR 0 则F值 0 当 1 0时 SSR 0 则F值 0 当我们设 1 0时 则较大的F值将推翻这一假设 故拒绝原假设 接受备择假设 即认为回归方程是显著的 课件 80 估计的前提 回归方程经过检验 证明X和Y的关系在统计上是显著的 回归分析的点估计 对于给定的X值 求出Y平均值的一个估计值或Y的一个个别值 若x 169 则 课件 81 利用点估计得到的Y平均值的点估计值和Y的一个个别值其结果是相同的 点估计不能提供估计量的精确度 在样本自变量取值范围之外进行预测要特别谨慎 使用点估计应注意的问题 课件 82 回归分析的区间估计 对于给定的X值 求出Y的平均值的置信区间或Y的一个个别值的预测区间 课件 8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论