




已阅读5页,还剩63页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章相关与回归分析 教学目的与要求 掌握相关关系的含义 以及相关关系与函数关系的区别 了解相关分析的内容 掌握相关关系的判别方法和类型 理解回归分析的实质 熟悉回归分析与相关分析的区别与联系 掌握一元线性回归分析方法和应用 本章主要内容 第一节相关分析 第二节回归分析 第一节相关分析 客观存在的各种现象之间的相互联系 都可以表现为一定的数量关系 研究现象之间的数量关系 则是回归分析和相关分析的宗旨 现象之间的相互联系 在许多情况下 表现为一定的因果关系 将这些现象数量化 则成为变量 其中起着影响作用的变量称为自变量 受自变量影响而发生变动的变量称为因变量 现象之间的相互关系 可以概括为两种不同的类型 即函数关系和相关关系 一 函数关系 相关关系的概念 1 函数关系 函数关系是一种严格的依存关系 这种关系可以用y f x 的方程来表现 2 相关关系 相关关系是一种不完全确定的随机关系 a 相关关系是指现象之间确实存在数量上的相互依存关系 b 现象之间数量依存关系的具体关系值不是固定的 函数关系 是一一对应的确定关系设有两个变量x和y 变量y随变量x一起变化 并完全依赖于x 当变量x取某个数值时 y依确定的关系取相应的值 则称y是x的函数 记为y f x 其中x称为自变量 y称为因变量各观测点落在一条线上 函数关系 几个例子 某种商品的销售额y与销售量x之间的关系可表示为y px p为单价 圆的面积S与半径R之间的关系可表示为S R2企业的原材料消耗额y与产量x1 单位产量消耗x2 原材料价格x3之间的关系可表示为y x1x2x3 相关关系 correlation 变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个值时 变量y的取值可能有几个各观测点分布在直线周围 相关关系 几个例子 父亲身高y与子女身高x之间的关系收入水平y与受教育程度x之间的关系粮食单位面积产量y与施肥量x1 降雨量x2 温度x3之间的关系商品的消费量y与居民收入x之间的关系商品销售额y与广告费支出x之间的关系 函数关系与相关关系的联系 由于有观察或测量误差等原因 函数关系在实际中往往通过相关关系表现出来 在研究相关关系时 又常常要使用函数关系的形式来表现 以便找到相关关系的一般数量表现形式 二 相关关系的种类 1 按相关的程度划分 完全相关 不完全相关 不相关 2 按相关的方向划分 正相关 负相关 3 按相关的形式划分 线性相关 非线性相关 4 按影响因素的多少划分 单相关 复相关 散点图 scatterdiagram 三 相关分析内容 1 确定相关关系的存在 形态和方向2 确定相关关系的数学表达式3 确定因变量估计值及误差的程度 四 相关关系的判别方法 一 相关图表 相关图表是相关分析的重要方法 通过相关图表可以直观地判断现象之间呈现的相关的形态和方向 相关表 简单相关表 分组相关表 单变量分组相关表 双变量分组相关表 相关图 利用直角坐标系第一象限 把自变量置于横轴上 因变量置于纵轴上 在将两变量相对应的变量值用坐标点形式描绘出来即可 广告费与月平均销售额相关表单位 万元 二 相关系数 相关系数是测定变量之间相关密切程度的统计指标 1 相关系数的计算方法 相关系数按 积差法 计算 该方法是通过两变量与各自平均值的离差的乘积来反映两变量之间的相关程度 积差法公式为 计算相关系数的简化式 相关系数计算分析例题 1 44 4 00 9 61 14 44 25 00 17 21 51 84 64 00 207 54 3844 7396 6400 12100 13225 17424 18225 25600 104214 74 4 172 0 248 0 418 0 575 0 805 2 972 0 1280 0 4544 6 根据计算结果可知 则相关系数为 说明产量和生产费用之间存在高度正相关 2 相关系数的意义 相关系数一般可以从正负符号和绝对数值的大小两个层面理解 正负说明现象之间是正相关还是负相关 绝对数值的大小说明两现象之间线性相关的密切程度 1 r的取值在 1到 1之间 2 r 1 为完全正相关 r 1为完全负相关 表明变量之间为完全线性相关 即函数关系 3 r 0 表明两变量无线性相关关系 4 r 0 表明变量之间为正相关 r 0 表明变量之间为负相关 5 r的绝对值越接近于1 表明线性相关关系越密切 r越接近于0 表明线性相关关系越不密切 相关程度可分为以下几种情况 为无线性相关 0 3 0 5 为低度线性相关 0 5 0 8 为显著线性相关 0 8 一般称为高度线性相关 以上说明必须建立在相关系数通过显著性检验的基础之上 五 相关系数 3 相关系数的显著性检验 样本相关系数的检验包括两类检验 1 对总体相关系数是否等于0进行检验 2 对总体相关系数是否等于某一给定的不为0的数值进行检验 相关分析 对总体相关系数是否等于0的检验 总体相关系数检验统计上用t检验 步骤如下 提出原假设和备择假设 假设样本相关系数r是抽自具有零相关的总体 即 五 相关系数 2 规定显著性水平 依据自由度 n 2 确定临界值 3 计算检验的统计量4 做出判断 将计算的统计量与临界值对比 若统计量大于或等于临界值 表明变量间线性相关在统计上是显著的 若统计量小于临界值 则说明相关关系在统计上并不显著 取显著性水平 根据自由度查分布表得 2 4469 例4 对例3中产品产量与生产费用间的相关系数检验 9 7236 计算检验的统计量 提出原假设和备择假设 由于 则拒绝 表明变量间线性相关在统计上是显著的 即产品产量与生产费用之间的相关系数是显著的 第二节回归分析 一 回归分析的意义 回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定 确立一个相应的数学表达式 以便从一个已知量来推测另一个未知量 为估算预测提供一个重要的方法 二 回归分析的特点 1 在变量之间 必须根据研究目的具体确定哪些是自变量 哪个是因变量 2 回归方程的作用在于 在给定自变量的数值情况下来估计因变量的可能值 一个回归方程只能做一种推算 推算的结果表明变量之间具体的变动关系 3 直线回归方程中 自变量的系数为回归系数 回归系数的符号为正时 表示正相关 回归系数的符号为负时 表示负相关 4 确定回归方程时 只要求因变量是随机的 而自变量是给定的数值 三 回归分析的类型 四 回归分析与相关分析的区别 1 回归分析必须区分自变量和因变量 而相关分析不必区分 2 回归分析的两个变量一个是自变量 一个是因变量 通过给定自变量的值来推算因变量的可能值 而相关分析的两个变量都是随机变量 3 回归分析中对于因果关系不甚明确的两个变量 可以建立两个回归方程 而相关分析只能计算出一个相关系数 4 一种回归方程只能做一种推算 即只能给出自变量的值来推算因变量的值 不能逆推 五 一元线性回归方程确定 1 一元线性方程式的一般形式 当两变量的增长比率为常数时 它们之间就呈现为一种一元线性关系 一元线性回归方程进行回归分析的前提 所分析的两个变量之间必须存在相关关系 且相关程度在显著相关以上 对两变量进行一元线性回归分析的任务 设法在分散的 具有线性关系的相关点之间配合一条最优的直线 以表明两变量之间具体的变动关系 在两变量相关的散点图中 引出一条最优的直线 这条直线就是估计回归线 它表明了两变量数量变动的一般关系 配合估计回归线的方程称为回归方程 方程式为 回归系数b的经济涵义 当自变量变动一个单位时 因变量的平均变动值 KarlGauss的最小化图 x y xn yn x1 y1 x2 y2 xi yi 2 求解直线回归方程的方法 求解直线回归方程的过程就是求解方程系数a b的过程 求解a b的方法一般采用最小平方法 用最小平方法配合回归直线的基本思想是 在所有的相关点中 通过数学方法配合一条较为理想的直线 这条直线必须满足两点 2 原数列与趋势线的离差平方和为最小值 即 1 原数列与趋势线的离差之和为零 即 通过求a b的一阶偏导可得到求解a b的联立方程 解联立方程得到 根据前面例题资料配合生产费用依产量变化的回归方程 则回归方程为 回归系数b的涵义 月产量每增加1000吨 生产费用平均增加12 9万元 计算得到 要求 分析两变量相关密切程度 若为显著相关以上 则对两变量进行回归分析 有某地区人均年收入与耐用消费品销售额资料如下 答案 相关系数r 0 98b 0 24a 1 13yc 1 13 0 24x 回归系数b的涵义 人均年收入每增加一元 耐用消费品销售额平均增加0 24万元 六 回归系数与相关系数的关系 因为 所以 即 七 回归分析预测步骤 第四点不介绍 1 确立预测目标 寻找影响因素2 收集整理因变量和自变量的有关资料3 建立回归预测模型4 进行相关分析 方差分析和显著性检验5 进行预测 表1 产品产量与生产费用相关表 例1 某地区某企业近8年产品产量与生产费用的相关情况如表所示 从表可看出 产品产量与生产费用之间存在一定的正相关关系 表2相关系数计算表 以表2资料 建立一元线性回归模型 3 回归方程的显著性检验 略 对于回归方程进行显著性检验基于以下两点 第一 在根据样本数据拟合回归方程时 我们首先假设变量x与y之间存在着线性关系 但这种假设是否成立 就必须通过检验才能证实 第二 样本回归方程中的Yc是对总体回归方程中参数Y的最小二乘估计值 样本回归系数b能否作为总体回归系数 的估计值 还需要对总体回归系数 的显著性进行检验 回归方程的检验一般包括两个方面的内容 一是线性关系的检验二是回归系数的检验 1 线性关系的检验具体方法是将回归离差平方和 SSR 同剩余离差平方和 SSE 加以比较 应用F检验来分析二者之间的差别是否显著 检验的具体步骤如下 第一步 提出假设 H0 0 H1 0 第二步 计算检验统计量F可以证明 在原假设成立的情况下 F统计量服从F分布 第一自由度为1 第二自由度为n 2 即F F 1 n 2 例 以表1的资料为例 对其回归模型作F检验 以表1的资料为例 处理的简要步骤与结果如下 在EXCEL主页面中 从 工具 数据分析 回归 进入回归分析的窗口做相应处理得如下图所示结果 一元线性回归问题的EXCEL处理 由上图可知 相关系数R 0 9697 F检验回归方程显著 t检验回归系数P值小于0 05 说明回归系数是显著的 于是有可预测的回归方程 F检验的步骤 2 回归系数的检验 回归系数的检验 续 例 以表1为例 对回归模型做回归系数检验 由于 9 72345 拒绝 表明样本回归系数是显著的 生产费用与产品产量之间确实存在着线性关系 产品产量是影响生产费用的显著因素 于是 128 9599 13 26277 9 72345 取显著性水平 0 05 并根据自由度 6 查分布表得相应的临界值 以表1的资料为例 处理的简要步骤与结果如下 在EXCEL主页面中 从 工具 数据分析 回归 进入回归分析的窗口做相应处理得如下图所示结果 4 一元线性回归问题的EXCEL处理 由上图可知 相关系数R 0 9697 F检验回归方程显
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高龄老年高血压特点
- 济南市2025-2026学年七年级上学期语文期末测试试卷
- 集安市2025-2026学年九年级上学期语文期中模拟试卷
- 电费账务基本知识培训总结
- 电脑钉钉显示课件
- 高质量培智说课课件
- 高职考现在进行时课件
- 电脑电缆知识培训课件
- 高考常见谦敬词课件
- 第5课《一着惊海天》课件-2025-2026学年统编版语文八年级上册
- 2025年锅炉检验员资格考试试卷:锅炉检验员考试模拟试题与解析
- 淋巴瘤健康教育课件
- 《Sketch Up 软件运用》课件(共九章)
- 发酵饲料培训课件
- 煤灰管道清理方案(3篇)
- 电信营业员的理论考试题及答案
- 2025年河北大学版(2024)小学信息科技三年级(全一册)教学设计(附目录 P179)
- 安保技能活动方案
- 物资部档案管理制度
- 2025-2030中国烟花爆竹市场竞争动态分析及前景销售格局研究报告
- 2025年普通高等学校招生全国统一考试数学试题(全国一卷)(有解析)
评论
0/150
提交评论