




已阅读5页,还剩95页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章相关关系分析法 西安石油大学经管院 第七章相关分析 相关关系分析概述简单直线相关分析简单直线回归分析曲线回归及多元线性回归分析其他相关系数的介绍 研究内容 本章学习目的 通过本章的学习要求理解相关分析和回归分析的有关概念 研究内容 掌握计算相关系数和配合回归方程的方法 并能结合实际资料对变量进行相关与回归分析 本章重点难点 重点 相关关系的概念和种类 相关系数的计算及应用 回归分析的概念 配合直线回归方程的方法 参数a和b的经济含义 难点 相关系数的计算 配合直线回归方程的方法 相关分析与回归分析的区别与联系 估计标准误的计算 一 函数关系 第一节相关关系分析概述 一 相关关系的的概念 函数关系 是指变量之间存在着严格的依存关系在这种关系中 当自变量取定一个数值时 因变量会有一个完全确定的值和它对应 或对于某一变量的每一个数值 另一变量都会有唯一确定的值与之相对应 并且这种关系可用一个数学表达式反映出来 如图1 1所示 如圆的面积 圆周率 半径2 销售额 销售量 销售价格 价格一定时 相关关系分析概述 距离 速度 时间 在匀速条件下 图1 1 相关关系分析概述 二 相关关系 相关关系 它是指现象之间确实存在的 但关系值不固定的相互依存关系 或现象之间客观存在的不严格 不确定的数量依存关系 如图1 2所示 例如粮食亩产量与施肥量之间 某种日用品的销售量与当地居民的人口数 身高与体重之间等 图1 2 相关关系分析概述 不相关 若两种现象之间彼此互不影响 其数量变化各自独立 则为不相关 一 按相关的程度分为 完全相关 不完全相关和不相关 完全相关 两种现象之间 其中一个现象的数量变化完全由另一个现象的数量变化所确定 则这两种现象之间的关系为完全相关 不完全相关 若两种现象之间的关系介于完全相关和不相关之间 则称其为不完全相关 二 相关关系的种类 相关关系分析概述 二 按变量之间相关关系的方向分 按相关的性质分 正相关和负相关 正相关 当一个变量x的值增加 或减少 另一个变量y的值也随之增加 或减少 同方向变动 例如 家庭的消费支出随着收入的增加而增加 随着技术水平的提高 产品合格率也不断提高等 负相关 当一个变量x的值增加 减少 时 另一个变量y的值随之减少 增加 反方向变动 例如 商品流转的规模越大 单位流通费用越低 劳动生产率水平提高 单位产品成本随之下降 相关关系分析概述 正相关 负相关若用散点图表示如图1 3中 1 2 所示 相关关系分析概述 图1 3 三 按相关的形式分 直线相关和曲线相关 直线相关 当一个变量发生增减变动时 另一变量随之发生大体均等的增减变动 或一种现象的一个数值和另一种现象相应的数值 在平面坐标系中确定为一个点 称为散点 相关点 若相关点大致分布在一条直线的周围 则为线性相关 曲线相关 当一个变量发生变动时 另一变量的值也随之发生变动 但这种变动是不均等的 在图形上 其观察点分布在各种不同的曲线周围 相关关系分析概述 图1 4为直线相关图 1 2 图1 5为曲线相关图 3 4 相关关系分析概述 图1 4 图1 5 四 按研究变量的多少分 单相关和复相关 单相关 研究两个变量之间的相关关系为单相关 即一个因变量和一个自变量之间的相关关系 例如 劳动生产率与单位产品成本之间的关系 收入水平 y 与受教育程度 x 之间的关系 复相关 研究三个或三个以上变量之间的相关关系 例如 同时研究商品的销售额 广告费支出 居民收入水平之间的关系 研究某种商品的需求量与价格水平及人们的收入水平之间的关系 相关关系分析概述 相关关系的图示 相关关系分析概述 确定经济现象之间是否存在相关关系及相关关系的种类 确定经济现象之间相关关系的密切程度 建立经济现象之间数量变动关系的数学方程式 确定因变量估计值误差的程度 三 相关关系分析的主要内容 任务 相关关系分析概述 研究内容 现象之间是否存在相关关系相关关系的种类相关关系的密切程度 第二节简单直线相关分析 简单直线相关分析 一 相关表 概念 将相关两个变量的对应数值按照一定的顺序或规格排列在一张表格上所形成的统计表 种类 按照资料是否分组相关表分为 简单相关表和分组相关表 简单相关表 是指资料未经分组 只将一个变量的数值按照从小到大 或时间 顺序 并配合相应的另一个变量的变量值一一对应而平行排列起来形成的表 一 相关表和相关图 简单直线相关分析 简单直线相关分析 分组相关表 是根据分组资料编制的相关表 单变量分组表 简单直线相关分析 双变量分组表 简单直线相关分析 二 相关图 使用年限 简单直线相关分析 一 相关系数的含义 相关系数 是说明两种现象之间直线相关关系密切程度的统计分析指标 二 相关系数的一般公式 二 相关系数 简单直线相关分析 协方差的作用 显示x与y之间相关的性质 即是正相关还是负相关 显示x与y相关程度的大小 标准差作用 消除离差积乘中两个变量原有计量单位的影响 将名数局限在 1到 1之间 简单直线相关分析 证明 同理 简单直线相关分析 根据 可得 2r 2 0 则 1 r 1 2r 2 0 r 1 r 1 简单直线相关分析 例 某市工资性现金收入与城镇储蓄存款余额资料及其相关系数的计算过程如下表 简单直线相关分析 经过计算 表明该市工资性现金收入与城镇储蓄存款余额之间存在着高度正相关 简单直线相关分析 判断相关关系密切程度的标准为 微弱相关 低度相关 显著相关 高度相关 完全相关 不相关 r 0 3 0 3 r 0 5 0 5 r 0 8 0 8 r 1 r 1 简单直线相关分析 三 相关系数的简化式 通过变量代换 可将相关系数的计算公式简化为如下公式 它可以直接利用原始变量值的和计算 简单直线相关分析 证明 同理 简单直线相关分析 由单变量分组表计算相关系数 或 简单直线相关分析 式中 简单直线相关分析 令 则 简单直线相关分析 如前面未分组资料 其相关系数的计算过程为 简单直线相关分析 计算结果表明 机床使用年限与维修费用之间为高度正相关 简单直线相关分析 三 简单直线相关分析的特点 1 用于相关分析的两个变量是对等的关系 不分自变量和因变量 4 用于相关分析的两个变量均为随机变量 2 只能计算出一个相关系数 3 相关系数r的有正负号 分别表示正相关 负相关 简单直线相关分析 第三节简单直线回归分析 回归分析法 就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定 确立一个相应的数学表达式 以便从一个已知的量来推测另一个未知的量 或 用数学方程式来反映经济现象之间数量变化的一般关系的方法叫回归分析法 这里的数学表达式叫回归方程 一 回归分析的意义 简单直线回归分析 简单直线回归分析的特点 1 在两个变量之间必须根据研究的目的确定哪个是自变量 哪个是因变量 2 在没有明显因果关系的两个变量中 可配合两个回归方程 值得注意的是 若两个变量存在明显的因果关系时 只能计算一条回归直线 另一条配合出来也没意义 3 回归方程的作用在于给出自变量的数值来估计因变量的可能值 简单直线回归分析 5 回归分析中 因变量是随机的 而把自变量当作研究时可以控制的量 即在给定不同自变量的数值下 观察对应的因变量数值的变化情况 4 直线回归方程中 自变量的系数b称为回归系数 回归系数的符号为正时表示正相关 为负表示负相关 简单直线回归分析 配合直线回归方程的前提条件是 两个变量之间确实存在线性相关关系 而且其相关的紧密程度至少是显著的 一 回归方程的建立 简单直线回归方程的一般形式为 二 直线回归方程的建立和求解 判断资料的变动规律及相关点的分布规律 当随着 的变动 的增长量大致相等时 或相关点分布在一条直线周围时 可配合直线回归方程 简单直线回归分析 若一条直线上的点和实际相关点的离差平方和为最小值 则这条直线是最理想的 二 参数a b的求解 根据这个条件所配合的方程叫最小二乘法 参数a b常用最小平方法来求解 b 回归直线的斜率 称回归系数 表明x每增加一个单位 因变量yc的平均变化值 b 0 x与y为正相关 b 0 x与y为负相关 式中 yc 因变量的估计值 x 自变量 a 回归直线在y轴上的截距 x等于0时y的值 简单直线回归分析 根据极值原理 令 则 对参数a b分别求偏导等于零得 即 简单直线回归分析 根据前面维修费用和机床使用年限资料 则 简单直线回归分析 回归方程的一个重要意义在于根据自变量的已知值推算因变量的可能值 回归直线的代表性如何 一般是通过估计标准误差指标加以检验的 它是用来说明回归直线代表性大小的统计指标 其原理与前面讲过的衡量平均数的代表性的原理相同 不同的是 前面说明平均数的代表性 而这里说明的是平均线或趋势线的代表性 三 估计标准误差 一 估计标准误差的意义 简单直线回归分析 二 估计标准误差的计算方法 2 根据参数a b计算 估计标准误差是说明回归方程代表性大小的统计分析指标 其值小 表明方程代表性大 反之说明方程代表性小 1 根据因变量的实际值和估计值的离差计算 简单直线回归分析 证明 已知 则 简单直线回归分析 例1 由前资料根据因变量的实际值和估计值的离差计算 简单直线回归分析 解 说明维修费的实际值和估计值是有差距的 这个差距有的大 有的小 平均来说为88 33元 简单直线回归分析 例2 由前面资料根据参数a b计算估计标准误差 a 329 25b 76 15n 12 维修费的实际值和估计值是有差距的 这个差距有的大 有的小 平均来说为88 33元 简单直线回归分析 三 估计标准误差和相关系数的关系 1 离差平方和的分解 因为 令 所以 简单直线回归分析 如图3 1 3 2所示 图3 1 简单直线回归分析 简单直线回归分析 它表明总变差的产生受两个因素的影响 也就是由于x与y的线性依存关系而引起y的变化部分称为回归变差 受自变量变动的影响 若无u 点会如图3 3所示 图3 3 简单直线回归分析 两个变量之间关系的密切程度可由 决定 指除了x与y的线性依存关系影响外的一切因素对y的影响部分 即总变差中减去回归变差后剩余的部分 A 若估计误差Q为最大值 等于总变差时 u 0 与完全重叠 y的大小不受x的影响 如图 1 B 若估计值为最小值0时 估计误差 简单直线回归分析 C 若Q的数值愈大 表明所有的观察点离回归线愈近 因而也就表示x与y的线性关系愈密切 由此看来 两个变量之间关系的密切程度完全由Q来确定 Q越小 y与x的关系越密切 Q愈大 x与y关系愈不密切 而估计标准误差是Q的平均值 所以估计标准误差也叫剩余标准差 由此看来 绝对有关 表示所有的点y都落在回归线上 所以x与y完全线性相关 简单直线回归分析 2 估计标准误差与相关系数的关系 根据方差分解公式得 简单直线回归分析 r2称为判定系数 表明已判明的因素在总变差中所占比重的大小 r2比重越大 Q所占比重越小 点与直线的距离越近 简单直线回归分析 或 这里的r称为方差法相关系数 它既适合于线性相关 也适合于非线性相关 在非线性相关条件下 用R表示 称为相关指数 r只取正值 但并不意味着表示正相关 线性相关是正相关 还是负相关由b决定 1 r2 1 简单直线回归分析 例1 检查5位同学学习时间与学习成绩如下表 解 经过计算 其直线回归方程为 简单直线回归分析 r2说明在总变差中 有91 35 可以由回归方程来解释 即已判明的因素在总变差中所占的比重为91 35 简单直线回归分析 说明理论分数与实际分数y之间平均误差为6 5分 这个数字与平均成绩62分对比约占10 48 r表明学习时数与成绩之间存在着高度的正相关关系 简单直线回归分析 第四节曲线回归及多元线性回归 一 曲线回归分析 在实践中 对已掌握的资料 应充分利用相关表 相关图 对相关点的分布特征进行分析判断 并结合一些已知的函数图形知识 选择适当的数学模型 再用可行的方法求解参数 一般用最小二乘法 许多情况下 非线性回归问题可以通过变量的变换转化成线性回归方程 计算简单方便 若增长速度大致相同 若二级增长量大致相同时 曲线回归及多元线性回归 若y比x的变化慢时用对数方程 若观察值的倒数的一级增长量大致相等时 可为其配合逻辑曲线 曲线回归及多元线性回归 二 多元线性回归分析 统计中研究一个因变量与多个自变量之间数量关系的理论和方法称为多元回归 多元回归分 多元线性回归 多元非线性回归 多元回归方程 是用于表达一个因变量和多个自变量之间相互关系的一种数学模型 当研究因变量y与n个自变量的关系时 方程为 曲线回归及多元线性回归 为回归系数 表示当其它自变量都固定时 设自变量变动一个单位 而使y平均变动的数值 一般来说 在y的所有影响因素中 可以找出几个主要影响因素 一般三个为宜 则方程为 求解其对数a 仍用最小二乘法 曲线回归及多元线性回归 第五节其它相关系数的介绍 一 复相关系数 线性条件下 它是测定两个或多个变量对某一特定变量之间关系密切程度的指标 当研究的是三个自变量与一个因变量的平均相关程度时 复相关系数可以用下式表示 其它相关系数的介绍 其余两个同理 R愈接近1 线性相关愈密切 相反R愈接近0 线性相关关系愈不密切 其它相关系数的介绍 二 偏相关系数 偏相关系数表示y对自变量x的纯 净 依赖程度 一级偏相关系数 剔除1个影响因素 其中 K为剔除因素 表示剔除了K的影响后i与j之间的净相关关系 其它相关系数的介绍 二级偏相关关系不数 剔除2个因素影响 其中 KL为剔除因素 表示剔除了KL的影响后i与j之间的净相关关系 其它相关系数的介绍 三 点双列相关 连续变量与二分型变量关系 在x与y两个变量数列中 若一个变量属于连续变量 而另一个变量属于 二分 型变量 男 女 成功 失败 对 错 合格 不合格等 为了测定二分型变量对另一连续型变量之间关系的密切程度 则用点双列相关系数用rb表示 是非标志的标准差 连续变量y的标准差 其它相关系数的介绍 P 具有某种属性的单位占总体单位数的比重 q 不具有某种性的单位占总体单位数的比重 与具有某种属性的单位对应的y的平均值 与不具有某种属性的单位对应的y的平均值 例如 某班有14名学生 男9人 女5人 男生统计学成绩分别为65 68 70 71 72 72 74 75 81 女生统计学的成绩分别为62 65 70 73 80 试计算性别与学习成绩之间的相关系数 其它相关系数的介绍 解 男生所占比重为 女生所占比重为 q 1 p 男生的平均成绩为 女生的平均成绩为 说明统计学成绩与性别无关 全班学生成绩的标准差为 其它相关系数的介绍 四 相关系数 均为二分型变量 当两个关联着的变量都是二分型的 要研究这两个变量之间相关关系的密切程度则用 相关系数 符号表示见表5 1 表5 1 其它相关系数的介绍 例如 婚姻状态与性别的关系 总的调查25岁以上的人412人 男女各半 其状况如下表 试计算二者之间的相关系数 解 说明婚姻状态与性别之间关系很微弱 其它相关系数的介绍 五 等级相关系数 它是将相关着的两个变量分别从小到大的顺序排列成等级顺序1 2 3 形成两个序数数列 然后再测定这两个数列之间相关关系的密切程度的方法 它既适合品质标质 也适合数量标志 在赋予等级时 若有相同的数值时 按其应有的等级赋予其平均等级 如 有两个人的数学成绩是65分 应排为5 6级 就各赋予5 5级 公式为 d为对应等级之差 其它相关系数的介绍 若两种等级恰好相反 完全负相关 若x与y的编号一致 即增加 有规律地增加 二者为正相关 反之为负相关 其它相关系数的介绍 例1 某企业工人数和产值资料见下表 试计算等级相关系数 其它相关系数的介绍 解 说明工人人数和总产值之间存在高度的正相关关系 例2 某企业组织一次技术操作劳动竞赛 参赛者是不同技术等级工人中的佼佼者 事后按竞赛优胜名次排列如下表 计算相关系数 其它相关系数的介绍 解 说明劳动竞赛名次与技术级别高低呈显著等级相关 名排列朝前 技术等级越高 其它相关系数的介绍 谢谢大家 你们辛苦了 EndofChapter 本章小结 第一节相关关系分析概述 一 相关关系的概念 一 函数关系 二 相关关系 相关分析的对象 二 相关关系的种类 一 按相关因素的多少可分为单相关和复相关 二 按相关的形式可分为线性相关和曲线相关 三 按相关的方向可把直线相关分为正相关和负相关 四 相关程度可分为完全相关 不完全相关和不相关第二节简单直线相关分析一 相关表和相关图二 相关系数 一 相关系数的概念和计算公式 二 相关系数的取值范围 三 利用相关系数判别相关关系密切程度和方向的方法与标准三 直线相关分析的特点 1 相关分析的两个变量是对等的关系 它不分自变量和因变量2 用于相关分析的两个变量均为随机变量3 相关系数只有一个4 相关系数r的取值范围在 1到 1之间 当r大于零时 为正相关 小于零时为负相关 第二节简单直线回归分析 一 回归分析的概念二 简单线性回归方程的建立回归直线方程中的参数a和b的几何及经济含义 参数a和b的求解方法 三 回归分析的特点1 用于回归分析的两个变量不是对等的关系 必须依据研究的目的 确定哪个是自变量x 哪个是因变量y 2 用于回归分析的两个变量中 自变量x是给定的数值即它是非随机变量 因变量y是随机变量 3 回归分析的作用在于给出自变量x的数值来估计因变量y的可能值 所以 一个回归方程只能作一种推算 即由自变量x推算因变量y 而不能由因变量y推算自变量x 即不能回归方程逆推 推算的结果表明两个变量之间的因果对应关系 4 对于没有明显因果关系的两个变量x与y 可求出两个回归方程 计算出两个回归系数 5 直线回归方程的回归系数有正负号 说明变量变动的方向 四 估计标准误估计标准误的大小与回归方程的代表性大小成反比例变化 本章思考与练习题 一 思考题 简答题 二 单项选择题三 多项选择题四 填空题五 计算题 一 思考题 1 什么是相关关系 它与函数关系有何区别和联系 2 相关关系的种类有哪些 3 简述相关系数的概念及其取值范围 4 简单直线相关分析有什么特点 5 与相关分析比较 回归分析有哪些特点 6 回归直线方程中的参数a和b的几何及经济含义是什么 7 简述相关分析和回归分析的区别和联系 10 什么是相关系数 在相关系数r的计算公式中 标准差和协方差所起的作用分别是什么 9 什么是相关关系 根据相关关系的密切程度将相关关系分为哪几种 试分别举出一例 12 说明相关系数的取值范围 详细说明如何利用相关系数来判断现象之间的相关的方向和程度 8 什么是估计标准误 它有哪些作用 二 单项选择题 在每小题的四个备选答案中选出一个正确的答案 并将正确答案的号码填在题干后的括号内 A 研究变量之间的变动关系B 研究变量之间的数量关系C 研究变量之间相互关系的密切程度D 研究变量之间的因果关系 A 单相关B 复相关C 正相关D 负相关 2 两个变量之间的相关关系叫 1 相关分析是 3 相关分析对资料的要求是 A 两变量均是随机变量B 两变量均不是随机的C 自变量是随机的 因变量不是随机的D 两变量均不是随机的 4 相关系数的取值范围是 A 0 r 1B 1 r 1C 1 r 1D 1 r 0 5 每一吨铸铁成本 元 倚铸件废品率 变动的回归方程为 yc 56 8x 这意味着 A 废品率每增加1 成本每吨增加64元B 废品率每增加1 成本每吨增加8 C 废品率每增加1 成本每吨增加8元D 如果废品率增加1 则每吨成本增加56元 三 多项选择题 从每小题的五个备选答案中选出二至五个正确答案 并将正确答案的号码分别填写在题干后的括号内 1 相关分析中的负相关是指 A 自变量数值增加 因变量数值也增加B 自变量数值增加 因变量数值相应减少C 自变量数值减少 因变量数值也减少D
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高校课程教学质量评估方案
- 小学数学知识点全面复习提纲
- 制造业设备维护技术操作规程
- 2025年营养学饮食膳食搭配方案评估模拟测试卷答案及解析
- 学生课外阅读推广活动策划方案
- 基层医疗机构健康服务提升方案
- 多渠道市场推广方案范例
- 中考英语副词专项训练题汇编
- 标准货物买卖合同范本
- 高考英语时态重点解析
- 电信公司炒店活动方案
- 2024年食品安全抽检监测技能大比武理论考试题库(含答案)
- 《 大学生军事理论教程》全套教学课件
- 小学道德与法治学科教师专业素质考试试题及答案
- GB∕T 23322-2018 纺织品 表面活性剂的测定 烷基酚和烷基酚聚氧乙烯醚
- 全国质量奖现场汇报材料(生产过程及结果)课件
- 政策评价-卫生政策分析课件
- 高中物理实验—测定物体的速度及加速度(含逐差法)
- 饮食习惯与健康
- 华为人力资源管理纲要2.0
- 第二章 园艺设施的类型、结构、性能及应用
评论
0/150
提交评论