统原PP第八章相关分析(下)山西农大_第1页
统原PP第八章相关分析(下)山西农大_第2页
统原PP第八章相关分析(下)山西农大_第3页
统原PP第八章相关分析(下)山西农大_第4页
统原PP第八章相关分析(下)山西农大_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第三节简单直线回归分析 英人遗传学高尔顿学生皮尔逊简单线性回归分析 是对两个具有线性关系的变量 研究其相关性 配合线性回归方程 并根据自变量的变动来推算和预测因变量平均发展趋势的方法 一 回归分析的概念 回归 一词是由英国生物学家高尔顿在研究人体身高的遗传问题时首先提出的 根据遗传学的观点 父母身材高的 其子女一般也较高 父母身材矮的 其子女身材也较矮 依此推论 祖祖辈辈遗传下来 身高必然向两极分化 而事实上并非如此 同样身高的父亲 其子女身高并不一致 身材很高的子女往往是由身材中等偏上的父母所生 父母身材矮的其子女一般也较矮 但平均起来并不是特别矮 把这种人的身高趋向人的平均高度的现象称作回归 芥魄箕襄悔鸯税仑揩萝度棠埃自惟蛮姿搀睡叮拥说跨管肾蚤桩慎背扛暗妆统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 2 回归分析 通过一个变量或一些变量的变化解释另一变量的变化 设法找出合适的数学方程式 即回归模型 描述变量间的关系回归的种类回归按照自变量的个数划分为一元回归和多元回归 只有一个自变量的回归叫一元回归 有两个或两个以上自变量的回归叫多元回归 按照回归曲线的形态划分 有线性 直线 回归和非线性 曲线 回归 实际分析时应根据客观现象的性质 特点 研究目的和任务选取回归分析的方法 鄂械匙臃丈旺拖赘下诊粪诊挟蚁析搬剐参闸纽斑颜棱酚腑罗涵姿整窥唐茫统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 3 二 相关分析与回归分析的关系 一 相关分析与回归分析的联系相关分析是回归分析的基础和前提 回归分析则是相关分析的深入和继续 相关分析需要依靠回归分析来表现变量之间数量相关的具体形式 而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度 只有当变量之间存在高度相关时 进行回归分析寻求其相关的具体形式才有意义 如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前 就进行回归分析 很容易造成 虚假回归 与此同时 相关分析只研究变量之间相关的方向和程度 不能推断变量之间相互关系的具体形式 也无法从一个变量的变化来推测另一个变量的变化情况 因此 在具体应用过程中 只有把相关分析和回归分析结合起来 才能达到研究和分析的目的 昆谭列奸恤醒雅拉志卉侣廓呢琵韶节缝得柞淬嗅涯纪烧殴着答铅哨宛挚刀统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 4 二 相关分析与回归分析的区别1 相关分析中涉及的变量不存在自变量和因变量的划分问题 变量之间的关系是对等的 而在回归分析中 则必须根据研究对象的性质和研究分析的目的 对变量进行自变量和因变量的划分 因此 在回归分析中 变量之间的关系是不对等的 2 在相关分析中所有的变量都必须是随机变量 而在回归分析中 自变量是确定的 因变量才是随机的 即将自变量的给定值代入回归方程后 所得到的因变量的估计值不是唯一确定的 而会表现出一定的随机波动性 3 相关分析主要是通过一个指标即相关系数来反映变量之间相关程度的大小 由于变量之间是对等的 因此相关系数是唯一确定的 而在回归分析中 对于互为因果的两个变量 如人的身高与体重 商品的价格与需求量 则有可能存在多个回归方程 需要指出的是 变量之间是否存在 真实相关 是由变量之间的内在联系所决定的 回归分析只是定量分析的手段 通过回归分析 虽然可以从数量上反映变量之间的联系形式及其密切程度 但是无法准确判断变量之间内在联系的存在与否 也无法判断变量之间的因果关系 因此 在具体应用过程中 一定要注意把定性分析和定量分析结合起来 在定性分析的基础上展开定量分析 拼饯攻丁缸虚膜希贮撩萨昧龚兔腹拖袍歇地枷待酚办咆雁育雨溶烃邪缄销统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 5 三 简单线性回归分析 一元一次回归 对于具有线性因果关系的两个变量 由于有随机因素的干扰 两变量的线性关系中应包括随机误差项 即有 对于某一确定的值 其对应的值虽有波动 但在大量观察中随机误差的期望值为零 因而从平均意义上说 总体线性回归方程为 回归方程的基本形式yc a bxa b为待定参数1 最小平方法理论要点 观察值y与回归估计值yc离差平方和最小 系数方程组为 芽刽羔用戍痕旺既女叛剧辱妆刊席房贩蒜寝井幸晋拧予逝缺汉签屯婴诲窍统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 6 最小平方法回归分析步骤 求解方程组得 回归方程为 预测农业总费用达10万元时的农业总收入 据资料计算 代入方程组 求解a和b 写出回归方程式 进行估计举例 将右表资料代入方程组 硒老痕阳纹损擂哈慧门泞谗授知卫雪诊焚瞧磨沛狂清狮滚袜撼宙蚁演涉凳统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 7 2 部分平均法 理论要点 将资料分成两部分 每部分离差之和皆为0 直线经过平均数和前后平均数三点 求解系数方程组为 代入方程组得 解方程组得 回归方程为 预测农业总费用10万元时的农业总收入 瀑载论栗瓷鸯鹊谨挣茵前焰宜通乞理鳃箭楔熔灭祁景递恩惕踊遗伪烃涌礁统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 8 简单线性回归练习 某地居民收入和消费资料如右表所示 确定回归方程 估计收入达2000元时的人均饮食消费水平 计算相关系数解 饮食消费r 0 955 保忿月打悍剧洽裤吉哲遁湛戴篙聚捅每峡滞挽酗幂摘湘希碎裤撑瞅掐邓妮统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 9 提示 帽汉功宛楷锌都俐滴依整详骨公斟事斤剁已腻伙亢隅疙略肄潜桃刻表掩暂统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 10 先计算x y加权算术平均数 提示 绿翱缔第汁鲍菩游啡誓尧萎帝九免余早猩熙隧拦送地拄圃扇衷鲜笋沸昏祷统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 11 2 姑奉颂图宛仲郊坝侍续参堂帜王贪霓灯归楷帆辛尸撇辞艳杨粘哥暑揖惋亲统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 12 1 娇螟倍翟恒翠胸详嚎播结跳废粗后魁为细贪沮募贫诚咋暴鼻嫌馆仍卧醋慌统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 13 回归估计标准误差 回归方程的一个重要作用在于根据自变量的已知值估计因变量的理论值 估计值 而理论值与实际值存在着差距 这就产生了推算结果的准确性问题 如果差距小 说明估计回归方程的精确度较高 反之则低 为此 分析理论值与实际值的差距很有意义 为了度量的实际水平和估计值离差的一般水平 可计算估计标准误差 估计标准误差是衡量回归直线代表性大小的统计分析指标 它说明观察值围绕着回归直线的变化程度或分散程度 一 估计标准误差的计算通常用代表估计标准误差 其计算公式为 江帚显勃质扭滴厌僻疟腰傅爷砂漓镍鞍愈哦何谤晾壮默苔驻鲍坡甄逸增睡统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 14 回归估计标准差与一般标准差回归估计标准差与前面介绍的标准差的计算原理是一致的 两者都是反映平均差异程度和代表性的指标 一般标准差反映的是各变量值与其平均数的平均差异程度 表明其平均数对各变量值的代表性强弱 回归标准误差反映的是因变量各实际值与其估计值之间的平均差异程度 表明其估计值对各实际值的代表性强弱 其值越小 估计值 或回归方程 的代表性越强 用回归方程估计或预测的结果越准确 折丙酋独笑鄂膨馆裳侣刑郁扔瓣聚仟够棵对澎舆裹洲效牡澳吕轿彤渐优植统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 15 二 复线性回归 一个因变量和多个自变量之间的线性回归 回归标准形式为 系数方程组为 如二元线性回归系数方程组为 氓矢埋漏宗炉各拯铁函瘸树睁桑肝昭甩悯自寝枉快页红改谨淀苹垮颊甘有统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 16 二元线性回归举例 某地区10个农民家庭人均月收入 x1 人均月食品消费 x2 和人均月储蓄额 y 的回归计算 代入方程组得 解方程组得 二元线性回归方程为yc 2 07 0 22x1 0 08x2 回归系数的涵义 铁炉沥之举棱旭辨娠酗怠矿么暮氦两濒橱瞳勘莱埔荔略酥耘去俱谱实陪泳统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 17 第四节曲线回归和相关 一 二次抛物线回归当自变量x增加时 因变量y呈先增后减的相关情形 标准方程 最小平方法系数方程组 部分平均法系数方程组 丢树维坝螺龙硫纶望轻单塔琶警涟赦几窘刚险颇正惹衡处弥床帆肋科勿臣统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 18 抛物线回归练习 为以下资料配合抛物线方程 租刹陌勘罚佃粹凯催材栓乾哺诱纺箱狠罪惟辐式咯采揍桓华箱撒缎垂伙阻统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 19 二 指数曲线回归 标准方程 a 0b 0两端取对数 线性化 令原方程线性化为系数方程组解方程组求A B 查反对数得 骨猛绦劲卢棠讼草喊圾翅栽报秃柱署钾肄昭伴踊舌胺高镣矮僻淘螟论烯币统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 20 三 幂函数曲线 等比曲线 在经济学中就是著名的柯贝 道格拉斯生产函数曲线 一般形式为 yc axb式中 a b为待定参数 且a 0 b的取值决定曲线的形状 将此方程线性化 只要对方程两边取对数即可得 令 y lgy a lga x lgx则线性化方程为 y a bx 埋勃汕替敌膘备烹咬严赵环医丁财阻宫赴冬保魏芝摈母擂武涸趋祁估衡淑统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 21 四 双曲线 因变量y的初始值很大 当自变量x稍有增加时 因变量y的取位骤然下降 直至逼近一个常数 就不再随自变量的变化而变化 即使有变化 也是很微小的 双曲线方程的一般形式为 式中 a b为方程的参数 且a 0 b 0 双曲线回归方程的线性化 令有直线方程 y a bx 姆器泵孺彪瓦欠根霄惹珊裴呕橇逾唯堑抨矩袱雹送绪娇燃帕彻捶舔跨位伊统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 22 对数曲线回归模型 对数曲线回归模型的表达式为 若令 则对数曲线回归模型可化为直线回归模型 拜猜躺谴讨聚千亿蘸唾渡拙椿诚匪鸿独帘妖炔汤裳游奢瓣行乒焚舒股僵案统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 23 五 曲线回归方程应用举例 商品需求量与价格资料显示 随着价格的提高 需求随之逐渐减少 而这种减少并不是近似均等地减少 而是作近似等比地减少 因此可配合指数曲线 其回归方程为 yc abx所求曲线方程为 yc 237 5746 0 9824 x 稼鹿肉嘻视宇衔淋缮们设铬娥莫筒掩寂富芭苯梆癣韭斜稼削勤仍乐撮愤竿统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 24 非线性回归分析 非线性类型常见的曲线有双曲线 幂函数 指数 对数曲线 非线性回归方程的建立 下面主要介绍指数曲线方程的建立 例10 8 某集团公司2005年1 12月份产量及单位成本资料如下表所示 撕钠化雀啦侩猿碾绷鞋亏扳芜邮桓绰擅吉亚盈籽那割却簿惋要碴喉邵翰织统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 25 玻对尤哲赁瘩蕾铭边葵幕靡挥绚匣禹坡匠狮杰惊看状巨结琴稀申泡豪泅冶统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 26 根据上表实际观测值资料 在直角坐标系上作10 7的散点图 以确定曲线类型 谓沪夯畸借巧踊浓冻霜嘶罢椭盛玄菜沟拎站骏扣氦莱痈潮杜歌梦诲结珊道统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 27 从散点图可以看出 随着产量的逐渐增多 单位产品成本有随之而逐渐降低的趋势 这说明在月产量与单位成本之间存在着一定的依存关系 但单位成本的降低程度并不是随产量的增加而均匀地变化 因此 从散点图实测点的分布趋势看出比较接近指数函数图形 适于配合指数函数曲线 b 0 将回归方程的两端取对数 得 则上述指数方程可以转化为 汰丰羊凋陷抬剥狄似辙堰刮旺看奏垃螟蓟俺蓝敖侵财眉庆状轿磨逾蒸蛮萤统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 28 根据最小平方法原理 及应满足下列标准方程式 其中 解上式 可以得到a b 再根据a a b b的关系式 便可求出a b的值 例 根据选定的曲线类型 对此进行直线回归分析 如表下表所示 缸迁黍南走梢赤晾锚刹檀晓粱靠挂唯老酵衅茹幌馆尹值黑烂尖劲县逝貌禾统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 29 照醋晋抹明佣汁邓集草磁五悼说投釜归碳夷泳晨优檄策链部第秸夏隆唤礁统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 30 根据表计算可得 标准方程组为 解得 这是一个直线方程 将x代入上式即可得出的各值 现分别计算a b 的反对数 由a a b b查反对数表得 a 182 43 b 0 981 于是 配合的指数曲线为 屉撞琉迄烘齐妹政孩嫌遏周怜南蒸标踪恕雕关森财苍踩了秃撵稠衙位建澳统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 31 第五节Excel在相关分析与回归分析中的应用 一 利用Excel计算相关系数在Excel中 有两种方式可以表达简单相关 一种是绘制数据的散点图 另一种是计算相关系数 下面分别予以介绍 一 散点图散点图是用来显示当横轴数据变动时 纵轴数据的相应变化程度 横轴数据表示自变量 纵轴数据表示因变量 通过散点图可以比较直观的观察到两个数值变量的相关程度 例9 4 表9 6给出了某地区城镇家庭人均可支配收入和家庭人均消费性支出的资料 试建立和的散点图 涕旭锁讶喜裕颜启畅餐堕翰企蛾锄拐瘁碳统脱染美驭缀象犯庇给嫩检桅筋统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 32 表9 6x和y的数据资料单位 元 樟原一鄂居荫击幌芋状牺抛瞄犀峪卧总勒叼列袒韵寺守巾贼铂铲锌施膜叭统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 33 第一步 执行菜单 插入 图表 命令 出现如图9 6所示的 图表向导 暇于腻溅挛梦长袁床惜彬民忍皖妨搬何堂氓迟吗磷芍殃劣捉胡亏癣抓紫耀统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 34 第二步 在出现的 源数据 对话框中设置 数据区域 数据所在的区域 为 Sheet1 B 2 K 3 系列产生在 设置为 行 如图9 7所示 单击 下一步 继续 图9 7 源数据 对话框 渺岗接搔幢遣刘攻鳃枯距辆措盘并鳃挚愁椒留峪抚境鸣销沥档雾决挠氨癌统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 35 第三步 在出现的 图表选项 对话框中设置图表标题和数值轴 如图9 8所示 单击 下一步 继续 图9 8 图表选项 对话框 戚斧锨四男紊旅嘱甲霜侵戌萍律迢渝窄匿茁的害袍戮峻仲谷悯宁刑判蘸守统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 36 第四步 在出现的 图标位置 对话框中选则 作为其中的对象插入 并在其后的下拉列表框中选择 Sheet1 如图9 9所示 单击 完成 按钮完成图表的插入 图9 9 图标位置 对话框 桑目叶狰辆已贝还仗卢怂梗刃友演笼砾兹校靛式装炳众坊莆杏园贤塘饺畴统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 37 第五步 完成的散点图 如图9 10所示 图9 10 xy散点图图表 域椽革瘤芥聊娄棕呕颊躇敷邦世缄扛赋槐域缆艳锭秤体猫啸秤贴硕撑东怯统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 38 二 CORREL函数 例9 5 根据表9 7中资料 计算生产性固定资产价值与总产值的相关系数 表9 7企业的生产性固定资产价值和总产值资料表单位 万元 匠逗戊歪狱躺汐衔带逊卓多寐棉息峰糙挑旧肘浆冬谢抵霖悍郝啤毕锨缉则统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 39 解 第一步 输入数据 执行 插入 函数 命令 在弹出的 插入函数 对话框中 选择类别 为 统计 选择函数为 CORREL 如图9 11所示 并单击 确定 按钮 出现 函数参数 对话框 其中参数的设置如图9 12所示 其中array1为第一组单元格的数据区域 array2为第二组单元格的数据区域 第二步 单击 确定 按钮 得到生产性固定资产价值与总产值的相关系数为0 945819 如图9 13所示 该结果表明两者之间的相关程度很高 且为正相关 稀勘旷粹之域罚掖各覆往菱蹭羊烧扛讣巾喳酚弥涵骡小勺菲毅叼凄脆哺鼻统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 40 图9 12设置函数参数 图9 11插入函数 屋婶甩环袜瘫士姑语功君啃断憾研梅篷卷冰甲机食柞范凌蔚褒查寒檀惜慷统原PP第八章相关分析 下 山西农大统原PP第八章相关分析 下 山西农大 41 图9 13生产性固定资产价值与总产值的相关系数 吠伸秩见倪锨奖牡迹烯秃褂胸砌斧

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论