相关性分析及回归分析_第1页
相关性分析及回归分析_第2页
相关性分析及回归分析_第3页
相关性分析及回归分析_第4页
相关性分析及回归分析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关和回归分析、2、学习目标、相关和回归分析等数据处理和分析方法。了解相关分析理论和模型建立方法了解相关系数等参数的经济重要性了解回归分析理论和模型建立方法了解相关参数(如定制度)的重要性了解Excel学习核心Excel的数据分析工具回归相关系数,3,相关分析,相关分析,相关分析是两个变量之间线性关系的说明和测量变量之间的关系吗?如果有关系,他们之间是什么关系?变量之间的关系强度如何?样品中反映的变量之间的关系可以表示整个变量之间的关系吗?相关步骤可以绘制散点图,如果变量之间的关系形式是线性相关的,则可以测量相关系数,以确定两个变量之间的关系强度,并确定示例中反映的关系是否可用于表示两个变量的整体关系。4,散点图A正相关,以图形方式大致描述变量之间的关系形式:如果一个变量增加或减少,则另一个变量也相应增加或减少。B-负相关:一个变量增加或减少,而另一个变量减少或增加;C-非线性相关:变量之间的关系用一条曲线近似表示。D-无关:表示两个变量是独立的。也就是说,不能通过一个变量的值预测另一个变量的值。5,相关系数,相关系数:基于样例数据计算的两个变量之间线性相关性的统计信息,用“r”符号表示。6,相关系数表示的意义,相关系数r是对两个变量的线性相关性的测量,表示-1到0,1范围内变量之间的相关强度。r值为1表示两个组的数量完全负相关。也就是说,两者之间存在反向关系。一个变量变大表示另一个变小,r值为0表示两个变量之间没有线性关系相关系数值。范围包括:-1r1 Excel计算相关系数的两种方法Excel数据分析功能CORREL()函数,7,加载分析工具库,从文件/选项/Excel选项插件/分析工具库/Excel插件/加载宏对话框示例1-使用Excel数据分析计算相关系数,方法2- CORREL()函数确定两个变量之间的相关系数=CORREL(Array1,Array2)array1和Array2。需要确定相关性的两组数据集的差异方法1在变量之间的相关系数方法2中,通过检查两个变量之间的数量伴随关系并建立变量之间的数学表达式来说明此关系,从而确定一个或多个参数对其他特定变量(变量)的影响程度,从而通过参数的值预测变量的可能值。确定样例数据集中变量之间的数学关系。对关系的可靠性进行各种统计测试,找出影响特定变量的许多变量中哪些变量的影响重要,哪些变量不重要。根据一个或多个变量的值估计或预测其他特定变量的值,并使用必要的关系提供这些估计或预测的置信度。回归分析可以根据涉及的参数数分为一元回归分析和多元回归分析。根据参数和变量之间的关系类型,可以分为线性回归分析和非线性回归分析。11,一元线性回归分析,回归基本上被认为是最合适的数学方程,拟合变量和一个或多个参数组成的原始数据集。最简单的形式是线性回归分析,因为有变量和参数,所以使用线性方程y=a bx拟合变量x和y的一系列数据观测值的过程。12,在建立回归模型的阶段取得引数和相依变数的观测值。绘制XY散点图以确定参数和变量之间是否存在线性关系。建立具有未知参数的回归方程式。工具-数据分析-回归。回归方程检查;R2确定回归方程的拟合度。t统计和伴随概率值、自变量和相关变量之间的关系;f统计和伴随概率值判断方程的回归效果显著。进行预测。13、检查回归模型,使用系数R2确定回归方程的适合度。通常,如果R2大于0.9,则生成的回归线拟合得更好;如果R2小于0.5,则生成的回归线可能难以说明变量之间的从属关系。t统计信息如果相应t统计信息的p值小于参数的重要级别(或置信度、置信度级别),则可以认为参数和从属变量相关。如果f统计信息f统计信息的p值小于重要级别(或可靠性、信任级别),则可以认为方程的回归效果很重要。14,示例2-一元回归分析示例,15,散点图和趋势线,根据数据在X轴上放置散点图,将趋势线添加为简单线性拟合(“线性”类型),将变量放置在Y轴上,选择公式表示法和显示R2值以分析趋势线(线性)方程和R2,16,分析,如果f统计信息的p值小于重要级别(0.05),则回归模型的整体效果将显着,所有自变量和从属变量的线性关系可以视为整体上的重要。确定系数R2是对估计回归方程拟合度的测量值范围0,1。R2越接近1,表示回归线越接近观测点,回归线拟合得越好。R2=0.8463=84.63P%说明方程式拟合程度更好,18,示例3-二次方程式拟合示例知道新品牌的肥料施用量对作物产量的影响,如下表所示。请估计5.5克肥料使用量时预计的产量。因为变量位于y轴上,所以在x轴上设置散点图参数的19,2次方程拟合阶段、多项式的趋势线类型附加显示公式和R2值显示选择结果很明显将拟合程度从线性方程的60%提高到二次方程的97%。反映观察到的饱和程度。20,例4-最大利润模型(思考),假设作物以每公斤4元,每克肥料0.2元的价格出售。请确认可获得最大利益的肥料使用量。(使用计划解决方案)总利润=价格计算=4元(-0.0066X2 0.0897x 0.2419)总成本=肥料成本肥料施用量=0.2X,21,获得多元回归分析、多元线性回归模型一般形式的多元线性回归预测阶段候选收购和相依变量的观测结果;在候选参数中,选择合适的参数最优子集方法向前添加方法等,确定回归系数,确定回归方程的拟合度。根据回归方程进行预测。22,实例5:对生产空调的企业连续15年销售和员工工资以及该地区平均总家庭收入的数据进行汇总销售的多元回归分析。此数据显示在工作表的“多元回归补充”中。该企业的管理层想根据此数据找出销售和其他两个变量之间的关系,以便进行销售量预测,并提供对未来预算工作的参考。根据这些资料,分析哪个模式更合适,假设未来一年员工的工资为25万韩元,平均家庭总收入为33.4,预测该年的销售量。,23,结果分析,f统计的p值小于重要水平(0.05),回归模型的整体效果显著,所有自变量和变量下的线性关系可以视为整体重要。R2=0.9984=99.84P%说明方程式拟合更好,如果t统计信息的p值小于重要级别(0.05),则可以认为该参数对变量的影响很重要。建立回归方程销售=5.92*员工报酬8.65*平均家庭总收入105.44预测=5.92*250 8.65*33.4 105.44,24,建立对不良贷款的回归方程,利用实例1中的数据构建对其他变量的不良贷款的估计方程。可信度是95%。数据-数据分析-回归将显示贷款馀额、今年累计应收帐款、贷款项目数、今年固定资产投资额收购导致的回归模型估计、25、结果分析将显示,今年累计应收帐款、贷款项目数、今年固定资产投资收购3个除外,只有贷款馀额作为收购来构建回归模型。t统计的p值大于重要水平(0.05),在创建回归方程时必须删除参数,t统计的p值小于重要水平(0.05),使用此参数建立回归方程,26,查找不良贷款的回归方程,不良贷款的贷款馀额的估计方程y=-0.8229.03789 x回归系数0.03789坏账平均为0.03789亿元,27,课堂练习、作业、课堂练习:示例1-6作业:P200-2、3、5、7、9、11、17、18中使用的所有数据都可以写入excel分析影响GDP的几个重要因素,可以为我国国民经济发展趋势提供理论和数据支持。GDP计算方法一般有支出法和进口法。支出法核算GDP,是从产品的使用中合计一年内购买的每个最终产品的支出,计算该年生产的最终产品的市场价值。在现实生活中,产品和劳务的最终使用主要是居民消费、企业投资、政府购买和出口。考虑选择四个变量作为解释变量,研究GDP的变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论