相关回归分析.doc_第1页
相关回归分析.doc_第2页
相关回归分析.doc_第3页
相关回归分析.doc_第4页
相关回归分析.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课次8 相关与回归分析相关关系 :两变量 X , Y 均为随机变量,任一变量的每一可能值都有另一变量的一个确定分布与之对应。 回归关系 : X 是非随机变量或随机变量, Y 是随机变量,对 X 的每一确定值 x i 都有 Y 的一个确定分布与之对应。 从上述定义可看出相关关系中的两个变量地位是对称的,可以认为它们互为因果;而回归关系中则不是这样,我们常称回归关系中的 X 是自变量,而 Y 是因变量。即把 X 视为原因,而把 Y 视为结果。另外,回归分析和相关分析的目的也有所不同。回归分析研究的重点是建立 X 与 Y 之间的数学关系式,这种关系式常常用于预测,即知道一个新的 X 取值,然后预测在此情况下的 Y 的取值;而相关分析的重点则放在研究 X 与 Y 两个随机变量之间的共同变化规律,例如当 X 增大时 Y 如何变化,以及这种共变关系的强弱。由于这种研究目的的不同,有时也会引起标准和方法上的不同,我们将在相关分析一节中作进一步介绍。 从两个变量间相关(或回归)的程度来看,可分为以下三种情况: ( 1 ) 完全相关 。此时一个变量的值确定后,另一个变量的值就可通过某种公式求出来;即一个变量的值可由另一个变量所完全决定。这种情况在生物学研究中是不太多见的。 ( 2 ) 不相关 。变量之间完全没有任何关系。此时知道一个变量的值不能提供有关另一个变量的任何信息。 ( 3 ) 统计相关 (不完全相关)。介于上述两种情况之间。也就是说,知道一个变量的值通过某种公式就可以提供关于另一个变量一些信息,通常情况下是提供有关另一个变量的均值的信息。此时知道一个变量的取值并不能完全决定另一个变量的取值,但可或多或少地决定它的分布。这是科研中最常遇到的情况。本章讨论主要针对这种情况进行。为简化数学推导,本章中如无特别说明,一律假设 X 为非随机变量,即 X 只是一般数字,并不包含有随机误差。但所得结果可以推广到 X 为随机变量的情况。 实验一、实验目的与要求:掌握相关系数的求解方法,能够熟练运用回归分析工具进行一元和多元线性回归分析,了解单因素方差分析工具的使用。二、实验主要内容:(1)相关系数的计算(2)回归分析三、实验步骤一、相关分析【例】用下表资料对学生身高和体重做相关分析。学生身高(cm)体重(kg)1171532167563177644154495169556175667163528152479172581016050 用Excel进行相关分析有两种方法,一是利用相关系数函数,二是利用相关分析分析工具。利用函数计算相关系数在Excel中,提供了两个计算两个变量之间相关系数的函数,即CORREL函数和PEARSON函数,这两个函数是等价的,这里介绍前者。操作步骤:单击任一个空白单元格,单击插入菜单,选择函数选项,打开粘贴函数对话框,在函数分类中选择统计,在函数名中选择CORREL。单击确定,出现CORREL对话框,在Array1中输入B2:B11,在Array2中输入C2:C11,即可在对话框下方显示出计算结果为0.8960。用相关分析工具计算相关系数操作步骤:在“工具”菜单中,单击“数据分析”选项,弹出“数据分析”对话框,选择“相关系数”分析工具。如图所示。单击“确定”,弹出“相关系数”对话框,在输入区域中输入:$B$1:$C$11,分组方式选择“逐列”,选择“标志位于第一行”,在输出区域中任选一单元格(如$B$15)。单击“确定”,得到输出结果。二、回归分析1、利用图表拟合分析例 某企业希望确定其产品制造过程中的每月成本支出与产量之间的关系,以制定生产计划。试根据该企业选择历年的产量(吨)和成本支出(千元)的样本,进行一元线性回归分析,求出回归方程和相关系数。 操作过程:打开“产量成本”工作表从“插入”菜单中选择“图表”选项,打开“图表向导”对话框。在“图表类型”列表中选择XY散点图,单击“下一步”按钮。在数据区域中输入A1:B15,选择“系列产生在列”,单击“下一步”按钮。自己设置标题等选项。单击“完成”按钮,便得到XY散点图。用鼠标激活散点图,把鼠标放在任一数据点上,单击鼠标右键,打开菜单,在菜单栏里选择“填加趋势线”选项,打开趋势线对话框。 打开“类型”页面,选择“线性”选项,Excel将显示一条拟合数据点的直线。 打开“选项”页面,在对话框下部选择“显示公式”和“显示R平方值”选项,单击“确定”按钮,便得到趋势回归图。一元回归方程为:y=2.9386x+1.262,表示当产量每增加1吨时,成本平均增加2.9386千元。相关系数=R=【例】测得不同地区某微量元素超标量与平均患病人数资料,试拟合Y关于X的回归方程。操作步骤:绘制散点图。从图中可以看出:Y与X是曲线相关关系。 在散点图的任一个散点上单击右键,选取快捷菜单中的“添加趋势线”。在弹出的“添加趋势线”对话框类型中选取“对数”。在“选项”中选“显示公式” 和“显示R平方值”。单击“确定”,即可得到回归方程为:Y=7.7771Ln(X)+19.745 R2=0.9922 表明拟合精度较高。2、用Excel 回归分析工具 回归分析工具是通过对一组观察值使用“最小平方法”进行直线拟合,以分析一个或几个自变量对单个因变量的影响方向与影响程度的方法。它是Excel中数据分析工具的一个内容。【例】某地区玻璃销售额与建筑业产值资料,试建立回归模型。 数据见excel表“玻璃销售额”。操作步骤:在“工具”菜单中选择“数据分析”选项,弹出“数据分析”对话框,选择“回归”分析工具。 单击“确定”,弹出“回归”对话框,在Y值输入区域中输入:B1:B18,在X值输入区域中输入:C1:C18,选中“标志”复选框,置信度选择95%(默认值为95%,可以根据需要修改),在输出区域中任选一单元格。单击“确定”,得到输出结果如图所示。回归方程为:Y= 181+ 12.68x 回归分析工具的输出结果解释Excel的回归分析工具计算简便,但内容丰富,计算结果共分为三个模块:回归统计表回归统计表包括以下几部分内容:Multiple R(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量x和y之间相关程度的大小。本例中:R0.9481为,表示二者之间的关系是高度正相关。R Square(复测定系数R2 ):用来说明用自变量解释因变量变差的程度,以测量同因变量y的拟合效果。复测定系数为0.8989,表明用自变量可解释因变量变差的94.68%。标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量,此值越小,说明拟合程度越好。观测值:是指用于估计回归方程的数据的观测值个数。方差分析表方差分析表的主要作用是通过F检验来判断回归模型的回归效果。回归参数表回归参数表是表中最后一个部分。回归参数如下:Intercept:截距0第二行:0(截距) 和1(斜率)的各项指标。第二列:回归系数0(截距)和1(斜率)的值。第三列:回归系数的标准误差。第四列:根据原假设H0:0=1=0计算的样本统计量t的值。第五列:各个回归系数的p值(双侧)。第六列:0和195%的置信区间的上下限。 故回归方程为:Y= 181+ 12.68x从方程检验来看,总体方程拟合优度较高,且通过了F检验,因此回归方程总体效果显著。从回归系数来看,两个自变量对应的回归系数对应的P值均显著小于0.05,表明这两个自变量对玻璃销售额均有显著影响。 上机实验作业:用Excel软件计算某化妆品公司在10个城市销售一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论