第10章线性相关与回归_第1页
第10章线性相关与回归_第2页
第10章线性相关与回归_第3页
第10章线性相关与回归_第4页
第10章线性相关与回归_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章 线性相关与回归(Linear Correlation & Regression )线性相关与回归第一节 线性相关第二节 线性回归第三节 线性相关与回归的区别和联系第三节 等级相关一、线性相关的基本概念二、线性相关系数三、相关系数的显著性检验四、进行线性相关分析的注意事项线性相关 ( linear correlation)一、线性相关的基本概念为直观地判断两个变量之间的关系,可在直角坐标系中把每对( Xi,Yi) 值所代表的点绘出来,形成散点图 。 例如 12名男青年身高与前臂长资料绘制的散点图如图所示: 若一个 变 量 X由小到大(或由大到小),另一 变 量 Y亦相 应 地由小到大或由大到小, 则 两个变 量的散点 图 呈直 线趋势 ,我 们 称 这 种 现 象 为共 变 , 也 就是 这 两个 变 量之 间 有 “ 相关关系 ”。男青年身高与前臂 长 散点呈直 线趋势 ,即男青年身材高,前臂亦 长 , 说 明身高与前臂 长 之间 存在 线 性相关关系我 们 把 这 种关系称 为 直 线相关。 线性相关用于双变量正态资料 。 它的性质可由散点图直观地说明。散点图中点的分布即线性相关的性质和相关之间的密切程度,可分为以下几种情况:1.正相关 2.负相关 3.无相关 二、线性相关系数在分析两个变量 X与 Y之间关系时,常常要了解 X与 Y之间 有无相关关系,相关是否密切,是呈正相关还是负相关。相关系数就是说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。皮尔森 (Pearson)相关系数的计算公式为: 相关系数 r没有测量单位,其数值为 -1+1 相关系数的计算方法 计算时分别可用下面公式带入相关系数 r的计算公式中例 10.1 从男青年总体中随机抽取 11名男青年组成样本,分别测量每个男青年的身高和前臂长,身高和前臂长均以 cm为单位,测量结果如下表所示,试计算身高与前臂长之间的相关系数。 编 号 身高( cm) 前臂 长 ( cm) XY X2 Y2(X) (Y)1 170 47 7990 28900 22092 173 42 7266 29929 17643 160 44 7040 25600 19364 155 41 6355 24025 16815 173 47 8131 29929 22096 188 50 9400 35344 25007 178 47 8366 31684 22098 183 46 8418 33489 21169 180 49 8820 32400 240110 165 43 7095 27225 184911 166 44 3174 28561 2116合 计 1891 500 86185 326081 22810三、相关系数的显著性检验与前面讲的其它统计量一样,根据样本资料计算出来的相关系数同样存在抽样误差。即假设在一个 X与 Y无关总体中作随机抽样,由于抽样误差的影响,所得的样本相关系数也常常不等于零。因此要判断两个变量 X与 Y是否真的存在相关关系,仍需根据作总体相关系数 是否为零的假设检验。 常用的检验方法有两种 : 1.按自由度直接查附表 11的界值表,得到 P 值。2.用假设检验法,计算统计量 ,其公式为:例 10.1所得的 值检验男青年身高与前臂长之间是否存在相关关系 ?四、进行线性相关分析的注意事项 线 性相关表示两个 变 量之 间 的相互关系是双向的,分析两个 变 量之 间 到底有无相关关系可首先 绘 制散点图 ,散点 图 呈 现 出直 线趋势时 ,再作分析。 相关系数的计算只适用于两个变量都服从正态分布的情形,如果资料不服从正态分布,应先通过变量变换,使之正态化,再根据变换值计算相关系数。 四、进行线性相关分析的注意事项 依据公式 计 算出的相关系数 仅 是 样 本相关系数,它是 总 体相关系数的一个估 计值 ,与 总体相关系数之 间 存在着抽 样误 差,要判断两个事物之 间 有无相关及相关的密切程度,必 须 作假 设检验 。四、进行线性相关分析的注意事项 相关分析是用相关系数来描述两个 变 量 间 相互关系的密切程度和方向,而两个事物之 间 的关系既可能是依存因果关系,也可能 仅 是相互伴随的数量关系。决不可因 为 两事物 间 的相关系数有 统计 学意 义 ,就 认为 两者之 间 存在着因果关系,要 证 明两事物 间 确 实 存在因果关系,必 须 凭借 专业 知 识 加以 阐 明。 一、线性回归的基本概念二、线性回归方程的计算三、线性回归方程的显著性检验四、进行线性回归分析的注意事项第二节 线性回归( linear regression)一、线性回归的基本概念相关是分析两个正态变量 X与 Y之间的互相关系。在相关分析中,分不清 X与 Y何者为自变量,何者为因变量。现在假设两个变量 X 、 Y 中,当一个变量 X 改变时,另一个变量 Y 也相应地改变,当这样的两个变量之间存在着直线关系时,不仅可以用相关系数 r 表示变量 Y与 X线性关系的密切程度,也可以用一个直线方程来表示 Y 与 X 的线性关系。根据大量实测数据,寻找出其规律性,寻求一个直线方程来描述两个变量间依存变化的近似的线性数量关系,即线性回归关系,这样得出的直线方程叫做线性回归方程。二、线性回归方程的计算例 10.3 有人研究了温度对蛙的心率的影响,得到了表 10-2中所 示的资料,试进行回归分析 。对 象 温度( X) 心率( Y)XY X2 Y21 2 5 10 4 252 4 11 44 16 1213 6 11 66 36 1214 8 14 112 64 1965 10 22 220 100 4846 12 23 276 144 5297 14 32 448 196 10248 16 29 464 256 8419 18 32 576 324 102410 20 34 680 400 115611 22 33 726 484 1089合 计 132 246 3622 2024 66101.根据表 10-2数据绘制散点图,如下图所示 :2.计算回归系数与常数项 在本例中 : 则,回归方程为3. 作回归直线三、线性回归方程的显著性检验 对线性回归方程要进行假设检验,就是要检验b是否为 =0的总体中的一个随机样本。该假设检验通常用方差分析或者 t检验,两者的检验效果等价。 线性回归方程的显著性检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论