统计基础第七章.ppt_第1页
统计基础第七章.ppt_第2页
统计基础第七章.ppt_第3页
统计基础第七章.ppt_第4页
统计基础第七章.ppt_第5页
免费预览已结束,剩余25页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 相关分析和 回归分析,本章相关内容,第一节 相关分析 第二节 回归分析,第一节 相关分析,一、相关关系概念,事物或现象间在数量上存在着相互依存、相互制约的关系,这种关系可以分为两种类型,一种是确定性关系,即变量之间客观存在的确定性的数量对应关系,当自变量取一个值时,因变量就有一个完全确定的值与之对应,又称为函数关系。 相关关系是客观现象之间确实存在着的数量相互依存关系。它是一种变量之间的不严格、不确定的关系,受着随机因素的影响。,二 、相关关系类型,(一)按相关的因素多少来分,单相关也叫简单相关,是指两个变量的相关关系,,复相关是指三个或三个以上变量之间的相关关系。,偏相关是指在一个变

2、量与两个或两个以上变量相关的情况下,假定其他变量不变时,其中两个变量之间的相关关系成为偏相关。,二 、相关关系类型,(二)按相关的形式来分,线性相关:又称直线相关,是指当自变量变动时,因变量随之发生大致均等的变动,从图形上看,近似地表现为一条直线。,非线性相关:也称曲线相关,是指当自变量变动时,因变量也随之发生变动,但这种变动不是均等的,从图形上看,近似地表现为一条曲线。,二 、相关关系类型,(三)按相关方向来分,正相关是当自变量的数值增加或减少时,因变量的数值也相应增加或减少。,负相关是当一现象量增加(减少)另一现象数量减少(增加)。,二 、相关关系类型,(四)按相关的程度来分,完全相关是指

3、一个变量的数量完全由另一个变量的数量变化所确定,即函数关系。,不完全相关是指两个变量的关系介于完全相关和完全不相关之间,在统计学中,一般的相关关系指的就是这种关系,相关分析的主要对象是不完全的相关关系,完全不相关又称零相关,指两个变量的数值之间不存在任何依存关系,彼此独立,互不影响。,三、相关分析的步骤,3,确定现象之间有无相关关系,2,确定相关关系的表现形式,判定相关关系的方向和密切程度,4,确定因变量估计值误差的程度,5,确定相关数学表达式,1,四、相关关系的测定,定性分析 定性分析是依据研究者的理论知识、专业知识和实践经验,对客观现象之间是否存在相关关系,以及有何种相关关系做出判断相关表

4、 相关图,定量分析 变量之间相关关系的定量分析主要通过相关系数分析进行。 相关系数(r)概念 用来测定变量间相关密切程度的指标。,简单相关表举例: 将一系列的成对观察值排列在统计表中,就形成了简单相关表。如下表:,相关图举例: 相关图是利用直角坐标,将变量值用相对应的坐标点描绘出来,从坐标点的分布状况观察变量之间的相互关系的图形。如下图:,绘制相关图时需注意的问题,1.自变量应置于横轴上。否则,容易给人造成错觉,不易判断是正相关还是负相关; 2.点与点之间不可用线段连接。因为,这些坐标点本来就都是一些独立的试验点,正是在这个意义上,相关图也叫散点图。,(四)相关系数的计算,英国统计学家卡尔皮尔

5、逊设计了一个用于测定变量之间线性相关程度和相关方向的统计指标相关系数(r),它的定义公式为:,利用相关系数判别相关密切程度的方法,相关系数的取值范围:-1r1。 1.当|=1;完全线性相关 2.当00正相关;0负相关。,随堂训练:为了了解某公司员工的工龄与其工作效率之间的相关性,该公司人力资源部进行了一项研究,其目的是想依据研究成果预计员工的工作效率,随机抽取样本如下:计算相关系数,说明相关程度。 解:r=0.3531,微弱相关,第二节 回归分析,一、回归分析的概念,回归分析是对具有相关关系的变量之间数量变化的一般关系进行测定,选择一个合适的数学模型,确定一个相应的数学表达式,以便从一个已知量

6、来推测另一个未知量,为估计预测提供一个重要的方法。,二、回归分析与相关分析的区别与联系,1回归分析与相关分析的区别 (1)相关分析研究两个变量之间相关的方向和相关的密切程度。但是相关分析不能指出两变量相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化关系;回归分析则是通过一定的数学表达式来反映变量之间相互关系的具体形式,以便从一个已知量来推测另一个未知量。为估算预测提供一个重要的方法。 (2)相关分析可以研究因果关系的现象也可以研究共变的现象,不必确定两变量中谁是自变量,谁是因变量;回归分析是研究两变量具有因果关系的数学形式,因此必须事先确定变量中自变量与因变量的地位。 (3)计

7、算相关系数的两变量是对等的,可以都是随机变量,各自接受随机因素的影响,改变两变量的地位并不影响相关系数的数值;在回归分析中因变量是随机的,自变量是可控制的解释变量,不是随机变量。因此回归分析只能用自变量来估计因变量,而不允许由因变量来推测自变量。,2.回归分析与相关分析的联系 (1)相关分析是回归分析的基础和前提。如果缺少对现象之间的相关关系作判断,就不能作回归分析,即使勉强做了,有时也没有实际意义。 (2)相关关系决定回归分析 相关的类型决定回归的类型 相关的性质决定回归系数 现象相关的密切程度决定回归预测的准确程度 回归分析是相关分析的深入和继续。相关分析仅仅说明现象之间是否具有关系,它们

8、之间的关系密切程度如何。只有通过回归分析,建立了回归方程,才能从数量上反映变量之间的联系形式,才可进行相应的回归预测,使相关分析具有实际意义。,三、回归分析的步骤,建立回归预测模型,检验回归预测模型,计算预测误差,进行相关分析,计算并确定预测值,根据预测目标,确定自变量和因变量,四、简单直线回归分析,1.确定自变量和因变量; 2.整理资料; 3.判断相关性质及密切程度; 4.确定回归模型; 5.求参数a、b; 6.确定直线回归方程; 7.直线回归预测,随堂训练:,某农场单位面积施肥费用与单位产量之间的关系如下表,要求绘制散点图,计算相关系数,求回归直线方程。,绘制相关图:,参数a、b值的计算:

9、,直线方程为:,相关系数r的计算:,估计标准误差,估计标准误差是因变量的估计值与实际观察值之间的平均误差大小的指标。用来说明回归方程的代表性大小的统计指标。其值越小说明估计的值越接近实际值,估计的越准确。一元线性回归的估计标准误差用公式表示为:,一元线性回归的估计标准误差的公式为:,Sy:为估计标准误差 y:因变量实际观察值 yC:根据回归方程推算的因变量的估计 n-2:表示估计回归线失去两个自由度,即样本数据的个数减去自变量的个数(m=1),再减1。在实际应用中,当n很大时,一般是n30时,计算估计标准误差时就用n来代替n-2。 。,公式简化为:,回归估计标准差与标准差的区别与联系 1)计算原理是一致的,两者都是反映平均差异程度和代表性的指标。 2)一般标准差反映的是各变量值与其平均数的平均差异程度,表明其平均数对各变量值的代表性强弱; 3)回归标准误差反映的是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值的代表性强弱。,相关系数和估计标准误差的关系,估计标准误差小,相关系数的绝对值就越大,表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论