版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章 相关与回归分析 第一节 相关与回归的基本概念 第二节 一元线性回归分析第1页,共46页。睡眠时间同学习成绩之间的关系学习成绩同收入之间的关系学历同收入之间的关系国内研究:学历、年龄、收入关系国外研究:学历、年龄、收入关系第2页,共46页。第一节 相关与回归的基本概念函数关系与相关关系相关关系的种类相关关系的判断方法第3页,共46页。1.1 函数关系与相关关系(一)函数关系1. 定义当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。第4页,共46页。2.函数关系特点(1)是一一对应的确定关系;(2)设有两个变量 x 和 y ,变量 y 随变量
2、x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量(3)各观测点(x,y)落在一条线上 xy第5页,共46页。3.函数关系举例 函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价)圆的面积与半径之间的关系可表示为S = r2 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3 第6页,共46页。1. 定义: 当一个或几个相互联系的变量取一定数值时
3、,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种关系称为具有不确定性的相关关系。现象之间客观存在的不严格、不确定的数量依存关系。(二)相关关系第7页,共46页。2.相关关系特点(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;当变量 x 取某个值的时候,变量 y 的取值可能有几个;(3)各观测点(x,y)分布在某条线的周围。xy第8页,共46页。 相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品的消费量(y)与物价(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)
4、、降雨量(x2) 、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系3.相关关系举例第9页,共46页。1.2相关关系的种类相关关系按相关程度分类按相关方向分类按相关形式分类按所研究变量多少分类第10页,共46页。(1)完全相关:当一种现象的数量变化完全由另一种现象的数量变化所确定时,称这两种现象间的关系为完全相关。(2)不相关:当两种现象互不影响,其数量变化各自独立时,称为不相关现象。(3)两种现象之间的关系介于完全相关和不相关之间,称为不完全相关。1.按相关的程度可划分为:完全相关,不完全相关和不相关第11页,共46页。(1)当两种相关现象之间的关系大致呈现为线性关系时,称之
5、为线性相关。(2)当两种相关现象之间的关系不表现为直线关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关。2.按相关的形式可划分为:线性相关,非线性相关第12页,共46页。第13页,共46页。(1)正相关:两个相关现象间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。 例如收入与消费的关系。(2)负相关:当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)趋势变化,即反方向变化。 例如物价与消费的关系。3.按相关的方向可划分为:正相关,负相关第14页,共46页。(1)当只研究两个变量时,它们之间的相关,称为单相关。(2
6、)当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。例如,某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。(3)在某一现象与多种现象相关的场合,假定其他变量不变,只考察其中两个变量的相关关系称为偏相关。例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。4.按相关关系涉及的变量多少可划分为:单相关,复相关和偏相关第15页,共46页。相关关系的图示不相关负线性相关正线性相关非线性相关完全负线性相关完全正线性相关第16页,共46页。定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判
7、断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。1.3 相关关系的判断 第17页,共46页。(一)相关表相关表是一种反映变量之间相关关系的统计表。将自变量x的数值按照从小到大的顺序排列,然后再将与其相关的因变量y的对应数值平行排列,便可形成简单的相关表。第18页,共46页。 例:为了研究分析某种产品完成量与其单位产品成本之间的关系,调查30个同类公司得到的原始数据如表。整理后有第19页,共46页。(二)相关图相关图也称散点图,是在平面直角坐标系中,以横轴表示变量 x,纵轴表示变量y,将两者对应的数值形成的坐标点(x,y)
8、在图中标出,即可看出变量之间关系密切程度。如下图(销售收入与广告费相关图)第20页,共46页。销售收入与广告费相关图第21页,共46页。相关图的相关检定分别作x、y中值线 数各象限和中值线上的点计算 判定 :将N和相关检定表界限值比较,判定相关性第22页,共46页。(三)相关系数及其计算第23页,共46页。1.相关系数早在1890年,英国统计学家皮尔生(Pearson)便提出了一个测定两个变量线性关系的计算公式,通常称为积距相关系数。计算公式:式中:分子是两个变量x和y的协方差;分母是两个变量的标准差。第24页,共46页。2.相关关系的测度(相关系数) 样本相关系数的计算公式或化简为第25页,
9、共46页。计算相关系数的“积差法”第26页,共46页。例1.某企业10名工人的工龄和年工资资料如下:职工编号1 2 3 4 5 6 7 8 9 10工龄X(年)4 4 5 6 7 8 8 9 9 10工资Y(百元)42 46 50 60 64 68 74 72 80 84要求:计算相关系数,已知条件如下第27页,共46页。例2.某企业200名工人的工龄和年工资资料如下,计算两者的相关系数,已知条件如下:第28页,共46页。 表1 我国人均国民收入与人均消费金额数据 单位:元年份人均国民收入人均消费金额年份人均国民收入人均消费金额1981198219831984198519861987393.8
10、419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148【例】在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。收集到19811993年的样本数据(xi ,yi),i =1,2,,13,计算相关系数。第29页,共46页。解:根据样本相关系数的计算公式有 人均国民收入与人均消费金额之间的相关系 数为 0.9987第30页,共46页。3.相关系数取值及其意义
11、(1) r 的取值范围是 -1,1(2)|r|=1,为完全相关r =1,为完全正相关r =-1,为完全负正相关(3) r = 0,不存在线性相关关系(4)-1r0,为负相关;0r1,为正相关(5)|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切第31页,共46页。4.相关程度评价标准0| r |0.3为微弱相关0.3| r |0.5为低度相关0.5| r |0.8为显著相关0.8| r |1为高度相关第32页,共46页。相关系数检定表第33页,共46页。第二节 一元线性回归分析一、一元线性回归的基本问题(一)回归的来源 “回归”这个统计学术语,最早采用者是英国遗传学家高尔登,他把这
12、种统计分析方法应用于研究生物学的遗传问题,指出生物后代有回复或回归到其上代原有特性的倾向。高尔登的学生皮尔逊继续研究,把回归与数学方法联系起来,把代表现象之间一般数量关系的直线或曲线称为回归直线或回归曲线。第34页,共46页。(二)什么是回归分析?从一组样本数据出发,确定变量之间的数学关系式;对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著;利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。第35页,共46页。(三)回归模型的类型一个自变量两个及两个以上自变量回归模型多元回归一元
13、回归线性回归非线性回归线性回归非线性回归第36页,共46页。1.一元线性回归模型(1)当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归。(2)对于具有线性相关关系的两个变量,可以用一个线性方程来近似表示它们之间的关系。(3)描述因变量 y 如何依赖于自变量 x 和误差项的方程称为回归模型。第37页,共46页。二、一元线性回归模型的估计第38页,共46页。(一)回归方程1.描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程。2.简单线性回归方程的形式:a是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值;b是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值。第39页,共46页。最小二乘法(图示)xy(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)123哪条线最能够表达x和y之间的关系?第40页,共46页。最小二乘法(图示)xy(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)ei = yi-yi2e1e2e3e4e6e7e8e9e5第41页,共46页。3、回归系数的估计的最小二乘法公
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 海南电信消防安全云课堂
- 高中地理易混淆地理概念辨析别再混淆了
- 英语四年级下册Unit 2 Family Rules 教案
- 阅卷评分标准与细则
- 公关服务公司公关服务技能专项培训管理制度
- 2026电商插画面试题库及答案
- 2026东阳科学面试题目及答案
- 工业机器人应用开发协议(2026年科技公司)
- 常见肿瘤标志物重点2026
- 电气安装工程质量验收规范手册
- 《相见欢无言独上西楼》课件
- 浓硫酸泄漏应急预案
- 广东省普通高中学生档案
- DB13T 5714-2023 道路运输企业安全生产风险分级管控规范
- 华中科技大学研究生入学考试组织行为学
- 濮良贵机械设计课件完整版
- RB/T 024-2019合格评定服务认证技术应用指南
- GB/T 4010-2015铁合金化学分析用试样的采取和制备
- GA/T 832-2014道路交通安全违法行为图像取证技术规范
- 输电线路工程组塔施工质量控制
- 公共伦理学(第三版)-课件
评论
0/150
提交评论