版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、?,7相关分析,在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们搜集到19811993年的样本数据(xi,yi),i=1,2,,13,数据见表7-1。,第七章相关分析,学习目标,掌握一元线性回归的基本原理和参数的最小平方估计方法掌握回归方程的显著性检验利用回归方程进行预测掌握相关系数的含义、计算方法和应用用Excel进行回归分析,7.1概述,相关关系的概念相关关系的表现形式(种类)相关关系研究的内容,7.1.1变量间的关系,变量间的关系(函数关系),函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为y=px(p为单价)圆的面积(S)与半径之间
2、的关系可表示为S=R2企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1x2x3,变量间的关系(函数关系),是一一对应的确定关系各观测点落在一条线上,变量间的关系(相关关系),相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系,变量间的关系(相关关系),变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个
3、值时,变量y的取值可能有几个各观测点分布在直线周围,7.1.2相关关系种类,正相关与负相关直线相关与曲线相关单相关与复相关,相关关系的图示,7.1.3相关关系分析的内容,相关分析-计算变量之间关系的密切程度(直线相关用相关系数描述,曲线相关用相关指数描述)回归分析-用数学方程表达出变量之间的相关关系,7.2一元线性回归,回归分析的特点一元线性回归方程估计标准误差回归方程的显著性检验利用回归方程进行预测与控制对总体回归方程参数的估计,7.2.1回归分析的特点,回归分析是应用统计方法寻找一数学方程,建立自变量与因变量之间的关系,并据以利用自变量的给定值来推算或估计因变量的值线性回归与非线性回归一元
4、与多元,7.2.2一元线性回归方程的建立,一元线性回归方程模型最小平方法确定回归方程系数,一元线性回归模型(概念要点),对于只涉及一个自变量的简单线性回归模型可表示为模型中,Y是X的线性函数(部分)加上误差项线性部分反映了由于X的变化而引起的Y的变化误差项是随机变量反映了除X和Y之间的线性关系之外的随机因素对Y的影响是不能由X和Y之间的线性关系所解释的变异性,估计(经验)的回归方程,简单线性回归中估计的回归方程为,总体回归参数是未知的,必需利用样本数据去估计,一元线性回归模型,7相关分析,在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们搜集到19811993年
5、的样本数据(xi,yi),i=1,2,13,数据见表7-1。,最小平方法(图示),最小平方法(概念要点),使因变量的观察值与估计值之间的离差平方和达到最小来求得方程系数的方法。即,用最小平方法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小,最小平方法确定回归方程参数,最小平方法确定回归方程系数,最小平方法确定回归方程系数,估计方程的求法(实例),【例7.1】根据表7-1中的数据,配合人均消费金额对人均国民收入的回归方程。根据方程系数的求解公式得,估计(经验)方程,人均消费金额对人均国民收入的回归方程为,y=54.22286+0.52638x,估计方程的求法(Excel的输出
6、结果),7.2.3估计标准误差,估计标准误差意义估计标准误差的计算,估计标准误差的意义,根据回归方程计算的因变量的值与实际观察值有一定的差距即估计标准误差,该误差的大小反映了回归直线的代表性,因此,拟合出回归线后,需要计算估计标准误差,以确定该回归线的可利用价值如何,最小平方法(图示),估计标准误差的计算,7.2.4回归方程的显著性检验,显著性检验的原理显著性检验的统计量,离差平方和的分解,因变量y的取值是不同的,y取值的这种波动称为变差。变差来源于两个方面由于自变量x的取值不同造成的除x以外的其他因素(如x对y的非线性影响、测量误差等)的影响对一个具体的观测值来说,变差的大小可以通过该实际观
7、测值与其均值之差来表示,离差平方和的分解(图示),离差平方和的分解(三个平方和的关系),两端平方后求和有,从图上看有,Lyy=U+Q,离差平方和的分解(三个平方和的意义),总变差(Lyy)反映因变量的n个观察值与其均值的总离差回归变差(U)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和剩余变差(Q)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和,回归方程显著性检验原理,估计标准误差的大小可以反映回归直线的精确度,但判断估计标准误差的大小要有一个基准,即当估计标准误差为多少时可认为回归直线有代表性即回归方程的线
8、性关系显著通过比较U与Q完成,回归方程显著性检验统计量,F(1,n-2),拒绝域,回归方程的显著性检验,H0:线性关系不显著H1:线性关系显著,U/Q/(n-2),回归方程的显著性检验(检验的步骤),提出假设H0:线性关系不显著,计算检验统计量F,确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F作出决策:若FF,拒绝H0;若FF,接受H0,回归方程的显著性检验(方差分析表),(续前例)Excel输出的方差分析表,平方和,均方,7.2.5利用回归方程进行预测与控制,利用回归方程进行预测与控制,小样本时预测值的区间估计大样本时预测值的区间估计,对于自变量x的一个某个值x0,根据回归
9、方程得到因变量y的一个预测区间,利用回归方程进行预测,E(y0)在1-置信水平下的预测值为,式中:Sy为估计标准误差,利用回归方程进行预测(置信区间估计:算例),【例7.2】根据前例,求出人均国民收入为1250.7元时,人均消费金额95%的置信区间。解:根据前面的计算结果712.57,Sy=14.95,t(13-2)2.201,n=13置信区间为,712.5710.265,人均消费金额95%的置信区间为702.305元722.835元之间,利用回归方程进行控制,控制是预测的反问题,即要求观测值在某区间(y1,y2)内取值时,问x需控制在什么范围。亦即要求以一定的置信度求出相应的x1,x2,使得
10、x1xx2时,所对应的观测值y落在(y1,y2)内。如当置信度为95.45%时,可利用y1=a+bx-2Syy2=a+bx+2Sy解出x1,x2作为控制的上下限。显然要实现控制,必须使区间(y1,y2)的长度小于4Sy,即应有y1-y24Sy。,7.2.6总体回归方程的参数估计,总体回归方程的参数估计,7.3多元线性回归分析,多元线性回归模型(概念要点),一个因变量与两个及两个以上自变量之间的回归描述因变量y如何依赖于自变量x1,x2,xp和误差项的方程称为多元线性回归模型涉及p个自变量的多元线性回归模型可表示为,是被称为误差项的随机变量y是x1,,x2,xp的线性函数加上误差项说明了包含在y
11、里面但不能被p个自变量的线性关系所解释的变异性,7.3.3应用回归分析时应注意的问题,定性分析与定量分析相结合预测不能随意扩大范围-只能内插,不能外推影响回归系数的因素-计量单位,7.4相关系数,相关分析与相关系数相关系数的测定相关系数的显著性检验及抽样误差等级相关,7.4.1相关分析与相关系数,相关分析与回归分析相关分析与相关系数,7.4.2相关系数的测定,相关系数的测定,相关关系的测定(相关系数),对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,记为r,相关关系
12、的测定(相关系数取值及其意义),r的取值范围是-1,1|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关r=0,不存在线性相关关系相关-1r0,为负相关0t,拒绝H0若tt(13-2)=2.201,拒绝H0,人均消费金额与人均国民收入之间的相关关系显著,相关系数的抽样误差,7.4.4等级相关,等级相关,等级相关的显著性检验,当n=30时,t检验,回归分析与相关分析的区别,相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 黑龙江省齐齐哈尔市2026年中考物理适应性模拟试题(含答案解析)
- 《钢铁是怎样炼成的》问题及答案
- (2025年)孙吴县辅警协警笔试笔试真题(附答案)
- 党风廉政建设知识测试题及答案
- 党员入党积极分子党史党章知识测试题库及答案
- 妇幼保健业务知识培训测试题及答案
- 食品营养与健康管理实训报告
- 幼儿园教育中的情感教育策略
- 重庆市南川区(2025年)社工考试真题及答案
- 重庆市武隆区(2025年)网格员笔试真题及答案解析
- 2024年白银辅警招聘考试题库含答案详解
- 2026年陕西工商职业学院单招职业倾向性测试题库必考题
- 纪检监察法规制度试题库及答案2025年
- 幼儿园大班语言《小汽车和小笛子》课件
- 初中化学实验安全操作培训课件
- 长沙停车场建设施工方案
- 配电室电缆穿管施工方案
- 树立良好的班风学风课件
- 天然气管道穿越河流施工专项方案
- 蓝天救援队培训知识意义课件
- 档案安全风险培训课件
评论
0/150
提交评论