版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章相关分析与回归分析PowerPoint统计学
第一节相关关系一、相关关系的概念相关关系又称非一一对应的关系,是指现象之间确实存在的、在数量上不确定的相互依存关系。如学生的学习成绩与学习时间之间的关系。函数关系又称一一对应的关系,是指现象之间确实存在的、在数量上确定的相互依存关系。如圆的面积与半径之间的关系。变量间的关系
(函数关系)是一一对应的确定关系设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x
,当变量x取某个数值时,
y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量各观测点落在一条线上
xy变量间的关系
(函数关系)函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为
y=p
x(p为单价)圆的面积(S)与半径之间的关系可表示为S=R2
企业的原材料消耗额(y)与产量(x1)
、单位产量消耗(x2)
、原材料价格(x3)之间的关系可表示为y=x1x2x3
变量间的关系
(相关关系)变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量
x取某个值时,变量y的取值可能有几个各观测点分布在直线周围
xy变量间的关系
(相关关系)相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系二、相关关系的分类
1、按相关变量的多少不同,分为单相关和复相关。
2、按相关的方向不同,分为正相关和负相关。
3、按相关的形式不同,分为线性相关和非线性相关(曲线相关。具体包括指数曲线相关、对数曲线相关、幂函数曲线相关、双曲线相关、抛物线相关、修正指数曲线相关、逻辑曲线相关和戈伯兹曲线相关)。
4、按相关的程度不同,分为完全相关、完全不相关和不完全相关(进一步又可分为高度相关、显著相关、低度相关和微弱相关)相关关系分类图
相关关系线性相关曲线相关
正相关负相关
幂指对双抛修戈逻完高显低微不函数数曲物正伯辑全度著度弱相数曲曲线线指兹曲相相相相相关曲线线相相数曲线关关关关关线相相关关曲线相相关关线相关关相关关图10-1三、相关分析的内容(一)、判断现象之间有无相关关系。(二)、分析现象之间相关关系的方向。(三)、分析现象之间相关关系的形式。(四)、分析现象之间相关关系的密切程度。四、相关分析的步骤
定性判断
编制相关表
绘制相关图
计算相关系数图10-2(二)、相关表
1、相关表的含义相关表是指表明现象之间相关关系的表格。
2、相关表的种类(1)、简单相关表(表10-1)。(2)、单变量分组相关表(表10-2)。(3)、双变量分组相关表(表10-3)。
3、相关表的作用
——表明想象之间相关关系的方向。例10-1某单位十名员工的智商值与劳动生产率相关关系表
表10-1智商值x809798103110120121122126130劳动生产率f2、73、22、93、05、26、04、24、85、26、3例10-2
某纺织厂118名工人看管机器数与劳动生产率相关关系表
表10-2按看管机器数分组(台)工人人数(人)劳动生产率(米/小时)5—710148—9141710—11212212—13302513—15333216—17323718—192142∑118—例10-3某公司200名职工的工龄和时工资等级相关关系表
表10-3按工龄分组(年)按时工资级别分组(元)合计1231—56—1011—1516—2021及以上2040241600102426000128202050605020∑1006040200(三)、相关关系的图示不相关负线性相关正线性相关非线性相关完全负线性相关完全正线性相关(四)、相关系数
1、相关系数的概念相关系数是指在线性相关条件下,表明两个变量线性相关方向和相关程度的统计分析指标。一般用符号r表示。
2、相关系数的计算公式从这一公式可以看出,相关系数由三部分组成
(1)、协方差标准差σx和σy的作用:1、x、y协方差是名数,标准化后成为无名数,可以作为不同现象相关程度的比较。2、x、y协方差的数值可以无限增多或减少,不便说明问题,将它标准化后,使相关系数绝对数不超过1,即
|r|≤1相关系数的计算公式3、相关系数的取值范围
-1≤r≤+1r>0,正线性相关;r<0,负线性相关;r=0,不存在线性相关(但可能存在曲线相关)。
|r|越接近于0,X与Y的线性相关程度越低;|r|越接近于1,X与Y的线性相关程度越高(具体见表10-4)。4、相关系数的直观意义D、r=0F、-1<r<0E、0<r<1C、r=0B、r=-1A、r=1图a、b、c、d是四种极端情况。图a、b即当x与y有精确的线性关系时,r=1或r=-1。
r=1表示x与y之间完全正相关,所有的对应点都在一条直线上。
r=-1表示x与y之间完全负相关,所有的对应点也都在一条直线上。这实际上就是一种线性函数关系,它并不是统计学中研究的主要内容。图c这种极端情况,说明所有的观察值分布杂乱无章,变量x与y之间没有相关关系,即r=0。在实际中,r=0的情况很少,往往我们拿来毫不相干的两个变量序列计算相关系数,其绝对值都会大于0。图d这种情况,表明x与y有非线性关系。所以,这里相关系数r=0只能说明x与y之间无线性相关关系,并不能说明x与y无任何关系。统计学主要研究线性相关关系。图e、f表示变量x与y之间有线性统计关系,0<|r|<1,统计学主要研究这种线性统计关系。相关关系的测度
(相关系数取值及其意义)
r
的取值范围是[-1,1]|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关
r=0,不存在线性相关关系相关-1r<0,为负相关0<r1,为正相关|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切5、相关系数与相关等级的对应关系表
表10-4相关系数相关等级|r|=10.8≤|r|<10.5≤|r|<0.80.3≤|r|<0.50<|r|<0.3r=0完全线性相关高度线性相关显著线性相关低度线性相关微弱线性相关不存在线性相关例10-4表10-5职工编号智商值X劳动生产率(件/小时)Y11105.20.490.64-0.5621206.086.492.5614.8831306.3372.493.6136.6741265.7234.091.6919.8951224.8127.690.164.5261214.2106.090.04-2.0671033.059.291.9610.788982.9161.292.2519.059802.7942.492.8952.1910973.2187.691.4416.44∑110744.02278.117.24171.80例10-1某单位十名员工的智商值与劳动生产率相关关系表
表10-1职工编号智商值X劳动生产率(件/小时)YXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.21210014400169001587614884146411060996046400940927,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.4∑110744.0124823210.845042.6第三节回归分析一、回归分析的概念回归分析是指在相关分析的基础上,将变量之间的相关关系用一定的数学关系式表达出来,并据此由自变量(因变量)的给定值去估计因变量(自变量)的值。二、回归分析的实质回归分析的实质是将变量之间不确定的数量关系转化为确定的数量关系,即将变量之间的相关关系转化为函数关系。三、回归模型的种类按自变量的多少分为一元回归模型多元回归模型
按是否线性分为线性回归模型非线性回归模型按是否带虚拟变量普通回归模型带虚拟变量回归模型回归模型的类型一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归四、回归分析与相关分析的关系
(一)区别
1、相关分析时,变量之间是对等的关系;回归分析时,变量之间是不对等的关系。
2、表明两个变量之间相关关系的相关系数只有一个;表明两个变量之间回归关系的回归模型有两个。
3、相关分析时,两个变量都是随机性变量;回归分析时,只有因变量是随机性变量,而自变量则是确定性变量。(二)联系
1、相关分析是回归分析的基础和前提。
2、回归分析是相关分析的继续和深入。五、回归分析的步骤
定性判断
拟合回归模型
检验回归模型
进行回归估计图10-4(一)、定性判断
1、判断有无必要进行回归分析。若|r|≥0.5,则进行回归分析;若|r|<0.5,则不必进行回归分析。
2、确定谁是自变量,谁是因变量。(二)、拟合一元线性回归模型1、回归模型(1)、回答“变量之间是什么样的关系?”(2)、方程中运用1个数字的因变量(响应变量)被预测的变量1个或多个数字的或分类的自变量(解释变量)用于预测的变量(3)、 主要用于预测和估计2、回归模型的一般形式3、解这个方程的a、b参数的方法与基本思路.(1)、方法:最小平方法(2)、思路:是对原数列(Y)配合一条趋势线(Ÿ)实际数列是波动的,我们想在实际时间数列中间作一条非常平滑的趋势线来描述它,然后利用它进行预测。
对所配合的趋势线有两点基本要求:
1、原数列与趋势线的离差平方之和为最小值。
Σ(Y-Ÿ)2=最小值
2、原数列与趋势线的离差总和为0。
Σ(Y-Ÿ)=0用这种方法既可配合直线,也可配合曲线.具体怎样配应根据实际数列确定.一元线性模型法
(a和b的最小二乘估计)1、原数列为直线。即Y=a+bx+e2、配合直线方程。即Ÿ=a+bx3、根据对趋势线的两点要求,求出a、b两个参数,这条趋势线就确定了。为了使Σ(Y-Ÿ)2=最小值则令Q=Σ(Y-Ÿ)2=Σ(Y-a-bx)2分别对a、b求偏导数,并令其为0,则Σ(Y-Ÿ)2=最小值θQ/θa=Σ(Y-Ÿ)2=Σ(Y-a-bx)2=-2Σ(Y-a-bx)θQ/θb=Σ(Y-Ÿ)2=Σ(Y-a-bx)2=-2Σ(Y-a-bx)x例10-1某单位十名员工的智商值与劳动生产率相关关系表
表10-1职工编号智商值X劳动生产率(件/小时)YXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.21210014400169001587614884146411060996046400940927,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.4∑110744.0124823210.845042.6例10-5拟合某单位10名员工智商值与时劳动生产率的一元线性回归模型。4、关于b的两点说明(1)、b称为回归系数,表示自变量X每变动一个单位,因变量Y平均变动b个单位。如上例表示智力值每增加一个单位,时劳动生产率将增加0.0754件。(2)、回归系数b与相关系数r的关系可表示为:(三)、检验回归模型
1、估计标准误差的概念估计标准误差又称估计标准误,是指因变量的实际观察值Y对其理论估计值的标准差。即因变量的实际观察值Y与其理论估计值离差平方的算术平均数的平方根。一般用符号表示。
2、估计标准误差的作用
——说明回归模型代表性的大小。标准差以平均数为中心计算,说明平均数代表性的大小;估计标准误差以回归模型为中心计算,说明回归模型代表性的大小。离差平方和的分解
(图示)xyy{}}离差分解图离差平方和的分解
(三个平方和的关系)1、从上图看有(总变差平方和)=(回归平方和)+
(残差平方和)
Lyy
=Q2+Q1。离差平方和的分解
(三个平方和的意义)总平方和(Lyy)反映因变量的n个观察值与其均值的总离差回归平方和(Q2)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和残差平方和(Q1)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和可决系数
(判定系数r2
)回归平方和占总离差平方和的比例取值范围在[0,1]之间反映回归直线的拟合程度
R21,说明回归方程拟合的越好;R20,说明回归方程拟合的越差判定系数等于相关系数的平方,即r2=(R)2职工编号智商值X劳动生产率(件/小时)YXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.227,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.44.34725.10125.85525.55365.25205.17663.81943.44242.08523.36700.72730.80780.19780.02140.20430.95370.67140.29420.37800.0279∑110744.0210.845042.6—4.2838表10-6
例10-6
计算某单位10名员工时劳动生产率的估计标准误差。例10-1某单位十名员工的智商值与劳动生产率相关关系表
表10-1职工编号智商值X劳动生产率(件/小时)YXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.21210014400169001587614884146411060996046400940927,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.4∑110744.0124823210.845042.6例10-5拟合某单位10名员工智商值与时劳动生产率的一元线性回归模型。
例10-6
计算某单位10名员工时劳动生产率的估计标准误差。4、关于Sy的几点说明:Sy是用来说明回归方程代表性大小的分析指标,其计算原理与标准差基本相同,Sy说明理论值(回归线)的代表性,若Sy小,表明回归方程准确性高;反之,估计不够正确,代表性小。第一、当Sy很大,大到等于标准差时,即Sy=бy时,说明第二、当Sy=0时,说明,各实际点都落在回归直线上,表明r=±1,完全相关。第三、当≠
y时,
Sy的取值在0~~бy之间;
r的取值在(+1)~~(-1)之间。Sy与r有如下关系:(四)、回归估计
1、由自变量X的值估计因变量Y的值。
2、由因变量Y的值估计自变量X的值。
例10-7
资料见表10-1。
要求:(1)估计智商值为125时的时劳动生产率;(2)估计时劳动生产率为5时的智商值。(1)X=125时,时劳动生产率的估计值:职工编号智商值x劳动生产率(件/小时)yXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.227,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.44.34725.10125.85525.55365.25205.17663.81943.44242.08523.36700.72730.80780.19780.02140.20430.95370.67140.29420.37800.0279∑110744.0210.845042.6—4.2838表10-6{(2)Y=5时,智商值的估计值:六、应用相关分析和回归分析应注意的问题(一)、在定性分析的基础上进行定量分析。(二)、只有当|r|≥0.5时才能进行回归分析。(三)、利用回归模型进行回归估计时,只能进行内插估计,不能进行外推预测。(四)、一种回归模型只能做一种估计。(五)、在进行多元回归分析时,应注意避免出现多重共线性问题。(六)、应考虑社会经济现象的复杂性。(七)、注意具体问题具体分析。七、相关与回归分析的步骤(一)、定性判定,画散点图(二)、列出计算表格(三)、计算相关系数r(四)、计算a、b参数,拟合一元回归方程(五)、计算估计标准误差Sy,(六)、进行预测某市十家超市每人月平均销售额和利润率资料如下:要求:(1)画出人均销售额与利润率的相关散点图;(2)计算的人均销售额与利润率的线性相关系数;(3)拟合人均销售额与利润率之间的一元线性回归模型,并指出回归系数的经济含义;(4)计算的人均销售额估计标准误差;(5)估计为人均销售额1万元时的存款额;(6)估计利润率为15%时的销
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026年初二化学(综合复习)上学期期末检测卷
- 2026年资产评估能力(资产分析)考题及答案
- 2025年高职建筑工程施工(测量放线)试题及答案
- 2025年中职软件工程(软件设计进阶)试题及答案
- 2025年大学(动画)三维动画制作期末试题及答案
- 2025-2026年九年级地理(区域发展)单元试卷
- 深度解析(2026)《GBT 18311.1-2003纤维光学互连器件和无源器件 基本试验和测量程序 第3-1部分检查和测量 外观检查》
- 深度解析(2026)《GBT 18128-2000应用错误与确认报文》
- 深度解析(2026)《GBT 17980.116-2004农药 田间药效试验准则(二) 第116部分杀菌剂防治苹果和梨树腐烂病疤(斑)复发》
- 深度解析(2026)《GBT 17980.2-2000农药 田间药效试验准则(一) 杀虫剂防治稻纵卷叶螟》
- 产褥感染课件
- 2025江苏省苏豪控股集团招聘参考笔试试题及答案解析
- 介入手术室护理查房
- 个体化肿瘤疫苗的临床前开发策略
- 装饰公司合伙协议书
- 尊崇宪法维护宪法
- 排水设施使用协议书
- 老年人失智症行为和精神症状(BPSD)护理方案
- 2025年超星尔雅学习通《环境经济学与生物资源管理》考试备考题库及答案解析
- JJG 1148-2022 电动汽车交流充电桩(试行)
- 智慧树知到《创新创业与管理基础(东南大学)》章节测试附答案
评论
0/150
提交评论