




已阅读5页,还剩84页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学,第一章总论第二章统计调查与统计整理第三章综合指标第四章参数估计第五章假设检验第六章方差分析第七章相关与回归第八章时间序列第九章指数,统计分析,1,第七章相关与回归分析,2,【主要内容】,一、相关和回归分析的基本概念二、一元线性回归分析三、多元线性回归分析四、非线性回归分析,3,1、什么是相关?2、什么是相关分析?3、相关分析主要解决什么问题?,4,第一节相关分析的意义和任务,一、相关关系的概念(注意相关关系与函数关系的区别),(一)函数关系,它反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来。,5,第一节相关分析的意义和任务,一、相关关系的概念(注意相关关系与函数关系的区别),例如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。销售额=销售量价格例:圆的面积与半径的关系;计件工资总额与零件数量;看书时间和学习成绩。,6,出租汽车费用与行驶里程:总费用=行驶里程每公里单价,函数关系确定性关系,7,(二)相关关系,它反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:,1.现象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;,2.现象之间的这种依存关系是不严格的,即无法用数学公式表示。,8,家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。,相关关系非确定性关系,9,商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品的销售量也会随之发生变动。,在具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用X表示;发生对应变化的变量称因变量,一般用y表示。,10,二、相关关系的种类,11,1.按相关关系涉及的因素多少来分,可分为:单相关和复相关。,在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关。,二因素之间的相关关系称单相关,即只涉及一个自变量和一个因变量。,三个或三个以上因素的相关关系称复相关,或多元相关,即涉及二个或二个以上的自变量和因变量。,12,2.按相关关系的性质来分,可分为:正相关和负相关,正相关是指两相关现象变化的方向是一致的。负相关是指两相关现象变化的方向是相反的。,13,3.按相关关系的形式来分,可分为:直线相关和曲线相关,直线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。,曲线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。,14,4.按相关程度分,可分为:完全相关、不完全相关和不相关,完全相关就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。不相关是指两现象之间在数量上的变化上各自独立,互不影响。不完全相关就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关系。,15,三、相关分析的任务和内容,相关分析的主要任务,概括起来是两个方面:,一方面,研究现象之间关系的密切程度,即相关分析;另一方面,研究自变量与因变量之间的变动关系,即回归分析。,16,相关分析的主要内容包括以下五个方面:,1.判断社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这是相关分析的出发点;2.确定相关关系的密切程度;3.测定两个变量之间的一般关系值;4.测定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;5.相关系数的显著性检验。,17,四、相关分析和回归分析,研究现象之间相关关系的两种基本方法:,相关分析,用一个指标来表明现象间相互依存关系的密切程度回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。,18,相关分析和回归分析的区别,1两者在关心变量性质上的不同。在回归分析中,必须将变量分为自变量和因变量,以便建立回归方程;也必须将变量分为确定性变量和随机变量,以便研究随机变量的分布以及对其进行统计推断。区分变量的性质是回归分析的前提条件,是回归分析中首先要解决的一个问题。相关分析中两变量是对等的,都是随机变量,不区分自变量和因变量.,19,2两者的任务和目的不同。回归分析是根据现象之间关系的特点,运用一定的办法,建立最适合于变量之间关系的回归方程,而且随着变量的变换,回归方程也会随之改变,回归方程是用来反映变量之间数量的平均变动关系,进而对因变量进行估算或预测。相关分析是通过计算相关指标,用来反映回归方程所表明变量之间依存关系的密切程度,是不能进行估算和预测的。,20,3两者的使用范围不同。回归分析只限于研究数量标志之间或指标之间的数量关系,对于品质标志之间和等级之间的关系在没有数量化之前是无法研究的。相关分析研究范围比回归分析研究的范围要广泛得多。从研究的范围来看,可以说,凡是能够进行回归分析的,都能够也必须进行相关分析,而能够进行相关分析的,却不一定能够或不都需要进行回归分析,回归分析总需要相关分析的帮助,而相关分析却不一定需要回归分析的帮助,相关分析具有独立性。,21,相关分析和回归分析的联系,相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析是建立在相关分析的基础上,需要依靠相关分析来表明现象数量变化的程度,只有当变量之间存在高度相关时,回归分析才有意义。,22,第二节简单线性相关分析,一、相关表和相关图,相关图,也称散布图(或散点图)。,相关表的种类,23,定性分析,依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。,定量分析,在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形态及密切程度。,相关表和相关图的作用:相关关系的测定,24,相关表的编制1、编制相关表前首先要通过实际调查取得一系列成对的标志值资料作为相关分析的原始数据。2、相关表的分类:简单相关表是资料未经分组的相关表,它是把因素标志值按照从小到大的顺序并配合结果标志值一一对应而平行排列起来的统计表。分组相关表是在简单相关表的基础上,将原始数据进行分组而编成的统计表。,25,、单变量分组相关表,自变量分组并计算次数,而对应的因变量不分组,只计算其平均值。单变量分组相关表的特点:使冗长的资料简化,能够更清晰地反映出两变量之间相关关系。、双变量分组相关表:自变量和因变量都进行分组而制成的相关表,这种表形似棋盘,故又称棋盘式相关表。,26,相关图的编制,1、相关图:利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,而将两变量相对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形。2、相关图被形象地称为相关散点图3、因素标志分了组,结果标志表现为组平均数,所绘制的相关图就是一条折线,这种折线又叫相关曲线。,27,正相关,负相关,曲线相关,不相关,又称散点图,用直角坐标系的x轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。,相关图,28,29,某市1996年2003年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。,简单相关表,30,分组相关表,31,二、相关系数,相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号r表示。,32,r的测定方法:,33,仍以上例1资料计算:,34,经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。,35,对r的解释如下:(即r的特点),(1)r取正值或负值决定于分子协方差;(2)r的绝对值,在0与1之间;(3)r的绝对值大小,可说明现象之间相关关系的紧密程度。,36,积差法公式进一步化简如下:,37,2.简捷法,38,39,资料计算如下:,40,3.从单变量分组表计算相关系数,41,三、简单线性相关分析的特点,通过对r的计算方法的讨论,可看出二个明显特点:,2.相关关系中只能计算出一个相关系数r。,1.相关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量;,42,3、相关系数与判定系数,在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,用r表示,相关系数,43,r2越接近于1,表明x与y之间的相关性越强;r2越接近于0,表明两个变量之间几乎没有直线相关关系.,相关系数与判定系数,是相关系数的平方,用r2表示;用来衡量回归方程对y的解释程度。,判定系数取值范围:,判定系数,44,第三节回归分析,一、回归分析的概念和种类二、一元线性回归分析三、多元线性回归分析四、非线性回归分析,45,一、回归分析的概念和种类什么是回归?什么是回归分析?,46,回归分析的种类,1、回归分析按变量的多少可分为:简单回归复回归2、回归分析按回归的形式可分为:线性回归:一元线性回归多元线性回归非线性回归,47,(一)标准的一元线性回归模型(二)一元线性回归模型的估计(三)一元线性回归模型的拟合优度(四)一元线性回归模型的检验(五)一元线性回归模型预测,二、一元线性回归分析,48,(一)标准的一元线性回归模型,1、回归函数总体回归函数t01tutut是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对的影响。,49,样本回归函数:,.nt称为残差,在概念上,t与总体误差项ut相互对应;是样本的容量。,50,51,样本回归函数与总体回归函数区别,总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。总体回归函数中的1和2是未知的参数,表现为常数。而样本回归函数中的是随机变量,其具体数值随所抽取的样本观测值不同而变动。总体回归函数中的ut是t与未知的总体回归线之间的纵向距离,它是不可直接观测的。而样本回归函数中的t是t与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出t的具体数值。,52,误差项的标准假定,假定:误差项的期望值为零:(ut)。假定:误差项的方差为常数:Var(ut)。假定:误差项之间不存在序列相关,协方差为零:Cov(utus)()。假定:自变量是给定变量,与误差项线性无关。假定:随机误差项服从正态分布。满足以上标准假定的一元线性回归模型,称为标准的一元线性回归模型。,53,(二)一元线性回归模型的估计,一元线性回归方程的几何意义,截距,斜率,一元线性回归方程的可能形态,54,总体一元线性回归方程:,以样本统计量估计总体参数,截距表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数表明自变量x每变动一个单位,因变量y平均变动个单位。,样本一元线性回归方程:,估计的一元线性回归方程,55,估计值的特性:,56,最小平方法,利用残差平方和为最小来估计回归系数的一种方法,又称最小二乘法。,57,58,59,根据整理方程简化可得:,60,61,【例】计算工业总产值与能源消耗量之间的相关系数及判定系数资料,62,63,【例】计算工业总产值与能源消耗量之间的相关系数及判定,64,结论:工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量x的变化能够解释工业总产值y变化的95.2。,65,【例】建立工业总产值对能源消耗量的线性回归方程。,【分析】因为工业总产值与能源消耗量之间存在高度正相关关系(r=0.9757),所以可以拟合工业总产值对能源消耗量的线性回归方程。,解:设线性回归方程为,66,【例】建立工业总产值对能源消耗量的线性回归方程,线性回归方程为:,结果表明,其他条件不变时,能源消耗量每增加10万吨,工业总产值将增加0.7961亿元。,67,(三)一元线性回归模型的拟合优度,拟合优度,是指样本观测值聚集在样本回归线周围的紧密程度。,68,1、可决系数用于度量回归直线的拟合程度,可决系数是建立在对总离差平方和进行分解的基础上的。2、估计标准误(从另一个侧面反映回归线的拟合程度)用来测度各实际观测点在直线周围的散布状况,也称估计量的标准差或标准误差,69,误差平方和,回归平方和,总离差平方和,70,总离差平方和,回归平方和,残差平方和,71,可决系数是对回归模型拟合程度的综合度量,可决系数越大,模型拟合程度越高。可决系数越小,则模型对样本的拟合程度越差。,可决系数,72,可决系数的性质:,(1)可决系数具有非负性。(2)可决系数的取值范围为(0,1)(3)可决系数是样本观测值的函数,是一个统计量。,73,可决系数与相关系数的关系,74,可决系数与相关系数的区别,可决系数无方向性,相关系数则有方向,其方向与样本回归系数b相同;可决系数说明变量值的总离差平方和中可以用回归线来解释的比例,相关系数只说明两变量间关联程度及方向;可决系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。,75,总体方差的估计,该式中,分母是自由度,其中是样本观测值的个数,是一元线性回归方程中回归系数的个数。在一元线性回归模型中,残差t必须满足:,因而失去了两个自由度,所以其自由度为。2的正平方根又称做回归估计标准误差可利用它做区间估计。,76,总体方差的估计,回归估计标准误差(S),是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准确。,77,总体方差的估计,回归估计标准误差的简化计算:,78,回归估计标准误差的计算:,【例】计算前面拟合的工业总产值对能源消耗量回归方程的回归标准差.,79,(四)一元线性回归模型的检验,线性关系的检验对整个回归方程的显著性检验,通常采用在方差分析基础上的F检验。回归系数的检验对各回归系数的显著性检验,通常采用t检验;在一元线性回归模型中,由于只有一个解释变量,对回归系数的t检验与对整个方程的F检验是等价的。回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设进行检验。,80,检验统计量:其中:,81,【例】对工业总产值与能源消耗量之间的回归
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年福建省古田县人力资源和社会保障局招聘10人考前自测高频考点模拟试题带答案详解
- 2025湖南永州市零陵区第二批公开引进急需紧缺专业人才(医疗岗9人)模拟试卷及答案详解(历年真题)
- 2025赤峰市中心医院招聘8控制数人员考前自测高频考点模拟试题及答案详解(易错题)
- 2025广东汕头大学医学院教务处医学教育拓展项目教辅人员招聘1人考前自测高频考点模拟试题附答案详解(考试直接用)
- 2025年宁波市鄞州区面向社会公开招聘社区专职工作者55人模拟试卷及答案详解(典优)
- 2025贵州省体育局直属事业单位第十三届贵州人才博览会引才1人模拟试卷有完整答案详解
- 2025重庆泰科防务科技有限公司招聘8人笔试历年参考题库附带答案详解
- 2025重庆两江新区人才发展集团有限公司派往泰科防务科技(重庆)有限公司招聘8人笔试历年参考题库附带答案详解
- 2025辽宁葫芦岛市南票区招聘区属国有企业高级管理人员3人笔试历年参考题库附带答案详解
- 2025贵州关岭自治县农旅产业投资(集团)有限责任公司引聘人才(第一批次)笔试历年参考题库附带答案详解
- 人社局聘用合同范本
- 2024年新北师大版七年级上册数学教学课件 第三章 整式及其加减 1 代数式 第1课时 代数式
- 2024 年甘肃省职业院校技能大赛高职组公共管理与服务类人力资源服务赛项竞赛规程
- NB-T+35056-2015-水电站压力钢管设计规范
- 2024年垃圾分类知识考试题库及答案
- 平行四边形的面积集体备课发言稿
- 大学美育(第二版) 课件 第八单元:建筑艺术
- 思想政治教育专业大学生职业生涯规划书
- 医院科研经费管理办法
- 2023年广州海洋地质调查局招聘社会在职人员高频考点题库(共500题含答案解析)模拟练习试卷
- 运用PDCA循环降低住院患者雾化吸入的不规范率品管圈成果汇报
评论
0/150
提交评论