




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,贵州财经学院数学与统计学院,第一节相关与回归分析的基本概念,第七章相关与回归分析,第二节简单线性相关与回归分析,一、函数关系与相关关系,(一)函数关系,1、是一一对应的确定关系.2、当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量。3、各观测点落在一条线上.,客观现象总是普遍联系和相互依存的。客观现象之间的数量联系存在着两种不同的类型。一种是函数关系;另一种是相关关系。,第一节相关与回归分析的基本概念,y=f(x),4、函数关系举例。当某种商品的单价p一定时,其销售额(y)与销售量(x)之间的关系可表示为y=px圆的面积(S)与半径之间的关系可表示为S=R2,(二)相关关系,1、变量间关系不能用函数关系精确表达;2、一个变量的取值不能由另一个变量唯一确定;3、当变量x取某个值时,变量y的取值可能有若干个;4、各观测点分布在直线周围。,相关关系是指客观现象之间存在一定的数量关系,但这种关系是不确定的、不严格的数量依存关系。,y=f(x),x,y,5、相关关系举例商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系,二、相关关系的种类(1)按相关的程度分,有完全相关、不完全相关和不相关。(2)按相关的性质分,有正相关和负相关。(3)按相关的形式分,有线性相关和非线性相关。(4)按影响因素多少分,有单相关和复相关和偏相关。,当自变量X值增加,因变量Y值也随之增加,这样的相关关系就是正相关。,当自变量X的值增加时,因变量Y的值随之而减少,这样的相关关系就是负相关。,正相关,负相关,一个因变量与一个自变量的相关,也称为一元相关。,单相关,正线性相关,负线性相关,不相关,完全正线性相关,完全负线性相关,非线性相关,三、相关分析与回归分析,(一)概念,相关分析和回归分析是研究现象之间相关关系的两种基本方法。,1、相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化,2、相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量,3、相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制,(二)相关分析与回归分析的关系,(三)相关分析与回归分析的主要内容,1、确定现象之间有无相关关系,以及相关关系的表现形态。(1)定性分析;(2)制作相关图(或相关表)。2、确定相关关系的密切程度。(1)相关系数的计算;(2)相关系数的检验。3、确定相关关系的回归数学模型,并进行参数估计。4、回归预测,并计算估计标准误差。,四、相关表和相关图,相关图又称散点图。用来反映两变量之间相关关系的图形。根据表71的资料绘制的相关图如下:人均收入(x)和人均消费(y),结果显示:两者存在线形关系,且相关程度密切。,五、相关系数,(一)概念相关系数(单相关系数)是测定两变量是否线性相关且相关关系密切程度的指标。它包括总体的相关系数和样本的相关系数。,定义式:,(二)相关系数(样本相关系数)的计算,计算公式,r的取值介于-1与1之间。r=0不存在线性关系;r1完全线性相关(函数关系);0|r|1不同程度线性相关;r越接近0相关程度越弱,r越接近1相关程度越强。(00.3微弱,0.30.5低度;0.50.8显著;0.81高度),(三)相关系数的特点,2000年我国部分省市城镇居民人均消费支出和收入情况,上例中:r=0.9933,样本相关系数是利用样本数据计算的,因而带有定的随机性。样本容量越小其可信程度就越差因此也需要进行检验。,检验统计量,t检验:对总体相关系数是否等于0进行检验,(四)相关系数的检验(t检验),在一定的显著水平下,当tt/2,接受H0,两者不存在线性相关,上例中:r=0.9933n=13,查表可知;显著水平为1,自由度为11的临界值t/23.106。上式中的r值大于3.106,拒绝H0。接受H1。因此r通过显著性检验。这就是说,这一结论证明人均收入(x)和人均消费(y)之间存在一定程度的线性相关关系。,第二节简单线性相关与回归分析,一、一元线性回归模型的建立二、一元线性回归模型的估计,一、一元线性回归模型,u是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对的影响。,在回归分析中,最简单的模型是只有一个因变量和一个自变量的线性回归模型,即一元线性回归模型。该模型假定因变量y主要受自变量x的影响,它们之间存在着近似的线性函数关系,即有:,(一)总体一元线性回归函数,12u,(二)样本一元线性回归函数:一般情况下,总体回归函数是未知的,需要利用样本的信息对其进行估计。根据样本数据拟合的直线,称为样本回归直线。显然,样本回归线的函数形式应与总体回归线的函数形式一致。样本一元线性回归模型可表示为:,即,实际观测值Y,并不完全等于样本回归直线上因变量估计值,如果用e表示二者之差(eY-),则有,样本回归线与随机误差项,Y,(eY-)称为残差,在概念上,与总体误差项u相互对应;,。,=0,估计回归方程的参数有许多方法,其中使用最广泛的是最小平方法,下面我们采用最小平方法来估计回归方程的参数。最小平方法的中心思想,是通过数学方程,配合一条较为理想的趋势线,这条趋势线必须满足两个条件:,二、一元线性回归模型的估计,(一)回归系数的估计,(1)原数列的观测值与方程的估计值的离差平方和为最小(2)原数列的观测值与方程的估计值的离差总和为零,设,将对求偏导数,可得:,加以整理后有:,以上方程组称为标准方程组,式中的是样本容量。,回归系数的最小二乘估计量,求解这一方程组可得:,(二)总体方差的估计,利用直线回归方程,估计或预测出的因变量数值与实际值y可能一致,也可能不一致。因而就产生了估计值的代表性问题。2是测定回归方程推算结果(估计值)的准确程度(代表性)的统计分析指标。,总体方差是总体随机误差项u的方差2。2可以反映总体回归模型误差的大小。由于随机误差项本身是不能直接观测的因此,需要用样本残差e的方差2来估计2。,式中,e是样本残差,分母是自由度,其中是样本观测值的个数。,估计标准误差,是测定样本回归线的代表性强弱的指标。越小表明实际值与所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电缆产品知识培训课件
- 河南省三门峡市陕州区2022-2023学年九年级上学期期中化学试题(含答案)
- 电站防汛知识培训心得课件
- 电磁兼容EMC基础知识培训课件
- 本科护理化学考试题库及答案
- 北京高中语文考试卷子及答案
- 北航研究生期末考试题及答案
- 新解读《GB-T 3000-2016致密定形耐火制品 透气度试验方法》
- 电焊基础培训知识课件
- 电焊初级基础知识培训内容课件
- 2025年春季学期1530学生安全教育记录表
- 《椅旁CADCAM全瓷修复技术指南》
- 空调维修保养合同范本
- 钣金安全生产培训
- 老年人口腔护理宣教
- 无人售货机的食品安全管理制度
- 鼻饲肠内营养腹泻的护理
- 高压氧舱培训
- 中餐分餐课件教学课件
- 检验科技术人员基本技能考核表2014
- 小学生防性侵安全教育主题班会课件
评论
0/150
提交评论