免费预览已结束,剩余2页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.1 一元线性回归预测回归预测在研究社会许多现象之间的定量关系方面有着十分广泛的应用,一元线性回归预测是最基本的、最简单的预测方法,是掌握其它回归预测方法的基础。一、参数估计一元线性回归预测模型的数学表达式是一元线性方程: (2-1)式中:预测对象,因变量或被解释变量; 影响因素,自变量或解释变量; 回归系数。其含意表示事物主要受一个因素的影响,而且这种影响是呈线性关系的。但是,事实上,自变量与因变更的关系并不完全是一条直线,而只是近似一条直线。但是怎样的直线才能最好地反映了与的关系呢?就是说,是否有一种方法使所确定的回归系数、是最佳的呢?最常用的方法是最小二乘法。即参数、的估计,一般采用最小二乘法。对于预测对象,相关因素,可以收集到对数据:如果经回归分析得到回归预测模型如式2-1所示,则对于每一个相关因素的值对应有一个的估计值。则实际值与估计值一般是不相等的,存在一个偏差,称为估计误差或残差,用表示。即 或写成最小二乘法是以误差平方和最小这一原理来估计系数,从而建立回归预测模型的。设以表示误差平方和,则有: (2-2)很显然,是参数、的函数,当求最小时,根据微分学中极值原理有:即 (2-3) (2-4)求解上联立方程可得 取 为的平均值, 为的平均值。代入(2-5),(2-6)式中,并将简写为,则有 按式(2-7)、(2-8)求得的参数所建立的一元线性回归预测模型具有最小的误差平方和。二、模型检验 回归预测模型建立后,是否与实际数据有比较好的拟合度其模型的线性关系的显著性如何?能否用来进行实际预测?必须进行数理统计和实际意义检验。常用的统计检验有,标准离差()检验、相关系数检验、显著性检验和随机性检验。 1标准离差检验 标准离差,用来检验回归预测模型的精度,其计算公式为: (2-9)或 (2-10) 从式(2-9)可以看到反映了回归预测模型所得的估计值与实际值的平均误差,所以希望的值越小越好。一般要求 (2-11) 2相关系数检验相关系数,用来检验两个变量之间的线性相关的显著程度,其计算公式为 (2-12)或 (2-13)此外,的另一种算法为 (2-14)数学上可以证明(2-12)式或(2-13)式与(2-14)式是完全等价的。如果 则得 即 当时,实际值完全落在回归直线上,与有完全的线性关系。当时,与有一定的线性正相关关系,即随的增加而增加。当时,与有一定的线性负相关关系,即随的增加而减少。当时,则说明与之间不存在线性关系,或许是因为两者之间的确没关系,或是二者之间不存在线性关系,而存在某种其它关系。由此可以看到,只有当接近于1时,才能用一元线性回归预测模型来描述与之间的关系,但在实际预测中,的值不一定十分接受于1,这样,应该大到什么程度,回归预测模型才有实际意义呢?实际检验中是通过与临界相关系数。的比较来判断的,这个过程叫相关性检验,其方法如下:(1)按式(2-12)、(2-13)或(2-14)计算;(2)拟定显著性水平,(一般取,即95%的置信度),然后查相关系数检验表,查表明取自由度,得到相关系数临界值。(3)进行判别。当时,与在显著水平下显著相关,检验通过。当时,与线性关系不显著。3检验检验用来检验与之间是否存在显著的线性统计关系。如果检验结果是否定的,即与之间不存在显著的线性统计关系,那么,所建立的回归预测模型无效,不能用来进行预测。的计算公式为 (2-15)或 (2-16)由式(2-16)可知值与值之间有一定关系,若显著水平已知时,由表可查得的临界值,可以求出相应的相关系数临界值即 (2-17)和相关系数检验一样,检验也是通过查得临界值,然后进行比较来进行判断的。其方法如下:(1)按(2-15)或(2-16)式计算值;(2)拟定显著性水平(一般取),查检验表,取自由度,得临界值;(3)进行判别。当时,认为与之间在显著水平下的存在线性统计关系,检验通过,所建回归预测模型有效。当时,认为与之间在显著水平不下存在线性统计关系,所建回归预测模型无效。4检验检验即为杜宾-瓦特森(Durbin-Watson)检验,又叫序列相关检验,序列相关是指同一变量前后期之间的相关关系。以一元线性回归预测模型来说。为随机误差项。回归模型的统计特征有一个假定,即是互不相关的。如果这个假定不能满足,就称是相关的,即存在序列相关,反之,是独立的,不存在序列相关。应该认识到,序列相关是一种常见的现象,如在社会经济系统中,人口的增加与前一年或几年人口有关,年的投资可能与年的投资有关,甚至与、年或更早些时的投资有关,科技进步水平的提高也是与以往的科技水平为基础的。此外,有时间序列数据的处理中,因采用内插、平滑等方法,也会引起序列相关问题。因此,序列相关在回归分析中是经常遇到的现象。但是,由于存在序列相关,当采用最小二乘法建立回归预测模型时,将会使、的估计不再具有最小方差,不再是有效的估计量,将会使系统检验功能减小,置信区间过宽,使预测失效。因而,必须对回归预测模型进行序列相关检验,以保证预测结果的有效性。检验方法如下:(1)计算的值。统计量定义为 (2-18)(2)拟定显著水平,查检验表,查得在样本个数为,变量个数时的临界值。(3)判别。判别的原则如表2-1。三、回归预测模型的预测和置信区间计算经以上检验并通过后,回归预测模型可用于预测。预测时,先确定自变量的值,然后代入所建立的回归预测模型,便可计算得到因变量的预测值。在确定自变量的值时,可能根据计算值得到,也可以通过其它预测模型,如时间序列模型得到。表2-1 检验判别表值检 验 结 果否定假设,有负序列相关否定假设,有正序列相关接受假设,无序列相关检验无结论检验无结论但是,由于回归预测模型是经过数理统计方法得到,有一定的误差,因而使预测结果也有一定的误差,即预测结果有一定的波动范围,这个范围称为置信区间,其计算方法如下:(1)按式(2-10)或(2-11)计算标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中学期末考试总结与表彰大会讲话稿
- 幼儿园家长会组织方案及案例
- 电商平台退换货流程规范
- 高中化学鲁科版选修教电解原理的应用教案(2025-2026学年)
- 英语语法讲解状语从句教案
- 川脐血库版介绍孕妇讲座教案
- 韩愈师说教案
- 幼儿园大班社会活动《动画片》教案
- 资料苏教版小学第十册美术教案(2025-2026学年)
- 小学语文部编人教版二年级上册古诗两首教案
- 儿童趣味化学知识
- 2025四川甘孜州色达县考聘公安警务辅助人员31人笔试考试备考试题及答案解析
- 腰肌劳损图文配合课件
- 电线电缆安全风险评估操作方法
- 苏教版三年级上册数学全册教学设计(配2025年秋新版教材)
- 2025至2030全球及中国过程分析技术(PAT)行业发展趋势分析与未来投资战略咨询研究报告
- 房屋市政工程生产安全重大事故判定标准
- 绿化器械安全使用培训课件
- 失禁护理指南
- 食源性疾病爆发培训课件
- 小儿晕厥的急救课件
评论
0/150
提交评论