版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、现代科技综述系列回归分析科技是人类区别于动物的重要文明之一,是人类对自然规律研究和利用的学科。本文提供对科技基本概念“回归分析”的解读,以供大家了解。回归分析数理统计的一个重要分支。在数量分析中往往会发现有些变量之间存在着某种不确定的关系。如果其中一些变量为可控变量而另一些变量作为它们的因变量对这种不确定关系的分析研究称为回归分析。通过回归分析可建立可控变量与因变量之间的数学表达式,从而进行预测和控制。早在19世纪初,就有人利用最小二乘原理作了一些回归分析方面的工作,而“回归”一词则由英国FGalton首先提出的,同时他还对父母的身高与子女的身高之间的关系进行了回归分析。不确定关系中最简单的情
2、况可归纳成由Gauss-Markov给出的线性回归模型。模型形式为:若对随机变量y和变量x1,x2,xp取得了几组观测测量(样本): (yi;xil,xi2,xip)(i=1,2,n) 且数据满足关系:yi=0+1xi1+2xi2+pxip+i(i=1,2,n) 其中诸1,2,n相互独立,且均服从N(0,2)分布。模型中的0,1,p为待估计参数,称为回归系数。求出了0,1,p的估计值,便可建立起回归方程: 模型也可表示成矩阵形式: 其中:Y=(y1,y2,yn)T;=(0,1,p)T; I为n阶单位矩阵: 模型中参数向量的估计的古典方法是最小二乘估计(LS估计)。若记的估计值为,由最小二乘原理
3、及微积分知识可建立起正规方程组: (XTX)=XTY 当XTX非奇异时,的LS估计为: 的LS估计具有良好的性质:(1)是的线性无偏估计。(2)对y与x1,xp可进行显着性假设检验。(3)可检验第i个因素xi对y是否有显着影响。正因为这些性质,所以LS估计至今仍被不少统计工作者采用。非线性情况一般都尽可能化为线性情况处理。多项式回归是最常用的非线性回归。对p元多项式回归只要令x1=x1,xp=xp,便可化为p元线性回归。正交多项式回归则是一种改进的多项式回归。逐步回归是随电子计算机技术的发展而产生的一种回归方法,就是将变量逐一引入回归方程,先建立与y相关最密切的一元线性回归方程,然后再找第二个
4、变量建立二元线性回归方程,每一步都要引入变量的显着性检验,仅当其显着时才引入,而每引入一个新变量后对前面已引进的老变量又要逐一检验,若发现某个变量变成不显着,就要将它剔除;重复这些步骤直到引入的变量均为显着而又没有新的变量可引入时,就结束挑选变量的工作而建立回归方程。LS估计具有很多优良性质,但有时并不很理想。这主要是由两个原因引起的。其一是当x1,x2,xp存在复共线性时(即X的列向量接近线性相关时),LS估计性能变坏;其二是LS估计受异常值影响很大。为了克服以上缺点,从20世纪60年代开始产生了一些新的参数估计法。岭回归是由AEHorel在1962年提出,RWPlennard在1970年完
5、善这种估计方法。岭回归的基本想法是以经过“中心化”、“标准化”处理的线性回归模型(这时0=0),选择适当的k使达到尽可能小的均方误差,以便消除复共线性的影响。因k的选择依赖于未知参数和2,所以选择k有一定的困难。对k的选择法有岭迹法、方差扩大因子法等。必需指出的是岭回归不具有无偏性。主成份估计是WFMally于1965年提出的一种回归估计法。其基本思想为:对原自变量x1,x2,xp通过一个线性变换产生一组新的自变量Z1,Z2,Zp然后把新自变量组中对试验变化不大的自变量并入模型的常数项中去(即以0为回归系数),这样便消除了X的复共线性。稳健回归是为了克服估计值受异常观测值较大影响而提出的一类回
6、归分析法。不少学者提出了多种稳健回归,其中Huber在1964年引入的M估计较为常用。事实上随着x的增加x2迅速增加,为此用一个增加速度比x2慢的的函数(x)代替x2以减少异常观测值对估计值的影响,这种想法就是M估计的出发点。不依赖模型的分布类型的回归分析法称为非参数回归。权函数回归是非参数回归中较成熟的一种。这里的权函数是“距离”的函数(“距离”可以是广义的,不一定是欧氏距离),它反映了对样本值的不同重视程度。下面给出权函数回归的一般方法: 记样本值为:(i=1,2,n) (xi1,xi2,xin)(i=1,2,n)为点Pi的坐标。要求点处y的预测值。这里的“距离”就是指从Pi到Q之间的距离
7、。由于离Q点越近的Pi对应的函数值yi对Q点处y的值影越大,故pi离Q越近权重应越大。当权函数已确定,便可得回归函数E(yx)的估计值。还需说明一点,权函数的确定除了要满足一定的数学条件外,还要考虑实际情况。而权函数与最小二乘估计的结合回归法,则是统计工作者比较乐意使用的方法。样条函数、计算方法等数学学科在回归分析中的应用日益广泛必会促使新的回归分析法的产生;而对某些回归分析性质的进一步讨论、研究也是当前人们感兴趣的一类问题。随着人们对社会科学、自然科学中不确定数量关系研究的不断深入,电子计算机技术在回归分析的应用日益广泛,可以相信回归分析这一学科必会得到进一步的发展。【参考文献】: 1 中国科学院数学研究所数理统计组回归分析北京:科学出版社,1975 2 Seber G AFLinear Regression AualyeisWiley,1977
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年造价管理与施工安全的关系研究
- 2026年基于生命周期的房地产融资模型
- 2026年基于BIM的土木工程可操作性分析
- 2026年气候变化与桥梁工程市场需求的适应
- 2026年房地产客户关系管理与人工智能的结合
- 电力科技创新培训课件
- 商业道德风险评估与控制方案
- 2026年五年级上册期末押题作文:《那一次我真-》例文4篇
- 胃穿孔的护理课件
- 造影剂肾病水化治疗
- 广东省深圳市福田区五校2024-2025学年九年级上学期期末(一模)化学试题(含答案)
- 承包商安全考核实施细则
- 2026年湖南财经工业职业技术学院单招职业技能测试题库及答案详解1套
- 西南名校联盟2026届“3+3+3”高考备考诊断性联考(一)英语试卷
- 干旱灾害课件
- PCOS卵泡微环境的干细胞重塑策略
- 《马原》期末复习资料
- 保乳术后放疗剂量分割方案优化
- 雨课堂学堂在线学堂云高等药理学 中国药科单元测试考核答案
- 2026-2031中国户外用品行业现状分析及前景预测报告
- 矛盾纠纷调解课件
评论
0/150
提交评论