(岩土工程专业论文)深基坑变形时空预测研究.pdf_第1页
(岩土工程专业论文)深基坑变形时空预测研究.pdf_第2页
(岩土工程专业论文)深基坑变形时空预测研究.pdf_第3页
(岩土工程专业论文)深基坑变形时空预测研究.pdf_第4页
(岩土工程专业论文)深基坑变形时空预测研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(岩土工程专业论文)深基坑变形时空预测研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着基坑开挖深度的增大,基坑变形的预测与控制已成为岩土工程领域研究的热点 之一。深基坑支护体系的变形控制设计是当今地下工程领域的重要研究课题,而变形控 制设计首先需要变形预报分析,即对支护结构在设计使用条件下的变形规律及趋势做出 预测分析。由于复杂的工程地质因素及深基坑变形的力学机制至今还无法完全查明和准 确表述。因此,试图通过建立完全正确的力学模型进行数值分析是困难的,其准确性也 值得怀疑。实际上,深基坑变形控制目标不仅包括支护体系,而且包括相邻环境,其多 样性、模糊性、易变性、随机性决定了变形预报问题的难度。 鉴于深基坑变形控制系统中的不确定性、模糊性因素很多,是一个典型的非线性动 力学系统,利用传统的方法较难建立满意的数学模型。本论文通过深入分析支持向量机 的结构、参数特征及学习算法,并引入遗传算法,建立了基坑地表变形预测的支持向量 机模型。并利用所建立的模型对上海某实际基坑工程变形问题进行了预测,预测结果与 实际监测数据非常接近。同时将支持向量机模型与人工神经网络b p 模型预测结果和时 间序列a r 模型预测结果进行分析比较,进一步表明支持向量机模型预测效果是可靠的。 从而说明采用支持向量机模型进行基坑变形预测是可行且有效的,该模型可推广应用于 工程实践中。 本文基于c + + 编程环境,编制了支持向量机变形预报程序,针对上海某深基坑工程 地表沉降预报进行了实例分析,结果表明,本文的方法具有较好的精度、适应性和通用 性。 关键词:深基坑变形预测支持向量机人工神经网络时间序列分析 a b s t r a c t w i t l lt h ed e p t ho f f o u n d a t i o np i t sb e c o m e sb i g g e ra n d b i g g e r , t h es t u d yo f p r e d i c t i o na n d c o n t r 0 1o ft h ed i s p l a c e m e n to ff o u n d a t i o np i t sb e c o m e so n eo ft h eh o ts u b j e c t ss t u d i e di n g e o t e c h n o l o g yf i e l d t h ed e f o r m a t i o n c o n t r o ld e s i g nf o r r e t a i n i n g s t r u c t u r ei n d e e p e x c a v a t i o ni sa ni m p o r t a n ts u b j e c ti nt h ef i e l do f u n d e r g r o u n de n g i n e e r i n gn o w a d a y s a n dt h e c o n t r o la n dd e s i g n sf o rr e t a i n i n gs t r u c t u r ei sa tf i r s td i s p l a c e m e n tp r e d i c t i o n ,i na n o t h e rw o r d s i ti st om a k eap r e d i c t i o na n da n a l y z ef o rt h ed i s p l a c e m e n tl a wa n dn e n do f r e t a i n i n gs t r u c t u r e f o rt h ec o m p l i c a t e dp r o j e c tg e o l o g i c a lf a c t o ra n dt h em e c h a n i c sm e c h a n i s mo fd e e p f o u n d a t i o np i td e f o r m a t i o ni sa i s ou n a b l et ob ef o u n do u tt o t a l l ya n ds t a t e da c c u r a t e l ys of a r , s o ,i ti sd i f f i c u l tt oa t t e m p tt oe a r l yo nn u m b e rv a l u ea n a l y s i st h r o u g hs e t t i n gu pt o t a l l yc o r r e c t m e c h a n i c sm o d e l s ,i t sa c c u r a c yi sd o u b t f u lt o o i nf a c t ,t h ed e f o r m a t i o nc o n t r o lg o a lo fd e e p e x c a v a t i o nn o to n l yi n c l u d e sr e t a i n i n gs y s t e m ,b u ta l s oi n c l u d e st h ea d j o i ne n v i r o n m e n t i t s v a r i e t y , f u z z yq u a l i t y , m u t a b i l i t y , r a n d o m n e s sp r e d i c t e dd e g r e eo fd i f f i c u l t yo ft h eq u e s t i o n a f t e rd e t e r m i n i n go u to f s h a p e t h e r ea r ea1 0 to fu n c e r t a i na n df u z z yf a c t o r si nt h ed e f o r m a t i o nc o n t r o ls y s t e mo fd e e p f o u n d a t i o np i t s i ti sat y p i c a ln o n l i n e a rk i n e t i c ss y s t e m h e n c ei ti sd i f f i c u l tt os e tu ps a t i s f i e d m a t h e m a t i c sm o d e lu t i l i z i n gt r a d i t i o n a lm e t h o dr e l a t i v e l y i nt h i sp a p e r , t h ef r a m ea n dt h e c h a r a c t e ro fa r g u m e n t s ,t o g e t h e rw i t hg aa n dt h et r a i n i n ga l g o r i t h mo fs u p p o r tv e c t o r m a c h i n ea r ed e e p l ya n a l y z e d s v mm o d e li sb u i l tu pt op r e d i c a t ed i s p l a c e m e n to ff o u n d a t i o n p i t s t h e n ,t h i sm o d e li su s e dt op r e d i c a t et h ed i s p l a c e m e n to fo n ef o u n d a t i o np i t se n g i n e e r i n g p r o j e c t si ns h a n g h a i t h ep r e d i c a t i o nr e s u l t sa r ei d e n t i c a lw i t ht h em o n i t o r e dd a t a c o m p a r i n g a n da n a l y z i n gt h er e s u l tp r e d i c a t e db ys v mm o d e lw i t ht h er e s u l t sp r e d i c a t e db yb pm o d e l a n da rm o d e l ,i ti si l l u s t r a t e dt h a ts v mm o d e lh a sab e t t e rp r e d i c a t i o ne f f e c tt h a nt h o s et w o m o d e l s s o ,i ti st e s t i f i e dt h a tu s i n gs v mm o d e lt op r e d i c a t et h ed i s p l a c e m e n t so ff o u n d a t i o n p i t si sf e a s i b l ea n de f f e c t i v e a l s o ,s v mm o d e lc o u l db eu s e di np r a c t i c a le n g i n e e r i n g p r o j e c t s b a s e do nc + + p r o g r a m m i n ge n v i r o n m e n t p r e d i c t i o np r o c e d u r eh a sb e e nm a d ef o rt h i s m o d e l a f t e rw o r k i n go u tt h es v mo u to fs h a p e ,s u b s i d ea n dp r e d i c tt h a tc a r r i e so nt h e i n s t a n c ea n a l y s i si nt h el o c a t i o no ft h ee a r t h ss u r f a c eo fp r o j e c to fh o l eo ft h eb a s ed e e p l yt o s o m eo fs h a n g h a i ,n l cr e s u l ti n d i c a t e st h a tt h em e t h o do ft h i st e x th a sb e t t e rp r e c i s i o n , a d a p t a b i l i t ya n dc o m m o na b i l i t y k e y w o r d s :d e e pf o u n d a t i o np i t sd i s p l a c e m e n tp r e d i c t i o ns u p p o r tv e c t o rm a c h i n e a r t i f i c i a ln e u r a ln e t w o r kt i m es e r i e sa n a l y s i s i l 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及 取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包括其他人已经发表或撰写过的研究成果,也不包含为获得河 南工业大学或其他教育机构的学位或证书而使用过的材料。与我一同工 作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表 示了谢意。 论文作者签名:笾建 f i 期:论文作者签名:拙丝 一 期:劢拍j 乡一2 2 关于论文使用授权的说明 本人完全了解河南工业大学有关保留、使用学位论文的规定, 即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;本 人授权河南工业大学可以将学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编 学位论文。( 保密的论文在解密后应遵守此规定) 论文作者签名:垄建日期:丝! :羔星墨 导师签名: 深基坑变形时空预测研究 第一章前言 1 1 基坑变形预测的历史与现状 随着国民经济的发展,特别是近年来城市高层建筑及大型基础设施等建设规模的不 断增大,城市用地目趋紧张。由于建筑物向上伸展要受到容积率的限制,因而加大对地 下空间的利用就成了较为有效的选择。另外,为满足高层建筑自身抗震、抗风等结构要 求,以及停车、设备存储等使用要求,地下室已成为高层建筑物不可分割的重要组成部 分。这样就使得基坑深度已逐渐由6 m 、8 m 发展到1 0 m 、2 0 m 以上。而且这些工程大多位 于城市繁华地段,周围交通繁忙,建筑物密集,地下管线密布。因此,准确地预测基坑 变形从而指导基坑安全施工对于人类的生命与财产安全具有重大意义。 近几年来人们已愈益认识到现场监测的重要性并提出了信息化旌工方法,基坑变形 预测即利用已有的变形监测数据来预测后期变形情况,由于基坑工程现场监测的时间序 列数据中蕴含着系统演化的信息,人们期望能从这些数据中找出其蕴含的规律,并用已 知的观测数据来预测系统未来的发展动态,也即利用施工过程中监测的信息来预测可能 引起的过量的变形位移和土体或结构潜在的失稳、破坏进而反馈于原设计,及时调整施 工方案或采取应急对策。 目前,无论在国内还是国外,大型基坑变形预测与控制是岩土工程领域的研究热点 之一。变形预测的方法主要可分为理论计算法和基于实测数据的实测数据分析法即反分 析法。 理论计算法主要包括以p e c k 理论为基础而不断发展、完善的经验理论法,以及以 有限元法为主的数值预测法。p e c k 于1 9 6 9 年首次提出了地表沉降曲线近似呈正态分布 曲线的概念。其后h t t e w e l l 于1 9 8 1 年提出最大地表沉降预测量。而日本的藤田研究了 不同盾构型式对地层的影响,并且在1 9 8 2 年给出了地表最大沉降量的预测值及其误差。 同济大学岩士工程系的有关专家对上海饱和软土及软粘土进行试验并提出了考虑固结 因素的p e c k 修正公式。数值预测法主要包括有限元法、半解析元法和边界元法等。国 内有学者在进行这方面的研究,李强、刘红洲等利用三维有限元分析盾构隧道引起的地 面沉降问题。孙均等用三维弹塑性有限元分析了上海地区地表受隧道开挖引起的变形问 题。在国外,f i n n o 和c l o u g h 采用二维平面应变方法模拟了美国旧金山某工程施工过程 中地层沉降隋况。i t o 和h i s a t a k e 用三维常景边界元法分析了均质线弹性地层中的地表 变形情况。 河南工业大学硕士论文 这些传统的预测模型需要大量的监测数据,其都局限于用差分方程建立离散的随机 模型,不便于描述系统变化过程的本质和内在规律。数值法具有数学方法上的精确性,但 由于基坑变形影响因素复杂、物理机制的模糊性以及参数的多变和不确定性,使得在应 用该方法时过分概化,降低了实用价值,难以提供及时可靠的分析结果。 实测数据反分析法是不管变形的作用机理如何复杂,其最终均是通过位移表现出来 的。利用现场监测数据,通过建立数据模型来预测后续开挖地层的变形。传统分析法主 要包括时序( a r ) 建模预测法和灰色系统( g m ) 建模预测法。 时间序列a r 模型本身即是一种线性自回归模型,它是一种差分方程形式的参数模 型。用此方法建立的模型并不复杂,它的形式简单,并具有良好的统计特性。但是,在 使用时,a r 模型要求数据序列为平稳、正态的序列。序列中的数据应该是其历史数据的 线性组合。可见,时间序列a r 模型表示一种随机信号的统计特性,因而要求序列数量 应该比较大,这样在观测时间较短的情况下,使用时就具有一定的难度。此外,在实际 工程监测中,观测所得的位移序列一般并非平稳、正态的随机序列。因此,在实际基坑 变形预测中一般不单独使用此模型。 灰色系统( g m ) 建模法是一种曲线拟合法,它的优点在于要求用于建模的样本数量相 对较少,原理简单,运算方便,具有可检验性。但是,灰色系统建模法也有其特定的使 用条件,灰色系统模型的适用范围为描述序列中所蕴涵的、确定性的指数规律。所以, 灰色系统不适用于数据变化规律上凸的情形,也不适用于数据中有负数的情况。更深入 的研究会发现灰色系统模型在对原始数据序列变化规律尚不清楚的情况下,只是采用指 数函数来逼近,而且理论中并不能说明此种逼近的近似程度,也未给出一种确定近似程 度的方法。灰色系统模型在建模开始时对原始数据序列进行的累加合成处理方法对确定 性的序列来说可以减少误差。而对于基坑变形观测得到的位移序列这样一类本身变化就 具有随机性的序列来说,这种处理除去了一些有用的信息,反而会导致预测误差更大。 近年来,随着计算机软硬件技术的迅猛发展,众多学者开始把机器学习的方法引入 到基坑变形预测中,建立了许多新的模型,如人工神经网络,以及改进的有限元方法等。 这些方法各有优缺点。” 比如,张尚根等人通过现场量测的深基坑围护结构变形信息资料,结合参数优化反 分析及有限元计算,建立了深基坑开挖中支护结构变形监测的预报方法;同济大学熊祚 森利用非线性动力学理论对基坑系统变形及其稳定性进行了反演分析;除此以外,更有 大量的学者用人工神经网络原理建立起了深基坑变形预测模型,如王旭东等人以b p 神 经网络为基础,建立深基坑支护结构最大侧向位移的预测模型,袁金荣等人利用b p 神经 网络建立起基坑变形时间序列预测的神经网络模型,张小凌利用神经网络建立了深基坑 2 深基坑变形时空预测研究 变形的预报模型,来拟合监测时间和监测位移的关系曲线。但是,由于基坑工程的复杂 性,它所涉及的工程地质条件和土体特性参数是不完全定量和高度非线性的,难于用确 定的数学模型表达。同时,数值方法具有计算量大、解的稳定性较差等特点,并且不能 保证搜索收敛到全局最优解。利用数值方法进行基坑变形预测,最重要的工作就是进行 土体的力学参数的选取和本构关系的确定。而由于土体是一种复杂的非线性材料,这使 得求解实际问题变得很困难。因此,数值方法用于变形预测有其局限性。可以说数值计 算、时间序列分析、灰色理论、神经网络等方法各有其优缺点,使得基坑变形预测问题 并没有得到很好的解决。 现有机器学习方法的重要理论基础之一是统计学。传统统计学研究的是样本数目趋 于无穷大时的渐近理论,现有学习方法也多是基于此假设,但在实际问题中,样本数往 往是有限的,所以这些方法存在着固有的算法缺陷。与传统统计学相比,统计学习理论 是一种专门研究小样本情况下机器学习规律的理论。支持向量机( s v m ) 方法是建立在 统计学习理论基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳 折衷,克服了神经网络分类和传统统计分类法的许多缺点,具备较高的泛化性能。支持 向量机作为数据挖掘中的一个新方法,它能非常成功地处理回归问题( 时间序列分析) 和 模式识别( 分类问题、判别分析) 等诸多问题,并可推广于预测和综合评价等领域,因此 可应用于理科、工科和管理等多种学科。目前国际上支持向量机在理论研究和实际应用 两方面都正处于飞速发展阶段。基于支持向量机的模式识别方法已经有了较成功的应 用,例如手写汉字识别、面部识别、笔记鉴别等。除此以外在回归估计、函数逼近等领 域也已有了广泛的应用。 目前,国内已经有学者把支持向量机引入到工程领域,中科院武汉岩土所的专家们 在国家“9 7 3 ”课题“灾害环境下重大工程安全性的基础研究”中为解决滑坡体力学参 数的唯一性问题,提出了滑体参数反演的进化支持向量机一有限元方法,为准确估计滑 坡的非线性变形演化特征,提出了非线性位移时间序列建模的进化支持向量机,并发表 了代表性论文1 5 篇。 王景雷等人则研究了支持向量机在地下水位预报中的应用,针对地下水系统结构不 甚清晰、基础资料不完备条件下区域地下水位预报问题,在介绍支持向量机基本原理和 实现算法的基础上,探讨了支持向量机方法在区域地下水位预报中的应用,经过与人工 神经网络方法预报结果比较,表明该方法具有速度快、泛化能力强的特点,可很好地克 服神经网络的过学习问题。 李海云、谢春琦将支持向量机应用于软土路基填筑施工中的沉降预测,提出了一种 有效的预测方法,并构造了预测路基沉降的支持向量机模型。经过与传统b p 神经网络方 3 河南工业大学硕士论文 法预报结果比较,表明该方法在较少训练样本的情况下具有精度高、泛化能力强的特点, 取得了较b p 神经网络建模方法更好的预报效果。为预测填筑施工引起的软土路基沉降 提供了一种新的方法。 北京交通大学的刘开云、乔春生等人针对边坡位移非线形时间序列的研究,采用支 持向量机算法来进行智能建模和预测。运用m a t l a b 语言来编写程序,选用不同的核函 数对具体的边坡工程实例作了计算,并将人工神经网络计算结果与之对比,无论是在学 习或预测精度方面,支持向量机算法较神经网络方法都有很大的优越性,可以运用于实 际工程。另外,他们还用支持向量机方法作了隧道变形方面的预测,同样取得了可信的 预测结果。 中科院的赵洪波、冯夏庭教授提出了一种非线性位移时间序列预测的讲化一支持向 量机方法用来进行岩土结构位移的预测,并采用遗传算法来搜索支持向量机的参数和核 函数,避免了人为选择参数的盲目性,同时提高了支持向量机的推广预测能力。运用这 种非线性智能预测方法,滚动预测施工位移变形量,就能及时调整和优化施工步序,维 护岩土结构的稳定性,他们将该方法用于卧龙寺边坡变形、三峡永船闸边坡变形预测, 结果表明,该方法具有科学可靠、实时性的优点,具有广泛的应用前景。本文试在此方 法的基础上,将支持向量机方法运用到深基坑变形预测方面,同样取得了很好的效果。 可见,根据深基坑变形的非线性特点,建立深基坑变形时间序列预测的支持向量机 模型是完全可行的。 1 2 本课题的确立及研究意义 随着城市建筑密集地区的大型深基坑工程越来越多,由此引起的环境公害问题也十 分突出。如何在保证工程自身稳定的同时,有效地控制与预报基坑周围土体变形以保证 城市地下管线以及周围环境的安全,已成为人们共同关注的问题。由于土体固有力学性 状的复杂性以及施工过程中的种种不确定因素,基坑的实际变形很难用统一的公式进行 描述,其变形量更表现出相当程度的随机性,为设计和旌工带来很大的难度,为此,愈来 愈多的学者和工程技术人员认识到现场监测的重要性,并提出了信息化施工方法。随着 我国城市建设的迅猛发展,会出现越来越多的基坑工程,因此以基坑工程作为研究对象 具有很好的学术意义和市场前景。 基坑的变形预测是基坑设计和施工的重要补充手段。通过预测数据不断调整优化设 计从而达到信息化施工的目的,这充分体现了“设计一施工一设计”的科学化施工管理模 式。由于理论计算法和传统的数据分析法都具有一定的不足之处,所以岩土工作者一直 在努力探索新的预测方法。由于支持向量机对复杂非线性系统具有较好的建模能力,对 4 深基坑变形时空预澳4 研究 数据具有良好的逼近性能,因而目前被视为解决岩土工程复杂非线性预测问题的较为有 力工具之一。 基坑变形的智能预测还处于起步和摸索阶段,还有许多方面有待于进一步的研究。 本文通过分析支持向量机的特点,利用该模型和实际监测数据建立了变形预测支持向量 机模型。从而,为变形预测的复杂、非线性问题提供了很好的解决办法,无论在理论研 究上还是实际工程应用上都具有重要的意义和价值。 近年来,随着对基坑工程性状认识的不断深入和依据现场监测进行反分析数值技术 的发展,基坑围护结构的设计正逐渐由传统的单纯验算强度和稳定性的方法向按变形控 制的动态信息设计方法过渡。在深基坑支护体系设计时,合理地考虑各项主要施工因素, 计入旋工中的时间和空间效应,充分调动并发挥土体自身控制变形的最大潜力,将会取 得十分显著的经济效益。由于士体的应力和变形都是随时间逐步释放的,其变形的增长 不仅与时间有关,而且与当时的应力作用水平和应力持续作用时间呈非线性关系,具有 明显的时间效应,而各种特定土体的本构关系及相应的土工参数又难以准确确定,因此 对于实际工程的施工实施严密的跟踪监测,并依据监测数据进行信息反馈,随时调整施 工参数,优化设计,显得极其重要。在当前阶段,在不断研究特定土体本构关系和变形 预测技术的同时,提高和完善综合监测水平以及反分析数值技术,大量积累监测数据并 进行信息反馈,将工程实践经验升华到理论高度,进而指导施工设计,是尤为重要的。 监测只能了解当前的变形,无法知道未来的变形,而未来变形的大小对工程是至关 重要的。这一问题已引起很多研究者的关注,并采用多种方法和手段进行了研究,基于 统计学习理论的支持向量机方法,克服了专家系统知识获取的“瓶颈”问题和人工神经 网络的推广能力差的问题,为基坑变形的预报研究提供了一条新的途径。 支持向量机是近年来在国外发展起来的一种新型机器学习技术,由于其出色的学习 性能,该技术已成为当前国际机器学习界的研究热点,它最早是由v a p n i k 和c o r t e s 根 据统计学理论提出的一种新的通用学习方法,由于它的优良特性,已经引起了许多研究 者的兴趣。支持向量机与传统的人工神经网络不同,s w 是基于统计学习理论的小样本 学习方法,采用结构风险最小化原则,具有很好的泛化性能;而a n n 是基于大样本的学 习方法,采用经验风险最小化原则。理论和实验表明,s v m 不但结构简单,而且具有较好 的泛化能力,尤其是对于小样本问题,成功地克服了a n n 学习过程中的“过学习”和可能 会陷入局部极小问题。另外,s v m 算法是一个凸二次优化问题,能够保证极值解是全局最 优解。 针对基坑变形的实际特点,本课题拟采用支持向量机的算法建立变形时间序列之间 的非线性关系,从而对未来的变形进行预测,以指导施工的进行。 5 河南工业大学硕士论文 1 3 本文主要研究内容和方法 1 3 1 主要研究内容 本文的主要研究内容是支持向量机模型在深基坑变形预测中的应用。文中对支持向 量机模型的结构特征、算法原理等问题进行了深入的研究,并在此基础上利用实际监测 数据建立了变形预测模型。同时,对常用的人工神经网络方法及时间序列分析方法也加 以简要分析,并利用相同的监测数据建立了人工神经网络预测模型以及时间序列预测模 型。通过分析对比这三种模型的预测结果和实际监测结果,表明支持向量机模型在变形 预测方面具有较为明显的优越性。 1 3 2 研究方法和技术路线 本文的研究方法为:通过大量查阅文献了解深基坑变形预测的发展历史及现状;总 结前人研究方法的利弊并提出新的研究方法即支持向量机方法;对支持向量机方法应用 于变形预测进行理论上的论证;通过具体的工程实例应用,比较支持向量机方法和前人 研究方法在变形预测方面的实际应用效果。 研究技术路线为:获取监测数据并对其进行预处理,利用c + + 工具,结合实际约束 条件进行s m o 算法的参数识别,并确立变形预测的支持向量机s m o 算法模型,利用此模 型进行预测,最后与人工神经网络b p 模型的预测结果、a r 模型预测结果进行了比较, 结果证明支持向量机方法运用于深基坑变形预测是可行的。 6 深基坑变形时空预测研究 第二章支持向量机理论 2 1 统计学习理论简介。1 支持向量机是基于统计学习理论的,统计学习理论( s t a t i s t i c a ll e a r n i n gt h e o r y 即s l t ) 是一种专门研究小样本情况下机器学习规律的理论。该理论最开始是由俄国科学 家v v a p n i k 、l e r n e r 和c h e r v o n e n k i s 等人于1 9 6 3 到1 9 6 4 年间提出,到上世纪九十年 代中期,随着其理论的发展和成熟,也由于人工神经网络等学习方法在理论上缺乏实质 性进展,统计学习理论开始受到越来越广泛的重视。1 9 9 2 年一1 9 9 5 年,在统计学习理论 的基础上发展出了一种新的模式识别方法一支持向量机( s u p p o r tv e c t o rm a c h i n e ) ,在 解决有限样本、非线性及高维模式识别问题中表现出了许多特有的优势,并能推广应用 到函数拟合等其他机器学习问题中。 统计学习理论是建立在套较坚实的理论基础之上的,它为解决有限样本学习问题 提供了一个统一的框架。这一套理论不仅圆满回答了人工神经网络在研究与应用当中提 出的一系列理论性问题,而且还构造出一种能克服人工神经网络局限性的学习方法一支 持向量机。目前,统计学习理论和支持向量机正在成为继神经网络研究之后新的研究热 点,并将有力地推动机器学习理论和技术的发展。我国早在八十年代末就有学者注意到 统计学习理论的基础成果,目前已有很多学者认识到这个重要的研究方向。 支持向量机是机器学习的一种方法,机器学习是基于数据的现代智能技术中的重要 方面,它主要是从观测数据出发寻找规律,利用这些规律对未来数据或无法观测的数据 进行预测。现有常用的机器学习方法包括人工神经网络、模式识别等在内,其共同的重 要理论基础之一就是传统的统计学。传统统计学主要研究的是样本数目趋于无穷大时的 渐进理论,现有学习方法也多是基于此假设。但是实际上,实际问题中所获得的样本数 目往往是有限的,这就使得一些理论上很优秀的学习方法在实际运用当中的表现就可能 不尽如人意,而支持向量机是以统计学习理论为坚实基础的。 2 2 机器学习的基本问题。“,”,” 2 2 1 学习问题的表示 机器学习的目的就是根据给定的训练样本求对某系统输入输出之间依赖关系的估 计,使它能够对未知输出作出尽可能准确的预测。可以一般地表示为:变量y 与x 存在 7 河南工业大学硕士论文 一定的未知依赖关系,即遵循某一未知的联合概率f ( x ,y ) ,( x 和y 之间的确定性关系可 以看作是其特例) ,机器学习问题就是根据n 个独立同分布观测样本: ( 一,y 1 ) ,( x :,y :) ,g 。,y 。) ( 2 1 ) 在一组函数( f ( x ,w ) 中求一个最优的函数f ( x ,w 。) 对依赖关系进行估计,使期望风 险: r ( w ) = j l ( y ,厂g ,w 归g ,y ) ( 2 - 2 ) 最小。其中,( f ( x ,w ) 称作预测函数集,w 为函数的广义参数, f ( x ,w ) 可以表示任何 函数集;l ( y ,f ( x ,w ) ) 为由于用f ( x ,w ) 对y 进行预测而造成的损失,不同类型的学习问题 有不同形式的损失函数。预测函数也称为学习机器、学习模型或学习函数。 共有三类基本的机器学习问题,即模式识别、函数逼近和概率密度估计。对模式识 别问题,输出y 是类别标号,两类情况下y = ( 0 ,1 ) 或 1 ,一1 ) ,预测函数称作指示函数,损 失函数可以定义为: f 0 ,fy = ( z ,却 z ( y ,厂0 ,w ) ) = ( 2 3 ) 1 1 ,fy 厂b ,w ) 在b a y e s 决策中使错误率最小就能使风险最小,在函数逼近问题中,y 是连续变量( 这 里假定为单值函数) ,损失函数可定义为: l ( y ,s ( x ,w ) ) = 一i ( x ,w ) ) 2 ( 2 4 ) 即采用最小平方误差准则。而对概率密度估计问题,学习的目的就是根据训练样本 确定x 的概率密度,记估计的密度函数为p ( x ,w ) ,则损失函数就可以定义为: 上( p b ,w ) ) = 一l o g p ( x ,w ) ( 2 5 ) 2 2 2 经验风险最小化原理 在以上的机器学习问题表述中,学习的目标在于使期望风险最小化,但是,由于我 们可以利用的信息只有样本( 2 1 ) ,而( 2 2 ) 式的期望风险并无法计算,因此传统的学习 方法中采用了所谓经验风险最小化( e r m ) 准则,即用样本定义经验风险: r 。( w ) = 去喜工( y ,o ,w ) ) ( 2 - 6 ) 作为对( 2 - 2 ) 式的估计,设计学习算法使它最小化,对损失函数( 2 _ 3 ) ,经验风险就是训练 样本错误率;对( 2 4 ) 式的损失函数,经验风险就是平方训练误差;而采用( 2 - 5 ) 式损失函 数的经验风险最小化准则就等价于最大似然方法。 8 深基坑变形时空预测研究 事实上,用经验风险最小化准则代替期望风险最小化并没有经过充分韵理论论证, 只是直观上合理的想当然做法,但这种思想却在多年的机器学习方法研究中占据了主要 地位。多年来人们将大部分注意力集中到如何更好地最小化经验风险上,而实际上,即 使可以假定当n 趋向于无穷大时,( 2 - 6 ) 式趋近于( 2 2 ) 式,在很多问题中的样本数目也 无法达到无穷大,那么在有限样本下经验风险虽小化准则得到的结果未必能保证真实风 险也较小。 2 2 3 复杂性与推广能力 经验风险最小化准则不成功的一个例子是神经网络的过学习问题,开始很多注意力 都集中在如何使经验风险更小,但很快就发现,训练误差小并不总能导致好的预测效果。 某些情况下,训练误差过小反而会导致推广能力的下降,即真实风险的增加,这就是过 学习问题。 之所以出现过学习现象,一是因为样本不充分,二是学习机器设计不合理,这两个 问题是互相关联的。究其原因,是试图用一个十分复杂的模型去拟合有限的样本,导致 丧失了推广能力,在神经网络中,若对有限的样本来说网络学习能力过强,足以记住每 个样本,此时经验风险很快就可以收敛到很小甚至零,但却根本无法保证它能很好的预 测未来的样本。 由此可见,在有限样本情况下:( 1 ) 经验风险最小并不一定能保证期望风险最小; ( 2 ) 学习机器的复杂性不但应与所研究的系统有关,而且要和有限数目的样本相适应; 我们需要一种能够指导我们在小样本情况下建立有效的学习和推广方法的理论,统计学 习理论就是针对这些问题提出的。 2 3 统计学习理论的核心内容。“”删 统计学习理论实质就是研究小样本统计估训和预测的理沦,其主要内容包括以下四 个方面: ( 1 ) 经验风险最小化准则下统计学习一致性的条件: ( 2 ) 在这些条件下关于统计学习方法推广性的界的结论; ( 3 ) 在这些界的基础上建立的小样本归纳推理准则; ( 4 ) 实现新的准则的实际方法( 算法) 。 其中,最有指导性的理论结果是推广性的界,与此相关的一个核心概念是v c 维。 统计学习理论提出了结构风险最小化原理,克服了经验风险最小化原理的缺陷,使得结 构风险达到最小时同时保证实际风险达到最小。 构风险达到最小时同时保证实际风险达到最小。 9 河南工业大学硕士论文 2 3 1v c 维 为了研究学习过程一致收敛的速度和推广性,统计学习理论定义了一系列有关函数 集学习性能的指标,其中最重要的是v c 维( v a p n i k - c h e r v o n e n k i sd i m e n s i o n ) 。v c 维的 概念是由v a p n i k 和c h e r v o n e n k i s 提出的,定义为能被一个函数集合分开最大数目的训 练例子数,从而能保证好的泛化能力。它是描述函数集或学习机器的复杂性或者说是学 习能力的一个重要指标,在此概念基础上发展出了一系列关于统计学习的一致性、收敛 速度、推广性能等的重要结论。 模式识别方法中v c 维的直观定义是:对一个指示函数集,如果存在h 个样本能够 被函数集中的函数按所有可能的2 “种形式分开,则称函数集能够把h 个样本打散,函数 集的v c 维就是它能打散的最大样本数目h 。若对任意数目的样本都有函数能将它们打 散,则函数集的v c 维是无穷大。有界实函数的v c 维可以通过用一定的闽值将其转化成 指示函数来定义。 v c 维反映了函数集的学习能力,v c 维越大则学习机器越复杂( 容量越大) 。但是, 目前尚没有通用的关于任意函数集v c 维计算的理论,只对一些特殊的函数集知道其v c 维,比如在n 维实数空间中线性分类器和线性实函数的v c 维是n + l 。对于一些比较复杂 的学习机器,其v c 维除了与函数集有关外,还受学习算法等的影响,其确定更加困难, 对于给定的学习函数集,不管是用理论或实验的方法,如何计算其v c 维是当前统计学 习理论中无法解决的一个问题,有待于进一步的研究。 2 3 2 推广性的界 统计学习理论系统地研究了对于各种类型的函数集,经验风险和实际风险之间的关 系,即推广性的界。关于两类分类问题,结论是:对指示函数集中的所有函数( 包括使 经验风险最小的函数) ,经验风险r e m p “) 和实际风险r ( w ) 之间以至少卜n 的概率满足 如下关系: r ( 们r 。( w ) + ( 生9 呈q 竺坐立:i 二! ! 生趔) ( 。一,) 其中h 是函数集的v c 维,n 是样本数。 这一结论从理论上说明了学习机器和实际风险是由两部分组成的:一是经验风险 ( 训练误差) ,另一部分称作置信范围,它和学习机器的v c 维及训练样本数有关。可以 简单地表示为: 胄) r 。( 、d + 矽阿h ) ( 2 8 ) l o 深基坑变形时空预测研究 它表明,在有限训练样本下,学习机器的v c 维越高( 复杂性越高) 则置信范围越大, 导致真实风险与经验风险之间可能的差别越大,这就是为什么会出现过学习现象的原 因。机器学习过程不但要使经验风险最小,还要使v c 维尽量小以缩小置信范围,才能 取得较小的实际风险,即对未来样本有较好的推广性。 需要指出,推广性的界是对于最坏情况的结论,在很多情况下是较松的,尤其当v c 维较高时更是如此。而且,这种界只在对同类学习函数进行比较时有效,可以指导我 们从函数集中选择最优的函数,在不同函数集之间比较却不一定成立。v a p n i k 。1 指出, 寻找更好地反映学习机器能力的参数和得到更紧的界是学习理论今后的研究方向之一。 2 3 3 结构风险最小化原理 从以上结论可以看到,经验风险最小化原则( e r m ) 在样本有限时是不合理的,我们 需要同时最小化经验风险和置信范围。其实,在传统方法中,选择学习模型和算法的过 程就是调整置信范围的过程,如果模型比较适合现有的训练样本( 相当于h n 值适当) , 则可以取得比较好的效果。但因为缺乏理论指导,这种选择只能依赖先验知识和经验, 造成了如神经网络等方法对使用者“经验技巧”的过分依赖。 统计学习理论提出了一种新的策略,即把函数集构造为一个函数子集序列,使各个 子集按照v c 维的大小排列:在每个子集中寻找最小经验风险,在子集间折衷考虑经验 风险和置信范围,取得实际风险的最小,如图2 1 所示。这种思想称作结构风险最小化 ( s t r u c t u r a lr i s km i n i m i z a t i o n ) 即s r m 准则。统计学习理论还给出了合理的函数子集 结构应满足的条件及在结构风险最小化准则下实际风险收敛的性质。 实现结构风险最小化原则可以有两种思路,一是在每个子集中求最小经验风险,然 后选择使最小经验风险和置信范围之和最小的子集。显然这种方法比较费时,当子集数 目很大甚至是无穷大时不可行。因此有第二种思路。即设计函数集的某种结构使每个子 集中都能取得最小的经验风险( 如使训练误差为0 ) ,然后只需选择适当的子集使得置信 范围最小,则这个子集中使经验风险最小的函数就是最优函数。支持向量机方法实际上 就是这种思想的具体实现。 统计学习理论是一套基于经验数据进行机器学习估计依赖关系的理论,建立了一套 较好的在有限样本下机器学习的理论框架和通用方法,较好地解决了小样本、非线性、 高维数和局部极小点等实际问题,其核心思想就是学习机器要与有限的训练样本相适 应。 河南工业大学硕士论文 风险 一胡 函数集子集:墨cs 2cs 3 v c 维:啊h 2 兰h 3 图2 1结构风险最小化示意图 2 4 支持向量机。“”1 支持向量机即s v m ,是统计学习理论中最年轻的内容,也是最实用的部分,支持向 量机方法是建立在统计学习理论的v c 维理论和结构风险最小化原理基础上的,根据有 限的样本信息在模型的复杂性( 即对特定训练样本的学习精度) 和学习能力( 即无错误地 识别任意样本的能力) 之间寻求最佳折衷,以期获得最好的推广能力,目前仍处在不断 发展阶段。 1 9 9 5 年v a p n i k 和c o r t e s 发表了文章“s u p p o r tv e c t o rn e t w o r k ”,这是支持向量 机出现的标志,支持向量机一出现就引起了人们的极大关注,目前已成为数学和计算机 人工智能研究的热点领域。1 9 9 8 年b u r g e 用支持向量机对模式识别问题进行了系统深入 的研究m 1 ,同一年,a l e xj s m o l a 等人用支持向量机方法对函数拟合问题进行了深入的 研究o 。针对支持向量机研究中出现的二次规划问题,1 9 9 9 年p l a t t 提出了s m o 方法, 使支持向量机的效率得到了提高m 1 ,同年,s k s n e r a d e 和s s k e e r t h i 分别针对函数 拟合和模式识别问题对s m o 方法进行了改进,提出了改进的s m o 方法“,本文采用即是 深基坑变形时空预测研究 改进的s m o 方法。2 0 0 0 年r o n a nc o l l o b e r t 对基于支持向量机的大规模函数拟合问题进 行了研究。“,2 0 0 1 年s t e i n w a r t 等对支持向量机的参数对推广能力的影响进行了大量的 研究“”。目前支持向量机已在多个领域有着成功的应用,而且相关理论仍在不断发展当 中。中科院冯夏庭、赵洪波等人对支持向量机在岩土工程中的应用进行了一些尝试,如 支持向量机的岩爆预测、支持向量机的边坡稳定性估计等,得到了一些很好的结果。1 。 2 4 1 广义最优分类面 支持向量机的理论最初来自对二值分类问题,它是从线性可分情况下的最优分类面 ( o t i m a lh y p e r p l a n e ) 发展而来的,基本思想可用下图2 2 所示两维情况说明。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论