已阅读5页,还剩70页未读, 继续免费阅读
(计算机软件与理论专业论文)李群机器学习中的量子群分类器研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
李群机器学习中的量子群分类器研究中文摘要 李群机器学习中的量子群分类器研究 中文摘要 长期以来,人们对量子群进行了各种探讨,然而,大部分采用的都 是纯群论或物理的方法,以致量子群的很多特性至今都还没有揭示出来。 量子群作为经典李群、李代数的基本对称概念的推广,与机器学习系统 中面对的非交换性和非对称性问题密切相关,本文将量子群引入机器学 习中,进行了李群机器学习中量子群分类器的研究。主要包括以下几方 面内容: 1 给出了李群机器学习中量子群分类器的构造方法; 2 给出了量子群学习算法,包括量子群的对称线性变换学习算法、 基于量子群生成元的分子匹配算法和基于量子群同构的药效团匹配算 法; 3 给出了量子群学习算法在计算机辅助药物分子设计的应用,包括 基因分类、分子对接,实现了基于量子群的三维分子检索系统。 通过本文的研究,一方面,为量子群在机器学习方面找到了应用, 进一步丰富了李群机器学习;另一方面,将量子群学习方法引入药物分 子设计中,初步实现了基于量子群的三维分子检索系统,对计算机辅助 药物分子设计具有积极的意义。 关键词:李群机器学习;量子群学习算法;药物分子设计 作者:何书萍 指导老师:李凡长( 教授) a b s t r a c t 李群机器学习中的量子群分类器研究 r e s e a r c ho nq u a n t u mg r o u pc l a s s i f i e ri nl i eg r o u p m a c h i n el e a r n i n g a b s t r a c t p e o p l eh a v ei n v e s t i g a t e dq u a n t u mg r o u pi nc e r t a i na s p e c t sf o ral o n g t i m e h o w e v e r t h e ym o s tl i m i t e dt h e m s e l v e st op u r eg r o u p t h e o r e t i c a l o r p h y s i c a la p p r o a c h e sa n dc a u s e ds om a n yp r o t e r t i e so fq u a n t u mg r o u p h a v e n t b e e ne x p l o r e du n t i ln o w a sag e n e r a l i z a t i o no fc l a s s i c a ll i eg r o u pa n db a s i c s y m m e t r i c a lc o n c e p t so fl i ea l g e b r a ,q u a n t u mg r o u ps h o w si t sp a r t i c u l a r a d v a n t a g e s i n s o l v i n gn o n c o m m u t a t i v ea n dn o n s y m m e t r i c a lp r o b l e m s h e n c et h i sp a p e ri n t r o d u c e dq u a n t u mg r o u pi n t om a c h i n el e a r n i n ga n d r e s e a r c h e do nq u a n t u mg r o u pc l a s s i f i e ri nl i eg r o u pm a c h i n el e a r n i n g t h e c o n t e n ti sa sf o l l o w s : 1 t h em e t h o dt od e s i g nq u a n t u mg r o u pc l a s s i f i e ri nl i eg r o u pm a c h i n e l e a r n i n gi sg i v e n ; 2 t h eq u a n t u mg r o u pl e a r n i n ga l g o r i t h m s a r e g i v e n ,i n c l u d i n g s y m m e t r i c a ll i n e a rt r a n s f o r ml e a r n i n ga l g o r i t h m ,q u a n t u mg r o u pg e n e r a t o r s b a s e dm o l e c u l a rm a t c h i n ga l g o r i t h ma n dq u a n t u mg r o u pi s o m o r p h i s mb a s e d p h a n n a c o p h o r em a t c h i n ga l g o r i t h m ; 3 t h ea p p l i c a t i o no fc o m p u t e ra i d e dd r u gm o l e c u l a rd e s i g nb a s e do i l q u a n t u mg r o u pl e a r n i n ga l g o r i t h m sa r eg w e n ,i n c l u d i n gg e n ec l a s s l t l c a t l o n , 一一一 一 m o l e c u l a rd o c k i n ga n df u r t h e r m o r ec o m p l e t e dt h ed e s i g no f3 dm o l e c u a r s e a r c h i n gs y s t e mb a s e do nq u a n t u mg r o u p t h r o u g ht h ew o r ko ft h i sp a p e r , o no n eh a n d ,t h ea p p l i c a t i o ni nm a c h i n e l e a r n i n gi sf o u n df o rq u a n t u mg r o u pa n df u r t h e re n r i c h e dl i eg r o u pm a c h i n e l e a r n i n g ;o nt h e o t h e rh a n d ,t h em e t h o do fq u a n t u mg r o u pl e a r n i n gi s i i a b s t r a c t李群机器中的量子群分类器研究 i n t r o d u c e dt od r u gm o l e c u l a rd e s i g n ,a n dap r i m a r yc o m p u t e ra i d e d3 d m o l e c u l a rs e a r c h i n gs y s t e mi sc o m p l e t e d t h i si sa ni n n v o n a t i o nt oc o m p u t e r a i d e dd r u gm o l e c u l a rd e s i g n k e yw o l d s :l i eg r o u pm a c h i n el e a r n i n g ;q u a n t u mg r o u pl e a r n i n ga l g o r i t h m ; d r u gm o l e c u l a rd e s i g n i w r i t t e nb y :s h u p i n gh e s u p e r v i s e db y :f a n z h a n gl i 苏州大学学位论文独创性声明及使用授权的声明 学位论文独创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进 行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含 其他个人或集体己经发表或撰写过的研究成果,也不含为获得苏州大学 或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡 献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律 责任。 研究生签名:么粹 日 学位论文使用授权声明 苏州大学、中国科学技术信息研究所、国家图书馆、清华大学论文 合作部、中国社科院文献信息情报中心有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本 人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文 外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分 内容。论文的公布( 包括刊登) 授权苏州大学学位办办理。 日期: o8 :丝 日期: 臼壁:垡 李群机器学习中的量子群分类器研究 第一章 1 1 李群机器学习的发展及研究现状 2 0 01 年,m j o l s n e s se 和d e c o s t ed 在( ( s c i e n c e ) ) 杂志上发表了一 篇介绍机器学习现状与展望的文章i l l 。文章认为,科学研究的完整过程一 般包括5 个步骤:观察有趣的现象( o b s e r v ea n de x p l o r ei n t e r e s t i n g p h e n o m e n a ) ;产生假设( g e n e r a t eh y p o t h e s e s ) 建立模型对现象进行解 释( f o r m u l a t em o d e lt oe x p l a i np h e n o m e n a ) ;检验理论预测的结果( t e s t p r e d i c t i o n sm a d eb yt h et h e o r y ) ;改进理论并重复( m o d i f yt h e o r ya n d r e p e a t ) 。而机器学习将在科学研究的各个步骤中发挥不可忽视的重要作 用。 机器学习是人工智能和计算机科学研究的一个永恒的课题1 2 1 。从1 9 4 3 年m c c u l l o c h 与p i t t s 对神经元模型( 简称为m p 模型) 的研究开始至今, 经过了6 0 多年的发展,虽然产生了许多机器学习范式,如统计机器学习、 流形机器学习、增强机器学习、半监督机器学习、量子机器学习、关系 机器学习、贝叶斯网络学习、支持向量机学习、集成学习等。但到目前 为止,对于机器学习的概念还没有一个统一的说法。目前比较公认的关 于机器学习概念的说法是s i m o n 对学习的阐述1 2 1 :“如果一个系统能够通 过某个过程而改进它的性能,这就是学习。”这是一个相对广泛的说法, 其要点是:其一,学习是一个过程;其二,学习是对一个系统而言的; 其三,学习能够改变系统性能。即“过程 、“系统 与“改变性能 是 学习的三个要点。我们将这种说法结合李群的内在性质,发现李群的定 义和机器学习的定义有着对应的关系,即李群本身就是一个非空的集合 且是一个系统,学习过程对应一个可微映射,然后通过解析性质来降低 数据维数、处理学习问题,从而达到改变系统性能的目的。 群论,作为代数学的一个重要分支,主要研究数学结构的对称性。 群论的应用涉及到现代科学的许多方面,如公钥加密体制、纠错编码、 第一章李群机器学习中的量子群分类器研究 分子结构、物理系统等。一般意义下的群论在机器学习中被运用的不是 很多,只有李群在机器学习中运用得较多。因为学习和编码不同,更多 关注的是连续空间,因此李群在各种群中对于学习来说特别重要。各种 子空间,线性变换,非奇异矩阵都可以基于通常意义的矩阵乘法构成李 群。李群中的映射,变换,度量,划分等等对于机器学习中代数方法和 几何方法的研究有重要的指导意义。 2 0 0 7 年,哥伦比亚大学的r i s ik o n d o r 在i c m l 2 0 0 7 上提出了机器学 习中的群理论方法1 3 1 ,他指出代数方法的使用,特别是群理论、表示论、 甚至是代数几何学中的一些概念的引用,将会是机器学习的一个新的研 究方向。除此之外,r i s ik o n d o r 等人已成功的将群论方法应用于图像分 析及多目标追踪等。 李凡长教授及其李群机器学习研究小组从2 0 0 4 年开始这方面的研究 工作,提出了“李群机器学习( l i eg r o u pm a c h i n el e a r n i n g ,简记l m l ) 的概念并建立了李群机器学习模型及相关学习算法睁1 2 i ,其目的就是基于 r d 上的一个给定的被观测数据集合,用李群中的可微性把被观测数据集 合的非线性结构进行线性化,使其约简成易于理解、表示和处理的线性 数据,然后通过局域李代数和李群之间的一一对应关系映射到观测空间 中去。从目前取得的成果看,其基础理论主要来源于两个方面:一方面 是李群机器学习继承了流形学习的优点,另一方面是李群机器学习充分 利用了李群的代数结构和几何结构的数学本质。 李群机器学习从产生至今,已在文本分类、人群分类、晶体辅助分 类系统1 1 3 j 、葡萄酒化学成分分析1 1 4 i 等机器学习的应用领域取得了一些成 功的应用,并引起了广大研究者们的兴趣。现就相关成果综述如下: 1 1 1 李群机器学习的公理系统 h u a nx u 和f a n z h a n gl i l 4 l 首先提出了李群机器学 - - 3 中的公理系统, 内容包括: 1 ) 一致性假设公理; 2 ) 划分独立性假设公理; 李群机器学习中的量子群分类器研究 第一章 3 ) 对偶性假设公理; 4 ) 泛化假设公理。 根据李群机器学习的定义,一致性假设公理主要研究g ( 观测空间) 和m ( 样本空间) ;划分独立性假设公理就是研究将样本集m 放到n 维 空间,寻找等价关系,使得问题决定的不同对象划分在不相交的区域内 或将n 维非线性问题映射成线性问题,形成可解的线性结构;对偶假设 公理主要研究观测空间g 和样本空间m 之间的对偶关系;泛化假设公理 则主要研究从样本集合m 中建立观测集g 的模型,泛化能力就是对模型 g 为真程度的指标。 从机器学习的发展历史看,早期机器学习的研究主要集中在划分假 设的研究上,而近期机器学习的研究则主要考虑划分假设和泛化能力, 对一致性假设的考虑不多。李群机器学习则包含了上述4 种假设,其学 习范式能考虑这几个方面的假设就是因为有李群理论的支持,这正充分 体现了数学工具在机器学习领域中的重要作用,同时也是李群机器学习 方法和其他机器学习方法的主要区别之一。 1 1 2 李群机器学习模型 近年来,几何结构学习引起了研究者的强烈兴趣,微分几何和线性 代数在获取这种结构中起了一定的作用。李群是一个把代数结构和几何 结构熔为一体的数学工具,根据李群的数学本质,任何一个李群( 非线 性结构) 都可以找到一个李代数( 线性结构) 和它对应,这样就可以将 机器学习面对的高维数据、非线性数据等通过李群和李代数之间的关系 来进行数据约简。2 0 0 5 年,f a n z h a n gl i 和h u a nx u1 7 1 基于李群、单参数 子群、李代数等这些李群理论中的基本概念和相关定理,将李群引入到 机器学习中去,提出了李群机器学习的概念及李群机器学习模型。在介 绍李群机器学习之前,首先了解一下李群: 设g 是一个非空集合,满足: 1 ) g 是一个群; 2 ) g 也是一个微分流形; 第一章 李群机器学习中的量子群分类器研究 3 ) 群的运算是可微的,即:f 1 3 g x g 至:l jg 的映射k 。,g :) hg 。爵1 是可微 的映射。 则称g 是一个李群( l i eg r o u p ) 。 从李群的定义,可以看出:李群既是一个群,也是一个微分流形。 从一般定义上讲,流形就是点、线、面以及各种高维连续空间概念的推 广,而我们的所有观察数据都是可以和点、线、面等结构建立起对应关 系的。也就是说,李群可以用来表示现实世界中的高维数据。 根据李群的定义,作者给出了李群机器学习( l m l ) 的定义: 令g 表示输入空间,m 表示输出域,且有g 尺d ,m 尺d ,d d , 借用李群的定义将g 对m 的左作用用如下映射矽表示: 缈:g m m , g ,x - 9 , 缈q ,z ) , 其中,缈( g 。,矽q :,工) ) = 缈0 ,g :,石) ,伊,x ) = x 。 于是对任意g g ,m 上存在微分同胚变换: 9 9 :m - - - ) m , x 寸缈( g ,x ) , 且映射集合奴,g g j 满足:哝。吼:= 饮g :,c o , = 吮。 由此,可得李群机器学习框图:如图1 1 2 1 。 图1 , 1 2 1 李群机器学习左作用模型 类似可定义群g 对m 的右作用: 少:m g - - m , x ,g 专沙g ,g ) , 其中,缈 g ,g 。) g :) = 少g ,g 。g :) ,缈g ,p ) = x 。 m 李群机器学习中的量子群分类器研究第一章 李群机器学习右作用框图见图1 1 2 2 。 图1 1 2 2 李群机器学习右作用模型 m 易看出g 对m 右作用对应的微分同胚变换: y g :m m , x - - - ) 沙g ,g ) 。 由于李群是一个具有群结构的解析流形,而且群运算是解析的。利 用这种李群机器学习范式我们可以分析数据的维数、紧致性、连通性、 幂零性、子群、陪集、商群、量子群等。这些基本结构,为设计李群机 器学习的算法、分类器奠定了基础。 ( 一) 李群机器学习的代数模型 根据李群机器学习的概念,将李代数、单参数子群、左不变向量场 和左不变流形这四种不同的数学结构定义成自然的一一对应关系,即李 代数丝 左不变向量场) - - 左不变流动) 丝 单参数子群) 。在李群机器学习 系统中,对于输入数据集g ,由上述对应关系可得李群机器学习代数模 型,如图1 1 1 3 所示。 陌丽鬲网卜屿际丽菊丽i 五习 tj r 微分 口 积分丁上微分 凸匪垂圃 图1 1 2 3 李群机器学习代数模型 第一章李群机器学习中的量子群分类器研究 基于这些数学结构的关系,文中还研究提出了李群机器学习的李代 数根系计算模型,分解模型及分类模型等。 ( 二) 李群机器学习的几何模型 利用李群的一些几何性质,如平移性、测地线性质等,可以得到李 群机器学习的几何模型。它们将有利于李群机器学习系统中的表示和度 且 里o 图1 1 2 4 李群机器学习几何模型 在此基础上,文献 1 3 1 提出了李群机器学习的等距映射算法及李群机 器学习的测地线距离的学习算法。 由此可见,李群机器学习方法是一种代数模型和几何模型熔为一体 的学习方法,这也是他和其他学习方法相区别的要点之一:如流形学习 只是一种学习几何结构的方法,而统计机器学习只是一种学习代数结构 的方法。 ,- 一_ 1 1 3 李群机器学习的d y n k i n 图几何算法 若将讨论的观测集假定成紧致且连通的,这样就可以在观测集中的 单位点上取一个自同构作用下不变的内积,对于这样取定的内积,再取 一组标准正交基,然后用左平移把它们分别扩张成观测集的左不变向量 场,就可以唯一地在观测集上的每一个点的切空间取定内积,使得该内 积恰好为左不变向量点的切空间的标准正交基,这样就构成了一个黎曼 空间。所以,h u a nx u 和f a n z h a n gl i 在2 0 0 6 年,进一步给出了李群机 李群机器学习中的量子群分类器研究 第一章 器学习的对偶空间计算模型,素根系的几何结构分类模型及李群机器学 习中的d y n k i n 图几何分类算法【6 i i 引,其理论依据是:复半单李代数是李 代数理论中最基本、也是最重要最完善的部分,由复单李代数组合而成; 复单李代数则由它的根系完全决定;根系结构又归结为其中的素根系; 素根系又由它的d y n k i n 图来决定。 假定g 是学习空间g 的复半单李代数,则素根系的可约性可用来判 断李群机器学习中学习问题是否可解。也就是说,若素根系n 是不可约 的,那么我们认为学习问题可解;反之,若n 是可约的,那么该学习问 题不可解。此外,因为对于每一个n 可以构造一个d y n k i n 图,进而也可, 以通过素根系的d y n k i n 图来判断学习问题的可解性。 两个复半单李代数同构当且仅当他们的d y n k i n 图相同。根据上述推 理,可以得到李群机器学习的学习空间同构性判别算法和分类算法1 6 1 。此 算法表明若我们的学习问题是可解的,那么就可以画出该学习空间对应 的d y n k i n 图,并且可以通过d y n k i n 图的定义和性质,在己知同构的意 义下,输入数据向量空间,就有它对应的d y n k i n 图,并且只能有4 ,e , g ,口,巨,e ,巨,e ,g 这九种可能。因此,若假设学习空间中 有1 1 个输入数据,这些数据用向量组表示为1 7 = 6 t 。,口:,o f , ,根据 d y n k i n 图进行分类,则可将学习问题分到4 ,墨,c l ,q ,e ,e ,最, e ,g 等九类之一。接下来,我们就可以对不同类别中的数据,找到其 对应的李群,如4 可以对应到特殊酉群s u 0 + 1 ) ,b 1 可以对应到特殊正 交群s 0 ( 2 l + 1 ) 等,再采取对应的问题求解方法,从而降低了学习问题的 求解难度。 1 1 4 李群机器学习中偏序集及格 在机器学习中,由于所学习的各类问题之间的特殊性和一般性,恰 当地描述和合理地选择假设空间有着非常重要的意义,李群中关于偏序, 学习子空间轨道生成格等的概念恰恰适用于这个问题,因而陈凤在李群 机器学习中给出了李群机器学习空间、学习子空间、轨道、目标轨道, 并引入了偏序集及格的概念1 1 0 1 ,文中将学习子空间表示成偏序集的形式。 第一章李群机器学习中的量子群分类器研究 偏序集的最大元素是学习子空间中最一般的点,即具有零描述的点,这 样的点对学习样例不加任何限制,因而可以描述任何事物。偏序集中的 极小元素是学习子空间中最具体的点,即与学习样例对应( 可以将样例 本身看成一个具体的概念) 。于是,考虑到将学习样例集p 规范成偏序, 并且根据需要映射到对应的学习子空间中,从而能与合理的操作算子集 合f ( fcq ) 相对应。 举例来说,在人脸识别中,可以利用眼睛,鼻子,嘴巴等局部特征 识别人脸,从不同的角度来研究这些特征,若从上到下来观测,用它们 之间的位置关系_ 高于来描述偏序,得到:眼睛鼻子嘴巴,反之, 从下往上观测,则有嘴巴鼻子眼睛。当然这些局部特征一般为矩形, 从独立个体的观测角度,它们相互之间是离散的,没有交集,但从邻域 的观点来看,其又是连续的,相交的,它们的交集便组成了人脸这一整 体。 在现实世界中,为了能更好的描述所处理的问题,可以将样例数据 集p 通过一定的变换映射到一个新的学习子空间中去。但是各个元素之 间的相互关系不会发生改变,对应于原学习子空间的元素,一方面可将p 看作是由尸生成的新的样例集合,即对样例集尸所作的轨道划分不会改 变其本质特征,从而保证轨道划分的正确性;另一方面,对于两个同构 的样例集户和尸,可以使用相同的轨道划分方法,从而避免重复学习。 在李群机器学习中,当将样例集从原高维空间映射到低维空间中时, 样例之间局部的偏序关系不变,要使样例经过映射后仍保持原有的性质 和内在的结构关系,文献【1 4 】进而提出了李群机器学习中局部有限偏序集 上的m o b i u s 函数,利用m 6 b i u s 函数来作为学习算法中判断学习过程中 各个状态之间关系的参数,若两个状态之间是等价的则该函数值为1 ,否 则为0 。 然而,在李群机器学习中,需要学习的目标函数的复杂度取决于它 的表示方式,学习任务的难度也随之变化。因此,很有必要选择与特定 的学习问题匹配的表示,作者进而提出了李群机器学习中的g a u s s 系数 和g a u s s 多项式,将输入空间的样例数据简单映射到另一个空间,寻找 李群机器学习中的量子群分类器研究 包含了原始属性中必要信息的最小特征集,这对李群机器学习的计算和 泛化性能都有益。 若将学习子空间( 具体的学习问题) 描述成含有若干结点的有向图 或树,有向图中由初始状态到达目标状态的某条通路( 树中始于根结点 到达叶子结点的分支) 正是一种格结构,路径上的结点关系不能任意调 换,体现在具体问题中,可理解为待学习( 分类) 的样例,在该结点用 此操作算子为最佳,即有利于得到最优轨道。为了有效的生成目标轨道, 作者提出了李群机器学习中的格的概念。 同样以人脸识别为例来说明,上述我们将眼睛,鼻子,嘴巴这些局 部的特征按照不同的观测角度描述成两种偏序结构,用矩形区域来表示 这些局部特征,它们不可调换的先后关系就形成了一个格结构,一旦确 定了图形的关键点,要从一个局部特征找到另外的特征需要考虑两者之 间的位置关系,如嘴和鼻子的邻域是连通的,可以通过计算它们的交、 并关系,由已知位置的一方来确定另外一方的位置。 1 1 5 李群机器学习中子空间轨道生成格算法 根据独立划分假设公理及一致性假设公理,观测空间集合中的每一 个元素都可以用一组独立实参数来描写,结合李群机器学习的几何模型 特点,在李群机器学习空间的基础上,文献 1 0 ,1 2 ,1 4 1 提出了李群机器学 习子空间轨道生成格的概念及轨道生成的广度优先、深度优先和轨道生 成启发式学习算法。 对于轨道生成,文中从给定的权值( 已知第一层权值) 出发,利用 每个已有的权值作简单的计算,从而创建新的权值即第二层轨道中 的所有权值列表,一个普通的权值对应于长度为2 的样例中的元素列表, 重复执行该过程,通过利用下一个低层的权值和简单计算可以获得任一 层次的权值列表。因而,在给定的第层权值有序的情况下,整个轨道, 或者说整个学习子空间的图就可以通过这种方法生成。但是在此要考虑 两个问题,首先是计算轨道时所需要的存储空间,其次是使用该方法生 成下一层列表所需要的重复计算的次数。由于对为每个新创建的轨道元 第一章李群机器学习中的量子群分类器研究 素而重复创建的列表进行简单查找的速度慢,效率低,因此,提出了一 种用于决定是否将一个轨道元素添加到下一个更高层次的权值列表中的 方法,轨道的更高层次仅需要局部数据,即新权值和创建此权值的所用 的一个简单计算。这样就解决了重复计算问题并且为生成轨道提供了一 个新的方法,与其一次生成一个层次,找出该层的所有权值,我们可以 将轨道考虑成一棵树且按“深度优先”来进行计算,尽可能到达较深层 次轨道中的权值,并且在回溯到未计算的“分支”之前根据一定的规范 来存储某个权值。后面的方法( 轨道生成深度优先) 用一个堆栈很容易 处理,这个堆栈具有成员数的先验范围,也就是样例集中样例数目,这 样就有利于减少存储空间。由于在计算机中很难一次性存储一个非常大 的轨道,这个新的方法由于其较小的空间需求,可被用于生成轨道 结点。 在李群子空间轨道生成格的理论基础上,陈凤进一步提出了轨道生 成的广度优先、深度优先和轨道生成启发式学习算法,并用实例比较了 广度优先和深度优先学习算法的分类正确率和时间消耗,可见两个算法 各有利弊,并将启发式学习算法g o 的分类结果与n b a y e s ,c 4 5 及k 小n 算法的结果比较,从分类正确率来看,g o 算法的可行性和有效性较高。 1 1 6 李群机器学习中一般线性群作用下学习子空间轨道生成格学习算 法 通过连通性和拓扑结构考虑机器学习中的学习问题,每个样例x i 由 具体的属性值来表征t = ( k i ,乞,后。) ,假定该问题存在若干类别,记作 c = 0 ,岛,乞) ,根据属性值将样例集中的每个样例表示到学习子空间 中,同一类别的样例具有相似或相等的属性值,它们之间应互为连通的, 不同类别的某些属性值也可能相似或者相等,但是必然存在不同的属性 值,当然可以首先确定各类别的关键属性值毛( 中心点) ,通过比较与k ,的 距离能够有效的确定样例所属的类别,同一类别中的某个样例必然存在 于另一样例的邻域内,不同类别集之间互不连通。 因而,在观测集上的一般线性群作用下,由多个相同维数或轨道和 李群机器学习中的量子群分类器研究 第一章 秩子空间生成的格,文献【1 1 ,1 4 】进一步提出了李群机器学习中一般线性 群作用下学习子空间轨道生成格理论。轨道生成格之间的包含关系用于 确定使用划分规则对样例数据集划分,从而生成轨道结点的次序,论证 了从样例集出发( 或从目标函数出发) 所生成的轨道结点具有几何性质。 作者根据划分规则集的性质不同,产生的轨道空间所满足的条件也不同 这一性质,提出了李群机器学习中的一般线性群作用下学习子空间轨道 生成格学习算法,并将该算法应用于葡萄酒化学成分的分析及分类,证 明了算法的可行性及通用性号 1 1 7 李群机器学习中辛群作用下学习子空间轨道生成格学习算法 辛群具有的代数和几何的特性,使得它在学习过程中能自动的保持 偶数维的状态域,在处理连续问题时无需将问题离散化,这就避免了在 离散的过程中所带来的错误和损耗。因此,在李群机器学习中,根据辛 群矩阵的反对称双线性的性质,构建两类问题的样例矩阵,通过矩阵的 不同变换,便得到相应的学习子空间轨道。于是,陈凤提出了李群机器 学习中辛群作用下子空间轨道生成学习算法s g o l l 4 1 ,并将该算法应用于 人种分类,与g o 算法相比,该算法更为有效。 但该算法的不足就是仅当向量空间的维数是偶数时,才会有辛群, 因此选取样例时,个数必须是偶数,且正负样例个数相等或比较接近, 应用领域比较有限。 1 1 8 李群机器的线性分类器设计及应用 随着信息时代的到来,机器学习算法遇到的数据种类越来越多,如 航天数据、生物数据和晶体数据等。根据李群机器学习的意义: g m m 。这些特定的观测数据g 可以构造成相应的典型群来进行处 理,而这些典型群都能嵌入在高阶( 厂( 刀) 群中作为子群来进行学习。 在具体构造线性分类器的过程中,我们必须首先描述符合一定条件 的事务全部,称为观测集合,其中的每一个事务称为这个集合的一个元 素,其次对给定集合定义一个线性组合,且集合中任意一组元素的任意 线性组合仍是这个集合的元素,则构成线性空间。 第一章李群机器学习中的量子群分类器研究 一般来说,线性分类器的构造可分如下步骤: 第一步:将样本集映射到g 这个非空集合上; 第二步:根据g 构造相应的李群结构; 第三步:将所得的李群作用于所建立的李群机器学习模型中; 第四步:形成相应的分类器; 第五步:实例测试; 第六步:应用。 文献 5 】以典型群舳( 刀) 为基础,将问题限定在三维矢量空间上,构造 了李群机器学 - - 3 的舳( 3 ) 分类器,在该分类器中,对每一个群元计算其矩 阵行列式的值,一组矩阵行列式为+ 1 ,而另一组矩阵行列式为1 ,从而 达到分类的目的。 在传统的文本分类算法中,常常需要度量两个文档之间的相似度, 常用的度量标准有欧几里德距离、向量的夹角余弦等。f a n z h a n gl i 和 h u a nx u g l 提出了一种新的文本分类方法,简称l g c ( l i eg r o u p c l a s s i f i c a t i o n ) 。在该算法中,将文档构成的向量空间看成是嵌入在一个微 分流形当中的,每个文档对应着流形上的点,然后用测地线距离而非欧 氏距离来度量两个文档之间地相似度。将该算法与采用欧氏距离为度量 标准的缸最近邻算法( 州) 分别对文档进行分类,并对查全率和查准 率进行比较。因为李群机器学习分类方法是将样本空间看成是一个微分 流形,因此文档向量空间被看成是弯曲的,这比欧氏空间描述文档集合 更能体现出异构、复杂的特性,而测地距离是欧氏距离的一般化,将它 作为度量标准更具一般性和普遍性。实验结果表明l g c 算法提高了文本 分类的性能。 众所周知,晶体是固体中非常重要的组成部分,理想晶体中的原子 排列具有周期性,所有晶体结果都用晶格来描述,晶格是一种数学上的 抽象,它由数学上的集合点在空间有规律的做周期性的无限重复分布构 成。在物理学中,对于晶体主要是研究它的宏观物理性质和对称性之间 的关系。若把晶体宏观对称中的理想晶形所有对称操作看成元素,把操 作的乘法看成运算,那么这些元素和这一运算如满足群的定义:满足封 李群机器学习中的量子群分类器研究第一章 闭性、存在单位元、存在逆元、满足结合律,又由相交定理,上述的对 称操作都相交于原点,在任何一个操作矩阵作用下,原点应保持不变, 即这些操作组成的群为三维正交群0 ( 3 ) 的有限子群,它与李群中的正交 群有着密切的联系。因此,文献 9 ,1 3 】针对晶体物理学家倍受关注的晶 体分类问题,提出了基于李群机器学习的晶体分类器,根据晶体的基本 结构,构造晶体的对称变换群、晶格点群,对晶体可能的1 1 种固有点群, 3 2 种点群,7 种晶系,1 4 种布拉菲( b r a v a i s ) 格点,7 3 种简单空间群和 2 3 0 种空间群,并将机器学习方法引入到晶体分类中,初步实现了基于李 群机器学习的晶体的计算机辅助分类系统,为李群机器学习找到了应用 领域。 1 2 李群机器学习中量子群分类器的提出 量子群这个概念,首先是1 9 9 0 年f i e l d s 奖得主d r i n f e l d 在1 9 8 6 年 于b e r k e l e y 举行的i c m 的报告中提出的【1 5 i ,最初的例子有两类特殊的 h o p f 代数,一类是半单李代数三的泛包络h o p f 的变形( d e f o r m a t i o n ) ,另 一类是仿射代数群g 的坐标环的变形。对于量子群的定义,目前也没有 一个公认的公理化定义。数学家s p s m i t h 说:“一个非交换且非余交换 的h o p f 代数叫做量子群 1 2 l i 。d r i n f e l d 则把量子群定义为非交换h o p f 代数的谱。他是这样引入的:把量子空间范畴定义为非交换代数范畴的 对偶,把代数a 对应的量子空间记为s p e c a ( a 的谱) ,根据他瞧义,h o p f 代数与量子群这两个概念实际上也是等价的,不过后者几何性质更丰富 一此 ,“ := o 量子群是经典李群、李代数的基本对称概念的推广。最初由量子可 积体系及可解模型中提出,与非交换几何、与量子对称性密切相关。它 研究的是一类特殊的非交换非余交换的h o p f 代数,尤其是从李代数的包 络代数和群的函数代数经过“量子化”得到的非交换非余交换的h o p f 代 数。因此,量子群理论是李群、李代数发展到一定阶段的产物,综合了 物理学与数学的许多分支的思想和内容,具有十分丰富的理论内涵和应 用范围。在代数学方面,它将群与代数的表示理论有机地结合起来;在 第一章 李群机器学习中的量子群分类器研究 物理学方面,它提供了量子力学系统的量子对称性的一种描述工具,并 与量子y a n g b a x t e r 方程的解密切相关。 近年来,量子群理论中隐藏的丰富数学结构和物理内涵已在研究中 不断被揭示出来。量子群及其相关的g 变形理论已被应用于物理学的各 个分支中,如统计物理学和可积模型,共形场论,规范场论与弦理论,振 子系统,量子光学,原子与分子物理以及核物理等广泛的研究领域。 n i k o l a o sn a s i o s 等人已经将相关结果应用于核分类中并取得了显著的效 剽2 1 1 。之所以这样,是因为它与多门数学和物理学学科相互交叉,形成 了千丝万缕的联系。在数学方面,它与李群李代数及其表示理论、特殊 函数、纽结理论、低维拓扑学、算子代数、非交换几何学、组合理论等 密切相关;在物理学方面,它与量子逆散射方法、可积模型理论、基本 粒子物理、共形场论与量子场论等相互作用。 正是因为量子群理论涉及方方面面,因此可以从许多角度来研究量 子群。长期以来,人们对量子群的性质等进行了各种理论性质的探讨, 然而,大部分采用的都是纯群论或物理的方法,以致量子群的很多特性 至今都还没有揭示出来。同时,也为了更好的研究李群机器学习,我们 从机器学习的角度出发,对量子群进行研究。 综上所述,本文的研究内容主要是利用量子群这一集数学、物理于 一体的工具,处理机器学习中的非交换和非对称问题,如基因中编码序 列、药物分子设计中各原子基团和药效团之间的位置等,他们都是非交 换的。将量子群看成量子超平面上的线性系统,利用量子群分析观测数 据,用量子群和量子代数的性质进行研究,通过非交换空间上的量子对 称变换、协变微分等操作对数据进行处理,根据量子群学习算法构造出 李群机器学习中的量子群分类器。本文所介绍的李群机器学习中量子群 分类器的学习算法和以往的量子逻辑、量子代数等方法有所不同,主要 区别是我们是用群的观点来解释学习问题,并将量子群的一些理论、技 术和方法结合到李群机器学习中去。 李群机器学习中的量子群分类器研究 1 3 研究目标及内容安排 鉴于目前李群机器学习方法还处于初步阶段,因此本文进一步研究 基于量子群的机器学习理论,针对量子群和李群的关系,结合量子群的 非交换且非对称的特性,使量子群在数学理论中的成果获得更多的应用, 建立李群机器学习中量子群分类器的模型并给出相关学习算法,设计李 群机器学习中量子群分类器,针对实际问题给出验证系统。 本文的研究内容分为六章: 第一章主要介绍了李群机器学习的研究背景和研究现状。 第二章介绍李群机器学习中量子群分类器的相关理论基础。 第三章给出了李群机器学习中量子群分类器的构造方法。 第四章给出李群机器学习中量子群学习算法在分子对接中的应用。 第五章给出了量子群学习算法在三维分子检索中的应用。 第六章给出了结论及展望。 第二章李群机器学习中的量子群分类器研究 第二章李群机器学习中的量子群分类器相关理论基础 量子群理论中隐藏的丰富数学结构和物理内涵己在研究中不断被揭 示出来。为了更好地研究李群机器学习中的量子群分类器,本章主要介 绍了李群机器学习中的量子群的定义、经典量子群的例子、量子化、量 子群的表示等数学理论基础以及量子群的判定算法等。 2 1 李群机器学习中的量子群理论概述。 量子群理论是由苏联数学物理学家19 9 0 年f i e l d s 奖得主d r i n f e l d 及 其合作者们在用“量子反散射方法 研究量子力学中的量子可积系统时 最先提出来的,因此它起源于理论物理,有其深刻的物理背景。但从数 学的某种意义上说,量子群的研究就是h o p f 代数的研究,而h o p f 代数 与数学的许多分支都密切相关。因此,量子群理论一经提出,很快引起 了许多背景不同的科学家的兴趣,发展得相当迅速。例如,环论专家着 重研究了h o p f 代数的结构,并且研究如何从交换的或余交换的h o p f 代 数经过某种变形理论得到既非交换亦非余交换的h o p f 代数( 量子化) , 或用某种特殊的方法构造二次代数的“自同构量子群”的方法与“r 矩 阵”方法构造既非交换亦非余交换的h o p f 代数。另一方面,由于交换 h o p f 代数范畴的反范畴是代数群范畴( 或李群范畴,依赖于基域与张量积 的定义) 的自然扩充,而余交换h o p f 代数范畴又可看成李代数范畴的自然 扩充。因此,李群专家、代数群专家与李代数专家则认为量子群理论是 李群理论,代数群理论与李代数理论的自然推广。他们的研究主要有: 经典李代数及k a c - m o o d y 代数的量子化( 量子包络代数) 以及量子包络 代数的表示理论;典型群或更一般地,简约李群或代数群( 的函数代数) 的量子化及其( 余) 表示理论;上述二者的联系;量子包络代数或量子群 的表示理论与素特征代数群表示理论的关系。此外,几何学家对与量子 群相联系的非交换几何感兴趣;而算子代数学家则致力于c 水h o p f 代数 以及与之相关的“矩阵紧致伪群”( 可以看成是紧致李群的量子化) 的研 李群机器学习中的量子群分类器研究第二章 究。 因此,我们李群机器学习研究小组,在李群机器学习的基础上,进 一步引入量子群这一集数学、物理为一体的工具,利用其非交换的特性, 提出李群机器学习中的量子群分类器。 2 2 量子群的形象描述 在介绍量子群之前需先做一些说明: 首先,给定一个域k 作为定义流形、函数、代数等对象的基础。对 物理学家来说,k 是复数域c 或实数域尺。对代数学家来说,k 可以是任 何域,但若k 不是尺或c “状态空间”只能是代数簇,“可观测元函数” 即正则函数。其次,我们把具有物理性质的术语“状态空间”与“可观 测元函数 分别用纯数学的术语“空间和“函数”来代替。如上所述, 采用的手段不同,这两个术语的含义也就不同。我们把空间x 上的函数 代数记为f u n ( x ) ,如所周知,无论我们采用何种手段讨论问题,f u n 都 是空间范畴到函数代数范畴的反变等价。若矽:x 寸y 是空间的态射,则 所对应的函数代数的同态矽:凡船( y ) jf u n ( x ) ,定义为矽( 口) = a 。缈。 7 在经典力学与量子力学中都有两个基本的概念:状态和可观测元。 在经典力学中,状态是一个流形中的点,而可观测元则是这个流形上的 适合某种条件的函数,条件根据问题的性质和讨论问题的手段而定,如 连续性、可微性、解析性、正则性等。在任何情况下,可观测元总是组 成一个交换的结合代数。在量子力学中,状态是一个h i l b e r t 空间的1 维 子空间,而可观测元则是该h i l b e r t 空间上的适合某种条件的算子。可观 测元也总是组成一个结合代数。但一般说来,这个代数不再是交换的了。 因此,从数学的角度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国液体化工物流市场需求预测与产能规划报告
- 2025标准版小额信用消费贷款借款合同
- 2025年阅读虚幻颂歌试题及答案
- 色彩构图考试题库及答案
- 2025年抖音带货考试题目及答案
- 高级店长心理素质及应对挑战训练教程
- 初级玻璃熔化工的技能提升途径探讨
- 中级化工总控工绩效管理计划
- 员工关怀活动策划与执行方案
- 评估中级炼钢工应急处理能力的场景设计
- 2025年郑州登封市公共交通运营有限公司社会招聘工作人员35人笔试考试参考题库及答案解析
- 2024年公务员国考行测真题(含答案)
- 灵活就业人员劳动合同范本及说明
- 退休人员返聘合同
- 智能物流设备维护操作指南
- 2025年学习两会精神应知应会知识测试题附含答案
- 水性涂料项目建设工程方案
- 2025年医养结合养老机构运营中的服务质量评估与改进报告
- 中国重症医学科建设和发展指南2025版解读 3
- 2025年北京市高考语文试题卷(含答案及解析)
- 工程资金监管协议书示范文本
评论
0/150
提交评论