蛋白质圆二色谱解析研究_第1页
蛋白质圆二色谱解析研究_第2页
蛋白质圆二色谱解析研究_第3页
蛋白质圆二色谱解析研究_第4页
蛋白质圆二色谱解析研究_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1分类号 密级 UDC 中国农业大学 硕士学位论文 蛋白质圆二色谱解析研究 Study on Circular Dichroism Spectra Analysis of Proteins 研 究 生 : 李冬梅 导 师 : 盛 毅 副教授 张志英 副教授 专 业: 生物物理 研究方向 :蛋白质圆二色谱解析 二零零一年六月 2目 录 摘要 4 ABSTRACT 5 1. 前言 6 1.1 蛋白质结构测定对分子生物学发展的重要意义 6 1.2 蛋白质二级结构分析的重要意义 7 1.3 圆二色谱解 析方法概述 8 1.4 圆二色谱解析的目的与意义 8 2. 蛋白质的结构 9 2.1 蛋白质的分子结构 9 2.2 蛋白质的二级结构 10 2.3 蛋白质二级结构的基本类型 10 2.3.1 -螺旋结构 10 2.3.2 -折迭结构 11 2.3.3 -转角 12 3. 圆二色谱技术 12 3.1 圆二色的基本原理 12 3.1.1 光学活性 12 3.1.2 圆二色性 13 3.2 圆二 色性的产生 14 3.3 圆 二色谱仪及其测量方法 14 3.3.1 圆二色谱仪的结构原理 14 3.3.2 圆二色谱仪的测量方法 15 3.4 圆二色技术的应用 16 4. 蛋白质圆二色谱解析的历史回顾 18 4.1 蛋白质浓度的确 定 18 4.2 CD 谱解析方法的历史回顾 18 4.2.1 单个波长点的螺旋量估测 18 4.2.2 多元线性回归从 CD 中预测蛋白质及多肽的二级结构 19 4.2.3 奇异值分解 20 4.2.4 凸集约束分析 20 4.2.5 选择方法 21 34.3 CD 谱解析方法的总结与建议 23 5. 神经网络法在蛋白质圆二色谱分析中的应用 27 5.1 主成分分析的原理 27 5.1.1 总体主成分 27 5.1.2 样本主成分 28 5.2 人工神经网络概述 29 5.2.1 第一次热潮 29 5.2.2 第二次热潮 30 5.2.3 BP 网络 31 5.2.4 径向基函数网络 34 6. 实验内容 3 6 6.1 实验材料 36 6.1.1 蛋白质缓冲液的制备 36 6.1.2 蛋白质样品 36 6.1.3 实验仪器 37 6.2 实验方法 37 6.2.1 仪器校正 37 6.2.2 处理方法 37 6.3 圆二色谱图 37 6.4 软件的设计与实现 38 6.4.1 设备要求 40 6.4.2 软件设计的流程图 40 7. 结果与讨论 41 8. 结论 47 参考文献 48 附录 54 致谢 56 4摘 要 随着分子生物学的迅猛发展和 21 世纪后基因组学的全面展开,蛋白质的结构分析逐渐成为了生物学研究的热点。圆二色谱是测量溶液中蛋白质和肽的构象的极好方法,它主要用于溶液中蛋白质二级结构的测定,并可对三级结构的类型进行初步估测。本文在介绍圆二色技术和圆二色谱解析历史的基础上提出了一种圆二 色谱解析的新方法 径向基神经网络算法,并给出了基于 MATLAB平台的计算程序。径向基神经网络方法预测蛋白质二级结构类型为: - 螺旋、3/10 螺旋、扩展的 - 折叠片层、 - 转角、聚脯氨酸 类似 3/1 螺旋以及其它结构,且预测实验所测蛋白质的结果良好。径向基网络方法对单个结构成分的预测要优于现今应用较为广泛的 BP 网络并且它还可以对多各组分进行同时测量,但预测精度有待于进一步提高。同时,它还可以在不知道蛋白质精确浓度的情况下进行预测且运行速度较快,从训练到预测的时间不超过 1 分钟。当然该方法也有许多不足之处还有待改进 ,本文对这些不足之处产生的原因进行了讨论并提出了改进的方法。 关键词: 圆二色谱 蛋白质二级结构 MATLAB 径向基神经网络算法 5ABSTRACT With the development of molecular biology and Post-Genome era, the structural information analysis is becoming the hot topic of biological science. Circular Dichroism(CD) is an excellent method for analyzing the conformation of proteins and peptides in solution. It is mainly used to predict the second-structures of proteins and also used to estimate the tertiary structure classes of proteins. Based on the introduction of CD technology and former various methods of obtaining structural information from CD data, a new method-Radbas (RB) neural network is put forward and computer program which run on MATLAB are also provided. Second-structures predicted by RB method are: H: -Heilx; G:3/10-Helix; E:extended- -strand; T: -turns; P: Polyproline-like3/1-helix and O: Others. This method obtains reasonable estimate of proteins on experiment. RB neural network method gives better estimates than widely used BP neural network method when it estimates one secondary structural class. At the same time, the RB neural network method still need to be improved when it estimates five secondary structural classes simultaneously. In addition, it does not need to determine precise protein concentration and runs quickly which make the total time is less than 1 minute. It is natural that it also has some disadvantages that have been discussed. Improved methods are proposed for these disadvantages. Key Words: Circular Dichroism Spectra Secondary Structures of Proteins MATLAB Radbas Neural Network Method 61. 前言 1.1 蛋白质结构测定对分子生物学发展的重要意义 在人类以往的历史上,生命科学象现在这样的蓬勃发展并吸引如此众多非生命科学的交叉和渗透还未曾有过。现在生物学研究正越来越定量化,不仅在方法和手段上更趋复杂和先进,而且需要多学科的知识,许多激动人心的发现和成果往往出现在这些交叉的前沿。前年, Nature 杂志曾刊登标题为“物理 学能否提供另一次生物学革命?”的编辑部文章 1,认为目前物理学和生物学家已认识到彼此交叉和渗透的重要性和必要性。他们之间在文化、机构、概念及语言等诸方面的壁垒正被打破。 翻开当今国际上生命科学中各分支领域的著名杂志,一个和十多年前显著的不同之处是出现了不少三维空间结构的生物大分子模型图 2。原因是要搞清楚生命过程的本质,一个根本前提是必须要了解蛋白质、核酸等大分子具有原子分辨率的空间结构以及这种结构又如何与其生物学功能相联系的。由此诞生了“结构生物学”这一新的研究前沿。最近随着人类基因组测序的完成,对未 知基因表达产物 蛋白质的结构和功能的了解已成为新的热点。因而对蛋白质空间结构的研究是后基因组时代很重要的方面。关于测定技术,目前80%以上的生物大分子结构是用 X 射线衍射法得到的。过去的十多年里,同步辐射技术的发展大大推动了结构生物学的研究进展 3。根据国际蛋白质数据库( PDB)资料, 70 年代每年登录的生物大分子空间结构数约 20 个,但到 1999 年一年中,新登录的数目已增加到2636 个。其中相当部分具有重要生物学功能的生物大分子结构是用同步辐射 X 射线测得的,同步辐射 X 射线特别适用于那些分子量大(可至数百万)、 晶体小(几十微米)的超分子复合体及膜蛋白。如近几年已报道的与能量转换有关的细胞色素 C 氧化酶等膜蛋白复合体,参与信号转导的 G 蛋白和其效应器的复合体、多种基因转乘因子和 DNA 复合体等。1999 年 Science 杂志则将测得细胞内合成蛋白质工厂的核糖体结构列为当年十大科技突破之一,这种结构的鉴定给新药设计提供了分子结构基础,有力促进了“基于结构的药物设计”或“合理的药物设计”的发展。国际上目前最著名的治疗 AIDS 病的蛋白水解酶抑制剂就是这样诞生的,用同步辐射白光 Laue 法测定肌红蛋白结合和释放 CO 的 150 微微秒的动 态结构例子则使我们能“看”到生命活动的“过程”。“基于同步辐射的结构生物学”之 7所以有这样大的发展,一个关键点是涉及遗传工程、低温结晶、高灵敏的探测技术、数据处理的计算机硬件及软件等技术上的飞速进步和第三代同步辐射装置的出现,正在上海筹建的“上海同步辐射装置”,设计能量为 3.5GeV,在世界第三代同步辐射装置中位居第四,可以期待在推动结构生物学和其他生命科学的发展中该项设施将起着重要的作用。 目前最为关注的是生物信息学 4,5,它已成为基因组学分析中的最重要的技术,其内容集中在算法、模拟、数据库构建与分析、 大范围基因序列的获取、 SNP( single nucleotide poly morphism)分析、蛋白质结构预测、药物分子研究等。 1.2 蛋白质二级结构分析的重要意义 自从早期 Kendrew 对肌红蛋白 X 射线衍射的研究揭示了多肽链的折叠以来,生化学家的研究已经从蛋白质的氨基酸序列扩展到了三维结构 6。尽管人们在这方面已经做出了巨大的努力,结果还是模糊不清。然而,随着人类基因组计划中大量新序列的产生,预测蛋白质的构象成为生化研究的新目标。然而,我们仅仅知道已知一级结构序列的 100, 000个蛋白质基因中不 足 3%的蛋白质的详细结构。许多未确定结构的蛋白基因与已知蛋白有足够的相似序列,通过同源物模型来预测这些蛋白的结构,与任何一种已知蛋白的基因序列重复性小于 25%的序列可能采取新的折迭构象,这些折迭组成与已知蛋白二级结构相似的域。因而,实验测得的一个蛋白的二级结构可能给理解其功能提供了重要的线索。 一组二级结构元系定义了一个蛋白质的基元,预测一个折迭基元在实验中的变化可通过测量包含该基元的二级结构元系得到。大多数情况下,存在于 螺旋、 折叠及非周期性构象中的肽链折叠部分可以从高灵敏度的光谱测量仪,如 CD (圆 二色)、 IR( 红外 )和拉曼光谱仪中估计出来。在有利的条件下,构象的变化伴随着基因和抑制剂的结合、亚基的聚集及其它的生物现象,这些可以从光谱的变化中观察到。这些测量为表达蛋白的定点突变和折迭构象提供了宝贵的信息。另外二级结构的光谱测量是评价蛋白质聚集和稳定性的一个很有价值的工具。对于在分子生物学中存在的许多重要问题,例如蛋白质折叠、蛋白质与蛋白质的相互作用以及蛋白质与核酸的相互作用等。二级结构的定量测定对结构特征的确定起着重要作用,而这些结构特征对生物功能又是至关重要的。 1.3 圆二色谱解析方法概述 81965 年, Holzwarth 和 Doty 第一次把圆二色性应用于蛋白质结构的分析中。当时,由于实验水平和技术的限制还只能得到 -螺旋的信息。直到 20 世纪 70 年代,才在圆二色谱中找到了关于 -转角的信息。后来,随着技术的进一步发展和商品化的圆二色仪的问世,能够测量到的圆二色的谱区越来越靠近真空紫外,从圆二色谱中获得的结构信息也就越来越多。迄今为止,商品化的圆二色仪可达到的最短波长为 140nm,有报道的可以获得误差范围内数据的最短波长为 168nm。在圆二色谱仪取得长足进步的同时,对蛋白质圆二色谱解析的方法也取得了很大进 步。至今为止有许多方法用来从圆二色谱中提取蛋白质溶液中的构象,所有这些方法都基于下述假设 6:一个蛋白质的圆二色谱是蛋白质二级结构元素谱的线性组合及噪音之和,噪音中包括芳香族生色团的贡献,如方程式( 1)所示: 是某一个波长处的 CD 值, Fi 是第 i 个二级结构所占的比重, S i 是第 i 个二级结构元素在该波长处的椭圆度。在限制权重的方法中所有二级结构所占的比重之和为 1,即 F 必须等于 1。从 CD 中提取结构信息的方法主要有:( 1)多元线性回归方法;( 2)奇异值分解法;( 3)岭回归方法;( 4)凸集约束分析方法; ( 5)神经网络分析方法;( 6)自适应方法。这些方法将在第四章中详述。使用这些方法的计算程序可以在 IBM-兼容机上运行(见附录)。 1.4 圆二色谱解析的目的与意义 近几十年来,随着基因工程与蛋白质工程的发展,人们迫切需要了解蛋白质的结构,目前应用较为广泛的 X-Ray 晶体衍射和核磁共振( NMR)技术都有其各自的局限性: X-Ray晶体衍射必须用蛋白质晶体作为样品,并且只能研究蛋白质的静态构象,而许多蛋白质由于无法得到结晶而不能使用 X-Ray 晶体衍射; NMR 技术虽然可以研究溶液中蛋白质的构象,但它要求所测 蛋白质的分子量必须在 15000 以下; CD 技术由于既可以应用于溶液又可以测定蛋白质构象的变化,并且不受分子量的限制,因而在近几年得到了快速发展。现在 CD 仪不仅应用于蛋白质二级结构和构象变化的测定,而且还广泛应用于核酸结构的测定以及一些药物中活性成分的鉴定 7。 在生化研究中, CD 谱的应用极为广泛,它已成为生化工作者的得力助手。如徐狄等( )1 += noiseSF ii llq 9用定点突变法对人白细胞介素 2末端 -螺旋的结构和功能研究 8;韩学海等对不同折叠状态的 Apocty.C 插膜后构象的研究 9;周月芳等对白细胞介素 2 中某些残基替换对活 性影响的研究 10;李晓鹏等对光系统核心天线 CP43 的纯化及性质的研究 11,王建华等对 28KD 蛋白的纯化及性质研究 12;韩学海等对低浓度蜂毒素在溶液中的自聚集的研究 13;崔涛等对尖吻蝮蛇出血毒素的圆二色性的研究 14,15等等都是利用圆二色性作为一种重要的研究方法。 随着圆二色仪在科研中的普及以及人类基因组计划中后基因组时代的到来,蛋白质的结构与功能的研究将成为 21 世纪研究的热点,而圆二色谱的研究作为一种日渐普及的研究方法必将在 21 世纪发挥更大的作用。 2. 蛋白质的结构 2.1 蛋白质 的分子结构 蛋白质是由氨基酸连接成肽链,然后折叠成具有特定立体结构的化合物,Linderstrom-Lang 早在 1952 年就提出蛋白质的结构可分为三个层次 16,17,即一级结构( Primary Structure) 、二级结构( Secondary Structure) 、三级结构( Tertiary Structure) 。一级结构是指组成蛋白质的肽链中的氨基酸排列顺序;二级结构是指肽链主链有规律的空间排布,不考虑肽链的构象及整个肽链的空间排列;三级结构则是指整个肽链的折叠情况,包括侧链的排列。也就是蛋白质分子 的空间结构或三维结构。 1953 年英国晶体学家 Bernal提出了四级结构 (Quarternary Structure)的概念,是指有些蛋白质有相同的或不同的亚基靠非共价键结合在一起而形成的更复杂的结构。随着蛋白质化学研究的进展,近年来越来越多的人认为在二级结构和三级结构之间应增加两种新的水平,即超二级结构( Supersecondary Structure) 和结构域( Structural Domain) 两个层次。超二级结构指的是二级结构的基本单位相互接近,形成有规律的二级结构聚集体,结构域指的是蛋白质分子中那些 明显区分的球状区域。 2.2 蛋白质的二级结构 蛋白质的二级结构是指多肽链本身的折叠和盘绕方式 16。研究证明,多肽链的二级 10结构主要有 -螺旋, -折叠和 -转角,氢键是稳定二级结构的主要作用力。 Pauling 及 Corey 利用 X-射线衍射技术研究了肽链的结构。一个重要发现是肽键具有部分双键性质而不能自由旋转,其长度( 0.132nm)介于 C-N 单键( 0.149nm)与 C=N( 0.127nm)双键之间。结果肽键的所有 4 个原子和与之相连的两个 -碳原子都处于同一平面内,此刚性结构的平面称肽平面( Peptide Plane)或酰胺平面( Amide Plane)。肽平面内的 C=O 与 N-H 呈反式排列,各原子间的键长和键角都是固定的。肽链主链上只有碳原子连接的两个键,如 C -N 键和 C -C 键是单键,能自由旋转。绕 C -N 键旋转的角度称为(角),绕 C -C 键旋转的角度称为(角),习惯上将这两个角称为二面角(,)。原则上,和可以取 -180 +180之间的任一值。这样多肽链主链的所有可能构象都能用和这两个构象角( Conformational Angle)即二面角( Dihedral Angle)来描述 。-螺旋的二面角 -60、 -45,折迭的二面角为 -130、 -120。根据以上特性,可把多肽链主链看成是由一系列刚性平面组成。因为主链的 C-N 键具有部分双键性质,不能自由旋转,使多肽链构象数目受到很大限制。虽然 原子的两个单键( C -N 和 C -C)可以自由旋转,但不是任意二面角(,)所决定的肽链构象都是主体化学所允许的,例如 0 , 0时的构象,由于会造成一些原子之间的空间重叠,而实际上不存在。因此,多肽链构象的数目又受到进一步的限制。蛋白质的三维构象是多肽链上各 个单键的旋转自由度受到各种限制的总结果。 2.3 蛋白质二级结构的基本类型 2.3.1 -螺旋结构 Pauling 及 Corey( 1951)研究羊毛、猪毛、鸟毛等的角蛋白时,提出了 -螺旋 (-helix) 结构, -螺旋具有下列特征 17: (1) 在 -螺旋结构中, 3.6 个氨基酸残基旋转一周,螺旋每上升一圈,沿纵轴的间距为0.54nm,每个残基绕轴旋转 100,沿轴上升高度为 0.15nm。 -螺旋有右手和左手两种,天然蛋白质中的 -螺旋几乎都是右手螺旋,右手的比左手的稳定。 11(2) -螺旋的稳定性是 靠链内氢键维持的。螺旋每隔三个氨基酸残基可形成一个氢键,即每个肽键上的 N-H 氢和它后面( N 端)第四个残基上 C=O 氧之间都形成氢键。氢键的取向几乎与中心轴平行。 (3) 肽键中氨基酸残基的 R 侧链分布在螺旋的外侧,其形状,大小及电荷等均影响 -螺旋的形成。 现在公认纤维状蛋白如毛、发、蹄、角、羽毛等的 -角蛋白( -keratin)都是由右手 -螺旋的平行肽链组成的。毛、发的 -角蛋白通常是由三条 -螺旋的多肽链构成的纤维状蛋白。 弯曲的 -螺旋在某些情况下亦可以伸展。例如构成 -角蛋白的螺旋链,在受热 水、稀酸或稀碱处理时即可伸展,但去掉处理后,又可恢复原状。 2.3.2 -折叠结构 -折叠( -plated sheet)结构学说是 Pauling 等人利用 X-射线衍射法研究丝蛋白结构时提出的。蚕丝蛋白几乎完全由 -折叠片组成。 -折叠是蛋白质二级结构中第二种最常见的二级结构,它是两条或多条几乎完全伸展的多肽链侧向聚集在一起,靠链间氢键连接的片层结构。其特征如下: (1) -折叠结构中两个氨基酸残基之间的轴心距为 0.35nm。 (2) 肽链按层排列,靠链间氢键维持其结构的稳定性, -折叠结构的氢键是由相 邻肽链主链上的 -NH 和 C=O 之间形成的。 (3) 相邻肽链走向可以平行也可以反平行。肽链的 N-端在同侧为平行式,不在同侧为反平行式(即相邻肽链的 N-端一顺一倒地排列),从能量角度考虑,反平行式更为稳定。 (4) 肽链中氨基酸残基的 R-侧链分布在片层的上下。 2.3.3 -转角( -turn) 也称回折( Reverse Turn) 这是球状蛋白质中广泛存在的又一种二级结构。蛋白质分子中的多肽链经常出现 180 12的回折,在这种肽链的回折角上就是 -转角结构。它是由第一个氨基酸残基的 C=O 与第四个残基的 N-H 之间形 成氢键,产生一种不很稳定的环状结构,由于 -转角结构,可使多肽链走向发生改变。另外,转角的侧链向外突出使 -转角经常出现在蛋白质的表面,因为那儿与溶液结合的氢键比较丰富。由于位于表面,转角结构在分子识别中起着重要作用。 除螺旋、折迭、转角以外的结构通常被称为无规则或随机结构。 3. 圆二色谱技术 3.1 圆二色的基本原理 圆二色( Circular Dichroism, 简称 CD)是研究偏振光对不对称分子作用的一种技术18。含有不对称碳原子的分子都能产生旋光现象( Opitical Rotation) ,这种物质成为具有光学活性( Optical Activity)的物质。生物体系的不对称性是一个很普遍的现象,氨基酸(一般为 L 构型)、核苷酸(含有糖、 D-核糖和 D-脱氧核糖)和碳水化合物( D 与 L 构型)是组成多肽、蛋白质、多聚核苷酸和多糖的基本单元。由于这些单元具有不对称性,所以由它们聚合而成的大分子也是不对称的。偏振光在通过光学活性物质后某些性质将发生变化。CD 就是根据这些变化来了解分子本身的结构及其变化的技术,由于 CD 适用于溶液,因而成为研究溶液中大分子构象的重要手段。 3.1.1 光学活性 偏振光与 分子的相互作用有两种情况:一种是当一束平面偏振光射入非旋光物质后,振动方向不改变。另一种是由于物质分子缺乏对称性,因而具有能使面偏振光振动平面旋转的能力。这样的物质被称为旋光物质或具有光学活性的物质,其中最显著的例子是糖类和石英。但是还有许多有机化合物,特别是生物大分子,几乎都具有这种特性。 含有不对称碳原子(即与四种不同的基团相连的碳原子)的化合物都具有旋光性,并有两种旋光型式,它们的关系是物体和镜象的关系,这样的化合物是一对旋光异构体。它们除了旋转平面偏振光的能力不同以外,其他物化性质完全相同,如丙氨酸 就是一例。 13H H H3C -C - COOH HOOC -C - CH3 NH2 NH2 L( +)丙氨酸 D()丙氨酸 这种氨基酸含有一个与四种不同的基团相连的碳原子,因而具有旋光性。其中使平面偏 振光偏向右边的(对着光源看,顺时针方向旋转)称为右旋,反之称为左旋。右旋用“ d”或“ +”表示,左旋用“ l”或“ -”表示,在有机化学中,按照分子内各种基团在空间位置排列的不同,以甘油醛为比较标准,把构型分为 D 和 L 型两类,蛋白质中的 氨基酸都属L 型,绝大多数常见的糖,如葡萄糖、核糖等均属 D 型。但 D 和 L 仅表示分子的构型,不表示旋光的方向。 3.1.2 圆二色性 由于光学活性物质对左、右圆偏振光的吸收 L 与 R 是不同的,这二者之间的差值 = L R 即为圆二色性。如果 L R 则为正圆二色性, 反之, L0。设 =0, 1 2 m( m0)为的 m 个特征根,设 H=(h1,h2, ,hm)是 m m 的正交阵,且使得 ),.,( 21 mdiagHH lll = 于是 h i 为对应于特征根 i 的的正规化特征向量。又取 =mm UUUXhXhXhXHU . 2121则 = HHXHCovUCov )()( 这说明 U 的分量 U 1 ,U 2 , ,U m 彼此间是不相关的,且 Var(U i )= i ,i=1,2, ,m, 于是称 2821 ),.,(mUUUXHU = 的分量 mUUU ,., 21 为 X 的 主成分或主分量,其中),.,( 21 mhhhH = 且 XhU 11 = 称为第一主成分,它的方差是 XhU 221; =l 称为第二主成分,其方差为 ,2l 等等。主成分具有以下重要性质: 第一主成分 1U 是具有最大方差的 X 的分量的正规化线性组合,且最大方差为 1l ;第二主成分 2U 是与第一主成分 1U 不相关的具有最 大方差的 X 分量的正规化线性组合,且最大方差为 2l ;第三主成分 3U 是与第一主成分 1U 及第二主成分 2U 不相关的具有最大方差的 X 分量的正规化线性组合,且最大方差为 3l ,等等。一般地,第 k 个主成分 kU 是与121 ,., kUUU 不相关 的具有最大方差的 X 分量的正规化线性组合,且最大方差为).,2,1( mkk =l 等等。 5.1.2 样本主成分 设 X 为 1m 的随机向量,且 X 1 , X 2 , X N 为来自总体 X 的一个样本,样本容量为 SnN ,1+= 为样本协方差矩阵,且 )1(,)()( = NnXXXXnSA ii 其中 =NiiN XX11 又设 mppp .21 为 S 的特征根,这些特征根以概率 1 各不相同,并且是 x 的特征根 mlll .21 的估计量。设 ),.,( 21 mqqqQ = 为 mm 正交阵,且使得 ,),.,( 21 mpppdiagPSQQ = 29于是 iq 为 S 的对应于特征根 ip 的正规化 的特征向量,它是 的特征向量 ih 的估计量,并有以下定义: 2121 ),.,(),.,(mm UUUXqXqXqXQU = 的分量XqUXqUXqU mm 2211 ,., = 称为样本主成分,它们是由 2121 ).,(),.,(mm UUUXhXhXhXHU = 给出的总体主成分 mUUU ,., 21的估计量。且称 ),.,2,1( miXqU ii = 为样本的第 i 个主成分。 实际问题中,观测的指标量纲常常是不同的,为了消除观测数据由于量纲不同带来的影响,常在进行主成分分析前先对原始观测数据进行标准差标准化处理 ,这时由变换后的数据算得的样本协差阵即为样本相关阵。一般说来,由样本协差阵 S 出发算得的主成分与由样本相关阵 R 出发算得的主成分是有一定差异的,在实际问题中,当观测指标量纲不同时,由相关阵出发求主成分更为合适。 由样本相关阵 R 出发进行的主成分分析称为 R 型分析,由样本协差阵 S 出发进行的主成分分析称为 S 型分析。 如本论文所编程序中使用的是样本协差阵的 S 型分析。输入值为 20 83 的矩阵,经过主成分分析后就成了 83 20 的主 成分矩阵,并且其所对应的前 20 个特征值分别为:363.3200, 37.0029, 4.1712, 3.3534, 1.5977, 0.7724, 0.4678, 0.2750, 0.0610, 0.0275, 0.0093, 0.0072, 0.0062, 0.0039, 0.0032, 0.0020, 0.0018, 0.0005, 0.0002, 0.0000, 0.0000。我们可以取不同的主成分作为神经网络的输入。 5.2 人工神经网络概述 神经网络的研究已有较长的历史,一般可以用两次热潮来划分其历史时期。 5.2.1 第一次 热潮( 1943 年至 1969 年) 早在 1943 年,心理学家 W. McCulloch 和数理逻辑学家 W. Pitts 合作首先提出了一个 30简单的神经网络模型 41,42,其神经元的输入输出关系为 )( =ijijij xwsigny q 其中输入输出均为二值量, jiw 为固定的权值。利用该简单网络可以实现一些逻辑关系。虽然该模型过于简单,但它为进一步的研究打下了基础。 1949 年 D. O. Hebb 首先提出了一种神经元连接强度的修改规则,通常称为 Hebb 学习规则,其基本思想是,当两个神经元同时兴奋或同时抑制时,它们之间的连接强度便增加。这可表示为 = =jijixxwnkkjkiji01)()(这种学习规则的意义在于,连接权值的调整正比于两个神经元活动状态的乘积,连接权值是对称的,神经元到自身的连接权值为零。现在仍有不少神经网络采用这种学习规则。 1948 年, Wiener 在其控制论的著作中提出了伺服机反馈自稳定系统概念。 1958 年, F. Rosenblatt 首次引进了模拟人脑感知和学习能力的感知器( Perceptron)概念,引起了人们的 注意。他们认为这是生物系统感知外界传感信息的简化模型。这种模型主要用于模式分类。 1961 年, Caianniello 发表了关于神经网络数学的理论著作,提出了神经元网络方程,将神经元作为双态器件,对其机能的动力过程用布尔代数加以模拟,进而分析和研究了细胞有限自动机的理论模型。 1962 年, B. Widrow 提出的自适应线性元件( adaline),具有自适应学习能力,在信号处理、模式识别等方面受到普遍重视和应用。 1969 年 M. Miskey 和 S. Papert 发表了名为“感知器”的专著。他们在专著中指出,简单 的线性感知器的功能是有限的,它无法解决线性不可分的两类样本的分类问题。典型的 31例子如“异或”运算,既简单的线性感知器不可能实现“异或”的逻辑关系。要解决这个问题,必须加入隐层节点。但是对于多层网络,如何找到有效的学习算法尚是难以解决的问题。因此它使整个 70 年代神经网络的研究处于低潮。 5.2.2 第二次热潮 1982 年,美国物理学家 J. J. Hopfield 在美国国家科学院的刊物上发表了著名的“ Hopfield”模型理论,这是一个非线性动力系统的理论模型 41,42,43。它引起了世界各国学者的关注,并力 图将这一数学模型进行电子学或光学的硬件实现,这就形成了一大批人工神经网络的研究队伍。当代 80%的各国研究者都是追随 Hopfield 模型而迈入这一学术领域中。这一模型对人工神经网络信息存贮和提取功能进行了非线性数学概括,提出了动力方程和学习方程,使人工神经网络的构造和学习有了理论指导。在 Hopfield 提出之后,许多学者力图将这一模型扩展,使之更接近人脑的功能特征。 1983 年,即 Hopfield 模型提出的第二年,年轻学者 Sejnowski 与其合作者 Hinton 提出了大规模并行网络 (Massively parallell) 学习机,并明确提出隐单元( Hidden Unit)的概念。这种学习机后来称之为Boltzmann 机。他们应用多层神经网络并行分布地改变各神经元间的连接权,克服了以往神经网络的局限性。此外, Sejnowski 还运用这些原理构造了著名的 NETtalk 程序系统。 K. Fukushima 在 Rosenblatt 的知觉器网络基础上增加了隐层,构成了多层认识器,实现了可塑的反馈联系和更为普遍的前馈联系 44。这种认知器通过抑制性反馈和兴奋性前馈作用,即使外部刺激停止以后,也可以继续实现自组织自学习过程 。还有 J. Anderson 提出了 BSB模型, S. Grossberson 提出了自适用共振理论, T. Kohonen 提出了自组织映射网络, D. Willshaw 等提出了联想记忆网络,这些努力为神经网络的后期发展奠定了牢固的基础。目前在研究方法上已形成多个流派,包括多层神经网络 BP 算法, Hopfield 网络模型,自适应共振理论 (ART),自组织特征映射理论等。 1987 年 IEEE 在 San Diego 召开了甚大规模的神经网络国际学术会议,国际神经网络学会也随之诞生,随后不久学会的杂志 神经网络和 IEEE 的神经网 络杂志相继问世。 迄今为止的神经网络研究,大体上可分为三个大的方向: 32(1) 探求人脑神经系统的生物结构和机制,这实际上是神经网络理论的初衷; (2) 用微电子学或光学器件形成特殊功能网络,这主要是新一代计算机制造领域所关注的问题; (3) 将神经网络理论作为一种解决某些问题的方法和手段,这些问题在利用传统方法时或者无法解决,或者在具体处理技术上尚存困难。 5.2.3 BP 网络 5.2.3.1 BP 网络概述 Minsky 和 Papert 的论点曾使许多人对神经网络的研究失去了信心,但仍有许多学者坚持这一方面的研究 44。 Rumelhart、 McClelland 和他们的同事洞察到神经网络信息处理的重要性,于 1982 年成立了一个 PDP 小组,研究并行分布处理方法,探索人类认知的微结构。 1985 年发展了 BP 网络学习算法,实现了 Minsky 的多层网络设想。 由于感知器神经网络中神经元的变换函数采用符号函数,其输出为二量值,因此它主要用于模式分类。 BP 网络也是一种多层前馈神经网络,其神经元的变换函数是 S 型函数,因此输出量为 0 到 1 之间的连续量,它可以实现从输入到输出的任意的非线性映射。由于权值的调整采用反向传播( Back Propagation)的 学习算法,因此也常称其为 BP 网络。在确定了 BP 网络的结构后,利用输入输出样本集对其进行训练,也即对网络的权值和阈值进行学习和调整,以使网络实现给定的输入输出映射关系。经过训练的 BP 网络,对于不是样本集中的输入也能给出合适的输出,这种性质称为泛化( generalization)功能。从函数拟和的角度看,这说明 BP 网络具有插值功能。 BP 算法的主要缺点为: (1) 收敛速度慢; (2) 局部极值; (3) 难以确定隐层和隐节点的个数。 33W(1,R) 在实际应用中, BP 算法很难胜任,因此出现了许多改进算法。 BP 算法的改进主要由两种途径,一种是采用启发 式学习方法,另一种则是采用更有效的优化算法。在神经网络工具箱中,函数 trainbpx( )采用了动量法和学习率自适应调整的策略,从而提高了学习速度并增加了算法的可靠性。动量法降低了网络对于误差曲面局部细节的敏感性,有效地抑制了网络限于局部最小。自适应调整学习率有利于缩短学习时间。函数trainlm 使用了 Levenberg-Marquardt 优化方法,从而使学习时间更短,但对于复杂的问题,这种方法需要很大的存储空间。 Levenberg-Marquardt 优化方法的权值调整率选为 eJIJJw TT 1)( += m 其中 J 为误差对权值微分的 Jacobian 矩阵, e 为误差向量, 为一个标量,当 很大时,上式就接近于梯度法;当 很小时,上式就变成了 Gauss-Newton 法,在这种方法中, 也是自适应调整的。 5.2.3.2 BP 神经元模型 图 5-1 给出了一个基本的 BP 神经元,它具有 R 个输入,每个输入都通过一个适当的权值 w 与下一层相连,网络输出可表示成 ),*( bpwfa = 。 BP 网络中隐层神经元的变换函数通常是 log-sigmoid 型函数 logsig,也可采用 tan-sigmoid 型函数 tansig,在某些特定情况下,还可能采用纯线性函数 purelin。如果 BP 网络的最后一层是 sigmoid 型神经元,那么整个网络的输出就限制在一个较小的范围内;如果 BP 网络的最后一层是 purelin 型线性神经元,那么整个网络的输出可以取任意值。 BP 网络所采用的传递函数均是可微的单调递增函数。在 BP 网络的训练过程中,计算函数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论