神经信息编码综述教材_第1页
神经信息编码综述教材_第2页
神经信息编码综述教材_第3页
神经信息编码综述教材_第4页
神经信息编码综述教材_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

神经信息编码综述沙漠蚁在寻找食物时会行走很长的距离,当一只蚂蚁搜索时,它以一种锯齿形弯弯曲曲的路径运动。但是一旦该蚂蚁发现了食源,它便转向巢穴,并直接以直线方式向巢穴进发。它是怎么做到这一点的呢?原来中枢神经系统记录了该蚂蚁的每一次左右转向,并能计算它开始时的位置,进而指导它笔直的回家。如此复杂的信息整合依赖于由太阳发出的偏振光[1]提供的坐标。沙漠蚁的眼包含对偏振光敏感的特异光感受器群,这些光感受器向中枢神经系统提供信息,由后者计算并记录在空间中的运动而建立一种新矢量。以上这个简单而又有趣的案例,向我们暗示了神经信息编码的过程和强大的功能。本章就带领读者具体了解人类大脑神经信息编码的生物学基础和如何使用数学方法对神经信息编码进行建模分析。当然,本文不是专业教材,所以对很多知识点只是点到为止,不会过于深入,但是在介绍具体知识点时会不断穿插一些非常有趣而经典的应用,使读者能感受到神经信息编码的巨大魅力。另外,关键的作用是帮助读者和笔者一起从神经元信息编码开始,到人脑结构、认知心理学、认知-情感体系,最终到意识的涌现,勾连出一个逻辑链条和理论框架,从而对人类自身活动的认识、理解提升到一个整体的层面,并最终获得最高层次的精神洗礼。[1]光是一种横波,由振动方向和光波前进方向构成的平面称为振动面,光的振动面如果只限于某一固定的方向,就是偏振光。第一节神经元的结构神经元又称神经细胞,是构成神经系统结构的基本单位。神经元是具有长突起的细胞,它由细胞体和细胞突起构成。细胞体位于脑、脊髓和神经节中,细胞突起可延伸至全身和组织中。细胞体是细胞含核的部分,其形状大小有很大差别,直径约4um-120um。核大而圆,位于细胞中央,染色质少,核仁明显。细胞体内有斑块状的核外染色质(旧称尼尔小体),还有许多神经纤维。细胞突起是由细胞体延伸出来的细长部分,又可分为树突和轴突。每个神经元都可以有一或多个树突,可以接受刺激并将兴奋传入细胞体。每个神经元只有一个轴突,可以把兴奋从胞体传送到另一个神经元或者其他组织,如肌肉或腺体。图1-1一个神经元的典型特征不同部位、不同种类的神经元,其胞体大小和形态各异,甚至同一种类的神经元也相差很大。单就大小而言,其直径在3-155um之间,如人类小脑颗粒细胞之间约为5-8um,而脊髓运动神经元直径可超过120um。胞体的形态有圆形、椭圆形、锥形、梭形等。如果加上突起,神经元的形态和大小就更加千差万别,从突起的长短看,有的很短,有的长达1m以上;就突起的多少而言,有一个、两个的,也有成千上万的。一个神经元通常只有一个轴突。也有的神经元缺乏轴突,只有树突。而且树突的多少、长短和分布是多种多样的,故整个神经元的形态,主要由树突决定的。如果神经信息编码是存在于脉冲序列之中[1],神经回路是处理这些脉冲序列信号的基础。而回路的基本单元是神经元,首先要考虑一个神经元的输入输出的变化关系。当一个神经元有成千上万个树突,会引发一个问题,就是信息海量输入的问题,如图1-2,是一个小脑中的浦肯野细胞(是从小脑皮质发出的唯一能够传出冲动的神经元,浦肯野细胞轴突穿过颗粒层和白质到达深部小脑核团,浦肯野细胞在运动协调中起着重要的作用),树突可多达15万个,也就是有15万的突触信息输入处。这么多的突触会使人们产生很多不可理解的猜测。1)从生理实验上看,脑中神经脉冲一般工作在几十到几百HZ的范[1]李轶.神经信息处理及其应用[D].浙江大学,2011:100-107.围内,最高不会超过1000HZ。如果一个突触1秒钟内接受一个脉冲,那么十几万个突触就有十几万个脉冲/秒,这表明细胞工作在1MHZ以上的频率,一个细胞根本不可能工作在这样高的脉冲频率上。如果说细胞在高频输入中都是处于阈值以下工作状态。如果细胞每接收10个脉冲兴奋一次(输出一个脉冲),则神经脉冲输出仍然有好几万。已使神经元处于饱和状态。每一信号都可以有一个耦合强度问题,要使细胞正常工作,平均耦合强度应在1/100。这种情况即使树突内传递处在阈值以下的分级电位状态,这么小的耦合强度已使突触很难传递信号。而且从实验可看出,树突中是存在动作电位的,也就是说工作在阈值以上。2)有一种可能的猜测,在平时这些与该细胞相连的十几万个细胞,都没有神经脉冲发出。当一、二个突触分支都有信号输入时,其他信号不会输入,这种状态不太可能存在。要知道神经系统是靠神经脉冲来维持它的生命的“健康”状态的条件,如果没有神经脉冲,则这些轴突和相连的细胞突触一定会萎缩掉。这些现象可从神经伤残病人中看出。神经元不管是否工作,每一突触一定会保持一定频率的脉冲序列存在。这种脉冲的出现是神经系统中存在大量脉冲噪声的原因。实验也可证明,脑在休息时还是有脉冲信号存在。3)十几万个信息综合能代表什么?特别是靠一个细胞能综合出什么?实在使人难以理解。或者有一种可能的解释是15万个信息都来自一、二个细胞的信息源。也就是这许许多多的突触实际上接受同样信号,以便提供可靠性。即使这样也用不着这么多,否则表明神经系统的效率太低了。4)15万个突触输入必须经常保持有脉冲信号输入,这些信号不是真正的有用信号就是噪声。对于一个细胞来说,一般不太可能同时需要十几万个信号才能处理信息。如果有一部分不是信息而是噪声,不管你如何合并、融合,合并的结果一定保有大量的噪声。特别是当输入的有用信号太少时,大量的突触输入都是低频噪声,噪声的作用会掩盖有用信号。这种情况细胞是如何处理的?这些噪声在统计上是有一定规律吗?即使有,这种有一定规律的噪声也会在很大程度上“模糊”真正有用的信号。5)在脑中存在大量的锥体细胞和蒲肯野细胞,其中锥体细胞,它的突触也有10000个数量级,由这些细胞构成的神经回路,不仅仅是一处具有海量输入,凡是细胞与细胞相连的地方都有海量信号(噪声脉冲)输入到回路中来。这样的神经回路如何工作?在脑中还能用现有的神经回路理论来分析问题吗?这样的问题还会有很多。海量树突输入信号处理实在使人难以理解。似乎以单细胞组成的神经回路来分析神经编码是有很大困难。这也许是提出神经元群体编码的重要原因之一。希望从宏观上(也就是从统计上)找规律是唯一的途径。但是这方面的讨论所得结果很少。要分析树突信息过程,首先要进行树突的结构分析。蒲肯野细胞从胞体出发有四个突出部分,其中一个是轴突,其余三个都是树突,从细胞一个突出部分出发包括与前面所有相连的树状系统可称为一株树突。每一树突可以有很多分支。每一分支端部接收来自另一个细胞轴突输入。浙江大学李秩博士提出一种新的视角解释这种现象。他们研究发现神经信号(神经脉冲)在神经元中各部分的传递是属于可激发介质中的传递性质。图1-3在神经树突中取出一段神经段在神经树突或者轴突中取出一段神经段,在某时刻产生对动作电位的区域称为活动区,这也是动作电位峰值所在区。在活动区膜内为正电荷,而活动区临近,如向前(将会出现动作电位)或向后(已经出现过动作电位),膜内则为负电荷。这种电荷的分布都是由离子通道的作用结果所致,或者说由于离子通道的作用不同而形成了轴突内的离子浓度波。一小段活动兴奋区见图1-3,它会在它的邻近产生电场,当电场强度超过阈值时,会促使邻近区离子通道的激活,使邻近区域离子浓度产生很大变化,从而达到兴奋,形成一个脉冲,而此时原活动区会自动回复到原来的静息状态。这一过程完成了神经脉冲向邻近传递的一步,这种传递形式是离子波的形式进行的。照例这种过程应该在活动区两边同时进行,但是活动区兴奋时,正好是它的左邻近区刚过了兴奋期后的不应期,这就保证了脉冲只能朝右边传播。这是激发介质动力学的特性,这种传递的波形并不取决于输入信号的形状,只是与当地的特性有关(包括膜离子通道和该区段的电特性),在均匀的轴突中波形传输将保持不变。在树突中传播的性质和轴突一样,而且这种现象在树突中表现更有意义。李博士在讨论脉冲序列在树突相互作用时,发现了树突系统中出现了一种可激发介质波的传递现象,他们称之为“Pr效应”。取一段树突的直线段,用一直线表示,如果在它的两段输入脉冲序列刺激{δi}和{δi′}({δi}频率较高)。开始时如图1-4中A所示,两边信号可按激发介质动力学规律相对前进。到B状态,双方的第一脉冲在D1处相遇,按上述分析在D1处左右都是不应期,所以D1处脉冲很快消失。接着双方第二个脉冲再相向前进,在D2相遇,如果两列脉冲频率一致,则D1和D2在同一地点,由于两列脉冲存在频率差,使D2偏离了D1,向低频方向移动,这一过程继续下去,就有D点的D1D2D3的左移,直至低频{δi′}退出该线段。两边信号的频率差越大,D这一点移动速度越大,这一现象李博士给它定义为highfrequencypreponderanceeffect,或简写为Pr效应。图1-4在神经元树突中高频脉冲压过低频脉冲的Pr效应把两个刺激加在一株树突的两个分支处,高频脉冲信号可以逐渐压制低频脉冲信号,虽然高低频脉冲信号的初始相遇点D可能在高频信号输入分支上(此时低频信号可以进入胞体),但是随着时间的推移,低频信号会被逐渐压制住,相遇点D会推移到低频信号的发出点,而此时能进入胞体的信号就只能有高频信号了,而这个过程随着高低频率差越大而越短。图1-5一株树突上高低频脉冲信号相遇到此我们得出了一个惊人的结论,对于图1-2具有三株树突树的浦肯野细胞而言,只有三个信号能同时进入胞体,在胞体把几路信号融为一体,最后输出另一串脉冲序列。神经元都是工作在高频脉冲状态中的,低频脉冲序列只是在休息时的一些动作,浦肯野细胞实际可很好的排除低频噪声。从神经系统的生理上分析看,正因为脑内有大量的浦肯野细胞、锥体细胞和多极细胞,才能使脑内信息处理回路产生海量的变化。只有这种多树突细胞的存在,才能保证脑中有大量的各种信息回路的出现,而且这种回路一旦没有了信号,回路就会消失,新的信号出现时又重新形成回路。使每一细胞能不断改变功能,为各种信息回路服务。而Pr效应保证了回路不受其他低频信号干扰,这是很有意义的现象。第二节突触及其可塑性神经元之间进行信息传递的特异性功能接触部位定义为突触[1]。借助于突触,神经元相互联系构成了神经系统,这就是有名的神经元学说。突触一词是由英国生理学家谢林顿于1897年首次提出的,是一个功能性概念。突触形态学概念是在20世纪50年代确立的,即通过电镜观察到,突触两侧的神经元胞浆并不相连通,突触前、后膜之间存在着与细胞外间隙相连通的突触间隙,但两侧膜都有不同的结构特征,成为信息传递的结构基础。随着后来的发展,突触的概念也用于表示神经元与非神经元之间的功能联系,包括感受器与神经元之间[1]越来越多的研究表明突触周围的胶质细胞也是突触的第三个成分,从而与前后两个神经元形成三重性的突触。的联系,神经元与效应器之间的联系,如神经与肌肉之间。 根据突触连接的成分分类:依照胞体、轴突和树突的相互结合,共有9种(3×3种)突触连接类型,其中轴-体、轴-树和轴-轴三种是最主要的突触。也可以根据突触的功能特性分类,若突触传递的功能是兴奋下一神经元即为兴奋性突触,反之就是抑制性突触。图1-6突触的显微结构在突触膜表面上存在两种受体[1]:离子型受体和代谢型受体。离子型受体上有离子通道,受体与特定的神经递质结合后,离子通道被打开或者关闭,从而将化学信号转换为电信号,此过程只能持续数毫秒,即及时的传递着神经冲动。而代谢型受体的一端凸出在细胞外,负责识别其他细胞发出的信号,另一端伸入到胞浆中,与特定的酶结合。代谢型受体识别并结合了细胞外的化学信使后,细胞内发生一系列变化,并通过第二信使发挥作用,代谢型受体产生的变化能促进谷氨酸的释放,并持续数秒至数分钟,其作用波及整个细胞。而谷氨酸是哺乳动物大脑中重要的兴奋性递质之一。通过增加谷氨酸释放量的方式增强了突触后电位,使突触后细胞更容易产生动作电位,这便是短时记忆形成机理的重要组成部分。[1]见果壳网影歌的专题日志,追寻记忆的痕迹。其内容主要来源于2000年诺贝尔奖得主Kandel的同名自传性科普书。长时记忆的形成需要突触发生结构性变化,此时需要激活基因,例如反复呈现的刺激促使蛋白激酶A与MAP激酶转移到细胞核里。在这里,蛋白激酶A激活CREB-1[1],而MAP激酶使CREB-2失活。CREB-1激活基因表达,而CREB-2抑制基因表达。也就是说突触联系的长时强化不仅需要开启某些基因,也需要关闭某些基因。而短时记忆不涉及核内机制。长时记忆不只是短时记忆在时间上的延伸。不仅是突触强度增加,神经回路中的突触数目也发生了变化。长时习惯化时(指反复呈现一种无害的刺激后,动物和细胞都不再对该刺激产生反应),感觉神经元和运动神经元之间的前突触数目减少;长时敏感化时(指有害刺激使动物和细胞变得敏感,对随后呈现的任何刺激(包括无害刺激)都产生强烈的反应),感觉神经元长出新的前突触端,其寿命与记忆维持的时间等长。实际上,两种CREB蛋白的拮抗性作用方式为记忆存储提供了阈值,只有重要的事件才能超越该阈值进入长时记忆。为了突破阈值,反复联系是必不可少的。例如海兔,反复电击它的尾部就是一种联系,就好比我们人类反复联系钢琴或者法语动词变位一样。然而,强烈的情绪状态可以不经练习直接进入长时记忆,如车祸等经历。在这种情况下,大量的MAP激酶瞬间涌入细胞核内,足以使全部CREB-2分子失活。解除了CREB-2的拮抗作用后,蛋白激酶A更[1]CREB为环磷腺苷效应元件结合蛋白,一种调节基因转录的蛋白质,目前发现的至少有10种以上,CREB的发现堪称心理学一大盛事,它让人类首度窥见了永久记忆如何形成。容易激活CREB-1,于是,一次经历就能顺利地进入长时记忆。最后,需要提及的一点是突触的可塑性都是针对化学突触而言的,电突触(突触间隙很小仅2-3nm,可以直接流过电流)是定型化的快速传递,不具备可塑性,但是它能双向传递信息。第三节神经系统的耦合同步活动1680年,荷兰旅行家肯普洛在泰国旅行时,记录下了在湄南河上顺流而下的时候观察的一个奇特现象:“一些明亮发光的昆虫飞到一棵树上,停在树枝上,有时候它们同时闪光,有时候又同时不闪光,闪光和不闪光很有规律,在时间上很准确。”肯普洛游记中所说的昆虫就是萤火虫,这是关于观察到震荡系统群体同步的首次记录。1729年,法国天文学家、数学家deMairan注意到扁豆的叶子会随着昼夜的更替同步的移动,之后许多更复杂的实验都证明了生命系统的生理节律与环境节律同步(即生物钟)的存在。随着电机工程和无线电工程的发展,同步现象的探索也进入到了新阶段。1920年Eccles和Vincent在实验中将两个频率有微小差异的发电机耦合起来,证明耦合作用使得两个发电机以相同的频率震动,几年后,VanderPol等重复并扩展了此实验,并首次对这一现象进行了理论研究。之后,各个领域的科学家观察到了很多有趣的同步现象并将其记录下来,数学家、工程师、物理学家以及其他领域的科学家进行了大量的研究工作来进一步理解同步现象。另外,有关同步现象,还有一个有趣的经验现象。上过自习课的学生都有一个经验,就是一个闹哄哄的教室,会在某个时刻突然安静下来,似乎是严厉的班主任突然出现了,但当大家四周看看发现没有任何老师来过,就又继续说话了。这是怎么回事呢?有一个可能的解释是,由于每个学生说话会因为呼吸、思考或者观望班主任是否到来而产生一定停顿,虽然每个人的停顿周期不同,但是一旦在某个最小公倍周期时,有一定数量的同学同时安静,造成了环境音量的突然降低,其他不在此周期还在说话的学生,也会因音量的突然降低而警惕的观察而停止说话,如此一来整个教室就在某个瞬间突然安静下来了。科学家们在不同神经元集群中也观察到了同步放电现象,比如在猫的视觉脑皮层,麻醉后的猫的视觉皮层,以及在清醒的猴子的脑电记录中都观察到了同步现象。SonyaBahar等在实验中发现龙虾通过同步行为在捕获食物的同时也躲避捕食者的入侵。此外,美国杜克大学医学中心神经学家发现神经元的同步兴奋性可能导致帕金森氏症,这个新发现颠覆了人们对帕金森氏症的原有认识。1同步绑定认知活动需要整合广泛分布在大脑各区域功能及区域间持续相互作用实现。这种大范围整合需要调节振荡神经元在有限的时间段内,在特定频段进入精确的锁定来完成。这就是神经元耦合动力学所说的同步现象[1]。动物和人的实验表明:小到神经元对之间,大到脑的某个区域内或脑的不同区域之间,都存在同步现象。正常认知活动需要广泛分布于整个大脑的大量功能区域的整合传导和彼此之间相互作[1]神经元活动的同步,主要指的是神经元电活动的频率和相位的一致性,振幅基本很难有一致性。用,对于这种大范围的神经整合来说,神经电信号同步是一种重要的潜在机制。从视知觉的基本问题出发,有一系列的实验表明各种不同的视觉信息是在大脑的不同区域得到处理的,同一客体的表征分布于大脑的不同部位,如单细胞记录技术表明,在视知觉中,颜色、形状与运动是沿不同的通道加工的,颜色与形状等客体特征是从枕叶到颞叶的腹侧视觉通路上得到表征的,而运动、深度等空间特征是从枕叶到顶叶的背侧通路上得到表征的。因此为了把外部世界的客体知觉为一个统一的整体,以避免形成到一个形状、颜色或运动等特征被错误结合在一起的无意义的知觉[1],同时也需要避免把先前或随后的其他客体特征错误整合到目前的客体特征中,这就需要把分布与不同皮层区的的分散信息合理地组织在一起,这就是所谓“绑定”问题。“同步实现绑定”的理论假设最早是由Milner和Malsburg提出,也就是说神经系统要完成复杂的认知任务,必须把广泛分布的神经反应亚单元选择性绑定在一起,才能进入以后的联合加工。为了做到被绑定的神经亚单元确属编码同一客体的,神经系统必须在毫秒级的时间尺度上反应同步化。1986年,Singer实验室首先获得有关支持同步机制的实验证据。Mioche和Singe在猫的视觉皮层放置多个电极,对[1]颜色、形状加工通路被称为what通路,运动、深度通路被称为where通路。对于听觉信息同样有此区分,不过对应的脑区不同。来自临床大脑皮层损伤病人的证据支持视觉皮层的两条通路理论,枕颞区的损伤产生的典型症状为物体失认症,面孔失认症和色盲,而枕顶区的损伤产生的典型症状为视觉运动性共济失调、空间忽视、运动不能和空间认知障碍。觉醒的猫进行了多个实验,实验的目的是研究猫单眼短期遮蔽前后条件下视觉皮层感受野神经元功能变化的时间过程。在这些实验中,特别需要注意的是当视觉在移动的光栅的刺激下,被同时记录的、空间上相隔离的神经元组均产生振荡,这些振荡的频率大约为40Hz,此振荡周期区别于刺激闪烁周期,并排除了是受噪声干扰的可能。这提示振荡来自于内部神经元的相互作用。在随后的几年里,一系列在猴子的视觉皮层的运动敏感区、鸽子的视顶盖、猫的其他皮层区和视网膜研究提供了更多关于振荡是神经元响应的方式;而这些振荡的同步是普遍存在并与刺激内容相关的证据。综合胼胝体切片多点记录及相关的研究进展显示远距离振荡的同步是通过皮层间的连接网络实现的。多位置记录同时提供了同步也出现在广泛分布的不同区域间,例如初级视皮层、视顶盖和上外侧裂周皮层区间的证据。2γ震荡简介[1]γ神经振荡(频率在30-100Hz之间)的一个显著作用就是对多特征的绑定。实验表明,它主要由具有快速放电的、表达有小白蛋白的篮状细胞组成的抑制性中间神经元网络产生。有研究用移动的光栅作为视觉刺激,记录猫视觉皮层对光栅方向有不同偏好的两个神经元的放电时发现,如果光栅的方向位于两个神经元共同偏好的方向范围中,两个神经元就以γ频率同步放电,而用[1]王静。γ神经震荡产生机制及其功能研究进展[J].生物化学与生物物理进展.2010,12:1-6各自分别偏好方向的刺激时,两个神经元的活动就不同步。这表明γ神经振荡具有将同一性质刺激的不同特征绑定和联合的作用。除此之外,EEG(脑电图)实验还发现,想像的三角形视觉刺激导致γ同步增加,说明γ神经振荡绑定了三角形的各个特征以形成感觉。γ神经振荡不仅具有绑定同一刺激物的各特征以形成感觉,而且还可以绑定同一事物的两种不同性质的多模态刺激。如向被试者同时展示同一种动物的图片和声音时,γ功率谱增加,而向被试者展示来自不同动物的图片和声音时γ功率谱的增加就没有那么显著。γ神经振荡的这种作用与γ具有促进神经元之间信息交换和整合的功能是一致的。γ神经振荡的另一个重要的功能是参与选择性注意。注意的过程就是选择与任务或目标特征相匹配的刺激。在视觉的空间注意任务实验中,提示被试者关注某一侧屏幕上出现的视觉刺激,当注意侧的刺激信号出现后,γ活动在注意侧的对侧顶枕叶增强。而且,当注意侧视觉刺激的空间发生变化时,γ活动也显著增加。说明γ振荡参与选择与目标匹配的刺激。躯体感觉刺激的选择性注意也同样显示γ振荡参与选择性注意。让被试者计数施加于一个手指上的痛觉刺激,以此作为目标刺激,而把让被试者忽略施加于另一个指头的刺激,作为对照刺激。实验发现,目标刺激引发了更强的γ活动。3目前神经同步研究的局限性1)神经电活动的同步性,目前还只是表象层面的描述。虽然有很多的数学工具来检验各个脑电信号的同步相干程度,但是对于同步发生时,神经信息具体如何整合起来,只有一个暗喻式的结论,似乎只要两个脑电信号同步了,大脑就对它编码完结了,而没有具体指明同步发生之后,大脑如何获得一个完整的认知。另外,对绑定后的同步特征进行分析,应该由所谓的工作记忆来完成,但是到目前为止,对于工作记忆中存储的是分离特征(即具体的细节特征)还是绑定特征(即客体整体),仍然没有定论,就更遑论工作记忆具体如何对被整合起来的特征进行逻辑推导产生新的判断、结论与思想的过程了。 最为重要的是,同步没有对神经网络学习识别各类特征的过程给予解释,这个问题的重担基本落在了人工神经网络模型上。2)为了测量同步性,所有测量方法都隐含一个假设[1],即所分析数据不是叠加信号。但事实是被检测具有高同步性的两叠加信号,其未叠加之前的信号分量根本不同步。例如,脑电信号是记录的头皮信号,而非脑内源信号,即各源信号传导到头皮层信号的叠加,有证据证明叠加信号的同步可能来自于叠加效应,因此,若不考虑这种效应可能导致错误的生物学结论。另外,由于颅骨的传导效应,也会导致错误的同步作用判断。因为相关同步可能是颅内同一源信号,沿颅骨传导的结果,而非颅内实际多个源之间相互作用的结果。最后,在研究大尺度源间的相互作用时,源活动的辐射传递增加了EEG测量通道间原本来源于两独立源相互作用的实际同步指数。当然,学者们过去提出诸如利用盲信号分离重构脑内源信号、独立成份分析等办法[1]周群.脑电信号同步:方法及应用研究[D].电子科技大学.2009:85减小叠加信号带来的影响,但是可以肯定的说,这种影响并没有彻底排除。总而言之一句话,神经电活动同步的研究还在幼稚阶段。第四节人工神经网络的信息编码人工神经网络一直是科幻小说中非常火爆的题材,同时也是引发人类对自身未来命运担忧的一个理论逻辑基础,多少年来我们都在讨论智能机器到底可不可能超过人类的大脑。最近几年也有很多惊动人心或者说令人不安的相关新闻。2014年6月7日是计算机科学之父阿兰•图灵逝世60周年纪念日。这一天,在英国皇家学会举行的“2014图灵测试”大会上,聊天程序“尤金•古斯特曼”首次以33%的认可率被误认为是一个13岁的小男孩而“通过”了图灵测试。图灵测试简单的说就是让计算机程序与测试人员聊天,如果一群测试人员对对方是人还是计算机程序的判断比率超过30%,那么这台躲在幕后的计算机程序就可以认为通过图灵测试了。这次通过图灵测试的对话看起来还挺有趣的,在此分享给各位读者。测试人员:嘿,你是个克林贡人还是台电脑?人/计算机程序:一个真正的战士绝不会问出这样的问题。测试人员:管他呢,回答我的问题。人/计算机程序:你丝毫没有荣誉感!测试人员:你为什么不肯回答我的问题?人/计算机程序:如果是别人这么问,那我当场就要让他血溅此地!测试人员:好吧,好吧……那你平常都有哪些娱乐活动?人/计算机程序:我旅行在鲜血汇成的河流之中!测试人员:不,说正经的,你都有哪些业余爱好?人/计算机程序:我所热爱与渴望的唯有敌人的鲜血!测试人员:我说伙计,你为啥总这么激动?人/计算机程序:RAAAWR!!!测试人员:为什么突然朝我大喊大叫?人/计算机程序:RAAAWR!!!测试人员:我不想玩这个测试了。人/计算机程序:RAAAWR!!!我旅行在鲜血汇成的河流之中,这个计算机程序如果真的是个小男孩,还真是让人不知道他是可爱还是有暴力倾向呢。2012年6月底的时候,一条新闻也是充斥网络,谷歌的神秘实验室GoogleX实验室中的天才们让一个电子神经网络成功的自主识别出了猫脸。他们用1.6万块电脑处理器构建了全球最大的人工电子神经网络,并通过输入YouTube上随机选取的1000万段视频,这个人工神经网络就在没有外界其他指令的情况下,自主的认识了猫脸。当人们认为它今天可以自主识别猫脸,明天能发现自己的存在,后天能成为科学家的时候,却发现它3年来几乎止步不前。哎,人们不知道这是件可喜的事情还是件可悲的事情。当人们悲喜交加的时候,2015年2月微软亚洲研究院视觉计算组开发的基于卷积神经网络的计算机视觉系统在ImageNet1000挑战中首次超越了人类进行对象识别分类的能力。这可真是东方不亮,西方亮,人工神经网络作为一个年轻的物种似乎真的在卯足了劲要打败被上帝选中坐了几百万年万物之灵头把交椅的人类。当然这个物种是否真有这个能力,这个问题目前只有哲学家们才知道答案,我们就不参与这种玄学般的讨论了,直接进入主题,看看人工神经网络到底是怎么回事。1感知器1943年,神经生物学家MeCulloch和青年数学家Pitts合作,提出了第一个人工神经元模型,并在此基础上抽象出神经元的数理模型,开创了人工神经网络的研究。以MeCulloch和Pitts提出人工神经元的数理模型(即神经元的阀值加权模型,简称感知器,如图1-7所示)为标志,神经网络拉开了研究的序幕。(出于表述严谨性的考虑,本节会出现若干数学公式,但读者若对公式理解有困难可以跳过具体的公式只看文字,并不会影响最终的阅读效果)图1-7多输出感知器每个神经元的行为都用一个激活函数F来表示,F一般取一个阶跃函数或者一个S型函数(如图1-8所示)。之所以采用阶跃函数来表示神经元电活动,主要是为了模拟神经元电位的静息和发放,当输入小于零时,输出也小于零,即神经元是静息的,当输入大于零,输出便大于零,即神经元开始发放动作电位了,有时也会加一个偏置θ来表示阈值。输出层神经元的输入是对每个输入层X和权重W之间的图1-8一个典型的阶跃函数和S型函数Sigmoid乘积之和,因此它的输出就是Oj=F(i=1n(我们知道一个二维坐标平面会被一条直线0=x1w1+x2w2+θ分成两半,当输入x1w1+x2w2+θ大于零时也就是说点(x1,x2)落在了直线划分出的上半平面,同理输入小于零时即点落在了下半平面,由此通过神经元的发放与否判断出点落在何处,从而最终我们用一个神经元完成了对点(x1,x2)的一种归类划分,当然类似的点(x1,x2,……,xn)就是n维坐标系被相应的n-1维超平面归类划分,用一个含有m个输出神经元的神经网络就完成了对点(x1,x2,……,xn)的m多种归类划分。当然这种划分可能并不是我们需要的划分方式,我们可以不断的调整权重w,使得划分方式是我们需要的。调整权重的方法就是著名的Hebb原则wij(n+1)=wij(n)+α(yj-oj)xi。这公式因为含有了理想输出y所以是一个有师学习(又称有监督学习)的过程,很多时候我们并不知道理想的输出y到底是什么,公式也可以改写为wij(n+1)=wij(n)+αojxi,这时便是无师学习(又称无监督学习)了。如此不断的输入训练样本、调节权重,直到获得我们需要的效果。Hebb原则是由加拿大著名生理心理学家唐纳德•赫布在其1949年出版的《行为的组织》一书中提出的神经心理学理论。赫布认为神经网络的学习过程最终是发生在神经元之间的突触部位,突触的联结强度随着突触前后神经元的活动而变化,变化的量与两个神经元的活性之积成正比(αojxi)。据说这个原则是受一条狗的启发得出的,这条狗就是巴甫洛夫的狗,估计它是史上最著名的狗了,就像薛定谔的猫是史上最著名的猫一样。俄国生理学家巴甫洛夫开始每次喂狗食物时,都会摇铃铛。等到一段时间后他发现只要摇铃铛,它的狗便会流口水,哪怕没有骨头出现。这便是著名的条件反射实验,内在神经学原理便是Hebb原则了,它的存在使得,巴普洛夫无意间加强了铃铛听觉神经元与唾液分泌神经元之间的联系。当然,Hebb原则是可以通过线性代数严格导出的,具体过程见下一节的注释。当人们对神经网络学说如痴如醉时,Minsky和Papert对以感知器为代表的网络系统的功能及局限性从数学上做了深入研究,于1969年出版了轰动一时《感知器》一书,指出简单的线性感知器的功能是有限的,它无法解决线性不可分问题。比如一个异或函数,它有两类四个点,(0,0),(1,1)为一类,(0,1),(1,0)为一类,这四个点在二维平面上无论图1-9直线无法把(0,0),(1,1)归为一类,(0,1),(1,0)归为另一类哪条直线都不能进行正确的归类划分。这个批评性的结论直接导致了神经网络学说进入一个长达10年的低谷期。2三层神经网络其实解决线性不可分问题并不难,只是由于当时集成电路与微电子技术迅猛发展,转移了聪明头脑们的注意力。等到他们回过神来立马发现只要让两层的感知器网络加入一层隐含层成为三层神经网络就可以彻底解决线性不可分问题。wwjkwijθ………………输出变量输入变量输入层隐含层输出层xao图1-10一个典型的Bp神经网络现已证明,如果隐含层的节点可以任意设置,且隐含层用S型激励函数,三层神经网络可以一致逼近任意的连续函数,也可以彻底解决线性不可分问题。具体的证明,专业书籍里自然有,但是我们可以通过合理外推感知器的分类逻辑来理解这一点。感知器之所以不能解决线性不可分问题,是因为每个神经元只能提供一种分类方法,虽然有很多输出神经元同时分类,但是他们的分类效果是独立的不可叠加的,但当再加上一层神经元时,就等于把原先的分类效果叠加后,再一次进行分类。如此便是原先一个二维坐标平面每次都只能由一条直线进行二分,而现在可把多条直线形成的多边形作为分类标准,那么就是再诡异的分类要求也是可以实现的了。当然直线不一定形成封闭的多边形,它们可以沿着坐标横轴一段一段的相连,从而逼近任何目标函数。 对于隐含层使用S型函数,采用误差回传的方式来逐层调节权重[1]的神经网络称为Bp神经网络。Bp神经网络是目前使用最广泛的一种神经网络,它可以逼近任何目标函数,不过它仍有很多不足,例如它容易陷入局部极小化,而不能进入全局最小化;收敛的速度很慢,常常需要迭代数千次甚至更多;最重要的是隐含层神经元的个数选择没有具体的理论指导,基本凭经验或者多次选择比较结果来最终确定。[1]我们简单说下权重调节过程。包括Hebb原则和Bp神经网络的内在调节原则是一致的,都是w(n+1)=w(n)-αdEdw,其中E=12(y-o)2,用文字语言来理解就是误差E和权重w之间有函数关系,在某个权重w处能取得最小误差,通过误差对权重的导数变化关系来指引当前权重的改变,从而使得随机初始化的权重逐步靠近理想的权重。对感知器而言,E=12(y-F(xw))2,代入公式立马可得wij(n+1)=wij(n)+α(yj-oj)xi。对于Bp神经网络由于有隐含层计算起来稍显比较麻烦。我们记中间隐含层的输出为oj=F(wijxi),输出层的输出为ok=F(wjkoj),在随机初始化权重后,这两个值在每一步都是已知的。由于E=12(y-ok另外需要提及的一点是,人工神经网络的隐含层神经元激活函数可以不使用S型函数,这样可以大大的增加人工神经网络多样性,使之有更强大的功能。例如,支持向量机、RBF神经网络。其中RBF神经网络隐含层运用的激活函数是高斯函数,输入层与隐含层的权重调节采用K-均值聚类方法,隐含层与输出层的权重调节采用最小二乘法,它同样可以解决线性不可分问题。3多层神经网络——卷积神经网络CNN 在本小节开篇中提到了三个新闻,其中一个是微软亚洲研究院使用卷积神经网络得到了超过人眼识别能力的计算机视觉识别系统。现在我们来看看这个有着神奇能力的神经网络是到底怎么回事。图1-11识别一个32x32交通限速牌的卷积神经网络 1959年,Hubel和Wiese发现猫的视觉系统是分级的,这种分级可以看成是逐层迭代、抽象的过程:瞳孔接收像素,方向选择细胞抽象出边缘,对边缘进一步抽象得出是什么形状,对形状进一步抽象出是什么物体。换言之,猫视觉系统不断的对接收的信号分类划分抽象出特征,其中高级特征是低级特征的进一步抽象与组合。当然高级特征之间如何互相组合是上一节提到的同步绑定问题,这一部分我们运用卷积网络来模拟从基础视觉景象不断抽象、组合出高级特征的过程。到了下一节符号动力学时,我们会进一步看看低级特征是如何从真实的生物神经元电脉冲中表现出来的,现在我们先看看卷积神经网络。卷积神经网络CNN是一个多层的神经网络,由多个卷积层、子采样层交替组成,而每层由多个独立神经元组成,它的基本框架结构如图1-12所示。其实粗糙点来说,卷积神经网络就一个含有多个隐含层的分类能力更加强大的Bp神经网络。图1-12卷积神经网络CNN的框架结构示意图上图所示的CNN框架由2个卷积层、2个子采样层交替组成。C标识的为卷积层,也称为特征提取层,每个神经元的输入与前一层的局部感受野(receptivefield)相连,并提取该局部的特征,一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来。C层中有多个不同的二维特征图,一个特征图提取的是一种特征,多个特征图表示提取多种不同的特征。在提取特征时,同一个特征图的权值是共享的,即使用相同的卷积核,不同的特征图使用不同的卷积核。C层将不同的局部特征保存下来,使得提取出的特征具有了旋转、平移不变性。如图1-13所示,由于C层的卷积核进行卷积时,是可以重合的,中间结果y中间结果y图1-138X8的输入被5X5卷积核卷积后得到4X4的中间结果即卷积核每次移动时只向右或者向下移动一格,所以一个8X8的输入图像被5X5卷积核卷积后得到了一个(8-5+1)X(8-5+1)=4X4的特征图,同理,图1-11中输入32X32的交通限速牌被5X5卷积核卷积后得到了(32-5+1)X(32-5+1)=28X28的一个特征图。为了充分获得输入图像的特征,会采用不同的卷积核进行多次卷积,而得到多个特征图,如图1-11中进行了4次卷积,使得C1层得到了4个特征图。 一个28X28的特征图含有28X28个神经元,每个神经元的激活函数可取S型激活函数sigmoid,则C1层每个特征图中单个神经元的最终输出为O=sigmoid(y)=sigmoid(wx+θ)。θ为每个神经元的偏置或称激活阈值。 依据以上描述我们可知,图1-11识别交通限速牌的C1层有4X(5X5+1)=104个参数需要学习,C1层和输入层之间总共有(5X5+1)X28X28X4=81536条连接。S标识的层是子采样层,也称为特征映射层,它负责将C层获得的特征进行子采样,使提取的特征具有缩放不变性。它的采样过程不同于C层,它的权重矩阵只有一个变量,如图1-11中S1层使用2X2矩阵对C1层进行采样,但是这个矩阵中4个值是一样的,而且每次移动都不与前一次采样区(感受野)重叠,因此它只是做了简单的缩放平均映射,需要训练的神经元权值相对较少。C1层28X28的特征图经过2X2的缩放采样后,得到了S1层中28X12X28X12=14X14大小的特征图,特征图的张数同于C1层。同时S层的每个神经元也有偏置,它每个神经元的输出就是O=sigmoid(wx+θ因此,S1层中有4X(1+1)=8个参数需要学习,总共有4X(1+1)X14X14=1568条连接。S2层与S1层一样采样方式比较简单,但是C2层虽然和C1层有些类似,但是它们之间又有重大差别。首先经过C1、S1层的卷积、缩放之后,即使C2层的卷积核和C1层一样大,它的单个神经元等效卷积覆盖面也已经远远大于C1层的单个神经元等效卷积覆盖面了,比如图1-11中,C2层采用5X5的卷积核,单个神经元等效覆盖输入层的大小为(5+7)X(5+7)=12X12。具体解释而言,由于C1层的卷积核在输入层上可以重叠移动,那么S1层2X2采样等效C1层纵横各移动一次,于是等效原始图像的(5+1)X(5+1)=6X6大小,而C2层采样S1层5X5个神经元,又因为S1层采样C1层是不能重叠的(等效于无形中又增多了一次纵横移动),故纵横各移动总共1+2+2+2+2=7次,因此等效于原始图像(5+7)X(5+7)=12X12大小。当然,它的每个特征图含有的神经元为(14-5+1)X(14-5+1)=10X10。再次,C2层的单个神经元可以同时使用n个大小相同内部变量不同的卷积核对S1层n个特征图同时采样,比如用3个卷积核对S1层3个相邻特征图采样求和到一个神经元。当然取哪3个是任意的、随机的,比如也可以隔一个取一个。同时C2层特征图的数目可以多设置些,不必和S1层一样多。这样做它可以破坏采样的对称性,不同的组合抽取的自然是不同的特征。剩下的C层、S层就依次类推了。一般而言C层、S层各两层是不够的,比如在一个植物叶片分类的卷积模型中,各只有两层时识别准确率只有40%,当增加到各三层时,准确率可以增加到99.56%而超过其他的分类识别方法[1]。最后在CNN的末层一般会接上一个全连接的RBF神经网络,最终输出层节点的个数就是分类目标个数,训练的方法是先由底层开始逐层的进行无监督学习,当所有层学习完毕后采用误差回传的方法进一步学习。最终目的就是使CNN的输出尽可能与原始的标签相近。到目前为止,我们花费了大量的时间、篇幅终于理顺了人工神经网络的内在逻辑。虽然人工神经网络的内容极其丰富,我们在此不可能面面俱到,比如可以用电路直接模拟的hopfield神经网络、自组织特征映射网络等等我们就没有去分析它,但是在本章神经信息编码的主旨下,有了本节提供的知识点和对人工神经网络内在主要逻辑的了解,我们已经足够去理解人大脑皮层神经网络的初步建模了。4人的大脑新皮层层级神经网络的初步模型[1]龚丁禧、曹长荣.基于卷积神经网络的叶片分类[J].计算机与现代化.2014,4:12-15.如果通过类比人工神经网络来理解大脑,最简单的一个模型就是把大脑皮层的感觉区、联合皮层区、运动区,对应为Bp神经网络的输入层、隐含层和输出层。其中感觉区包括接受来自双耳听觉冲动的颞横回,接受两眼对侧视觉冲动的距状沟上、下方皮质,接受身体对侧的痛、温、触和本体感觉冲动的中央后回(1、2、3区)等等脑区。联合皮层区包括额叶皮层大部,顶、枕和颞叶皮层的一些部分,它是汇集多通道的感觉信息进行决策、规划的脑区。中国有句老话说脑门大的人都比较聪明,其中脑门主要指的是额叶皮层,脑门大即负责决策的皮层区比较大,因此从这么看这句老话还是有一定的道理的。运动区主要包括主管精细协调功能的顶下小叶的缘上回,姿态调节的位于中央前回之前的6区,控制对侧骨骼肌随意运动的中央前回4区。当然把如此多的脑区都简单的归为输入层、隐含层或输出层,显得过于粗糙,只能提供对大脑皮层最基本的理解。图1-14大脑半球皮层的布罗德曼分区示意图(左图为大脑皮层外侧面,右图为内侧面)但是,如果用Bp神经网络模型来理解小脑可能就会稍显贴切。20世纪60年代末,由于对小脑结构和功能的深入研究,人们提出了小脑皮层是一个特殊感知器的设想。小脑皮层有两类输入:攀缘纤维和苔藓纤维,有五种不同细胞:浦肯野细胞,颗粒细胞、篮状细胞、星状细胞和高氏细胞。后三者为抑制性的,起负反馈作用并改善网络性能,而前两者为兴奋性细胞,为信息表示和处理的基础。在实验中观察到苔藓纤维和攀缘纤维所引起的浦肯野细胞的响应,时间上相差10毫秒。而动物做熟练动作时,攀缘纤维发放较小(即此纤维可能为“教师—误差回传”信号)。而去除攀缘纤维后,浦肯野细胞的树突棘消失。这些说攀缘纤维在学习中起了的作用。由此,人们提出,苔藓纤维输入相当于感知层,接受苔藓纤维输入的颗粒细胞层相当于隐含层,而浦肯野细胞作为小脑皮层唯一的输出,当然就相当于输出层了。攀缘纤维是经过下橄榄核中继的大脑皮层信号,就名副其实的成为了误差回传信号。但小脑Bp神经网络不是一个简单的神经网络,输出层有大量的节点(浦肯野细胞在人脑约2X107个),颗粒细胞与高氏细胞组成反馈抑制网络,使得在苔藓纤维中差别不大的模式,在颗粒细胞中有明显的差别,从而提高了神经网络的分辨能力。这么看来类比人工神经网络是理解人脑的一个好办法,那么我们能不能进行一次终极类比,把整个大脑皮层类别成一个多层卷积神经网络呢?早在20世纪30年代LorentedoNo就发现,大脑皮层不但在水平方向分为六层,而且在皮层的整个厚度内,神经元呈垂直链形排列。1956年,Phillips在猫的运动皮层中发现有柱形结构,之后Mountcastle、Hebel和Wiesed以及Merzenich等相继分别在猫的体感皮层、猫与猴的视觉皮层及猫的初级听觉皮层中发现有柱形结构。1980年,Rockel等报道了大规模的实验工作总结。他们调查了鼷鼠、家鼠、猫、猕猴以及人的大脑新皮层17区,3、1、2区,4区,22、7区,9区都有柱状结构。他们计算了直径为0.03mm,贯穿皮层整个厚度的一个柱状空间(相当于微柱)里的神经元数目,发现各种动物脑的体积不一,皮层各个区的厚度也有较大的区别。但是除了灵长类(包括人)的视皮层17区因能接受双侧视网膜投射而微柱内的神经元数为270以外,以上所列举的哺乳动物新皮层各区微柱里的神经元绝对数字都110顶面眼优势柱色小杆321层6(C)5(1)4顶面眼优势柱色小杆321层6(5(4(3(1)2(1)1(C)外膝核朝向柱白质IC至外膝核至上丘至外视区654图1-15初级视皮层里的一个巨柱(数字1~6代表大脑皮层1~6细胞层)左右,变异不超过10%。由此我们可以确信,无论是人大脑新皮层输入端的视听、体感皮层及输出端的运动皮层,还是联合区皮层,它们均有微柱结构。一般的测算,整个人大脑新皮层约有6X108个微柱。实验还证明,很多微柱同时对一种功能作出响应,相互联结形成更大一级的单位。Mountcastkn在1975年将这个更大一级的单位命名为巨柱。经测算,巨柱的直径为0.5~1mm,高为1.5~4.5mm。在了解到以上信息后,有学者就提出了由神经元局部回路第一层第二层第三层第四层第五层功能性质功能中枢联接群功能中枢巨柱微柱局部回路单元功能中枢巨柱微柱局部回路神经元单元数量1×102102~1041×10210左右3~10输入单元位于视觉、听觉、感觉皮层的功能中枢不分不分不分颗粒细胞隐藏单元联合区的功能中枢不分不分不分martinotti细胞

Cajal水平细胞等输出单元位于运动皮质

的功能中枢不分不分不分锥体细胞拓扑结构从箱出层到输入层

有反馈的阶层式相互结合式等

(没有明显的层次)相互结合式等

(没有明显的层次)相互结合式等

(没有明显的层次)辐散式、聚合式

链锁式、环式等工作范围整个大脑新皮层102~104mm30.5~1mm直径

1.5~4.5mm高0.03mm直径

1.5~4.5mm高约0.001mm3皮层内总数1861~2×104约6×108约6×109表1-1大脑皮层层级神经网络的基本内容微柱巨柱功能中枢功能中枢连接群(大脑皮层)逐级有规则的组织成一个层级神经网络,具体细节如上页表1-1所示[1]。这个模型为我们提供了一幅关于大脑的全局图,但同时也抹去了大脑信息处理极其丰富的内在细节。第五节人工神经网络与认知心理学的交媾广义的认知心理学是指以认知过程为主要研究对象的各种心理学流派和理论。狭义的认知心理学仅指自20世纪以后产生的信息加工认知心理学,又称为现代认知心理学。现代认知心理学把人的认知和计算机进行功能模拟用信息加工的观点看待人的认知过程,认为人的认知过程是一个主观的寻找信息、接受信息并在一定的信息结构中进行加工的过程。现代认知心理学自产生以来发展迅速,无论在理论探讨还是在研究方法上都有较大突破,并积累了丰富的实验资料,成了取代行为主义而为现代心理学界的一种最主要思潮。认知心理学恢复了被行为主义抛弃了的对人的认知等高级心理过程的研究,实现了对心理学研究对象的否定之否定,是心理学发展的一种历史进步。在现代认知心理学中主要有两种理论范式:符号加工主义、联结主义。它们的研究对象是一致的,都是人类的感知觉、注意、记忆、表象、思维和语言等。只是它们在解释这些心理过程所隐喻类比的对象不同。符号加工主义认为心理过程像电子计算机,心理过程是符号序列的串行加工,是按照数理逻辑的计算方式一步一步的完成认知过程的。比如他们认为语义是写在图灵机的带子上或者储存在冯若依曼[1]郑永昌、叶中行,人大脑新皮层层级神经网络模型研究[J].高技术通讯.1996,9:24-26机的地址存储中,可以用一张命题网络来解释句子的含义。在这个命题网络中每个节点代表一个词汇,而每个词汇之间或者相连或者不相连,来代表上下文语义。联结主义认为心理过程是人脑带来的,是分布表征和网络化平行加工的,人们利用网络化、可训练的神经系统来认识周围的世界,了解自己所经历的事件,以及处理信息和储存记忆。有些学者认为不能把联结主义理论看作是认知理论,因为联结主义没有提供说明认知基本方面所需要的那种表征即思维和语言的系统性。他们认为由于符号加工理论可以提供语言运用和思维的心理学,且模型中具有形式主义所需要的精确表征,而运用这些表征的加工对其结构又很敏感,正是心理表征的构成结构和对运用表征的过程结构的敏感性提供了心理系统性的基础,由于联结主义表征不具有构成结构,因而心智就不能是一种联结主义网络,既然如此,联结主义在认知过程的解释中就没有任何作用。如此,对认知的解释就必须运用符号加工系统的语言。还有的学者认为认知并非是简单统一的,对于一些进化的行为如逻辑推理和算法,心智模拟的是传统的冯一诺依曼结构,但对于一些其它形式的心理现象,心智模拟的则是联结主义结构。如直觉处理器处理的是不需要有意地运用规则的行为,如知觉、技巧性运动和单词理解,这些行为是典型的快速行为,一旦启动就很难停止并较少受到其它任务的影响,对这类行为的解释,就必须运用联结主义理论。但是,对于那些包括意识规则运用的行为,如推理和高水平语言操作则必须运用传统的符号加工理论来解释。但在笔者看来,联结主义或者说人工神经网络可以模拟人脑认知活动主义与符号加工主义本质上是可以统一的,只要我们发展人工神经网络使其也具有一定的符号加工能力便可做到两个主义的合一,同时也非常符合我们对人脑高级认知活动是从神经元活动的网络性、系统性中涌现出来的理解。我们先介绍由黄秉宪先生在《脑的高级功能与神经网络》中提出的两个认知活动的神经网络模型,来为联结主义助威,而后再来看看如何发展人工神经网络的能力来完成两个主义的合一。第一个认知活动模型是关于短时记忆的。短时记忆有存储时间短、存储容量有限,以及可以用适当组块提高其信息存储容量等特点。现有的短时记忆脑机制研究表明在大脑前后部多个脑区参与短时记忆的过程,而实际上,组块是利用原已学的的长期记忆的信息的结果。因此将长时记忆与短时记忆过程联系起来,将多个脑区联系起来,是使短时记忆模型具有接近实际人脑的性能的必要步骤。由此黄秉宪先生提出了一个指针式的短时记忆神经网络模型,这个模型中的神经元环路不储存信息内容,而是存储备用信息的指针,信息内容存储在与长时记忆所共有的信息表达区。表达神经元的兴奋表示其信息内容,同一指针可在不同时间指向不同的表达区。存储信息内容的指针的网络,由多个长度有限的神经元环路组成。由于有多个环路,因而可以使容量极大的共有记忆表达区(大脑皮层后部联合区)的全体都能与其中一个环路建立突触联系,而各个指针环路间有相互抑制存在,故在短时任务激发下,仅少数环路可以兴奋,并成为当前记忆信息内容的指针。信息内容的表达区由容量极大的多级联想记忆神经网络组成。其中神经元兴奋模式表示一个事件被感知,即信息输入到脑内或者被取出。当短时记忆任务出现时,被记忆的信息内容在表达区中以神经元兴奋模式的形式出现。与此同时,指针神经元环路中的神经元群被依次兴奋,从而与表达区中的兴奋神经元建立短时的突触联系。指针环路神经元的兴奋模式与信息内容无直接联系,信息内容完全由表达区兴奋模式决定。iiiVWUYZXKjiiiVWUYZXKj图1-16短时记忆模型(X为指针网络,Y、Z分别为基本、高级事件表达区)图1-16为短时记忆的模型示意图,其中权重V是长时记忆的故而是由经验先行确定的,短时记忆发生时,W、U按Hebb学习率快速增加然后逐渐衰减,从而建立起指针环路与表达区间的神经元的暂时联系。黄先生利用此网络模拟区分象棋高手和一般棋手的复盘能力,得到了很好的结果。第二个认知活动模型是关于海马区参与长时记忆形成的模型。海马是大脑半球内侧的一个神经结构,由于其外形与海洋生物海马相似而得名。人类对海马记忆功能的认识,关键资料是来自对海马损伤病人的观察和测试。其中最著名的是对HM的观察。HM从1942年开始患癫痫病,1953年做切除内侧颞叶(包括海马及其周围结构)手术。术后病情缓解但出现了严重而持久的遗忘症状。他的智商正常,保留短时记忆能力,若不有意复述则很快忘记。术后对事件的记忆很差,对1942年-1953年间的时间有不同程度的遗忘,即有逆行性遗忘症,但对早期的记忆却保存完好。他还能学的新的认知技巧:如从镜中阅读,但又宣称从未学过,这些现象说明人类多种类型记忆的分离;海马及其周围结构主要对长期记忆有影响,但不是长时记忆存储的脑区,而是事件长时记忆的巩固过程不可缺少的机构,尤其是情境记忆的巩固,如有的海马损伤者对过往学习到的知识保存的很好,但却经常不能找到放学回家的路。更深入的研究指明,大脑皮层各区域储存各种特殊记忆,这些区域与旁海马区由双向联系,对于比较简单的相互关系的记忆可知旁海马皮层中完成。而在海马主要完成对事件与其上下文(如事件发生的时间、地点)间的整合,以及灵活的组织存储信息。旁海马提供2/3的进入海马的纤维。海马可能记忆又分化又交叉型式的信息(如有能分别记住人物、地点和时间;又能将几方面结合成具体的事件)。并将特定的情节及其相关上下文信息编码为语义知识,而将这些具体记忆插入到记忆结构中,并提供整个知识结构的入口。神经解剖学告诉我们海马与大脑皮层许多区域有双向联系,各种不同信息可以汇聚到海马结构,因此我们的模型中不仅包含大脑皮层而且将它划分为若干区域。由此可以反映不同信息在海马的综合。同时海马内部有不同的结构来实现不同的功能,其中最主要的是CA3和CA1两个结构,由于CA3有大量的反馈联系,可以假定它是一个联想记忆网络,而联想记忆也是海马综合不同来源信息所需的,但CA1无反馈联系,且CA3到CA1的发散联系,是CA1可能将CA3综合结果形成各事件的单一表示。海马记忆功能的神经网络模型如图1-17所示,图1-17海马记忆功能的神经网络模型其中A、B、C三个神经网络组成两级联想记忆模型,其中A、B中兴奋模式表示不同的感觉事件,而C为高级结构,其中兴奋模式表示事件的全体。外部的信息经感觉系统的预处理后进入大脑皮层A、B区,然后到达CA3区,CA3区为联想记忆神经网络,将事件的各个组分联接起来,并保留各组分的特殊表示。而CA1为竞争网络仅对应一个兴奋模式,它代表事件的整体。CA1输出到大脑皮层病中C中出现新的兴奋模式,它是整个事件在皮层中的表示。依据神经解剖学事实,模型中海马内突触有长时程增强效应,它的出图能按Hebb律快速的增加,随后缓慢降低,而大脑皮层内突触虽也按Hebb律增加,但是学校速度比较慢,只有多次与海马作用才能建立巩固的联系。由于海马神经元数目为数百万的级别,而大脑皮层的任一区域都有几亿的级别,而海马又能与大脑皮层的所有兴奋模式建立联系,因而要求海马中每一个神经元都在不同时刻与大脑皮层的不同神经元兴奋模式中神经元相联系,使海马中的兴奋模式在某一时刻与某一事件的皮层相联系,而另一时刻可以和另一事件的皮层联系,因此,在A、B区与CA3区神经元间应有相互竞争和某些随机因素存在。对这个模型进行仿真,可以较好实现长时记忆的巩固,以及模拟海马损伤病人的遗忘模式。由以上两个模型我们可以看到联结主义解释认知心理学的强大能力绝不是符号加工理论所能比拟的,如果我们能证明人工神经网络也拥有符号加工理论中符号序列的串行处理能力,那么符号加工理论所盘踞的人类高级推理过程就也可以被人工神经网络所模拟,由此符号加工理论对认知心理学而言就可以进入历史博物馆了。在人工神经网络的研究中有从神经网络提取规则以及对专家系统与神经网络结合进行知识求精等研究,这些告诉了我们神经网络有能力把符号序列表达的知识、推理转化为神经网络表达的内部事宜。当然这种结果的出现在我们看来是水到渠成、理所应当的,毕竟人脑能进行符号操作,能且只能来源于神经网络的某种能力。1988年Gallant简述了连接结构的专家系统;此后,Yoon和Peterson以及Li和Wee开发了几个应用实例;1989年Dietz、Kiech和Ali又创建了喷气和火箭发动机诊断神经网络专家系统。1990年Benachenhou、Cader、Szu、Medsher、Wittwer和Garling等指出,神经网络和专家系统的集成方法是有前途的。自此以后神经网络和专家系统不断地结合,并在越来越多的符号加工领域获得新成果。符号加工本质上就是用或、与、非、蕴含(if—then)、等价、优先、至少/最多/恰好等基本逻辑构成推理过程。而每一个基本的逻辑推理都可以表示成某种神经网络,如图1-18所示。图1-18基本逻辑单元实现示例(左图实现“或”,右图实现“与”)把实现基本逻辑的各种单元组合起来也可以实现复杂的逻辑过程,如图1-19所示,实现了如果A与B为真,则X为真;如果A与C为真,则Y为真;如果B与E为真,则Z为真;如果A与D与E为真,则X为真;EDCBRULES:IFAandBTHENXIFAandCTHENYIFBandETHENZIFAandDandETHENXAZYXEDCBRULES:IFAandBTHENXIFAandCTHENYIFBandETHENZIFAandDandETHENXAZYX图1-19一个实现了较为复杂逻辑推理的神经网络案例再例如东华大学硕士学位论文《符号系统与神经网络相结合的知识求精技术研究》报道了使用KRSNN方法依据贷款人的工作情况、消费情况、婚姻状况、账户余额、还款年限、申请年龄等条件判断是否同意贷款审批的一个神经网络,在合理的分类精度下,该神经网络使得判断规则数量减少为原来的1.1%。因此,认知心理学的两个主义本质上是可以合一的,但这并不代表认知心理学的工作只要是不断的建神经网络模型模拟已发现的人类高级认知活动的规律就万事大吉了,因为认知心理学正面临着一次悄然的革命,现在的认知心理学还需要再出发,再出发去发现承载神经网络的大脑、肉身,本身亦是客观世界的一部分是如何被自己的大脑神经网络所认识的。20世纪70年代,第二代认知心理学开始起源,随后与盛行于80年代的具身主义运动同步发展。70年代后期,西方思想界对传统的哲学观、信息加工理论和生成语法提出了一系列不同的观点,其基本思路是质疑认知主义,批判各种形式的客观主义,诸如二元论、先验论、形式主义、符号主义等,转而强调研究认知、心智及语言与身体经验的关系。认知科学中的各个学科都开始了向身体(包括脑)及其经验的回归。1977年出版的《认知科学》和1979年召开的第一次认知科学年会是其发展史上的重大标志性事件。这一具身主义运动在哲学上集中反映在拉考夫在其1987年出版提出的新经验主义的思想中,拉考夫以后又将这一新经验主义在他与约翰森合写的名著中表述为一种新的哲学体系,即所谓具身哲学或称体验哲学。第二代认知科学的核心特征便是心智的具身主义。心智的具身主义意指:心智有赖于身体之生理的、神经的结构和活动形式。如果说“活动”实际上是主、客体的相互作用,那么,也可以把心智理解为深植于人的身体结构及身体与世界、环境的相互作用之中。对相互作用的的重视就必然引发对主体经验的重视。用西伦的话说,即“认知是具身的,就是说认知源于身体与世界的相互作用。依此观点,认识依赖于主体的各种经验,这些经验出自具有特殊的知觉和运动能力的身体,而这些能力不可分离地连在一起,共同形成一个记忆、情绪、语言和生命的其他方面在其中编织在一起的机体”。瓦雷拉等人认为,具身认知有两点含义:其一与西伦的观点类似,认知依赖于主体的经验种类,而这些经验乃出自于具有各种感觉运动能力的身体;其二,这些感觉运动能力根植于或嵌入于一个更广泛的、生物的、心理的和文化的情境之中。因此,人的心智不是某种离身的智慧,偶然而恰巧地发生在人的身上于是才有了所谓人的心智,它是温软的肉身而不是冰冷机器。人的心智不应是第一代认知心理学所描述的那样,对自己的大脑、肉身视而不见、弃之如敝履,建立起漂浮在虚空之中的、无所依附的特征提取、理智推理,而是需要把大脑及其肉身也作为客体的一部分。由此,一个大脑不仅要认识外界客体同时也要认知自身这个客体,从而来完成外界与自身的评估,最终形成一个外界与自身不断相互作用、不断协调的动力系统。符合具身认识理念的研究有很多,其中自我概念心理表征的文化神经科学研究,算是研究中比较经典的。这方面研究揭示西方文化观促使产生的“独立型自我”与东亚文化对基本社会联结的重视更易产生的“互依型自我”在自我概念表征的神经机制方面可以存在明显的不同,而能被脑成像研究发现。由于西方文化与东亚文化下的社会环境存在很大的不同,一个重要问题是成长于不同文化环境的个体,其自我面孔的加工机制是否也有所不同。根据Markus和Kitayama(1991)的理论,西方文化重视自我认同,所产生的独立型自我倾向于更多将注意投向自己而非他人。而东亚文化强调基本的社会联结,所产生的互依型自我通常会对重要他人的信息更为敏感,并且对他们倾注的注意与对自己同样多。根据这种观点,可以预期自我面孔识别的机制在西方与东亚文化间会有所不同。具体而言,西方文化下的独立型自我会对自己的面孔分配更多的社会显著性或更强的正性联结,这导致他们在自我面孔与他人面孔同时呈现时,更容易注意到自己的面孔,并对自我面孔有更深层次的加工。相比之下,由于东亚文化中的互依型自我更强调与他人之间关系的重要性,他们对自我面孔加工的关注程度可能不及西方文化中的个体,因而行为上表现较弱的自我面孔优势效应。此假设在近期的一项跨文化事件相关电位(ERP)研究中得到了验证。Sui等人(2009)采用相同的实验刺激和范式记录了不同文化组被试进行自我面孔加工时的行为和脑电反应。实验中向英国被试与中国被试呈现自我与朋友的面孔,并要求他们判断面孔朝向。尽管两组被试对自我面孔的反应时均短于他人面孔,这种自我面孔加工优势在英国被试中表现得更为显著。此外,两组被试反应时上的差异与脑电活动的组间差异呈正相关。英国被试判断自我面孔时在大脑额、中央区引发的负波N2,其幅度要大于判断熟悉面孔时引发的N2幅度。而中国被试则表现出相反的模式,相比于判断自我面孔,他们在判断朋友面孔时引发的前部N2成分幅度更大。由于前部N2与面孔加工深度相关,并有利于个体化过程(Kubota&Ito,2007),这种文化特异的N2活动说明,相对于中国被试,英国被试对自我相关信息倾注了更多的注意。因此,独立型自我构念可能会使得自我面孔相对于他人面孔的社会显著性增强,这导致了西方被试在行为表现与神经机制上均表现出自我-他人之间的分离。而东亚文化促生的互依型自我构念则演化出不同的认知神经机制,对熟悉的他人面孔赋予了比自我面孔更多的社会显著性。这些研究的结果充分证明了神经网络承载着自身与外界协调的重大职责,它可以让自己是独立型的也可以是互依赖型的,并且还会因此对外界与自身产生不同类型的表征。换言之,神经网络不是呆板的修改突触来刻画外界,而是带着一副由它自己创造的有色眼镜来观察、解释这个世界。最后,有的学者认为第一代认知科学是认知可计算主义的,这是在现代高科技包装下的古典毕达哥拉斯主义的复活,第二代认知科学必须抛弃可计算主义,并举出认知计算复杂度过高(可能大于用整个地球资源来构建目前最良好的电子计算机的计算能力)和拓扑视觉(拓扑不变性作为物体的高级几何特征却比物体的低级特征先行得到处理)来作为支持的证据。但笔者认为,作为理解宇宙运行的物理学都是符号演绎的,那么人脑的运行是不可能摆脱以符号演绎为内核的计算主义的,否则我们只能回到神秘主义了。本书将于第二章尝试构建一个具身主义的动力系统来完成心理学某种程度的统一,并以此作为计算主义成立的支持依据。第六节符号动力学的神经编码机制及其应用上一节我们提到人工神经网络需要再出发,来回答具身主义的问题,去构建一个神经网络自身与外界不断相互作用的动力系统,这可以看作是人工神经网络描述高级功能方面的再出发。但其实人工神经网络在底层方面也需要再出发,因为目前的人工神经网络的建模都直接输入数值或其他被赋予了意义的输入,而人脑的输入只有一串串的真实生物神经元发出的神经脉冲,没有任何给定的数值、模式或者意义,如何从乍看上去凌乱不堪的神经脉冲中学习出数值、特征、符号、感觉、意义,甚至完成意识涌现,是一个需要再一次从零开始思考的问题。1神经信息编码的有关问题Eric总结了一百年有关神经科学的发展概况[1],在结尾处提到:物理学家和化学家常谈起现代生物学还是处在非理性阶段,可是Eric认为这一日子不会太长了,他所指的“这一日子不会太长了”是指分子神经生物学的出现。确实,神经递质、离子通道等的生物化学过程分析已经有了很明确的结果,但是它还是不能解决神经信息的问题。神经元中某些分子成分产生变化,确实会影响到整个神经系统的工作。这正像电视机中某些电阻变质会影响图像质量一样,但是电阻的化学成分与图像还是两个层次上的概念、是两回事。因此,即使分子神经生物学发展得很完整,神经信息学还只能是处在描述性阶段。Gilles在Science上著文,文章开始也有这样一段话:研究神经编码需要回答如下问题:信号携带者的形式是什么?为什么是这一形式?虽然这样明显而浅近的问题,在这里却变得十分困难和出现各种偏见。在现有的文献中有的认为神经脉冲平均频率代表信息或称为频率编码,有[1]童勤业等,嗅觉神经系统脉冲编码的机理研究[J].中国科学E辑信息科学.2006,36(4):449~466。该文受“九七三”重大基础预研项目资助。的人认为神经脉冲各种分布函数代表信号,也有人认为单个神经元脉冲不能代表信号,于是提出了一簇神经元发放脉冲的综合波形代表信息的神经团理论或称为群体编码。究竟哪一种理论更正确呢?有学者认为,神经编码是一串串不规则的神经脉冲序列本身,但是,要确定它是否真是神经信息编码还要回答以下几个问题:1)神经脉冲序列的集合中能否找到一个子集与外界输入信号建立起对应关系。人的神经系统所能接受到的信息都是通过感觉器官,感觉器官所感受到的信息要在神经系统中反映,神经系统中神经脉冲序列就要有与外界输入信号建立起对应关系,至少在神经脉冲序列集合中存在一个子集与外界输入信号建立起对应关系。2)神经脉冲序列空间是一个有序空间。如果我们把所有在神经系统中可能出现的神经脉冲序列集合起来构成一个“神经脉冲序列空间”,那么这一空间是有序空间吗?因为所有的感觉器官所感受的刺激(如声、光、气味等)信号都有一最基本的特性就是“有序性”,声音有大小、远近之分,光有明暗之分,气味有浓淡之分。如果要把外界信息与神经脉冲序列空间建立起对应关系,那么神经脉冲序列空间也必须具有这一特征─可排序性。至少其中有一个子空间是有序的。3)神经脉冲序列空间内具有变换或运算的性质吗?神经系统中存在信息处理,这是被人们广泛接受的事实,信息处理的实质就是变换或运算。现在就要问这一空间具有什么样的特性?神经脉冲序列空间能构成什么样的体系呢?在这空间中能进行什么样的变换?编码空间内的变换规则是什么?尽管像EEG之类信号包含有信息,但是EEG所构成的空间至少到目前为止不能成为神经编码空间,因为在EEG空间中到目前为止还没有发现具有这一特性。这也是衡量神经脉冲序列是否能成为真正编码

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论