




已阅读5页,还剩60页未读, 继续免费阅读
(电路与系统专业论文)基于2dmesh拓扑结构的noc设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着系统规模的不断扩大、系统复杂度的不断提高、i p 核数量的不断增长, 集成电路设计面临更多的难题。n o c 片上网络的出现适应了集成电路产业的发 展。n o c 设计中最重要问题的是如何提高系统性能并减小系统功耗。为得到更 高吞吐量、更低延时、更低系统功耗的n o c 系统,对n o c 片上网络的的拓扑结 构、路由算法、通讯节点结构、资源节点结构进行详细分析。设计了一个基于4 4 二维网格拓扑结构,采用o e 路由算法,通讯节点输入端口虚拟通道f i f 0 b u f f e r 深度为6 ,并植入一个4 7 1 3 1f f a n n 的正反馈人工神经网络的n o c 片上网络。仿真表明,该新系统确实在少量增加系统功耗的前提下大幅提升了系 统系能。 论文作者主要进行和完成了如下工作: 阐述了两种路由算法x y 路由算法和o e 路由算法的工作原理。在同一个二 维网格拓扑结构n o c 片上网络中对两种路由算法的性能进行了比较,证明在该 架构中o e 路由算法能够为系统提供更高的吞吐量和更小的系统延时; 探索了一个3 4 二维网格拓扑结构通讯节点输入端口虚拟通道f i f 0 b u f f e r 深度取值对系统性能的影响,结果表明当f i f 0b u f f e r 为6 时系统具有 最大的吞吐量和最小的延时,且不浪费系统硬件资源; 描述了植入人工神经网络a n n 的n o c 片上网络的系统架构,表明植入硬件 应用的n o c 系统在吞吐量和延时方面具有更优良的表现。 论文在以上工作的基础上设计了一个新的n o c 片上网络,通过n i r g a m 对 其性能进行测试,获取的数据真实有效。测试结果证实了作者提出的构想,达到 了期望的优化目的,具有可行性,值得更深一步的研究。 关键词:x y 路由算法;o e 路由算法;虚拟通道b u f f e r 深度;人工神经网络; 摘要 a b s t r a c t w i t ht h ec o n t i n u o u se x p a n s i o no ft h es y s t e ms i z e ,t h ec o n t i n u o u si m p r o v e m e n t o ft h es y s t e mc o m p l e x i t ya n dt h eg r o w i n gn u m b e ro fi pc o r e ,i n t e g r a t e dc i r c u i td e s i g n i sf a c i n gm o r ep r o b l e m s n o c ( n e t w o r k - o n - c h i p ) a p p e a r st oa d a p tt ot h ed e v e l o p m e n t o ft h ei ci n d u s t r y t h em o s ti m p o r t a n tp r o b l e mo fn o cd e s i g ni sh o wt oi m p r o v e s y s t e mp e r f o r m a n c ea n dr e d u c es y s t e mp o w e rc o n s u m p t i o n i no r d e rt og e th i g h e r t h r o u g h p u t ,l o w e rd e l a ya n dl o w e rs y s t e mp o w e rc o n s u m p t i o no ft h en o cs y s t e m ,a d e t a i l e da n a l y s i so ft h en o ct o p o l o g y , r o u t i n g a l g o r i t h m ,t h e s t r u c t u r e so f c o m m u n i c a t i o nn o d e sa n dr e s o u r c en o d e sh a sb e e nd o n e an o c i m p l a n t e do fa 4 7 13 1 f f a n n ,b a s e do n4 x 42 d m e s ht o p o l o g ya n do ea l g o r i t h m ,w h o s e c o m m u n i c a t i o nn o d e s v i r t u a lc h a n n e lf i f ob u f f e rd e p t ho fi n p u tp o r ti s16h a sb e e n d e s i g n e d s i m u l a t i o nr e s u l t ss h o wt h a tt h en e ws y s t e md r a m a t i c a l l yi m p r o v e st h e s y s t e mw i t has m a l li n c r e a s ei ns y s t e mp o w e rc o n s u m p t i o n t h em a i nw o r k s c o m p l e t e db yt h ea u t h o r o ft h ep a p e ri n c l u d e : 1 t h ew o r k i n gp r i n c i p l e so ft w or o u t i n ga l g o r i t h m - x yr o u t i n ga l g o r i t h ma n do e r o u t i n ga l g o r i t h ma led e s c r i b e d t h ep e r f o r m a n c eo ft h et w or o u t i n ga l g o r i t h m si s c o m p a r e di nas a m en o cs t r u c t u r eb a s e do n2 d m e s ht o p o l o g y r e s u l t ss h o wt h a tt h e o ea l g o r i t h mp r o v i d e sh i g h e rt h r o u g h p u ta n ds m a l l e rs y s t e md e l a yi nt h ea r c h i t e c t u r e f o rt h es y s t e m 2 t h ep e r f o r m a n c eo ft h ef i f ob u f f e rd e p t hi nc o m m u n i c a t i o nn o d e s v i r t u a lc h a n n e l i nan o cs y s t e mb a s e do n4 x 42 d m e s ht o p o l o g yh a sb e e ne x p l o r e d r e s u l t ss h o w t h a tt h es y s t e mg e t st h em a x i m u mt h r o u g h p u ta n dm i n i m u md e l a yw i t h o u tw a s t eo f s y s t e mh a r d w a r ew h e nt h ef i f ob u f f e rd e p t hi s6 3 t h es y s t e ma r c h i t e c t u r eo fan o ci m p l a n t e da r t i f i c i a ln e u r a ln e t w o r ki sd e s c r i b e d r e s u l t ss h o wt h a tt h en o cs y s t e m i m p l a n t e dh a r d w a r ea p p l i c a t i o n s h a sb e t t e r p e r f o r m a n c ei nt h r o u g h p u ta n dl a t e n c y o nt h eb a s i so ft h ea b o v ew o r k ,an e wn o cs y s t e mh a sb e e np r o p o s e d t h e 摘要 s y s t e mw a st e s t e db yn i r g a me m u l a t o ra n dt h ea c c e s s e dd a t ai sr e l i a b l ea n d e f f e c t i v e t e s tr e s u l t sc o n f i r m e dt h ei d e ap r o p o s e db yt h ea u t h o r , a n da c h i e v e dt h e d e s i r e do p t i m i z a t i o np u r p o s e s i ti sf e a s i b l ea n dd e s e r v e sf u r t h e rr e s e a r c h k e y w o r d s :x yr o u t i n ga l g o r i t h m ;o er o u t i n ga l g o r i t h m ;v i r t u a lc h a n n e lb u f f e rd e p t h ; a r t i f i c i a ln e u r a ln e t w o r k ; 捅图清单 插图清单 集成电路的发展2 集成电路2 数字集成电路发展趋势一7 集成电路的设计方法8 图2 1 六种n o c 片上网络拓扑结构1 l 图2 2 典型的带有虚拟通道的交换开关的结构1 4 图2 3 带虚拟通道的交换开关1 4 图2 4 资源网络接口与lp 核的连接1 5 图2 5n o c 网络的通信协议1 6 图3 1 片上网络n o c 的协议栈结构1 9 图3 2 三行三列的二维网格拓扑结构2 0 图3 3 基于x y 路由算法的n o c 的系统延时2 6 图3 4 基于x y 路由算法的n o c 的系统吞吐量2 6 图3 5o e 路由算法的n o c 的系统延时2 7 图3 6o e 路由算法的n o c 的系统吞吐量2 7 图3 7 四行四列的二维网格结构3 0 图3 8 通信节点的内部结构3 0 图3 9b u f f e rd e p t h 与延时数据a v e r a g ei a t e n c yp e rf i t 关系图3 4 图3 10b u f f e rd e p t h 与吞吐量数据a v e r a g et h r o u g h p u tf o re a c hc h a n n ei 关系3 5 图3 1 1 神经元的结构示意图3 7 图3 1 22 虚拟通道的4 级管道路由器3 9 图3 1 3 四级管道路由方式3 9 图3 1 4 头数据片的内部结构4 0 图3 1 5 植入了f f a n n 的n o c 片上网络结构4 1 6 l 2 3 4 卜 卜 卜 卜 图 图 图 图 捅幽清单 图3 16 五种n o c 片上网络系统数据4 3 图4 1 二维网格拓扑结构的n o c 片上网络结构4 7 图4 2 基于x y 路由算法每片平均延时4 8 图4 3 基于x y 路由算法每数据包的平均延时4 8 图4 4 基于x y 路由算法的每信道的平均吞吐量4 9 图4 5 改进后的的n o c 片上网络的每片平均延时5 2 图4 6 改进后的的n o c 片上网络的每数据包的平均延时5 2 图4 7 改进后的的n o c 片上网络的每信道的平均吞1 止量5 3 7 表格清甲 表格清单 表3 1o e 路由算法的n o c 的性能比较2 8 表3 20 e 路由算法系统性能进行测试结果3 2 表3 3 五种n o c 片上网络系统每信道每卫片平均延时4 3 表3 4 基于c p s 和c p s p w 的对比4 4 表3 5 基于通讯负载的对比4 5 表4 一l 基于x y 路由算法仿真数据4 9 表4 2 改进后的的n o c 片上网络测试结果5 3 第一章绪论 1 1 课题研究背景 第一章绪论 1 1 1 集成电路的发展 从1 9 4 7 年,微电子技术的第一个里程碑贝尔实验室肖特莱等人发明了 晶体管开始,直到2 0 0 9 年领先世界的3 2 n m 工艺的英特尔酷睿i 系列的出现,集 成电路( i n t e r g r a t e dc i r c u i t ) 经过了几十年的发展和更新,技术越来越先进,工艺越来越精细,应用越来 越广泛,对人们的日常生活影响越来越深远,在国防技术、科学研究、工业制造 等各个领域种的作用越来越突出,已然成为对人类历史的发展过程中最具促进意 义的学科之一。 集成电路是为了完成一定电路功能而专门设计的微型结构,它可以是一种微 型电子器件,也可以是一种电子器件的部件。为了实现我们所需的这种微型结构, 在一定的工艺下,我们将电路中所需要的元件如晶体管、电阻、二极管、电感、 电容等按一定的要求被连接在一起( 布局布线) ,然后集成在一个或几个半导体 品片上进行封装( b g ab a l lg r i r da r r a y ) ,最终得到由所有元件组成的一个整体。 集成电路的发展历史漫长而曲折( 如图1 一1 ) :1 9 7 4 年总部位于美国新泽西 州的贝尔实验室发明了晶体管,这是集成电路历史上的一个伟大里程碑。次年, 结晶晶体管发明;再次年,场效应晶体管诞生。1 9 5 8 年,德州仪器和仙童公司 分别发明了集成电路,开创了微电子技术的历史。1 9 6 2 年,美国r c a 公司提出 了m o s 场效应晶体管,而如今绝大多数集成电路芯片采用的c m o s 工艺在1 9 6 3 年被f m w a n l a s s 和c t s a h 首次提出。1 9 6 4 年,著名的摩尔定律问世,它是由 英特尔公司的摩尔提出的,准确的预测了晶体管的集成度会在十八个月增加一 倍。1 9 6 6 年第一个c m o s 集成电路由美国r c a 公司研制成功,而在1 9 7 1 年英 特尔公司提出全球第一个微处理器4 0 0 4 ,随后,在1 9 7 9 年基于微处理器8 0 8 8 的第一台个人电脑( p c ) 被英特尔推出。8 0 年代,不同规格的动态存储器( d r a m ) 和静念存储器( s r a m ) 先后问世、9 0 年代,集成电路的芯片工艺技术不断发展, 逐渐由1 9 m 到0 8 p m 一直到o 1 8 9 m 。经过新世纪十来年的不断研究发展,如今 基于2 d m e s h 拓扑结构的n o c 设计 的英特尔酷睿i 系列已经采用了最先进的3 2 n d - n 技术,而更进一步的2 2 r l r n 也指 同可待【1 】步无以至千里,集成电路的发展是一段光辉的历程,它吸收容纳了几代 集成电路人的心血。 t r a n s i s t o s 图卜1 集成电路的发展 集成电路( 如图l 一2 ) 的特点在于体积小、容量大、效率高、性能好、低功 耗、更新发展速度快。根据结构功能的不同,集成电路一般分为三类:模拟集成 电路、数字集成电路和数模混合集成电路【2 】。模拟集成电路使用模拟信号( 以波 的形式出现,随振幅变化的) 来控制、处理、发送信息,相应的数字集成电路使 用数字信号( 如以二进制0 、l 代表信号) 控制、处理、发送信息。 图卜2 集成电路 2 0 0 篁 第一章绪论 1 1 2 集成电路的s o c 和n o c 时代 1 1 2 1s o c 是集成电路的发展趋势 s o c ( s y s t e mo nc h i p ) 耳j j 片上系统,s o c 的出现是集成电路发展的必然【3 】。集 成电路设计中,芯片利用率无疑是一项重要的指标,s o c 技术将一些必要的外围 电路和存储器与中央处理器( c p u ) 集成到一个芯片上,形成一个更为完整的系 统。相对于传统的集成电路芯片,s o c 芯片采用片上总线结构,它具有更大的利 用率、更低的耗电量、更高的速度、更多的系统功能,节省了体积,减少了成本。 如今的s o c 发展日益完善,拥有了高效的集成性为资本,s o c 代管传统的集成 芯片是必然的趋势。 如上所述,s o c 片上系统设计的关键是将尽可能多的必要的电子组件集成到 一个芯片上,它以嵌入式结构为基本结构,采用的技术包括i p ( i n t e l l e c t u a l p r o p e r t y ) 复用技术、低功耗技术、片上总线架构技术、验证技术、软件硬件协 同技术等。其中,i p 复用技术是整个s o c 设计的核心技术【4 】。将一个计算机系 统是现在一个芯片上的s o c 片上系统一般包括与硬件部分和软件部分。硬件部 分包括一些常用的计算机的几基本部件,如随机存储器、只读存储器、输入输出 接口等;软件部分指一些操作系统和应用软件。 s o c 技术最早出现于二十世纪九十年代的中期,最早的s o c 设计出现在1 9 9 4 年由m o t o r o l a 公布用于制作基于p o w e r p c 及6 8 0 0 0 定制微处理器的 f l e x c o r e 系统和1 9 9 5 年美商巨积公司为索尼公司设计的s o c l 5 j 。进入二十一 世纪后,片上系统s o c 成为了i c 产业发展的焦点,集成电路的发展已经向着 s o c 的时代不断前进。 1 1 2 2n o c 是s o c 的发展趋势 随着s o c 片上系统在集成电路各个领域的深入应用,s o c 芯片的规模越来 越大( 远远大于a s i c 芯片) ,s o c 芯片的复杂度也越来越高。m p s o c ( 多核s o c ) 的出现,要求一个s o c 片上系统中包含多个i p 核。基于深亚微米技术工艺带来 了生产工艺上的困难,规模越来越大、复杂度越来越高、生产周期越来越长、成 3 基于2 d m e s h 拓扑结构的n o ( 7 设计 本也越来越高。根据权威预测2 0 1 5 年左右,半导体芯片的特征尺度将达到2 5 9 m , 同时时钟频率将超过1 0 g h z 。在这种新形势下,传统的s o c 片上系统设计将遇 到一系列困难和问题,主要包括如下几个方面: ( 1 ) 单一时钟同步问题。传统的s o c 片上系统采用单总线架构【6 】。总线结构 要求s o c 片上系统采用全局同步模式。但是基于工艺特征尺寸不断缩小的要求, 工作频率迅速上升,达至l j l 0 g h z 以后,互连线延时造成的影响将严重到无法设计 全局时钟树【7 】。另一方面,庞大的时钟网络将占据芯片的大部分功耗,现有的低 功耗技术无法完美的解决这一问题。 ( 2 ) 可扩展性问题。随着多核s o c 片上系统i p 核的增多,数据业务处理量 也成倍增加,有限的地址资源将会成为扩大电路规模的瓶颈。单总线的s o c 片上 系统效率很低,难以支持一对以上的节点同时进行通信。层次化总线虽然可以在 一定程度上缓解这个问题,但随着片上i p 核的数目进一步增多( 比如达到上百 个) ,依然无法很好解决。 基于多核s o c 片上系统设计的片上网络n o c 系统是一种新型的通信架构,是 s o c 片上系统不断发展的必然结果。片上网络n o c 根据片上系统原有的单总线结 构,将计算机网络中的技术结合到芯片设计中,提出了全新的网络拓补结构;并 且采用全局异步、局部同步的工作模式,采用包交换技术和分层的网络协议,很 好的解决了片上系统s o c 设计中的不足和缺陷。 一个片上网络n o c 系统包括资源节点、网络节点( 通讯节点) 和通讯通道的 部分。类似于一个片上系统s o c 的各个部件被联系在一个网络中,使用类似于计 算机网络的通信机制进行信息传输。资源节点一般由多核s o c 的一个i p 核构成, 网络节点和通讯通道负责信息的传输,包括交叉开关、仲裁器、输入缓冲器等结 构。 片上网络n o c 解决了片上系统的单一时钟问题和可扩展性问题。它具有自身 的优点:片上网络使用的包交换模式( 即分组交换) 可同时发送、降低阻塞,能 够得到更高的链路利用率和带宽;采用分层协议使得信息的传输稳定性更高;信 息的传输采用点对点模式,功耗更低。 4 第章绪论 1 2 课题研究依据 近些年来,市场上数码领域消费品的需求与同俱增,而p c 市场同益趋于成 熟,硅技术产品市场f 由p c 时代迈向后p c 时代。在此推动下,通信电子类产 品需求迅速增长。权威数据显示,半导体产品市场的下一轮增长将由数码消费品 来引导,而数码消费品的最大特征在于更新换代频繁。如今,便携式产品已深入 消费群,m p 4 、m p 5 、i p a d 等游戏、网络产品对多媒体并行运算技术的要求越来 越高,英特尔的酷睿系列开启了双核处理器应用的先河;相应的,传统的电子产 品采用的单核处理技术已不能满足需求。根据权威预测,未来几年,数字产品的 晶片数目将增长达几亿个,而芯片时钟频率也将达1 0 h z 之多,片上延时会越来 越高,芯片模块越来越大,各模块之间影响越来越深,有效地连接处理器、输入 输出端口、存储阵列,采用并行处理模式减少延时将成为关键为题。 2 0 0 0 年左右,多核s o c 的研究就已经启动,二十一世纪集成电路界更是进 入了s o c 时代。电子技术、半导体技术以及计算机技术三个学科的交叉应用在 集成电路设计中占据主导地位。随着时代的进步,计算机技术将在集成电路设计 中显得愈发重要。s o c 可重构多核技术适应了硅产品新时代规模越来越大而技术 越来越精细且成本较低、更新迅速的要求, 另一方面,片上系统s o c 的设计与应用也面临着新的难题。随着芯片规模 的进一步增大,传统的s o c 片上系统结构也出现适应性问题。尤其是多核系统 的广泛应用,使得系统的功耗和成本不断增加,单总线结构串行结构的s o c 片 上系统成本低、实现较简单,但也难以支撑1 0 亿晶片数级别的大规模系统的运 行。其可扩展性差、带宽低的缺点亦不能满足更新迅速的电子市场的要求。采用 分组交换技术、网络拓补结构、全局异步局部同步的通信机制的片上网络n o c 能够很好地完成新的任务。 片上网络具有它本身的独特性质。首先,片上网络分为资源模块与通信模块, 计算与通信分开,使全局、局部模块在不同时间域下工作,避免使用单一的全局 通信机制;其次,可采用不同的拓补结构满足不同的需求,并且保证的良好的可 扩展性;再次,拓补结构、b u f f e r 深度等参数可由用户自行定制;最后,终端数 可变、支持多时钟频率的应用且支持系统测试。 片上网络n o c 的结构类似于计算机网络 s 】,其通信机制也于计算机网络相 幕于2 d - m e s h 拓扑结构的n o c 设计 似。但传统的计算机网络技术并不完全适用于片上的n o c 系统。因为片上网络 需要更成熟的技术应对资源开销、模块分布、容错、低功耗等问题。这币是本文 研究的意义和目的。 1 3 集成电路演变规律及设计方法学 集成电路是为了完成一定电路功能而专门设计的微型结构,它可以是一种微 型电子器件,也可以是一种电子器件的部件。为了实现我们所需的这种微型结构, 在一定的工艺下,我们将电路中所需要的元件如晶体管、电阻、二极管、电感、 电容等按一定的要求被连接在一起( 布局布线) ,然后集成在一个或几个半导体 晶片上进行封装( b g a b a l lg r i r da r r a y ) ,最终得到由所有元件组成的一个整体。 1 - 3 1 集成电路的演变规律 通信时代的技术发展史上有三个重要定律:光子定律指出光传输数据每九个 月增长一倍;麦特卡夫定律表明通信网络的价值与网络中的设备数目的平方成j 下 比;而摩尔定律指明了微电子集成电路技术的发展趋势。 上世纪五、六十年代半导体工艺制造业突飞猛进的发展,1 9 6 5 年戈登摩 尔提出了闻名世界的摩尔定律。戈登摩尔是大名鼎鼎的英特尔公司的创始人之 一,1 9 6 5 年担任仙毫半导体公司研发实验室主任。此时,他在电子学杂志 上发表的让集成电路填满更多的元件一文中提出,在1 9 7 5 年一块四分之一 平方英寸的面积上的单块硅芯片上,将有可能集成多达6 5 0 0 0 个的集成电路元 件。在1 9 7 5 年,这一大胆预测果然得到证实。随后,摩尔定律经过不断地演变 和发展,得到三种科学的解释:第一,集成电路芯片上集成的元件数每隔十八个 月将会增长一倍;第二,微控制器性能每隔十八个月翻一番,且价格降低一半【9 】; 第三,平均每一美元所购买的个人计算机的性能,每隔十八个月将会增长两倍。 回顾近几十年半导体芯片制造业的发展历程,摩尔定律的语言准确无误,它对集 成电路工业的发展有着深远的意义。 如图l - 3 为数字集成电路2 0 年的发展趋势。数字集成电路从开始的传统 a s i c 集成电路n - 十世纪的单核片上系统s o c 微处理器再到如今的多核片上系 统s o c 微处理器,规模与日俱增,性能不断完善,对集成电路设计技术的要求 也不断提高。 6 第一章绪论 ;as l ce r a :s o ce r a :- _ - _ _ _ _ - _ - _ _ _ _ 。卜! _ - _ _ _ _ _ - _ - _ - _ _ _ - - _ _ _ _ - _ - _ - - _ _ _ _ _ _ _ _ - _ _ - - - _ _ _ _ - _ - _ - _ l _ _ - _ _ - _ _ _ _ _ _ _ _ - _ _ _ - 。 9 8 5 1 9 9 5 鍪! 至2 兰兰! 窒 , 图1 3 数字集成电路发展趋势 集成电路技术的发展一般经历五个阶段:一上升期、二巅峰期、三低谷期、 四爬坡期、五平台期【l o 】。新的技术出现在上升期并迅速发展,到巅峰期达到顶峰; 此后,技术理论的成熟导致可研究的领域变小,学界对该项技术的研究进入低谷 期,关注度下降;然而随着该技术在电子产业中的应用不断推广,其生产应用技 术得以发展,进入爬坡期;最终,实际生产应用技术与理论研究达到相同的成熟 度,便达到平台期,说明该技术已经能满足科技发展的需求。当前,片上系统 s o c 技术已进入平台期,而片上网络n o c 技术j 刚刚达到理论发展阶段,即上 升期。因此,我们有理由相信片上网络技术拥有光明的未来,我们应该把握这一 机遇,多做研究,多出成果。 1 3 2 集成电路设计方法学 在集成电路的没计中,硬件设计和软件设计同样重要。随着深亚微米集成电 路技术的不断成熟,现有的集成电路设计技术不论是从规模上还是质量上都面临 着新的要求。 7 甚于2 d m e s h 拓扑结构的n o c 设计 u p c o r e s r a m r o m 3 i o 、h g i n t o - u p c o r e + j s r 戈m m a i m c r e a m ,a r 、参 妒鬟 d a t a c a c h r o m 。 k 强。; ,4 乎虾o l m p e g 。 4 - ,鳓 l o g i c , , l o g i c , 戮 l o g i c , 蓼s o 许p 鲴溺g 泐i 扣! 。彳谚箍勃鬻爿黝囊g 溺 a s i co nd s m c o m p u t e ra s i cw i 也af e wi p 弦p l u ga n dp l a ys y s t e mo nac h i p , t i m i n g d r i v e n 蹴磁峨b l o c k - b a s e d d e s i g n _ :雾黟剪影d e s i g n 、。” _ ”m “:x p i a t f o r m - b a s e d d e s i g 珏 图 - 4 集成电路的设计方法 如图1 4 ,集成电路的设计方法学主要包括三种:传统的a s i c 集成电路采 用时序驱动设计法、单个或i p 核较少的集成电路采用的基于模块的设计方法和 大规模的多核集成电路采用的基于平台的设计方法。 时序驱动t d d 设计法主要工作是版图规划和互联线延迟模型,其目的是使 心- i - l - - 门1 面积最小化。随着l p 产业的发展,多核芯片的出现促使基于模块的设计法 得以应用,i p 复用技术得以引进,同时这种设计方法的出现使得i p 核在集成电 路设计中的地位更加重要,i p 技术称为了主流技术。基于平台的设计方法是为 了适应现今大规模多核体系的集成电路设计而诞生的。所谓的“平台 包括硬件 平台和软件平台,两者组合构成了系统平台。如图所示,硬件平台包括静态存储 器s r a m 、随机存储器r o m 、输入输出接口等硬件部分,而软件平台即阴影部 分的r t o s 部分,也就是实时系统。 1 4 论文结构 本文第一章介绍了论文的研究背景和研究依据,简述了集成电路的演变规律 和设计方法学。第二章阐述了n o c 有关的基础知识,介绍了n o c 片上网络的拓 扑结构、交换机制、i p 核内部结构和n o c 片上网络的通信协议。第三章对一种 第一章绪论 基于2 d m e s h 结构的n o c 进行了深入研究,以期获得较高的系统吞吐量、较低 的系统延时和功耗。第一节对一个二维网络拓扑结构n o c 的路由算法进行了分 析,第二节对通讯节点输入端口的f i f ob u f f e r 深度取值进行了分析,第三节介 绍了植入人工神经网络的n o c 片上网络。基于第三章的研究分析,第四章提出 了一个新的n o c 片上网络,并对其性能进行仿真分析。结果表明,该n o c 片上 网络较于传统的片上网络具有更高的系统吞吐量更低的系统延时和功耗。第五章 对本文做出了总结和展望。 9 培于2 d m e s h 拓扑结构的n o c 设计 第二章n o c 基础知识 2 1n o c 与s o c 的关系 片上系统s o c 的设计方法将在未来几年发生革命性的变化。最近的研究资 料里,出现了由大规模数量的嵌入式处理器组成的s o c 系统。这些多处理器s o c , 即m p s o c ( m u l t i p r o c e s s o rs o c ) 的一个关键的组成部分就是互连的拓扑结构。 这样的s o c 片上系统意味着执行不同功能、运行在不同时钟频率的l p 核的无缝 集成。这种将多个组件集成到单一系统的设计方法给设计人员带来了新的挑战。 为了使s o c 的设计方法能得到广泛使用,拥有多种功能的i p 模块的系统集成是 至关重要的。 未来片上系统s o c 设计的主要问题之一是不可扩展的单总线结构的延时。 单一总线控制整个芯片的信号,但是随着技术的发展,这些总线不具有良好的可 扩展性。虽然随着技术发展门延时不断减小,总线延时确通常成倍的增加。即使 在系统中使插入中继器,也会总线延时也会线性增加,通常会增加一个时钟周期 甚至多个时钟周期。在超神亚微米技术中,至少百分之八十关键路径的延时是由 互连造成的。事实上,如今许多大规模集成电路的设计采用f i f o 缓冲器以同步 长距离传输数据来解决这一问题。因此,系统设计的网络和分布式计算首先必需 与通讯结构设计相结合,然后将功能模块集成到通信网络。 最常用的片上互连架构是共享仲裁总线的架构,所有的通信设备共享相同的 传输介质。共享总线结构的优点是拓扑结构简单,面积成本低,可扩展性好。然 而,对于一个相当长的线路,内在的寄生电阻和电容是相当高的。此外,每一个 连接到总线上的i p 模块增加了寄生电容,反过来又增加了传输延时。随着总线 长度的增加和i p 模块的增加,总线的位传输延时可能增长为任意大,最终将超 过设定的最大时钟周期。实际中,可连接到总线的i p 模块数的限制限制了总线 的可扩展性。这种情况下的解决方案之一是将总线分成多个段,并引入分层架构。 然而,这只是特定情况的临时解决方法,具有基于总线结构固有的局限性。由于 所有连接到总线上的设备必须共享总线带宽,包含了数十或数百个i p 模块、基 于总线互连组成的s o c 架构将面临严重的瓶颈问题。 我们认为片上网络n o c 是一种具有高性能并行计算系统的互连架构。以网 络架构为中心的设计方法中,i p 模块之问的通信可以以数据包传输的形式进行。 1 0 第二章n o c 皋础知识 所有片上网络n o c 架构的共同特点是,i p 功能模块之间在智能交换机的支 持下互相联系。因此,交换机可以被视为为i p 模块提供强大的数据传输介质功 能的基础设备。片上网络n o c 的提出解决了片上系统s o c 存在的可扩展性问题 和单一时钟问题。首先,片上网络n o c 采用各种功能结构的拓扑结构代替传统 的单总线结构,具有良好的空间可扩展性。理论上,只需增加i p 模块的数量和 路由器就可以将拓扑结构无限扩展。其次,片上网络n o c 采用全局异步局部同 步的通信机制,解决了传统单总线结构的单一时钟同步问题。拓扑结构中的每个 节点( 包括资源节点和通信节点) 与其他节点的通讯工作处于全局异步模式,单 个节点内部的数据处理和交换处于局部同步模式。 2 2n o c 网络的拓扑结构 接下来我们简单介绍近些年提出的不同的拓扑结构。所谓n o c 网络的拓扑 结构指的是n o c 片上网络中各资源节点之间的互连方式。n o c 片上网络是n o c 体系结构中非常重要的组成部分。它通常决定了n o c 片上网络采用的路由方式、 仲裁方法以及i p 模块的分布。n o c 片上网络常用的拓扑结构有网格( m e s h ) 结 构、环绕( t o r o u s ) 结构、胖树结构、蜂窝结构、八边形结构等。图2 1 为六种 被提出的n o c 片上网络拓扑结构。 ,二。 一,- i :? i i ;。 “| “i : 口 口 口; b 二一一 l 1i ! d 甘商西i 口:| 口d 才肃商f 口西e j口口口。口。 ( b )( c ) : 口 r h7 下 l q ,。 卜 口 一j i 弋 l , u i 屠 嗣 f :t - 。i蜩 夕一i 、一l1noc片上网络拓扑结构 甚于2 d m e s h 拓扑结构的n o c 设计 2 2 1 胖树结构 如图2 1 ( a ) ,g u e r r i e r 和g r e i n e r 为片上分组交换互连提出了一种通用互连模 板,采用一个胖树结构进行i p 模块的互连,称为s p i n ( s c a l a b l e ,p r o g r a m m a b l e ,i n t e g r a t e dn e t w o r k ) 结构。该结构中,每一级有四个母 节点,每个母与下一级的四个子节点相连。每个叶节点即一个i p 功能模块,每 个根节点即一个交换器,一共包括1 6 个i p 功能模块。如图2 1 ( 0 ,p a r t h ap r a t i m p a n d e 等人提出了一种蝴蝶型胖树结构b f t ( b u t t e r f l yf a t t r e e ) ,该结构的第一 级只有两个根节点与第二级的四个子节点相连。i p 功能模块依然在叶节点,交 换器依然在根节点,但是每一级的交换器数目更少。 2 2 2 网格结构 如图2 1 ( b ) ,k u m a r 等人提出了一种二维网格( 2 d m e s h ) 拓扑结构c l i c h i ! ( c h i p - l e v e li n t e g r a t i o no f c o m m u n i c a t i n gh e t e r o g e n e o u se l e m e n t s ) 。二维网格结 构是一种最简单、最直观的拓扑结构。该结构是一个m 行n 列的网络结构,网 络中每一个节点包含一个交换器和i p 模块。图中的c l i c h e 结构包含十六个节 点,每一个节点山通讯节点和资源节点组成。每一个通讯节点与相邻的四个通讯 节点和一个资源节点相连,其核心部件是交叉开关s w i t c h 。资源节点包括一个i p 核。整个网络中交叉开关的个数与i p 核的个数相等。 z 2 - 3 环状结构 环状结构( t o r o u s ) 可以看做是对二维网格结构的一种拓展。如图2 1 ( c ) , d a l l y 和t o w l e s 等人提出了一种二维坏状结构。二维二维环状结构也是基于二维 网格结构的,不同的是每个边缘节点都与另一端的一个边缘节点相连,组成了一 个环状的结构。每一个通讯节点与其他的四个通讯节点和一个资源节点相连。整 个网络中交叉开关的个数也与i p 核的个数相等。但是,网络中连接边缘节点的 长连线会增大系统延时。为了解决这一问题,折叠环状结构被提出,如图2 1 ( d ) 。 根据进一步的研究,这种折叠环状结构更加适合v l s i 的实现。 1 2 第二章n o c 慕础知识 2 2 4 八边形结构 如图2 1 ( e ) ,k a r i m 等人提出了一种多核s o c 的八边形拓扑结构。该结构包 括八个路由节点和1 2 个双向的通信连线。每个节点有一个处理元件和一个交换 器。在八边形拓扑结构中,每一对节点问的通信最多只需要两次路径转换,即最 多只路由经过一个其他的节点。八边形拓扑结构可扩展至多维空间。但是,这种 结构可能会导致布线复杂度的增大。 2 3n o c 网络的交换机制 交换技术决定了n o c 网络内部的的交换器与输入模块和输出模块如何相 连、何时相连,以及信息元件在路由路径中的传输时问。对于所有的n o c 网络 架构,交换机制主要由三种:电路交换技术、分组交换技术和虫孔交换技术。 分组交换技术中,待传输的数据被分为固定的长度,称为包。当源节点中数 据包需要传送时,由源节点决定包的传输,而不是先确定路由路径再发送数据。 为了在交换器中存储所有的数据包信息,传统的分组交换对缓冲器的要求很高。 s o c 的设计环境要求交换器不能像i p 模块那样消耗大量的硅芯片面积。 虫孔交换机制中,数据包被分成固定长度的流量控制单元卫片( f l i t ) 。输入 模块和输出模块只存储少量的卫片。因此,虫孔交换机制中缓冲器对空间的需求 比分组交换技术小。所以,使用虫孔交换技术,交换器更小且更紧凑。路由信息 存储在第一个卫片,即头卫片中。交换器中头卫片的解码确定路由路径,随后的 卫片简单的沿着路径以流水线的方式传输。传送来的每个数据包中的数据片只需 沿着之前的数据片由输出信道转发,并且到达目的节点后不需进行数据包重组。 如果卫片进入一个繁忙的信道,随后的卫片需在当前位置等待。这种简单的虫孔 交换机制的一个缺点是在物理信道中不同信息的传输不可以交错或重合。在前一 条信息通过信道之前,该信道不可以被另一条信息使用。如果某数据包中的卫片 在缓冲器中出现死锁现象,信道的利用率就会降低。为了提高信道利用率,我们 在输入端口和输出端口引入虚拟通道。如果某数据包中的卫片在虚拟通道中出现 死锁现象,备用数据包的卫片可以使用其他虚拟通道的缓冲器和物理信道。图 2 2 为一个典型的带有虚拟通道的交换开关的结构。 皋十2 d m e s h 拓扑结构的n o c 设计 i n p u tb u t i e 噶o u p u tb u f f e r s r o u t i n g a n d a r b i t r a t i o n 图2 2 典型的带有虚拟通道的交换开关的结构 2 4n o c 网络的i p 核结构 n o c 网络的i p 核的关键部分是交换开关,交换开关为i p 模块提供了可靠的 数据传输功能。 2 4 1 交换开关 一个典型的带虚拟通道的交换开关如图2 3 所示。 图2 3 带虚拟通道的交换开关 交换开关包括输入输出缓冲器、输入输出仲裁器、输入输出多路复用器 m u x 、分离器d e m u x 和一个路由模块。为了得到连续高效的吞吐量,植入一 个虚拟通道,使得交换开关的每个端口都拥有多个并行的缓冲器。先入先出缓冲 器f i f ob u f f e r 是交换开关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临床医学新上岗试题题库及答案2025年版
- 2025年CCAA服务认证基础考试试题(答案+解析)
- 中草药种植及加工产业发展报告
- 建筑项目安全管理月度总结
- 船舶航行路线规定
- 学校门卫制度实施方案
- 中医养生大秘籍
- 微波炉使用技巧总结
- 供应商管理与合作伙伴关系培养
- 创新网络营销手法总结
- 卫生洁具采购与安装投标方案(技术标)
- 华为HCIE-CloudServiceSolutionsArchitect云服务练习试题附答案(一)
- 消防维保方案(消防维保服务)(技术标)
- 画法几何及工程制图完整课件
- 部编版语文七年级上册第一单元类文阅读理解题(含解析)
- 篮球比赛8队淘汰赛-对阵表
- 2023年江西美术出版社七、八、九年级美术基础知识测试试卷+参考答案
- 2023学年完整公开课版法兰克王国
- 2输变电工程施工质量验收统一表式(变电工程土建专业)
- 整理黑龙江基准地价与标定地价早
- 牙及牙槽外科牙拔除术
评论
0/150
提交评论