




已阅读5页,还剩67页未读, 继续免费阅读
(微电子学与固体电子学专业论文)noc路由器和低功耗通信网络设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 幽i lrlrllt l j i i l i j i i j l l 1 l l f i l i j f l l l r lrlllflllu r u i y 2 0 6 6 8 17 楠季 随着多处理器芯片( c m p s :c h i pm u l t i - p r o c e s s o r s ) 的出现,传统基于总线的 s o c ( s y s t e m - o n - e h i p ) 已越来越不能满足系统对通信带宽和可扩展性的需求,片上 网络( n 0 c :n e t w o r k - o n - c h i p ) 良好的可扩展性和并行通行能力为未来c m p s 的发展 提供了一种更加有效的互连架构,作为构成通信网络的核心组件,路由器直接影 响着n o c 的性能。 本文在论述n o c 关键技术的基础上,设计了一种虚通道路由器,该路由器基 于2 d m e s h 拓扑结构,采用g a l s 时钟策略、x y 维序路由算法、虫孔流控机制 和基于信用值的低层流控技术。本文详细介绍了路由器的各个组成模块,包括输 入缓存、输入控制器、路由计算、虚通道分配、开关分配、信用值分配、交叉开 关等,每个路由器包括5 个双向端口,每个端口包括4 个虚通道。通过功能仿真 验证了所设计的路由器能够正确工作,通过综合生成了路由器的门级网表j 并得 到了路由器及其组成模块的面积和功耗参数。 互连架构占芯片整体功耗的比重越来越大,因此降低通信网络的功耗显得至 关重要,本文介绍了与通信网络相关的低功耗技术,通过低摆幅技术、串行化编 码和低功耗f i f o 实现了通信网络的低功耗设计。在输入方波信号的情况下,低 摆幅互连与插入中继器的单端全摆幅互连相比功耗下降了3 1 6 9 ,带门控时钟的 低功耗f i f o 和不带门控时钟的f i f o 相比,面积增加了6 1 ,而功耗减小了2 5 7 。 关键词:片上网络路由器虚通道低功耗 a b s t r a c t l - 一一 a b s t r a c t w i t ht h ea d v e n to fc h i pm u l t i - p r o c e s s o r s ( c m p s ) ,t r a d i t i o n a ls o c b a s e do nb u s h a sb e c o m ei n c r e a s i n g l yu n a b l et om e e tt h ed e m a n do fs y s t e m s ,s u c ha sc o m m u n l c a - t i o nb a n d w i d t ha n ds c a l a b i l i t y , e t c n e t w o r k - o n - c h i p ( n o c ) i sa na p p e a l i n g a l t e r n a t i v e f o rc o m m u n i c a t i o ni ns o c sw i t hc a p a b i l i t yo fp r o v i d i n gh i g ht h r o u g h p u t ,l o wl a t e n c y a n ds c a l a b i l i t y t h ep e r f o r m a n c eo fn o c sd e p e n d sh e a v i l y o nt h eo n - c h i p c o m m u n i c a t i o nf a b r i cw h o s ec o r ec o m p o n e n ti sr o u t e r 。 b a s e do nt h ed i s c u s s i o no ft h ek e yt e c h n o l o g i e so fn o c s ,av i r t u a lc h a n n e l r o u t e r i sd e s i g n e d t h er o u t e ri sb a s e do n2 d m e s ht o p o l o g y ,u s i n gt h eg a l s c l o c ks t r a t e g y , x yd i m e n s i o no r d e rr o u t i n ga l g o r i t h m ,t h ew o r m h o l ef l o wc o n t r o lm e c h a n i s ma n d l o w l e v e lf l o wc o n t r o lb a s e do nc r e d i t t h i sp a p e ri n t r o d u c e st h er o u t e rm o d u l e si nd e t a i l , i n c l u d i n gt h ei n p u tc h a n n e l ,t h ei n p u tc o n t r o l l e r , t h er o u t i n gc o m p u t a t i o n ,t h ev i r t u a l c h a n n e la l l o c a t o r , t h es w i t c ha l l o c a t o r ,t h ec r e d i ta l l o c a t o r , s w i t c h ,e t c t h i sr o u t e r c o m p r i s e s5b i d i r e c t i o n a lp o r t s ,e a c hp o r tc o m p r i s e s4v i r t u a lc h a n n e l s t h ea d o p t i o n o fv i r t u a lc h a n n e l si m p r o v e st h ep e r f o r m a n c eo ft h eo n c h i pc o m m u n i c a t i o nf a b r i c ,1 1 1 er m c t i o ns i m u l a t i o nv e r i f i e st h ec o r r e c t n e s so ft h er o u t e r ,g a t e l e v e ln e t l i s ti s g e n e r a t e db ys y n t h e s i s t h ep o w e ro ft h ec o m m u n i c a t i o nn e t w o r kb e c o m e sam a j o rc o n c e r ni n t h e r i ) 1 】t e r 南a s e dn o c s ,i ti sc r i t i c a lt h a tt h en e t w o r kp r o v i d e sl o wp o w e rc o m m u n i c a t i o n s t h a ts c a l et oh i g hc o r ec o u n t s t h el o wp o w e rt e c h n o l o g i e sr e l a t e dt or o u t e r a n d c o n u l l u n i c a t i o nn e t w o r ka r ed i c c u s s e d , a n dt h e nl o w - s w i n gs i g n a l i n g ,s e r i a le n c o d i n g a n dl o wp o w e rf i f oa r eu s e dt or e d u c et h ep o w e rc o n s u m p t i o n o ft h en e t w o r k o nm e i n p u to fs q u a r ew a v es i g n a l ,c o m p a r e dw i t hf u l l s w i n gi n t e r c o n n e c t i o n w i t hr e p e a t e r s i n s e r t e d ,t h ep o w e rc o n s u m p t i o no fl o w - s w i n gi n t e r c o n n e c t i o nd e c r e a s e sb y3 1 6 9 c o m p a r e dw i t hf i f ow i t l l o u tg a t e dc l o c k , t h ea r e ao fl o wp o w e rf i f ow i t hg a t e d c l o c ki n c r e a s e sb y6 1 ,b u tt h ep o w e rc o n s u m p t i o ni sr e d u c e db y2 5 7 k e y w o r d s :n e t w o r k - o n - c h i pr o u t e r v i r t u a l - c h a n n e ll o w - p o w e r 第一章绪论 ; 第一章绪论 随着微电子工艺水平的不断进步,工艺尺寸在不断缩小,表1 1 是i t r s ( i n t e m - a t i o n a lt e c h n o l o g yr o a d m a pf o rs e m i c o n d u c t o r s ) 2 0 0 9 年报告【l 】预测的工艺尺寸的 变化趋势,例如,m p u 金属层l 的半间i t 三( h a l f - p i t c h ) 至02 0 2 0 年将达到1 1 9 n m , 到2 0 2 4 年更是达到7 5 n m 。工艺尺寸的不断缩小使单片上可集成的晶体管数目不 断增加。 表1 12 0 0 9i t r s 预测的半导体工艺尺寸趋势 年份 2 0 l o2 0 1 22 0 1 42 0 1 62 0 1 82 0 2 02 0 2 22 0 2 4 f l a s h 半间距( 衄) 3 22 52 01 5 91 2 61 086 3 d r a m 半间距 4 53 62 82 2 51 7 91 4 21 1 38 9 御u a s i cm 1 半间距4 53 22 41 8 91 51 1 99 57 5 m p u 物理栅长2 7 2 2 1 81 5 31 2 81 0 78 97 4 a s i c 物理栅长 2 92 41 81 5 31 2 81 0 78 97 4 据i t r s2 0 0 9 预测,消费类便携式产品用s o c ( s o c c p :s o cc o n s u m e r p o r t a b l e ) 的主处理器的个数在2 0 0 8 年为1 4 个,2 0 1l 、2 0 1 4 、2 0 1 7 、2 0 2 0 、2 0 2 3 将分别达到2 - 6 、4 - 8 、6 - 1 0 、8 1 2 、1 0 1 4 个。 ,j 2 s 8 9 9 - t ? ,t 。 尹1 2 7 9 ”。一一 耐,” ppp p 梦梦pp 梦审p 梦p 图i is o c 设计复杂度随年份的变化 假设单个处理单元p e ( p r o c e s s i n ge n g i n e ) 的电路复杂度不变,则单个s o c 中 包含的p e 个数将迅速增加,如图1 1 所示,到2 0 2 0 年,p e 的个数将达到1 2 7 9 个。随着p e 个数的增加,总的逻辑和存储单元尺寸将不断增加,到2 0 2 0 年单片 s o c 中总的逻辑电路的尺寸将是2 0 0 9 年的1 5 倍。 2n o c 路由器和低功耗通信网络设计 因此,随着工艺尺寸的缩小和芯片规模的不断扩大,单个芯片上将集成越来 越多的晶体管,如何组织和充分利用这些计算资源,成为我们不得不面对的问题。 现有的基于总线的设计方法学,越来越不能满足未来s o c 系统对通信带宽和可扩 展性的需求。要克服这个问题,新的设计方法学的提出和运用成为必然,在这种 情况下,n o c ( n e t w o r k - o n - c h i p ) 的概念被提出,它不同于传统的基于总线的s o c 设计,而是借鉴了计算机网络的概念,通过通信网络实现p e 之间的并行通信, 从而大大提高了通信效率。n o c 是最有希望,也许是唯一一种能够满足未来复杂 s o c 设计需求的片上架构1 2 】。 n o c 集成了大量的计算资源、存储资源和连接这些资源的通信网络【3 】,计算 资源包括处理器、d s p 、可重构逻辑、专用硬件、存储器阵列、i o 接口等,通信 网络用来实现计算和存储资源之间的高速并行通信。 1 1 1s o c 的局限性 1 1n o c 研究背景 目前,s o c 中处理单元( p e :p r o c e s s i n ge n g i n e ) 之间的通信基于总线,但是, 对于多处理器芯片( c m p s :c h i pm u l t i p r o c e s s o r s ) ,在性能、可扩展性和功耗上,总 线就成为了瓶颈1 2 i 。基于总线的s o c 的缺点主要包括:不断增加的互连延时和时 钟树功耗、较小的互连带宽、较差的可扩展性等。 1 ) 互连延时 随着集成电路工艺水平的进步,特征尺寸不断缩小,导线的延时已超越门延 时,成为延时的主要部分,s o c 中总线等长互连线的延时更是达到了若干个时钟 周期,因此时序分析和优化将变得越来越困难。 2 ) 时钟网络 在目前的s o c 设计中,时钟树消耗了相当大一部分的功耗,一般约占整个芯 片功耗的2 5 到3 0 。随着数字系统的规模变得越来越大,在整个芯片上分布一 个偏斜在一定范围内的同步时钟将变得越来越困难。n o c 中可以采用全局异步局 部同步( g a l s :g l o b a l l ya s y n c h r o n o u sl o c a l l ys y n c h r o n o u s ) 、准同步等时钟分布方 案,能够有效解决以上问题。 3 ) 通信带宽 传统的s o c 基于总线结构,在某一时间段内,只能有一对i p ( i n t c l l e c t u a l p r o p e r t y ) 使用总线通信,而其它的口只有取得了总线使用权,才能与其它p e 交 换数据。因此,通信带宽有限,效率不高,限制了s o c 的性能。 4 ) 可扩展性 第一章绪论 3 基于总线的s o c 设计,为了保持较高的互连性能,往往对i p 的个数有限制, 如a m b a 2 0a h b 协议规定主设备( m a s t e r ) 的个数不超过1 6 个。而随着s o c 规模 的不断扩大,单片上所集成的m 个数不断增加,因此,需要新的设计方法学以提 高s o c 设计的可扩展性。 1 1 2n o c 的优势 b l o c 克服了传统的基于总线结构的s o c 的主要缺点,它将互连网络的概念引 入到s o c 设计中,大大提高了系统的通信效率和带宽,并通过结构化的架构克服 了传统s o c 中的互连延时和时钟树问题,随着系统复杂性的不断增加,n o c 有望 取代传统的s o c 设计,成为s o c 设计方法学的主流。 图1 为一个基于2 d m e s h 结构的n o c ,包括处理单元( p e ) 、路由器( r o u t e r ) 、 网络接口( n i :n e t w o r ki n t e r f a c e ) 和互连。p e 是系统的计算单元,路由器完成数据 从源节点到目的节点的传输,它和互连一起组成n o c 的通信网络,n i 完成路由 器和p e 间的数据通信,包括对p e 产生的数据打包和对传输到p e 的数据解包。 路由器和与它相连的n i 合称为通信节点。 图1 2 基于2 d - m e s h 结构的n o c 架构 1 ) 全局异步局部同步 近年来提出了多种适合于n o c 的时钟方案,如g a l s 、准同步时钟、全中同 步时钟分布等。g a l s 时钟分布网络将芯片划分为若干个模块,每一个模块内部 采用同步设计,而不同的模块工作在不同的时钟域,不同模块间采用异步通信传 4 n o c 路由器和低功耗通信网络设计 输数据,g a l s 解决了s o c 设计中庞大时钟树所带来的设计和功耗问题。g a l s 可使不同的模块工作在最佳的时钟频率下。 2 ) 并行通信 n o c 结构化的设计方法可集成更多的计算资源和存储资源,从而大大提高系 统的运算能力,同时基于通信网络的并行通信使不同的p e 间同时传输数据, 从而大大提高了通信带宽,而基于总线的s o c 中,同一时间只能有一对设备占用 总线。 3 ) 可重用性 n o c 设计的一个主要目的就是提高资源的可重用性,包括通信节点和p e 的 可重用。随着芯片规模的扩大,可重用结构在芯片设计中的使用将越来越频繁。 已设计好的礤核甚至s o c 都可以通过m 集成到n o c 中。 4 ) 可扩展性 n o c 有规则的拓扑结构,不同的p e 遵守统一的通信协议,p e 之间通过通信 网络进行通信。因此,若需要增加p e ,只需在已有的通信网络上增加一个通信节 点,并与新增加的p e 相连即可。 5 ) 可预测性 全局异步局部同步的通信方案,规则的拓扑结构和通信网络使得带宽、通信 性能等可预测,可重用p e 的使用和通信节点的可重用性使设计和验证变得可预 测。 1 2n o c 路由器和低功耗通信网络研究现状 路由器是n o c 的主要组成部分,路由器、网络接口和互连一起构成了n o c 的通信网络。路由器的性能和功耗在很大程度上影响着n o c 的性能和功耗。目前, 国内外有大量的科研机构和公司在研究n o c 相关技术,包括路由器和低功耗通信 网络的研究,并取得了一定的成果。 1 2 1 路由器研究现状 文献 4 】中,作者介绍了能精确模拟现代路由器关键模块的路由器延时模型, 该模型具有当代路由器的流水线、基于虚通道的流控机制、虚通道共享交叉开关 端口等特性。基于该模型,作者提出了一种投机虚通道路由器架构( s p a : s p e c u l a t i v ev i r t u a lc h a n n e lr o u t e ra r c h i t e c t u r e ) 。该路由器的虚通道分配( v a :v i r t u a l c h a n n e l a l l o c a t i o n ) 和开关分配( s a :s w i t c ha l l o c a t i o n ) 同时进行,即假设v a 的结 果是能够分配到一个可用的输出虚通道,因此,在v a 的同时进行s a 。如果v a 第一章绪论 5 最终没能分配到一个虚通道,那么该s a 将不起任何作用,如果分配到一个虚通 道,则可以在已有s a 的结果上直接进入下一个流水级,s p a 消除了v a 和s a 之间的依赖关系。为了不影响路由器的吞吐量,开关分配模块的非投机请求输入 的优先级将高于投机请求输入。与虫孔路由器比较,该路由器有相同的单跳 ( p e r - h o p ) 路由器延时,但吞吐量增加了4 0 。 文献【5 】中,作者提出了一种片上网络低延时路由器,通过将控制模块从关键 路径上分离以减小周期时间和延时,并使微片能够在一个周期内通过路由器。 文献 6 】中,作者提出了一种低面积路由器架构r a s o c ( r o u t e r a r c h i t e c t u r ef o r s o c ) ,并以参数化的v h d l 模型实现,用于低面积要求的n o c 中,该模型提高 了不同尺寸的n o c 的综合中r a s o c 的可重用性。该架构基于虫孔交换机制和确 定性路由算法,采用握手协议和轮循仲裁机制以及输入缓存。r a s o c 包括输入通 道和输出通道,输入通道模块包括输入流控制器、输入缓存、输入控制器和输入 读开关,输出通道模块包括输出控制器、输出数据开关、输出读开关和输出流控 制器。 ; 文献【7 】中,作者提出了一种基于v h d l 的r t l 级路由器模型和路由器间物 理互连的模型,用于评估基于n o c 的互连架构的延时、吞吐量、动态和泄露功耗。 该路由器包括5 个单元路由器,分别在东( e a s t :e ) 、西( w e s t :聊、南( s o u t h :s ) 、 i = l 匕( n o r t h :n ) 、本地( l o c a l :l ) 5 个方向上,5 个单元路由器通过交叉开关相连。数 据通过异步握手协议在路由器间以及路由器和p e 之间传输。单元路由器包括输 入链路控制器、输出链路控制器、虚通道、头译码器和仲裁器。 文献【8 】中,作者设计了一种5 端口的双通道流水型包交换路由器,路由器之 间通过中等同步接e l ( m s i n t :m e s o c h r o n o u si n t e r f a c e ) 相连,每个端口的2 个通道 共享一个交叉开关端口。在6 5 r i m 、8 层金属c m o s 工艺下,路由器版图面积为 0 3 4 r a m 2 ,包含2 l 万个晶体管,在1 2 v 下工作频率可达到5 1 g h z ,功耗为9 4 5 m w 。 与基准路由器相比,面积减少了3 4 ,平均功耗减少了1 3 ,器件数目减少了2 6 。 文献【9 】中,作者提出了一种快速虚通道( e v c :e x p r e s sv i r t u a lc h a n n e l ) 路由器。 该路由器在网络中预先定义虚拟快速通道,使数据包可以跳过中间的路由器而直 接在快速通道连接的两个路由器问传输,从而减少包延时和功耗,减小竞争,并 提高吞吐量。 文献b 0 l q ,作者提出了一种低成本路由器架构,通过减小缓存容量、简化 开关分配和分离维序间的路由,从而实现了单周期路由器延时和接近理想的片上 网络延时。仿真结果显示,在相同的吞吐量的情况下,作者提出的低成本路由器 和传统虚通道路由器相比,面积减少了3 7 ,功耗减少了4 5 。 文献【1 l 】中,作者提出了一种低延时路由器架构,利用虚拟输出队列( v o q : v i r t u a lo u t p u tq u e u i n g ) 减少微片的传输时间,将包传输的流水级减少到开关分配 6n o c 路由器和低功耗通信网络设计 和开关传输两个流水级。通过将s a 和s t 并行执行,可以实现一种单周期路由器。 作者还提出了一种多重虚拟输出队列( m u l t i p l ev o q ) 路由器结构,即在每个输入 端口,给每个输出端口分配个以上的队列,该结构可提高通信网络的吞吐量。 结果显示,与超前( l o o k - a h e a d ) 路由计算投机虚通道路由器相比,基于该路由器的 4 x 4 二维m e s h 拓扑结构n o c ,通信延时和面积分别减小了2 5 和6 7 3 。 文献 1 2 1 中,作者采用动态超前旁路技术,实现了一种低延时的路由器,同 时减少了缓存的读写操作所消耗的能量。不同流量模式下的仿真结果显示,与投 机虚通道路由器相比,该路由器架构可减少最多3 2 1 的包延时。 总之,路由器设计的目标在于提高其性能,减小包延时并提高通信网络的吞 吐量。为此可以采用虚通道、投机仲裁、旁路等技术。但是要在满足性能要求的 前提下,尽量减小路由器的面积和功耗。 1 2 2 低功耗通信网络研究现状 n o c 是实现多处理器芯片( c m p s ) 的- - 种很有新引力的架构,它解决了传统 s o c 设计中互连、带宽和可扩展性等方面的问题,但是不断增加的功耗制约着n o c 的广泛应用,因此如何减小n o c 和通信网络的功耗越来越受到人们的关注,并己 取得了一定的研究成果。 文献【1 3 】中,作者设计了一种低功耗片上网络,包含多个r s i c 核、s r a m 、 可配置逻辑阵列和i o 接口等,这些口之间以星形拓扑结构相连,分男i j 工作在不 同的时钟频率下。该设计采用了多种低功耗设计技术,包括低摆幅传输、部分激 活交叉开关、串行链路编码和时钟频率缩放等。基于0 1 8 u r nc m o s 工艺的芯片, 在1 6 g h z 的频率下可提供总共l1 2 g b s 的带宽,功耗为1 6 0 r o w ,其中通信网络 的功耗为5 1 m w 。 文献 1 4 1 中,作者提出了一种带功耗控制技术的路由器h e r m e s g l p ,该路由 器采用了门控时钟( c l o c kg a t i n g ) 和动态频率缩放( d f s :d y n a m i cf r e q u e n c y s c a l i n g ) 技术。h e r m e s g l p 在路由器设计层级采用门控时钟机制,由一个时钟控 制模块实现,将空闲的路由器的时钟关断。d f s 通过使时钟频率在两个或更多个 时钟间动态转换来实现,每个包包含一个优先级指示,每个路由器接收的优先级 指示个数等于该路由器的端口数,根据这些优先级指示,路由器算出最高优先级, 并选择最佳的工作频率,d f s 使路由器的工作频率能够根据通信需求而自动调节。 仿真结果显示,和不采用低功耗技术的路由器h e r m e s g 相比,h e r m e s g l p 能显 著降低功耗,同时只少量增加包延时。 文献 1 5 1 中,作者提出了一种低功耗路e h 器架构,通过减少路由器内部缓存 的大小来降低功耗,为了减小由此带来的性能降低,作者提出了自适应双功能链 第一章绪论 7 路,该链路不仅能传输数据,还能在需要的时候存储数据。仿真结果显示,在路 由器缓存减少一半的情况下,该路由器架构能获得接近4 0 的缓存能耗降低,3 0 的总通信网络功耗降低和4 1 的面积减小,而性能只下降了1 - 3 。 文献 1 6 1 中,作者结合自适应通道缓存和流水级旁路两种技术,在降低路由 器功耗的同时改善了片上网络的性能。该路由器采用双功能通道缓存,可以在需 要时将微片存储在这些缓存中,从而可以减少输入虚通道缓存的大小,旁路技术 可以使微片跳过一级路由器而直接传输到下一级路由器,从而避免了微片的读写 操作,采用更少的缓存资源和尽量减少对微片的读写可以显著降低片上网络的功 耗。仿真结果显示,结合这两种技术的片上互连网络可以带来6 2 的功耗减小和 超过l o 的性能改善。 文献【1 7 】中,作者基于9 0 r i m 的c m o s 工艺设计实现了一种基于2 d m e s h 拓 扑结构的8 * 8 片上网络,采用t f c ( t o k e nf l o wc o n t r 0 1 ) 流控机制实现缓存旁路, 从而减少缓存读写的功耗,采用低摆幅交叉开关和链路减小互连线的功耗。和不 采用这些低功耗技术的路由器相比,该路由器可以带来3 8 的功耗降低和3 9 的 延时减小。 总之,路由器和通信网络的低功耗设计已成为n o c 研究的主要内容之一,可 以从系统级、体系结构级、r t l 级等各个设计层级上降低通信网络的功耗,包括 新的路由器架构、低摆幅技术和低功耗编码、d v f s ( d y n a m i cv o l t a g ea n d f r e q u e n c ys c a l l i n g ) 、门控时钟( c l o c kg a t i n g ) 、低功耗缓存、自适应通道缓存、动 态缓存管理、流水级旁路、低功耗交叉开关等。 1 3 论文章节安排 本文的主要内容为概述n o c 相关关键技术,总结路由器的研究成果和发展现 状,在此基础上,采用v c r i l o gh d l 实现虚通道路由器的r t l 级设计,并验证该 设计的功能,使用d e s i g nc o m p i l e r 综合生成设计的门级网表,得到路由器各模块 以及项层模块的功耗和面积等参数。在所设计的路由器的基础上,实现通信网络 的低功耗设计,采用低摆幅互连、串行化编码和低功耗缓存技术减小通信网络的 功耗。 本文共分为5 章,各章节内容如下: 第一章:绪论。本章论述了s o c 技术未来的发展趋势,指出基于总线的s o c 技术所面临的问题,表明其已不能满足未来多处理器芯片对通信带宽和可扩展性 等方面的需要,指出了n o c 较s o c 的优势,并总结了n o c 路由器以及通信网络 低功耗技术的研究现状。 8 n o c 路由器和低功耗通信网络设计 第二章:n o c 关键技术。本章论述了与n o c 和路由器相关的时钟策略、数 据格式、通信协议、路由算法、流控机制、仲裁机制等关键技术,为下文的路由 器设计提供了理论基础。 第三章:虚通道路由器设计。本章详细介绍了虚通道路由器的各个子模块的 设计,包括输入通道( i n p u tc h a r m e d 、输入控制器( i n p u tc o n t r o l l e r ) 、路由计算 ( r o u t i n gc o m p u t a t i o n ) 、虚通道分配( v i r t u a lc h a n n e la l l o c a t i o n ) 、开关分配( s w i t c h a l l o c a t i o n ) 、信用值分配( c r e d i ta l l o c a t i o n ) 等。在此基础上,设计实现了一种基本 虚通道路由器,该路由器采用g a l s 的时钟策略,使用异步f i f o 实现不同时钟 域之间的数据传输;每个物理通道包含4 个虚通道,以提高通信网络的性能;采 用x y 维序路由算法,微片首先在x 方向上传输,再在y 方向上传输;采用轮循 仲裁机制,确保仲裁的公平性;采用虫孔交换技术,减少了对缓存资源的需要。 通过功能仿真验证设计的正确性,通过综合生成路由器的门级网表。 第四章:通信网络低功耗设计。通过三种低功耗技术,即低摆幅技术、串行 化编码和低功耗缓存,减小路由器和通信网络的功耗。 第五章:总结和展望。本章总结了本文的工作,并给出了后续n o c 路由器和 通信网络低功耗设计的参考研究方向。 第二章n o c 关键技术9 第二章n o c 关键技术 n o c 包括资源节点和通信节点,通信节点由路由器和网络接口组成,通信节 点及其之间的互连构成了通信网络,资源节点之间通过通信网络交换数据。 n o c 克服了s o c 设计中遇到的时序同步困难、可扩展性差、通信带宽有限等 问题,它借鉴计算机网络的有关概念,资源节点之间可以并行通信。本章将介绍 n o c 的相关关键技术,包括时钟策略、拓扑结构、通信协议,路由算法、交换策 略、仲裁策略、数据格式等。 2 1 时钟策略 全局同步设计的一个主要问题是如何在整个芯片上分布一个无偏斜的时钟网 络,随着时钟频率的提高以及时钟树规模的扩大,时钟网络消耗了相当大的一部 分功耗。为了解决这些问题,人们提出了多种适合n o c 的时钟方案。包括全局异 步局部同步( g a l s ) 、准同步时钟、中同步时钟等方案。 n o c 通过通信网络实现资源节点之间的数据传输,而每个资源节点与其它资 源节点之间是相对独立的,和s o c 的全局同步设计相比,可将n o c 划分为若干 个不同的时钟域,每个时钟区域内包含完全同步的模块,不同时钟域间通过同步 异步接口实现数据通信,如图2 1 所示,图中灰色方框代表本地的时钟源。g a l s 的时钟方案,有效解决了全局同步设计中时钟树所带来的功耗和时钟偏差问题, 且能与动态电压频率缩放( d v f s ) 技术有效结合。 图2 1g a l s 时钟方案 1 0n o c 路由器和低功耗通信网络设计 g a l s 的关键在于不同时钟域间的同步,目前己提出了多种方法,包括基于 异步f i f o 缓存和暂停时钟( p a u s i b l ec l o c k i n g ) 等方案。基于f i f o 的g a l s 方案如 图2 2 所示,f i f o 的写时钟为同步模块l 的时钟c l k l ,读时钟为同步模块2 的 时钟c l k 2 ,模块l 的数据在c l k l 的控制下写入f i f o ,当f i f o 满时,模块l 停止写数据,f i f o 的数据在c l i c 2 的控制下读出,当f i f o 空时,模块2 停止读 数据。 图2 2 基于异步f i f o 的g a l s 准同步时钟方案【嘲,即整个片上网络使用频率相同、相位差恒定为常量的同 步时钟。这种时钟方案将整个芯片划分为若干个时钟区域,时钟信号到达不同区 域的时钟偏差是可控的。在准同步时钟方案中,时钟在进入芯片的位置被直接缓 冲并分布到最近的相邻节点,在相邻节点处,时钟再一次被缓冲并被送至其它节 点。在水平方向上,时钟被缓冲并再次分开,在垂直方向上,时钟被缓冲并按照 时钟进来的方向继续向前。这一过程一直重复直到芯片上的所有时钟区域都被覆 盖。每一个时钟区域可以继续分为若干个子区域,直到一个合适的树层次,再用 局部h 树或x 树完成时钟分布。 图2 3 为该时钟分布方案的一个例子,n o c 被划分为1 6 个时钟区域r 1 1 到 r 4 4 ,在每个交叉处都有一个缓冲器,为所在的时钟区域提供时钟信号。相邻缓 冲器间的延时为l t d 。时钟信号从左上角进入,缓冲后为区域r l l 提供时钟信号 并被分布到相邻的区域r 1 2 和1 t 2 1 ,进入r 1 2 的时钟被再次缓冲并被分布到区域 r 1 3 和1 1 2 2 ,进入1 1 2 1 的时钟被再次缓冲并被分布到1 1 3 1 ,如此进行,直到芯片 上的所有区域被时钟覆盖。 第二章n o c 关键技术 图2 3 准同步时钟分布 2 2 拓扑结构 n o c 拓扑结构是指片上网络中通信节点的组织和连接方式。拓扑结构的选择 是n o c 设计的第一步,路由策略和流控机制都依赖于拓扑结构,应根据具体的应 用和对通信的需求,选择合适的拓扑结构。 拓扑结构可以分为规则拓扑和不规则拓扑,规则拓扑又可分为直接网络和间 接网络。在直接网络中,每个资源节点与一个通信节点相连,通信节点与其相邻 的通信节点通过一对方向相反的链路相连。在间接网络中,通信网络是由通信节 点相互连接而成,每个资源节点通过一个网络适配器与通信网络相连。直接网络 拓扑包括二维网格( 2 d m e s h ) 、二维环绕网格( 2 d t o r u s ) 、二维环绕折叠网格 ( 2 d f o l d e dt o m s ) 边形( o c t a g o n ) 、星形( s t a r ) 、环形( r i n g ) 、超立方体( h y p e c u b e ) 、 蛛形( s p i d e r g o n ) 等结构,间接网络拓扑包括二叉树、胖树( f a t - t r e e ) ,s p i n 、蝶形 ( b u t t e r f l y ) 等结构。不规则拓扑结构是由不同的规则拓扑结构组合而成。 拓扑结构的评价标准包括节点度、网络直径、连通度等,其含义如下: 节点度:一个通信节点和其它通信节点连接通道的个数,每个边都包括输入 和输出,所以一个边的节点度为2 。节点度越大,通信节点路由选择的余地越大。 最小距离:实现两节点之间通信的最短路径所需的跳数。 网络直径:通信网络中任意一对节点之间最小距离的最大值。 连通度:使通信网络不连通需要去掉的通信节点数目的最小值,连通度越大, 1 2 n o c 路由器和低功耗通信网络设计 网络拓扑越复杂。 2 d - m e s h 拓扑结构如图2 4 所示【埘,该图表示包含1 6 个通信节点的4 4 片 上网络。灰色方框表示通信节点,白色方框表示资源节点,通信节点之间和通信 节点与资源节点的互连用直线表示。2 d - m e s h 拓扑结构简单、规则、扩展性好, 是目前片上网络研究中最常用的拓扑结构之一。 m e s h 结构的网络直径较大,造成包延时增加,t o r u s 拓扑结构在m e s h 结构 的基础上,将位于边缘的通信节点连接起来,如图2 5 所示【2 0 】。t o m s 在保持m e s h 结构简单的同时,增加了边缘节点之间的通信能力,减小了平均通信延时。但t o r u s 结构增加了连线的数目,且新增加的导线与已有导线交叉,增加了后期的布线难 度。 图2 4 m e s h 拓扑结构 图2 5 t o m s 拓扑结构 虽然t o m s 拓扑结构减小了网络直径,但环绕的长互连可能带来相当大的互 连延时,f o l d e dt o m s 可有效避免长互连,如图2 6 所示。 八边形拓扑结构如图2 7 所示,八边形的每个顶点上有包含一个通信节点, 环内通信节点通过四条对角线两两连接,每个通信节点有三个双向端口与邻近通 信节点相连,环内一个节点最多经过两跳即可到达任意节点。如果将一个通信节 点作为桥节点,则可叠加更多的八边形。该结构的特点是环内通信的平均延时较 小,但连接两个环的通信节点会成为通信的瓶颈,且布线复杂。 一一 - - o 、 u 、u 1 l _ii u t u t l_1 l 、 u 、 il l _ j l - i _ i - i u 。一一u 口丫 图2 6f o l d e dt o m s 拓扑图2 7 八边形拓扑 蛛形拓扑如图2 8 所示【2 ,该结构基于一个双向环形对称结构,共包括 第二章n o c 关键技术1 3 n ( n = 2 n ,n = 2 ,3 , 4 ) 个通信节点,每个通信节点的一个端口与资源节点相连,三个 端口与其它路由器相连。该拓扑结构的网络直径较小,物理设计复杂度相对较低。 图2 8 蛛形拓扑结构 s p i n ( s c a l a b l ep r o g r a m m a b l ei n t e r c o n n e c t i o nn e t w o r k ) 拓扑基于胖树( f a t - t r e e ) 结构,如图2 9 所示【2 2 1 。和二叉树结构不同的是,一个路由节点可以有多个父子 点。图2 9 是4 维的胖树结构,每个通信节点有相同个数的父节点和子节点。资 源节点与叶子节点相连,资源节点之间的通信首先在其所在的叶子节点内查找, 若不成功,则向上一层查找,如此逐层查找。 图2 9 s p i n 拓扑 b f t ( b u t t e r f l yf a tt r e e ) 拓扑结构如图2 1 0 所示,与s p i n 结构类似,但其减 少了根节点的数目,从而降低了芯片的实现难度和布线复杂度。 图2 1 0 b f t 拓扑结构 此外,还有超立方( h y p e r c u b e ) 、基于簇的结构c l u s t e rm e s h 、星形( s t 砌、蝶 1 4 n o c 路由器和低功耗通信网络设计 形等规则拓扑结构。 上述规则拓扑的的性能对比如表2 1 所示。 表2 1 拓扑结构性能比较 节点数节点度网络直径连通度 2 d m e s h n 2 ( n 为维度) 8 2 ( n - i ) 2 2 d - t o n m n 2 8n 4 o c t a g o n孙l ( n 为八边形个数) 6 ( n 2 - 8 ) 1 4 + 4 1 s p i d e r g o nn 4 n 4 3 s p qn4n 8n 2 2 非规则拓扑结构根据不同的应用需求定制而成,包括专用网络、基于规则拓 扑、分层网络、网络总线混合拓扑等。专用网络拓扑根据具体的应用从零开始设 计,使得其在相同的性能指标下,比规则网络使用更少的通信节点,在面积和功 耗上更具优势。基于规则拓扑是指在规则拓扑的基础上增加或减少某些节点,从 而使网络呈现非规则性。分层网络拓扑表现为两层或更多层的层次化结构,每层 可以根据需要选择不同的拓扑。网络总线结构中,全局网采用规则或者非规则的 拓扑结构,局部网内部基于总线通信。 2 3 通信协议 信息从一个资源传输到另一个资源的规则和方法称为通信协议。在n o c 中,通信协议决定了p e 如何与通信网络相连,还决定了信息是如何从源节点到 达目的节点。片上网络通信协议参考了7 层的o s i 模型,o s i 参考模型中的较低 三层,即物理层、数据链路层和网络层几乎不用修改就可以用于片上网络。由于 片上网络通信范围有限,o s i 参考模型中的上四层被压缩成两层,即传输层和应 用层,n o c 的五层通信协议栈如图2 1 l 所示1 2 3 1 。 片上网络五层通信协议各层的定义如下: 物理层:这一层主要涉及交换节点之间以及交换节点和资源节点之间物理互 连介质的物理特性,包括电压高低、互连线的长度和宽度、信号的时序、单元间 的连线数量等。 数据链路层:该层为信息在物理互连上的传输提供可靠性保证,使数据在节 点之间无误地传输。数据链路层的功能包括检错和纠错、数据编码、数据率管理 等。 网络层:该层的功能是完成数据通过通信网络从源节点到目的节点的传输, 包括缓存、路由决策、缓存分配、开关分配等。 第二章n o c 关键技术 1 5 传输层:该层负责对资源节点产生的数据打包以及对传输到资源节点的数据 解包,并利用底层协议完成数据包的传输。 应用层:该层相当于7 层o s l 参考模型的顶部三层,即应用层、表示层和会 话层。该层的功
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年保安员考试模考模拟试题附答案详解(典型题)
- 六年级英语上册 Module 8 Unit 2 I often go swimming说课稿2 外研版(三起)
- Unit1 Lesson 4 My school days (说课稿)-冀教版(2024)初中英语七年级上册
- 小学语文获奖篇目教学设计范例
- 2024秋五年级英语上册 Module 5 Unit 1 There are only nineteen crayons第2课时说课稿 外研版(三起)
- Unit4InterestsandAbilities-TopicTalk教学设计北师大版英语七年级上册
- 2024-2025学年新教材高中数学 第3章 排列、组合与二项式定理 3.1 排列与组合 3.1.2 第1课时 排列与排列数说课稿 新人教B版选择性必修第二册
- 川教版八年级信息技术上册教学设计:第四课 制作简单表格
- 4 红领巾爱心义卖行动教学设计-2025-2026学年小学综合实践活动六年级下册海燕版
- 人教版八年级上册第二单元《第4课 书间精灵-藏书票》说课稿
- 驾考宝典三力测试考试试题及答案
- 骨科围手术期的护理流程
- 不明原因肺炎病例监测、排查和管理方案2025年修订版
- 呼吸衰竭护理疑难病例讨论
- 熠星创新创业大赛
- 高考英语阅读理解1200个高频
- 2025安全生产法律法规专题知识培训
- 《狼来了》寓言故事演讲课件
- 《瑞吉欧课程模式》课件
- 特种作业电工安全培训
- DB37-T 1933-2022 氯碱安全生产技术规范
评论
0/150
提交评论