




已阅读5页,还剩47页未读, 继续免费阅读
(微电子学与固体电子学专业论文)影响片上网络性能的关键技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘篮 摘要 随着半导体工艺的进步以及s o c ( s y s t e mo nc h i p ) 技术的不断完善,单个 芯片上集成的晶体管已达到数十亿,这意味着集成的i p 核数目将达到上万个。 传统的s o c 技术,i p 核之间是以共享总线方式进行通信的,这种模式己遇瓶颈, 出现了包括像性能、功耗、延时以及可靠性等方而的问题;另外,多处理器s o c 的出现,使得总线结构在可扩展性、通信效率及功耗等方面的问题更为突出。面 对总线架构出现的上述问题,人们将计算机网络通信的思想移植到芯片设计上 来,提出片上网络( n e t w o r ko nc h i p ,n o c ) 的概念。n o c 是基于包( p a c k e t ) 传输的 网络通信,并利用全局异步局部同步( g l o b a l l y a s y n c h r o n o u sl o c a l l ys y n c h r o n o u s , g a l s ) 机制完成i p 核之间的高速通信。n o c 是更大规模、更高层次的片上系统, 是片上的网络系统,是未来:占片设计的主方向。 本文首先介绍了课题的研究背景和当前国内外的研究动态;接着对片上网络 相关的技术要点做了分析,包括拓扑结构、交换技术、路由算法、流量控制和通 讯协议等。 本文主要对拓扑结构和路由算法做了深入研宄和设计。首先提出一种层次化 紧密全互连的拓扑结构( g e n e r a l i z e dh i e r a r c h i c a lc o m p l e t e l yc o n n e c t e dn e t w o r k s , g h c c ) ,该结构具有良好的扩展性、统一性等特点,通过仿真验证得出:该结 构性能上与其余常用拓扑结构相媲美,有趋于更优的趋势,从而是片上刚络设计 时一个很好的选择。然后证明了输入选择对于路由效率的影响,并设计了一种基 于阻塞程度的输入选择机制( b l o c kl e v e li n p u ts e l e c t i o n ,b l i s ) 。该机制在高负 载情况下,保证了阻塞区域优先选通,提高了通信效率。在与输出选择机制组成 完整的路由算法后,实验证明:除了在对调模式下b l i s 输入选择与传统的先到先 得( f i r s tc o m ef i r s ts e r v i c e ,f c f s ) 输入选择性能相近外,其余模式下,b l i s 性 能均优于f c f s 。在一些模式下,b l i s 还能使复杂度低、硬件需求少的x y 路由 算法在性能上接近甚至超过高复杂度、硬件需求高的o e 算法。 关键词:片上网络;拓扑结构;层次化紧密全互连;输入选择 英文摘要 a bs t r a c t w i t ht h ea d v a n c e si ns e m i c o n d u c t o rt e c h n o l o g y , a sw e l la st h es o ct e c h n o l o g y c o n t i n u e st oi m p r o v e ,t h ei n t e g r a t i o no ft r a n s i s t o r so nas i n g l ec h i ph a sr e a c h e d b i l l i o n s t h i sm e a n st h a to das i n g l ec h i pt h en u m b e ro fi pc o r e sc a nr e a c ht e n so f t h o u s a n d s i nt h et r a d i t i o n a ls o ct e c h n o l o g y , i pc o r ei sb a s e do nt h e s h a r e db u s c o m m u n i c a t i o n ,a n dt h i sp a r e mh a sm e tt h eb o t t l e n e c kw h i c hh a db e e nt h ec a s e , i n c l u d i n ga s p e c t sl i k ep e r f o r m a n c e ,p o w e rc o n s u m p t i o n ,d e l a ya n dr e l i a b i l i t y i n a d d i t i o n ,t h ee m e r g e n c eo fm u l t i p r o c e s s o rs o cm a k e sb u sa r c h i t e c t u r ei ns c a l a b i l i t y , c o m m u n i c a t i o ne f f i c i e n c ya n dp o w e rp r o b l e m se v e nm o r ep r o m i n e n t f a c i n gt h e p r o b l e m so fb u ss t r u c t u r ea b o v e ,p e o p l et r a n s p l a n t e dt h ei d e ao fc o m p u t e rn e t w o r k c o m m u n i c a t i o nt ot h ec h i pd e s i g na n dp r o p o s e dt h ec o n c e p to fn o c ( n e t w o r ko n c h i p ) n o ci s b a s e do n p a c k e t t r a n s m i s s i o ni n s t e a do ft h et r a d i t i o n a ls o cb u s c o m m u n i c a t i o n ,a n dg l o b a la s y n c h r o n o u sl o c a ls y n c h r o n o u sm e c h a n i s mt oc o m p l e t e t h eh i g h s p e e dc o m m u n i c a t i o n sb e t w e e nt h ei pc o r e s n o ci s al a r g e r s c a l ea n d h i g h e r - l e v e ls y s t e mo nac h i p ,a n dw i l lb et h em a i n d i r e c t i o no ff u t u r ec h i pd e s i g n t h i sp a p e ri n - s ti n t r o d u c e st h er e s e a r c hb a c k g r o u n da n dc u r r e n td o m e s t i ca n d i n t e r n a t i o n a ld y n a m i c s t h e nt h en o c r e l a t e dt e c h n i c a lp o i n t s ,i n c l u d i n gt o p o l o g y s t r u c t u r e ,s w i t c h i n gt e c h n o l o g y , r o u t i n ga l g o r i t h m s ,f l o wc o n t r o l ,a n dc o m m u n i c a t i o n p r o t o c o l s ,i se l a b o r a t e di nd e t a i l t h i sp a p e rf o c u s e so nt h et o p o l o g ys t r u c t u r ea n dr o u t i n ga l g o r i t h ma n dm a k e s s o m ei n d e p t hr e s e a r c ha n dd e s i g no nt h et w ot e c h n i c a lp o i n t s f i r s t ,an e wt o p o l o g y s t r u c t u r ec a l l e dg e n e r a l i z e dh i e r a r c h i c a lc o m p l e t e l yc o n n e c t e dn e t w o r k s ( g h c c ) i s p r o p o s e d ,t h es t r u c t u r eh a sg o o dc h a r a c t e r i s t i c sl i k es c a l a b i l i t ya n du n i f o r m i t y a n di t c o u l do b t a i n e dt h r o u g hs i m u l a t i o n st h a tt h en e ws t r u c t u r eg o tag o o dp e r f o r m a n c e c o m p a r e st ot h ec o m m o n u s e dt o p o l o g y , a n de v e nt e n d st ob eb e t t e r i t i sag o o d c h o i c ef o rn o cd e s i g n a n dt h e n ,t h ei n f l u e n c eo ft h ei n p u ts e l e c t i o nf o rr o u t i n g e f f i c i e n c yi sp r o v e da n dan e wi n p u ts e l e c t i o nm e c h a n i s mc a l l e db l o c kl e v e li n p u t 英文摘篮 s e l e c t i o n ( b l i s ) i sp r o p o s e d u n d e rh e a v yl o a dc o n d i t i o n s ,t h i sm e c h a n i s mg r a n t st h e b l o c k i n gr e g i o nah i g h e rp r i o r i t yt oa c c e s s t h eo u t p u tc h a n n e lw h i c hr e m o v e st h e p o s s i b l ec o n g e s t i o na n di m p r o v e st h ec o m m u n i c a t i o ne f f i c i e n c y n om a t t e rw h i c h o u t p u ts e l e c t i o ni su s e d ,e x p e r i m e n t ss h o wt h a tt h ep r o p o s e db l i si n p u ts e l e c t i o n a c h i e v e db e t t e rp e r f o r m a n c et h a nt h et r a d i t i o n a lf i r s tc o m ef i r s ts e r v e di n p u ts e l e c t i o n f o rm o s tt r a f f i cp a r e me x c e p tt h et r a n s p o s et r a f f i cp a t t e m ,w h e r et h et w oi n p u t s e l e c t i o nh a v et h es i m i l a rp e r f o r m a n c e e v e nm o r e ,b l i sc o u l da l s oe n a b l e st h el o w c o m p l e x i t y , l o wh a r d w a r ec o s tx yr o u t i n ga l g o r i t h ma c h i e v es i m i l a ro re v e nb e t t e r p e r f o r m a n c et h a nt h eh i g h e rc o m p l e x i t 5h i g h e rh a r d w a r er e q u i r e m e n t so er o u t i n g a l g o r i t h m k e y w o r d s :n e t w o r k o nc h i p ;t o p o l o g y ;g e n e r a l i z e dh i e r a r c h i c a lc o m p l e t e l y c o n n e c t e d ;b l o c kl e v e li n p u ts e l e c t i o n i i i 插图清单 插图清单 图2 1 片上网络系统及通信节点组织架构7 图2 2 片上通信方式演变8 图2 3n o c 设计流程9 图2 4 环形拓扑结构1 1 图2 - 5 蛛网型( s p i d e r g o n ) 拓扑结构1 2 图2 6m e s h 型拓扑结构1 2 图2 7 二维环状m e s h 1 3 图2 8 胖树型拓扑结构1 3 图2 9 八角型拓扑结构1 4 图2 1 0 存储转发技术1 5 图2 1 1n o c 分层协议结构1 8 图3 一lg h c c 框架结构图2 2 图3 2 基本块( r = 2 ,3 ) 结构2 3 图3 3g h c c g ( 3 ) 完整网络拓扑结构2 5 图3 4 紧密全互连g h c c g ( 2 ) i 丛1 种架构2 6 图3 51 6 个节点时各拓扑结构吞吐率2 9 图3 62 5 个节点时各拓扑结构吞吐率2 9 图4 1 通信节点框架图3 1 图4 2 输入输出选择机制3 4 图4 3 含有b l i s 的s w i t c h 结构图3 5 图4 4 普通模式下算法的性能比较3 8 图4 5 对调模式下算法的性能比较3 9 图4 6 热点模式下算法的性能比较3 9 幽表清单 图表清单 表3 1g h c c g 常规结构节点数和链接数比较2 7 表3 2 各拓扑结构连接数3 0 表4 1b l i s 算法伪代码3 6 v i i 第一章绪论 1 1 课题背景 第一章绪论 在集成电路发展的近几十年中,其制造工艺平均每年以5 8 的速度增长,并 遵循着摩尔定律不断推进着,即工艺特征尺寸每1 8 个月缩小一倍,集成度每1 8 个月增加一倍。随着半导体工艺技术进入到纳米阶段,单颗芯片上集成上亿个晶 体管已经成为现实,根据国际知名半导体技术路线图i t r s ( i n t e r n a t i o n a l t e c h n o l o g yr o a d m a pf o rs e m i c o n d u c t o r s ) 预测,到2 0 1 3 年,单个芯片上集成的 晶体管数将会超过4 0 亿个i 。如何充分利用这数以亿计的晶体管成为芯片体系 结构设计的新难题。传统的单核思想,使得芯片设计在互连延迟、带宽、功耗等 性能上遭遇瓶颈。所以,寻求一种新型的芯片体系架构来达到性能增长的同时功 耗下降已经成为业界普遍的追求。多核技术是现今总结出来的一条可行之路,目 的是在利用多个低频率的处理器核产生超过单一高频率的处理器核的处理性能, 获得更高的性价比。多核技术已经成为芯片设计研冗的重点和未来发展主方向 3 u 。 按照互连方式的不同,片上多核技术可以分为两大类:基于总线的互连和基 于网络的互连。传统的基于总线的互连可以通过层次化总线技术使片上集成多个 处理器核,从而达到高性能和高复杂度。基于网络的互连是近些年提出的新概念, 片上多个处理器核之间采用分组交换的方式进行通信,克服了传统总线架构所遇 到的各种瓶颈问题【3 l 】。这种新的技术被称为片上网络( n e t w o r k o n c h i p ,n o c ) 技术。 1 1 1 总线架构遇到的困难 传统的基于总线的互连结构,由于不支持并行计算,可扩展性差等种种弊端 使其不再适合未来的片上互连需求。突出的问题表现在: 1 全局时钟同步问题【2 1 当工艺特征尺寸在4 5 n m 以下、工作频率达到数个g h z 时,时钟信号的布 影响片上m 络性能的天键技术研究 线变的尤为困难。不断翻转的时钟信号将对周嘲信号的传输造成很大的影响,其 自身也会因这种串扰而产生信号延迟和时钟的不确定性,从而造成时钟偏差和时 钟抖动,由此限制时钟频率的提升。因此,设计单一系统时钟的全局同步电路几 乎变得不可能。 2 可扩展性问题 总线是种共享互连结构,当前时刻只允许一个i p 使用总线。仲裁机制允许 高优先级的i p 核优先获得当前总线的使用权,在总线被占用期间,所有其他的 请求被延迟,直到总线空闲【3 2 1 。因此,总线的利用率很低。随着工艺的提高, 片上集成的i p 核越来越多,待处理的数据量也越来越大,总线结构的可扩展性 差的问题就越来越突出,有限的地址资源,将严重制约着电路规模的增大【3 3 】。 1 1 2 片上网络架构的优势 3 】 片上嗍络是基于分组交换的路由方式进行片上通信的,它在通信效率、功耗、 重用性和单一时钟全局同步等方面都有一定优势,具体表现在以下几个方面: ( 1 ) 有利于提高通讯效率川 现有的芯片架构主要是基于总线结构,但随着电路规模的持续增大,总线结 构将在芯片设计过程中不断遭遇瓶颈:首先总线地址资源有限,并不能随着计算 单元的增加而无限扩展;其次同一条总线无法支持一对以上的用户同时通信,这 种串行访问机制严重影响了通信的效率;此外,总线架构庞大的时钟网络与连线 功耗将占据芯片总功耗的绝大部分。 片上网络的网络拓扑结构提供了良好的可扩展性,理论上集成在片上的i p 核数目不受限制;其连线网络结构提供了并行计算能力,从而使通信带宽增加, 提高了通信效率;此外,片上网络将长的总线变成交换开关之间的短互连线,可 以有效的控制功耗。 ( 2 ) 有利于提高可重用性 每个系统的设计都是从需求分析开始的。同样的,芯片设计过程首先是根据 需求确定硬件系统各功能模块并将各模块在芯片上的相对位置确定。总线、时钟 网络及各信号走线根据具体需求进行专门设计,并最终达到可以正确工作。在物 理设计结束后,一旦发现原设计中出现某个错误,纠错过程将导致再一次的重新 第一章绪论 设计。这不仅浪费了大量的人力物力,而且还延缓了产品投放市场的时间【3 4 1 。 n o c 设计一个重要的基础就是i p 复用技术。在设计过程中将现有的i p 核通 过某种方式“拼装成具有一定功能的s o c 就是i p 复用技术【3 5 】。n o c 把整个系统 划分成多个独立的同步单元,每个单元内采用已有的i p 模块,各个单元之间并 行设计到最终。n o c 不仅表现在i p 上可以重用,它的通信系统( 包括像通信开 关和物理信道) 也是可以重用的。 ( 3 ) 有利于解决全局同步的难题 n o c 资源之间采用短线互连,这种架构使得全局异步局部同步( g a l s ) 时 钟策略成为可能【3 l 】。 全局异步局部同步通信机制,使得局部每一个i p 节点都工作在自己同一的 时钟域,全局不i _ 】的节点之间再通过网络进行异步通信,这样就很好地解决了总 线结构的单一时钟难同步的问题,进而解决了庞大的时钟树所带来的资源和功耗 浪费问题 3 6 】。 1 2 片上网络的研究动态 1 2 1 国外研究动态 2 0 0 0 年1 1 月,瑞典皇家技术学院等研究单位提: “n e t w o r ko nac h i p ”概念, 把n o c 定义为在一块芯片上实现计算机资源、存储资源以及i o 资源通过交换 开关的网络互连。资源结点之间的通信是通过交换开关将自带寻址信息的数据包 从源地址传送到目的地址。随着电子技术的不断发展,越来越多的研究人员意识 到n o c 的巨大发展潜力,纷纷投入到其中研列4 1 。如今n o c 俨然已经成为了一 个前沿的学术研亢领域。近年来,有大量的研究成果 4 - 5 1 涌现。 2 0 0 1 年,斯坦福大学的w j d a l l y 等人发表论文,提出利用片上互连网络数 据包通讯的方式来代替各种连线结构的构想,并将研究重点转移到n o c 上来。 2 0 0 2 年,“n e t w o r ko i lc h i p ”国际研讨会在日本京都召开,讨论了n o c 的概 念与范畴、设计方法学及设计空间探索等问题。 2 0 0 3 年,斯坦福大学与博洛尼亚大学开展的联合计划“n e t c h i p ”,重点研究 了n o c 的综合流程,包括拓扑结构映射、拓扑结构选择和拓扑结构生成。 影响片上h 络性能的关键技术研宄 2 0 0 4 年,e l s e v i e rs c i e n c e 的( ( j o u r n a lo fs y s t e m sa r c h i t e c t u r e ) ) 发表了一些 n o c 专题,内容包括i p 互连、n o c 数据打包与路由交换、n o c 通讯协议的服务 质量以及n o c 设计探索的结构建模等。 2 0 0 6 年国际研究内容主要包括设计方法学、拓扑结构如何减少延迟和降低 功耗、设计e d a 工具、系统管理、应用程序接口、电源功率等。 2 0 0 8 年i n t e l 公司成功研制出应用n o c 技术的集成有8 0 个i p 核的芯片,成 为第一块性能超过1 0t e r af l o p s 的芯片【6 】。 2 0 1 1 年突尼斯m o n a s t i r t 3 0 】研究所发表论文提出,他们设计了一种低功耗的资源网络 接口,植入一种可控的时钟机制,该机制能够使各子模块在空闲使用时停止运行,从而有效 降低功耗并具有一定自适应性。 1 2 2 国内研究动态【3 6 】 相对于国外在此领域的研究已发展到了整体架构的设计和优化,并且有成熟 的芯片面世;国内研究大多还停留在片面技术的研究上。目前国内的研究单位主 要有合肥工、j k 大学、西北工业大学、西安电子科技大学、哈尔滨工业大学等。有 多位在读博士、硕士致力于此领域的研究,研究的成果主要有: 西北工大对于n o c 体系架构的研究,引入了模块化的测试方法。对于并行 处理器方面提出了片上网络功耗模型和时延模型,并利用模型分析了二维和多层 m e s h 结构中功耗时延的差别7 1 。 哈尔滨工业大学提出一种低功耗自适应的数据保护机制,该机制可以根据不 同的通信链路错误数,自适应的选择路由节点问势据保护的跳距,从而使得芯片 的功耗达到最优。 合肥工业大学研究表明【8 1 ,n o c 从本质上解决了多核技术所带来的体系架构 问题,同时也解决了总线结构难题:全局时钟同步问题。基于路由交换的网络技 术实现了多任务多进程的通信,实现了真正的并行计算。 清华大学林世俊等人【9 】设计了一种g a l s 通信的网路接口,具有高速、低延 迟的特点:西安电子科技大学何世超等【1 0 】提出测试交换结构问互连线串扰的 b i s t 的方法。 4 第一章绪论 1 3 本文的目标与主要工作 1 3 1 本文的目标与主要工作 本文基于阅读大量相关的国内外文献基础上,介绍了片上网络相关理论概 念,并对影响片上网络性能的关键技术进行了分析研究,包括片上网络的拓扑结 构、交换技术、路由算法、流控策略、通讯协议、性能评估因素等。这些都是片 上网络研究的热点问题。通过对这些关键技术因素的研究,可以得知拓扑结构和 路由算法是影响片上网络性能最重要的两个方面。因此,本文的目标就是设计出 高性能的拓扑结构和路由算法,为下一步片上网络设计工作打下基础。 本文主要工作内容有: 1 提出一种层次化紧密全互连的拓扑结构( g e n e r a l i z e dh i e r a r c h i c a lc o m p l e t e l y c o n n e c t e dn e t w o r k s ,g h c c ) ,该结构具有良好的扩展性、统一性和对称性等特 点。通过仿真验证得出:该结构性能上与其余常用拓扑结构相媲美,有趋于更优 的趋势,从而是设计片上网络时一个很好的选择。 2 证明了输入选择对于路由效率的影响,并设计了一种基于阻塞程度的输入选择 机制( b l o c kl e v e li n p u ts e l e c t i o n ,b l i s ) 。该机制在高负载情况下,保证了高阻 塞区域优先选通,提高了通信效率。在与输出选择机制组成完整的路由算法后, 实验证明除了在对调模式下,b l i s 输入选择机制与传统的f c f s 输入选择机制 性能相近外,其余模式下,b l i s 性能均优于f c f s 。在一些模式下,b l i s 还能 使复杂度低、硬件需求少的x y 路由算法在性能接近甚至超过高复杂度、硬件需 求高的o e 算法。 1 3 2 章节安排 全文共分五章,具体章节安排如下: 第一章分析了集成电路发展的趋势及本课题的研究背景,紧接着讨论了国 内外研究现状,最后阐述了本文的研究方向和主要工作。 第二章首先论述了n o c 基本概念及设计方法学。之后,对相关的技术要点 和性能评估因素进行了详细阐述。 影响片上叫络性能的关键技术研究 第三章着重对片上网络拓扑结构进行了分析,提出一种新颖的层次化紧密 全互连的拓扑结构,通过一些基本定义,详细描述了该具体结构的搭建方法。最 后通过实验给出该拓扑结构的性能优势。 第四章是对路由算法进行研究,首先论证了输入选择机制在完整路由算法 中的重要性,并提出一种基于阻塞程度的输入选择机制,接着详细阐述了该机制 工作原理的和实现策略,最后给出了相关的仿真试验结果。 第五章是对本文主要工作内容的总结,同时给出了了有待进一步研宄工作 和方向。 6 箱_ 章片e m 络相天技术婴点 第二章片上网络设计相关技术要点 2 1 片上网络设计方法学 n o c 的核心思想就是将计算机网络通信技术移植到芯片设计中来,从体系 架构上彻底解决总线通信的瓶颈问题 3 7 1 ,它借鉴了分布式计算机的通信机制, 利用路由和分组交换技术进行通信。 2 1 i 片上网络的基本概念 n o c 是在单个j 占片上构建的网络系统,它是在单个:卷片上集成了多个特定功 能的i p 核或是小系统的s o c 。n o c 主要由两类基本单元组成:资源节点( r e s o u r c e n o d e s ) 和通信节点( c o m m u n i c a t i o nn o d e s ) 。 ( a ) 片上网络( b ) 通信节点 图2 1 片上网络系统及通信节点组织架构 如图2 - 1 所示是一块小的片上网络系统架构,它是由通信节点s ( s w i t c h ) , 以及连接在每个通信节点上的资源节点r ( r e s o u r c e ) 和通道c ( c h a n n e l ) 组成。 7 z 一一“ 影响片上b q 络性能的关键技术研究 ( 1 ) 通信节点:主要的任务就是执行片上信息的交换。如图2 1 ( b ) 所示,包 括仲裁器( a r b i t e r ) 、交叉开关( c r o s sb a r ) 、缓冲器( b u f f e r ) 和一些输入输出 端口。仲裁器决定着信息的流动方向,交叉开关功能就是将信息从输入端口传输 到输出端口。信息在通信节点中暂存在缓冲器中,缓冲器包括输入缓存和输出缓 存。有的通信节点只含有其中一种缓存,有的两种都含有。 ( 2 ) 资源节点:任务就是对信息的处理、计算。它可以是一个小的s o c 系统, 也可以是一个的i p 核,像是嵌入式的微处理器、d s p 核、f p g a 等。 ( 3 ) 通道:是指资源节点与通信节点、通信节点与通信节点之间的连线【3 7 】。通 信:常点之间的信息交换通道有四个方向:n ( n o r t h ) 、s ( s o u t h ) 、w ( w e s t ) 、e ( e a s t ) 。 通信节点与资源节点的信息交换通过通道l ( l o c a l ) 完成。 ( 4 ) 资源网络接口:资源节点与通信节点之间的接口。以下为了简化起见,将 资源网络接口合并到资源节点上,统称为资源节点。 2 1 2 片上通信方式的演变l 如图2 2 所示,片上通信的方式几经变化,从传统的点到点通信到基于总线 的通信再到现在的基于分组交换的片上网络通信。 ( a ) 点到点通信 ( b ) 基于总线通信 ( c ) 片上网络互连通信 图2 2 片上通信方式演变 8 第_ 章片上网络相关技术篮点 ( a ) 点到点通信方式将导致每个i p 核有大量的管脚。片上大量的连线资源 引起连线时间增加,同时也耗费了大量的芯片面积。造成不可预测的信号延迟和 信号质量等问题。每个部分都是不可重用的,但是用点到点的方式构造s o c ,性 能上可能是最优的。 ( b ) 基于总线的通信方式是目前片上系统设计中最常用的。通过总线结构的 分时复用,每个i p 核的管脚数有所减少,减少了连线面积。层次化的总线让各 i p 核之间能高效的通信,总线通信也有一定的可升级性。但是有限的带宽,对 于日益复杂的系统通信而言,性能上跟不上要求。 ( c ) 计算机网络的成功加上其良好的扩展性引起了芯片设计者的关注,并将 基于路由的网络和基于分组交换的通信方式引入到芯片设计上来。基于分组交换 的通信对于无限可扩展性提供了理论上的可能性,也提高了架构的可重用性。对 于芯片性能,缩短设计周期,加快新产品问世都有十分关键的作用。我相信,在 不久的将来,n o c 产品将会是下一代电子产品的主流。 2 2 片上网络设计流程 n o c 设计主要包括计算资源结构设计和n o c 结构设计两部分。如图2 3 计篝资源结构的设计 n o c 络构设汁 通演梗墼化分析 拓孙结构与协波设计 版图规划湃访 系统健套2 努析 n o c 逻辑与电路设计 功耗与面积分析 图2 3n o c 设计流程 9 影i 响片上网络性能的关键技术研究 首先进行计算资源的结构设计,计算资源描述了应用系统的行为,实现了系 统的功能。计算资源结构设计涉及两种模型:计算资源结构模型和行为模型。 其次进行n o c 结构设计,在设计时要依据计算资源结构设计。主要包括: ( 1 ) 通信模型化分析。分析计算资源之间信息数据传输的特点,在仿真中, 通过追踪信息的特点建立通信模型。 ( 2 ) 拓扑结构与协议设计。该阶段是n o c 设计的核心部分。它是在已经建 立的通信模型基础上设计拓扑结构和通信协议,用尽可能少的资源实现通信要 求,同时要考虑系统的性能。 ( 3 ) 版图规划与评估。n o c 中影响系统功耗和面积的主要因素是互连结构。 版图规划与评估是通过评估时钟周期的每个互连延迟,并分析功耗面积,从而为 互连结构提供设计要求。 ( 4 ) 系统的性能分析。利用仿真平台仿真n o c 结构,通过仿真结果完善系 统设计。若性能不满足要求,则返回至拓扑结构与协议设计。 ( 5 ) n o c 逻辑电路设计。其逻辑电路行为由拓扑结构与通信协议设计来定 义,并通过硬件描述语言描述与综合。其中互连设计是n o c 分析重点。 ( 6 ) 功耗与面积分析。通过累加每个小部分的功耗和面积,得到总的功耗 和面积。若不满足设计要求,则返回重新进行电路设计和版图规划,若还是不行, 则需要重新进行拓扑结构与协议设计。 2 3 片上网络相关技术要点 片上网络要达到高性能,在设计上有诸多因素要考虑。与n o c 设计相关的 技术要点有:拓扑结构、交换技术、路由算法、通讯协议、流量控制等。n o c 性能的优劣也有诸多评估因素,比如吞吐率、时延等。这些都是近些年n o c 研 究的热点问题。接下来针对n o c 主要的技术要点做相关介绍。 2 3 1 拓扑结构 拓扑结构体现的是n o c 中通信节点是如何在芯片中分布和连接的。由于片 上网络的规模不同,加上节点模块的尺寸和位置的需求,不同的n o c 架构会选 择不同的拓扑结构。拓扑结构对系统的性能和面积有很大的影响。所以在选择拓 1 0 第_ 章片上h 络栝1 关技术篮点 扑结构时要慎重考虑,良好的拓扑结构要考虑以下的因素【3 6 l : ( a ) 通信节点与资源节点之间,通信节点之间有明显的局部“相邻”性; ( b ) 片上网络中资源节点和通信节点之间相互影响; ( c ) 片上网络中节点之间的物理连线不能太复杂,具有一定的可扩展性。 目前片上网络拓扑结构有很多种,接下来介绍研究中几种比较常见的几种拓 扑结构。 ( 1 ) 环形( r i n g ) 结构【1 2 】 环状( r i n g ) 拓扑结构 图2 4 环形拓扑结构 如图2 4 所示为一含有5 个通信节点的环形拓扑,该结构简单,实现起来也 比较容易。它是由n ( n 3 ) 个通信节点依次连接而成,每个通信:符点连接一个 资源节点。数据包在通信节点问的流动方式只有两种:顺时针和逆时针。该结构 适用于电路规模比较小,需要处理的数据较少的清况。一旦链路负载较重,数据 处理能力跟不上,将会造成大量数据等待,数据延迟增长,严重影响链路效率。 ( 2 ) 蛛网型( s p i d e r g o n ) 结构【1 3 】 蛛网型是环形结构的升级。如图2 - 5 所示,该结构含有偶数个通信节点n = 2 n ( n = 2 。3 ) ,在环形上的节点依次相连,节点地址顺时针依次递增,处在环形对 角的两个节点( i ,i + n ) 再横跨相连。对于每个通信节点i ( 0 i c x ) c h a n n e l = w : e l s ei f ( d x c y ) c h a n n e l 2 n ; e l s ei f ( d y c y ) c h a n n e l = s ; e l s ec h a n n e l = l ; e n d 此算法较为简单,在网络负载较低时,它的延迟比较低,效率比较高。但是 在网络繁忙、数据包注入率较大时,当某一条线路被占用,其他需要流过此条线 路的数据包就必须等待。这样就造成了网络阻塞,加大了延迟,从而降低了系统 的性能。这时,就需要另一种自适应的路由算法来提升系统性能。所谓的自适应 路由算法,就是说同一对源节点与目的节点,在不同的网络负载情况下,路由路 径是不一样的。它考虑到实际的网络的拥塞情况,选择一条更有效的路径,从而 避免阻塞。 同样的应用在m e s h 结构中的o e ( o d d e v e n ) 算法,就是一种部分白适应的 路由算法。该算法对数据包在路由转弯上做了些限制。它定义:节点所在列的x 坐标若是奇数,就称该列为奇数列。对应的,节点所在列的x 坐标若是偶数, 就称该列为偶数列。用n ( 北) 、s ( 南) 、w ( 西) 、e ( 东) 来定义路由中的八 种转弯:w s 、w n 、e s 、e n 、n w 、n e 、s w 、s e 。例如,w s 表示由西向南转 弯。路由过程中,o e 算法禁止了一些特定转向:奇数列的节点禁止s w 、n w 转弯;偶数列节点禁止e s 、e n 转向;禁止1 8 0 。转向( 反向转弯) 。u s 描述 了算法在m e s h 结构中的应用,并与x y 算法做了对比,通过仿真发现o e 算法 在性能上表现的更出色,该算法具有更好的自适应性。 1 7 影响一上嗍络性能的关键技术研究 2 3 4 流量控制 片上网络的流量控制包括拥塞控制和死锁控制两个方面。目前,对于网络通 信时出现的拥塞情况主要采用自适应的路由算法加以控制。自适应的路由算法面 对阻塞区域会重新选择一条负载较轻的路径路由,从而有效的避免阻塞。对于死 锁避免主要有:虚拟路径:将一条物理通道划分成多个独立的缓存队列逻辑通 道,数据在传送时相互独立,互不影响。路由方向控制:规定数据在路由时避 免做循环往返流动,这样保证了在每次路由之后,数据与目的节点的距离都在减 少。 2 3 5 通讯协议【2 9 】【3 9 计算机网络问的通讯必须依靠一定的通讯协议才能完成,像简单的请求应答 式的同步握手协议。n o c 借鉴了计算机网络的o s i 协议模型实现了自己的层次 化协议组。如图2 1 1 所示,协议组主要分为五层协议: 图2 1 ln o c 分层协议结构 ( 1 ) 物理层 物理层定义了各节点之间的连线数目长度以及信号时序电压等。全局连线就 是片上网络中通信信道的物理实现。 第一一章片上刚络相关技术婴点 ( 2 ) 数据链路层 数据链路层定义了节点之间的传输协议,从而确保物理连接之间信息的可靠 传输。功能就是促使信息在各节点之间准确无误的传输。由于相邻节点可能不是 工作在同一种模式,数据链路层除了进行数据的检错纠错外,还要考虑硬件的同 步问题。物理层与数据链路层均与所采取的工艺有关。 ( 3 ) 网络层 网络层的任务就是定义n o c 根据一个数据包的接收地址,如何将数据包从 源节点传送到目的节点。包括路由算法和交换方式的选择。其中路由算法分为确 定型算法和自适应型算法,交换方式分为电路交换和分组交换。 ( 4 ) 传输层 传输层的任务负责建立节点之间的连接和使用下层传输信息,包括在源节点 对信息的打包分组和在目的节点对打包的数据进行分包整合。 ( 5 ) 应用层 对于片上网络而言,计算机网络o s i 七层协议中的上三层可以合并到一层 即应用层。应用层的功能包括数据的同步与管理、接收端数据格式转换以及与应 用相关的一些功能等。 2 3 6n o c 性能评估因素 片上网络的性能评估因素有很多,包括吞吐率、时延、丢包率、链路利用率、 面积、功耗等,其中吞吐率和时延是性能的主要衡量因素。 ( 1 ) 吞吐率 吞吐率表明了单位时间内通过片上网络的数据流量【4 0 1 。定义为: 吞吐率= ( 数据包数木数据长度) ( 节点数木总时间) 片上网络的拓扑结构、路由算法、流量控制等因素都会影响吞吐率,吞吐率越大, 片上网络性能越好。 ( 2 ) 时延 片上网络的延时包括发送延时、转发延时、链路延时等【1 6 】。随着芯片规模的增 大,布线的增多,链路延时成了总延时主要部分。 1 9 影响片上m 络性能的关键技术研究 2 4 本章小结 片上网络解决了传统总线架构所遇到的扩展性差、全局时钟难统一、带宽利 用率低等问题,将是下一代电子产品趋势所在。本章首先介绍了片上网络的概念 并总结了片上通信方式的演变,接下来介绍了片上网络设计流程,并对设计时要 考虑的相关技术要点多了分析,包括拓扑结构、交换技术、路由算法、流量控制、 通讯协议等,最后介绍了片上网络的性能评估因素,所设计的片上网络产品要尽 可能的达到低延时和高吞吐率。 2 0 第- 二章拓扑结构的设汁 第三章拓扑结构的设计 传统s o c 共享总线结构,片上的连线随着功能模块的增多而急剧增长,这 带来的是芯片面积和功耗的极大浪费。片上网络拓扑结构可以有效降低连线数量 从而缩减芯片面积。由于i p 核之间彼此互连方式有很多种,所以片上网络的拓 扑结构也随之而异,例如之前介绍的m e s h 结构、环状结构、胖树结构等。拓扑 结构决定着片上布局、连线长度和复杂度,更重要的是影响着片上网络的吞吐率 和延时,从而决定着片上网络的性能。本文主要贡献之一就是研究了一种全新的 拓扑结构:广义的层次化完全互连结构( g e n e r a l i z e dh i e r a r c h i c a lc o m p l e t e l y c o n n e c t e dn e t w o r k s ,g h c c ) 。这种结构不管电路规模有多大,所有节点都有统 一的维度数,并且具有良好的扩展性、统一性和对称性。 本章接下来是对g h c c 结构和实现做重点介绍,并最后基于仿真验证这种 结构的可行性。 3 1 引言 前面介绍可知,片上网络每个资源节点都通过资源网络接口连接在一个通信 节点上。为了简化起见,现将每一对通信节点、资源节点合并为一个节点,称为 片上网络的节点。假定对于一不确定的拓扑结构,我们用公式g
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025医疗健康数据安全与隐私保护服务承揽合同
- 江西公务员面试题及答案
- 涉税业务知识培训课件
- 2025年工业互联网平台IPv6技术升级与智能制造融合部署报告
- 2025年教育行业质量评估与认证体系教育评价改革与发展研究报告
- 计量培训课件下载
- 2025年教育行业数字化招生策略与在线教育平台商业模式研究报告
- 幼儿培训简笔画课件
- 2025年环境监测物联网系统设计与数据安全保障报告001
- 新产程观察培训课件
- 《七大营养素》课件
- 国际道路旅客运输经营许可申请表
- (2023版)电信智家工程师认证必备考试题库大全(含解析)-下(判断题汇总)
- 超高层带伸臂结构巨型环桁架施工技术总结附图
- 2乳的验收与预处理解析
- 三峡大学级本科电气工程及其自动化二本培养方案
- 架桥机安装与拆除安全技术交底
- GB/T 19839-2005工业燃油燃气燃烧器通用技术条件
- 伤口造口新进展课件
- (完整版)人工智能介绍课件
- 预防校园欺凌-共创和谐校园-模拟法庭剧本
评论
0/150
提交评论