




已阅读5页,还剩133页未读, 继续免费阅读
(电路与系统专业论文)片上网络的建模仿真与性能优化研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 得益于半导体工艺和v l s i 设计技术的迅猛发展,嵌入式系统能够胜任越来越 复杂和高性能需求的工作。然而工艺尺寸的持续减小和嵌入式应用对带宽需求的增 加,使得传统总线式的片上通信架构面i 临着巨大的挑战。片上网络以其出色的扩展 性、灵活性和传输并行性等特点,受到广泛的关注,成为替代传统总线的新兴通信 架构。 片上网络具有多样化的拓扑结构、复杂的通信协议和众多的配置参数,构成了 巨大的设计空间。如何从中选择最适合的架构,是设计初期应解决的重要问题之一。 本文提出了一个适用于大规模设计空间搜索和参数优化的解析模型,它以m m i k 排队系统为基础,可应用于任意拓:t l 、结构,不仅计算了平均延迟和吞吐量等基本性 能信息,还可以分析各路由器中等待延迟的空间分布状况,能够快速定位拥塞区域。 该模型的创新点在于提出了一种基于路径分解的性能评估方法,它利用路由信息对 共享链路进行拆解和分类,分析和量化了虫孔交换中链路相关性对传输延迟的影响, 提高了建模精度。 解析模型基于统计方法和数学公式来分析网络行为,抽象层次高,运行速度快, 在处理静态的、可量化的系统参数方面具有较好的效果。但是,对于动态可配置的 架构、复杂的流控策略以及难以量化的因素,解析模型则较难处理,还需要借助于 精确度更高的仿真工具。本文设计了一款时钟精确的片上网络仿真器。它细粒度的 模拟了路由器的流水线结构和控制逻辑,不仅支持多虚通道的管理和分配、虫孔交 换方式、基于信用量的流控机制等通信技术,在网络规模、流量模式以及缓存大小 等参数配置方面也具有很好的灵活性。通过对不同参数的片上网络进行仿真分析, 可以看出拓扑结构、虚通道数目和缓存深度等因素对通信性能的影响,从而帮助设 计者优化互联架构和改善通信质量。 在对片上网络进行合理建模和精确模拟的基础上,本文提出了一种基于非均匀 带宽异构网络的吞吐量优化方法。通过分析影响网络吞吐量的关键因素,提出了基 于通信量和基于通道利用率两种不同的通信容量规划策略,在有限的连线资源下优 化通道带宽,提高通信性能。基于通信量的带宽分配方案只考虑了流量负载在不同 i 浙江大学博士学位论文 链路上的分布比例。基于通道利用率的方案使用了前面建立的n o c 解析模型,能够 兼顾通信量、链路依赖关系和资源利用率等多种因素,在预测拥塞位置方面表现更 好。为了实现不同位宽链路之间的数据匹配和交换,本文还设计了一款多端口路由 器,它采用非全连通的交叉开关以降低硬件开销。最后,仿真模型验证了非均匀带 宽异构网络在吞吐量改善方面的效果。 关键词: 片上网络,性能评估模型,路径分解方法,时钟精确仿真器,路由器架构,吞吐量 优化方法,非均匀带宽异构网络 i v a b s t r a c t a b s t r a c t e m b e d d e ds y s t e m sb e n e f i tf r o mf a s td e v e l o p m e n to fs e m i c o n d u c t o rt e c h n o l o g ya n d v l s id e s i g nm e t h o d o l o g i e s ,a n dt h e yi m p r o v eg r e a t l ya n ds t e a d i l yi np e r f o r m a n c et o m e e tt h en e e d so fc o m p l e xa n dc o m p u t a t i o n a l l yi n t e n s i v ea p p l i c a t i o n s h o w e v e r , t h ef a c t t h a tt h ed e v i c ef e a t u r es i z ei sc o n t i n u o u s l ys h r i n k i n ga n dt h eb a n d w i d t hr e q u i r e m e n t sa r e i n c r e a s i n g ,c h a l l e n g e st h et r a d i t i o n a lb u s b a s e dc o m m u n i c a t i o na r c h i t e c t u r e s n e t w o r k s o nc h i p ( n o c s ) h a v ee m e r g e da sap r o m i s i n ga l t e r n a t i v eb e c a u s eo ft h e i re x c e l l e n t s c a l a b i l i t y , f l e x i b i l i t ya n dt r a n s a c t i o n l e v e lp a r a l l e l i s m n o c sh a v ed i v e r s et o p o l o g i e s ,c o m p l i c a t e dc o m m u n i c a t i o np r o t o c o l sa n dv a r i o u s c o n f i g u r a t i o np a r a m e t e r s h o wt oc h o o s ea no p t i m a la r c h i t e c t u r e f r o mt h ee n o r m o u s d e s i g ns p a c ei sac o m m o n a n di m p o r t a n tp r o b l e mi nt h ee a r l yd e s i g ns t a g e s w ep r e s e n ta g e n e r a la n a l y t i c a lm o d e lf o rl a r g es p a c ee x p l o r a t i o n sa n dd e s i g no p t i m i z a t i o n s i t i s d e v e l o p e db a s e do nm m i i ( q u e u i n gs y s t e ma n d n o tl i m i t e dt oc e r t a i nt o p o l o g i e s i tc a n p r o v i d eu s e f u lp e r f o r m a n c ei n f o r m a t i o n ,i n c l u d i n ga v e r a g el a t e n c y , t h r o u g h p u ta n d w a i t i n gt i m ed i s t r i b u t i o ni nr o u t e r s b e s i d e s ,w ep r o p o s et h er o u t i n gp a t hd e c o m p o s i t i o n a p p r o a c ht oa n a l y z ea n dq u a n t i f y t h e i n f l u e n c eo fl i n kd e p e n d e n c i e so nl a t e n c y i t r e s o l v e st h ei n h e r e n td e p e n d e n c yo fs u c c e s s i v el i n k so c c u p i e db yo n ep a c k e ti nw o r m h o l e r o u t i n g ,a n di m p r o v e se v a l u a t i o na c c u r a c y a n a l y t i c a lt o o l s m o d e ln e t w o r kb e h a v i o r sb a s e do ns t a t i s t i c a lm e t h o d sa n d m a t h e m a t i c a lt h e o r i e s t h e yf e a t u r eh i g h l e v e lm o d e l i n ga n df a s te v a l u a t i o ns p e e d ,a n d a r eh e l p f u li na n a l y z i n gs t a t i ca n dq u a n t i t a t i v ep a r a m e t e r so fw e l l d e f i n e ds y s t e m s o n t h eo t h e rh a n d ,a c c u r a t es i m u l a t i o nt o o l so u t p e r f o r mi nm e a s u r i n gd y n a m i ca n d q u a l i t a t i v ef a c t o r so fc o m p l e xs y s t e m s w ep r e s e n t ac y c l e a c c u r a t en o cs i m u l a t o r , w h i c h e m u l a t e st h ep i p e l i n es t a g e sa n dc o n t r o ll o g i ci nr o u t e r sa taf l i tl e v e l i tp r o v i d e sg o o d s u p p o r t sf o rv a r i o u sc o m m u n i c a t i o nt e c h n i q u e s ,s u c ha sv i r t u a lc h a n n e lf l o wc o n t r o l , w o r m h o l er o u t i n g ,c r e d i t b a s e df l o wc o n t r o l ,e t c t h e s i m u l a t o ri sf l e x i b l ei n c o n f i g u r a t i o n s a n dc a ne v a l u a t ea s s o r t e dt o p o l o g i e s ,t r a f f i cp a t t e r n s a n dr o u t e r v 浙江大学博士学位论文 a r c h i t e c t u r e s e f f e c t so ft h e s ep a r a m e t e r so nc o m m u n i c a t i o np e r f o r m c ec a nb er e v e a l e d i n t u i t i v e l yt h r o u g hs i m u l a t i n gn o c sw i t hd i f f e r e n tc o n f i g u r a t i o n s a ss o ,t h es i m u l a t o ri s au s e f u lt o o l f o r d e s i g n e r s i n o p t i m i z i n gi n t e r c o n n e c ta r c h i t e c t u r e sa n di m p r o v i n g c o m m u n i t i o nq u a l i t y e q u i p p e dw i n lt h ea n a l y t i c a lm o d e la n dt h ea c c u r a t es i m u l a t o r , w ed e s i g na t h r o u g h p u to p t i m i z a t i o na p p r o a c hb a s e do nn o n u n i f o r ml i n kc a p a c i t ya l l o c a t i o n w ef i r s t a n a l y z et h ek e yf a c t o r sw h i c hi n f l u e n c en o ct h r o u g h p u t ,a n dp r o p o s et w om e t h o d so f c h a n n e lb a n d w i d t hp l a n n i n g ,o n ei sb a s e do nt r a f f i cv o l u m e ,a n dt h eo t h e ri sb a s e do n c h a n n e lu t i l i z a t i o nd e r i v e db yt h ea n a l y t i c a lm o d e l a l l o c a t i o nb a s e do nt r a f f i cv o l u m e o n l y c o n s i d e r sw o r k l o a dd i s t r i b u t i o n ,w h i l et h es o l u t i o nb a s e do nc h a n n e lu t i l i z a t i o nt a k e s r e s o u r c eu t i l i z a t i o na n dl i n kd e p e n d e n c yi n t oa c c o u n ta sw e l la st h ew o r k l o a d t h e r e f o r e , t h el a t t e rp e r f o r m sb e t t e ri nl o c a t i n gc o n g e s t i o n w ep r e s e n tam u l t i - p o r tr o u t e rt oc o n n e c t l i n k so fd i f f e r e n tb a n d w i d t h i te m p l o y sl i m i t e d - c o n n e c t e dc r o s s b a rt or e d u c eh a r d w a r e c o s t i m p r o v e m e n to nt h r o u g h p u to fo u rp r o p o s e dh e t e r o g e n e o u sn o ci sv a l i d a t e db y s i m u l a t i o nr e s u l t s k e yw o r d s : n e t w o r ko nc h i p ;p e r f o r m a n c ee v a l u a t i o nm o d e l ;r o u t i n gp a t hd e c o m p o s i t i o n m e t h o d ;c y c l e a c c u r a t es i m u l a t o r ;r o u t e ra r c h i t e c t u r e ;t h r o u g h p u to p t i m i z a t i o n a p p r o a c h ;h e t e r o g e n e o u sn o c 、析t hn o n - u n i f o r ml i n kc a p a c i t y v i 致谢 致谢 在我的学业生涯中,尤其是在攻读博士学位的六年期间,得到了许多人的帮助 和鼓励,在此对他们表示由衷的感谢。 首先感谢严晓浪教授多年来对我的教育和指导。他作为超大所的负责人,为研 究所的发展倾注了多年的心血,为我们创造了良好的学习平台和科研环境。严老师 扎实稳固的专业基础,广阔开放的研究视野,高屋建瓴的思想,以及对国家i c 产业 发展的责任感,都使我受益良多。 感谢潘赞老师、张宇宏老师、沈海斌老师,他们严谨治学的态度和勤勉的工作 精神一直影响着我,也激励着我努力学习,不敢懈怠。他们在项目上给过我细致的 指导,无私的传授了他们的经验和积累。 感谢超大所的老师们,在你们的辛勤耕耘下,我们才有了良好的学习环境和丰 富的学习资源,能够顺利的进行学习和科研。 感谢我的师兄师姐,全励、李德贤、彭剑英、李磊、陈华锋,他们在生活和学 习上都给过我很多热心的帮助。感谢我的同学胡琛、陈孟儒、蒋辉,和他们合作的 项目中使我受益颇多。还有我的师弟师妹们,薛念,李源深,颜晓峰,万民永,马 斌,王一木等等,这里充实而愉快的生活令我终生难忘。 感谢我的室友倪娟、康雯、朱钰、明朝燕,和他们度过了非常快乐的大学生活, 大家的欢声笑语是我们辛苦学业中的点缀。感谢所有关心我的朋友们,谢谢你们的 支持。 最后,衷心感谢我的父母和哥哥,他们时刻牵挂着我,在远方为我祝福。在艰 难困苦的时候,是你们的默默支持和鼓舞让我充满希望,是你们无私的付出成就了 今天的我。我对你们的感激之情无法用言语描述。 i i 浙江大学博士学位论文 图目录 图目录 图1 1m p s o c 系统与n o c 互联2 图1 2i n t e l4 8 核处理器架构3 图2 1 总线架构与环形网络架构的拓扑结构1 2 图2 2 由1 6 节点构成的不同维度网络的拓扑结构1 3 图2 3 网络适配器抽象结构图1 5 图2 4 路由器的不同组织结构1 7 图2 5 不同深度的路由器流水线结构1 8 图2 6 数据包在不同延迟段的分布情况以及平均延迟比较2 1 图2 7 稳定网络与不稳定网络的吞吐量变化曲线2 2 图2 8 服务质量等级与资源利用效率的关系2 5 图2 9 五种n o c 架构的面积开销对比2 7 图2 1 0n o c 拓扑结构示意图2 7 图2 1 1 线性投入特性下的设计复杂度3 1 图2 1 2 线延迟和门延迟的比值随工艺变化趋势3 3 图3 1 自相似随机过程与平稳随机过程3 8 图3 2 丢弃流控机制下三级b u t t e r f l y 网络的丢包概率3 9 图3 3 排队系统的服务台结构4 0 图3 4 端到端的传输路径所组成的排队系统4 1 图3 5n o c 常用的交换方式4 3 图3 6 虫孔交换网络中的链路相关性4 6 图3 7 路径分解方法的简单示例5 0 图3 8 解析模型的建模流程框图5 2 图3 9 以链路为中心的排队模型及其延迟参数5 3 图3 1 0 支持多虚通道的解析模型5 7 图3 1 1 数据包平均延迟随注入速率的变化曲线及解析模型的相对误差6 0 图3 1 2 热点( 1 ,0 ) 、( 2 ,2 ) 与均匀模式下的延迟变化曲线6 2 x t 浙江大学博士学位论文 图3 1 3 均匀与热点模式下的通道传输延迟分布图6 3 图3 1 4 路由器( 3 ,1 ) 处使用虚通道结构而引起的延迟变化情况6 5 图4 1 应用与架构分离,计算与通信分离6 8 图4 2n o c 的应用层抽象模型6 9 图4 3 路由交换器的结构框图7 1 图4 4 不同结构的路由器流水线7 2 图4 5 路由器内部的资源竞争现象7 3 图4 6 基于信用量的流控机制中切片与信用量的传递流程7 5 图4 7v cn e t 的代码组织结构7 7 图4 8 路由器、数据源节点和目的节点的连接关系7 7 图4 9 软件利用串行模拟并行和实际硬件并行的区别7 9 图4 1 0v cn e t 的控制流程与数据流向8 0 图4 1 1 虚通道仲裁和输出端口仲裁组成的交换分配步骤8 1 图4 1 2 数据包的延迟参数随负载流量的变化曲线8 4 图4 1 3 不同的虚通道结构下延迟参数随负载流量的变化曲线8 5 图4 1 4 缓存等待时间的空间分布情况8 7 图4 1 5 多虚通道结构下各虚通道的等待延迟分布情况8 8 图4 1 6 不同虚通道结构下源节点缓存的延迟分布对比8 8 图4 1 7 不同虚通道架构下延迟抖动的概率分布情况8 9 图5 11 6 个节点构成的不同拓扑结构中的对分通道9 3 图5 2 不同流量模式下m e s h 架构中各链路的负载比例9 5 图5 3 自适应路由算法的通信路径9 7 图5 4 通信架构的实际吞吐量的影响因素:9 7 图5 5 单一通道与多虚通道流控机制的比较9 9 图5 6 切片与信用量形成的闭合往返旅程9 9 图5 7 基于通信量的分配策略在8 x 8m e s h 架构中的应用示例1 0 1 图5 8 基于通信量的带宽分配策略流程图一1 0 3 图5 9 基于通道利用率的带宽分配方案流程图1 0 4 图目录 图5 1 0 增加链路带宽对排队系统的影响1 0 5 图5 1 1 基于通道利用率的分配策略在8 8m e s h 架构中的应用示例1 0 6 图5 1 2 基于端口划分的路由器架构1 0 7 图5 1 3 使用数据选择器实现的4 5 交叉开关1 0 8 图5 1 4 大规模交叉开关拆分为两个小规模交叉开关1 0 9 图5 1 57 x 5 交叉开关的内部互联结构1 0 9 图5 1 6 以输出方向为仲裁对象的交换分配策略1 1 0 图5 1 7m e s h 与t o r u s 网络的实际吞吐量与理想吞吐量比较1 1 2 图5 1 8 非均匀链路带宽分配方案所得的异构网络1 1 3 图5 1 9 三种非均匀带宽异构n o c 的延迟变化曲线与吞吐量1 1 3 图5 2 0 均匀m e s h 、t o r u s 与三种非均匀带宽架构的连线资源比较11 4 图5 2 1 热点模式下两种带宽分配方案所得的异构网络1 1 5 图5 2 2 均匀m e s h 架构与两种非均匀带宽异构网络的延迟变化曲线1 1 6 浙江大学博士学位论文 表目录 表2 1 总线架构与n o c 的优缺点1 3 表2 2 多级a m b a 总线与x p i p e s n o c 架构的功耗与能耗比较2 9 表2 3n o c 各组件的功耗开销比例3 0 表3 1 网络和模型参数的符号及其含义4 9 表4 1 不同抽象层级的通信行为7 0 表4 2 下游虚通道的状态标志8 1 表4 3 基于体切片优先和最长等待时间的虚通道分配算法8 2 表5 1n e d 流量模式下节点( 0 ,o ) 的发送概率分布9 4 1 绪论 1 绪论 1 1 研究背景 随着半导体工艺的发展,集成在单个芯片上的晶体管数目达到1 0 亿的数量级【l j , 使i c 设计师能够在单个芯片上集成数十到上百个i p 单元,显著的提高了片上系统 ( s y s t e m o n c h i p s o c ) 的性能和丰富了其功能。集成电路设计和制造技术的进步, 促使了嵌入式系统从计算能力到通信能力都有了大幅的提升。其中,在计算能力方 面从采用主频不断提高的单核处理器转变到采用规模越来越大的多处理系统 ( m u l t i p r o c e s s i n gs o c 。m p s o c ) ;在通信能力方面从传统共享式总线转变到片上网 络( n e t w o r k o n c h i p ,n o c ) 。这些技术都为嵌入式系统的设计带来了巨大的变革。 在嵌入式系统中,计算任务和通信任务有着密不可分的关系,计算单元的通信需求 也直接影响了通信架构的选择。 1 1 1 嵌入式系统的通信需求 据研究预测圈,从2 0 0 9 年到2 0 1 4 年,嵌入式系统的市场份额将增长3 倍。嵌 入式系统运行于各式各样的电子设备中,形成了广阔的应用领域,主要包括消费类 电子、通信、工业控制、交通、医疗、军事国防等 3 1 。随着嵌入式系统的普及,人 们对它的性能、功耗和成本等提出了更高的要求。特别是伴随着多媒体实时应用和 互联网技术的迅速发展,计算密集型和数据密集型应用给嵌入式系统的设计带来了 新的挑战。 在2 1 世纪初期,嵌入式系统的典型结构仍然由单一处理器和多个i p 单元组成, 模块之间的通信任务由共享式总线承担,如a m b a a x i 、w i s h b o n e 以及c o r e c o n n e c t 等。在最初的m p s o c 架构中,总线和专用互联线仍然是主流的片上通信架构。针 对数据电视应用的p h i l i p sn e x p e r i a 系列- 心1 4 - 片 4 】使用了三组独立的总线,并通过桥接 模块在不同处理器之间交换数据;针对手机多媒体应用的s tn o m a d i k 架构【5 使用 a m b a 总线来连接多个处理器;同样是针对手机视频应用的t io m a p 系列芯片 6 】 则使用了专用互联线和邮箱在四个处理器之间通信。以上系统虽然使用了m p s o c 浙江大学博士学位论文 架构,但是处理器数目较少,对通信的并行性要求不高,共享总线仍然能够满足它 们的通信需求。 2 0 0 5 年,索尼、i b m 与东芝联合开发的c e l l 处理器【7 】问世。c e l l 处理器集 成了一个主控处理器和8 个高速协处理器,并通过环状网络彼此相连,其工作频率 可达到4 g h z 以上,计算能力约为2 5 6g i g a f l o p s ,是名副其实的高性能m p s o c 系统。 c e l l 处理器摒弃了传统总线的通信架构,因为共享总线的独占传输方式大大限制 了数据交换的速度,成为提升系统性能的瓶颈。可见随着m p s o c 系统规模的增加, 并行计算能力大幅提高,对数据传输的并行性和通信带宽都提出了更高的要求。而 传统总线的通信容量和通信方式已不能满足m p s o c 的需求,n o c s 替代共享总线是 嵌入式系统架构发展的必然结果。 在规模较大的m p s o c 系统中,网格状n o c 是最为常用的互联方式。例如,t i l e r a 公司研发的t i l e 6 4 处理器【8 】集成了6 4 个相同的计算单元,以8 x 8 阵列布局,通信 链路由五个独立的数据通道构成,为高性能需求应用提供了充足的带宽。t r u o n g ,d n 等人设计的1 6 7 核计算平台9 1 面向嵌入式应用,它集成了若干个异构处理器,使用 可重构的非对称网络来提供高吞吐量、低成本和低功耗的通信服务。p h i h u n gp h a m 等人设计的6 4 核r i s c 处理器平刨1 0 1 采用了f o l d e d t o r u s 互联方式,通信架构占总 芯片面积的9 4 ,消耗1 8 的总功耗,提供了4 4 6g b s 的对分通道带宽。 图1 1m p s o c 系统与n o c 互联 图1 】展示了v a n g a l 等人设计的一款8 x 1 0 阵列的m p s o c 系统1 1 1 ,每个计算节 点都和一个路由器相连,数据通过路由器进行转发和传递。路由器在每个处理单元 中占据了大约1 7 的面积。整个系统的工作频率能够达到4g h z ,而n o c 架构提供 了2t e r a b i t s s 的通信带宽,是传统总线所无法比拟的。 图1 2 为i n t e l 设计的一款4 8 核通用处理器架构1 2 】,它采用6 x 4 的m e s h 网络作 2 1 绪论 为通信架构,每两个处理器共享一个路由器。路由器采用虚拟直通的交换方式1 3 】, 系统工作频率为2g h z ,n o c 的对分通道带宽为2 5 6g b s 。 v o l t a g e r e g u l a t o r c o n t r o l l e r ji e f ,7 l 2 $ 1 c o r e l 2 5 8 k r 灞糯一j m p e j ll l 2 $ 1 | jc o , e o 2 , 5 6 k 卜 卜 1r 图1 2i n t e l4 8 核处理器架构 综上所述,m p s o c 系统大多采用结构简单的计算单元,因而能够取得较高的工 作频率;另一方面,多处理架构从硬件层面到软件层面都支持高度的计算并行性, 因而对通信架构的容量和带宽都提出了很高的要求。特别是规模较大的m p s o c 系 统集成了越来越多的计算单元,不仅增加了通信量,也提高了数据冲突和资源竞争 的概率。n o c 架构能够支持各种粒度的数据并行传输,并提供了高效的通信传输协 议和资源调度策略,和m p s o c 系统具有良好的契合度。总之,多处理架构与n o c 的有机结合,促使了嵌入式系统在性能上整体提升。 1 1 2n o c 的优势 在2 0 0 1 年的d a c 会议上,s t a n f o r d 大学的w i l l i a mj d a l l y 教授提出n o c 的概 念,阐述了规则网络相比于全局专用互联线在电气特性、传输性能和设计复杂度等 方面都具有明显的优势,更加适合于模块化的设计方法 14 1 。h e n k e l 等人也认为,n o c 是一种具有良好可扩展性和灵活性的通信架构”】,它能够充分发挥设计单元的可重 用性,有助于缩小设计生产效率和芯片可用容量的差距【1 6 】。 从系统层面来看,n o c 促进了模块的封装和重用,有助于清晰、规则的设计和 实现大规模s o c 。在模块化的设计方法学中,定义良好的接口和可重用的设计单元 浙江大学博士学位论文 大大降低了大规模s o c 的设计复杂度,提高了设计者的生产效率。n o c 使用较短的 互联线和规则的布局,将系统划分为界限清晰、相对独立的各个模块单元。如果这 些模块设计完善,不仅门级的逻辑单元,高层的编程模型或者底层的物理版图都可 以被重用,为s o c 设计提供了更为快捷简单的途径。 从物理层面来看,随着工艺进入深亚微米级,器件的特征尺寸持续减小,线延 迟在整体延迟中所占比例越来越大,成为影响系统性能提升的限制因素之一【1 7 】。使 用全局长连线的通信架构( 如总线) 只能通过降低工作频率、或在传输线上插入中 继器来维持信号的完整性。另一方面,不规则连线的互扰和寄生电容等参数在设计 早期难以估计,会引入不可预测的电气特性,影响电路优化。n o c 架构则克服了这 些缺点。除了时钟树和电源布线之外,模块单元之间都使用长度一致的互联线。设 计者能够把不确定和不规则的因素都限制在模块单元内部,顶层架构全部采用规则 布局和分段互联方式,为信号传输提供了良好的可预测性。 除了规则布局的优势,n o c 架构也具有很高的灵活性,为设计者提供了广阔的 设计空间。a j e r r e g a a r d 等人借鉴宏观网络的o s i 模型为n o c 建立了一个简单的分层 模型【1 8 】,它包括系统层、网络适配层、网络层和物理层等。系统层涉及到抽象模型、 设计方法学、架构组成及流量特征等方面;网络适配层将计算单元与通信架构隔离, 并在二者之间管理通信服务;网络层描述了数据包层面的通信行为,包括拓扑架构、 传输协议及流控机制等参数的选择;物理层定义了通信链路的具体实现。n o c 架构 在各个层面都涵盖了丰富的内容,为s o c 设计提供了多样化的实现策略。 总之,n o c 架构提供了真正意义上的以通信为中心的互联方法,在多个层面实 现通信任务和计算任务的分离,促进了s o c 模块化设计和可重用性设计的发展。相 比于传统共享总线,n o c 架构具备了高性能、扩展性强和灵活性好等优点,为大规 模s o c 中提供了更大的通信容量和更好的通信服务。 1 1 3n o c 面临的挑战 基于网络的通信互联在许多领域中已有广泛且成熟的应用,如生物系统、计算 机系统和电子系统等各种规模较大的复杂系统。网络型架构凸显了模块化设计的优 势,有助于控制整体设计的复杂度,使顶层互联更加清晰和简洁。显然n o c 也属于 这一类互联方式,所以它可以借鉴其他系统中积累的一些经验、模式和研究方法, 4 1 绪论 特别是片间网络( o f f - c h i pn e t w o r k ) 。但是n o c 架构和片间网络在需求、成本和实 现方面都存在较大的差异,后者的设计方法并不能完全照搬到n o c 中。例如,在 n o c 中模块间的数据带宽不会像片间网络一样受到芯片周围管脚数目的限制,在连 线资源方面比片间网络丰富得多;n o c 内部面积有限,不能像片间网络一样配备独 立和大容量的存储模块。此外,片间网络的通信协议复杂,传输延迟较长,功耗开 销也高,而n o c 在面积、功耗和设计复杂度方面却受到严格的限制,很多片间网络 的设计模式并不适用于n o c 。 因此,设计者需要一套针对n o c 特征而开发的设计方法学,以充分利用n o c 提供的丰富资源,并合理考虑它的限制因素。例如,系统层的流量模型能够帮助设 计者分析计算任务的通信需求和数据特征;网络适配层的标准接口有助于设计者封 装和重用各种模块,实现不同单元的无缝衔接等;网络层的通信模型提供了参数化 的具体实现架构,以便设计者针对既定目标进行筛选和优化。 m a r c u l e s c u 等人总结了n o c 的主要研究领域,包括应用特征的提取抽象、高层 模型的优化分析、底层架构的设计实现、以及解决方案的综合评估等【1 9 】。在n o c 设 计过程中,设计者在系统平台、逻辑电路到版图实现的各个步骤都面临优化和折中 的选择。其中设计空间由不同的通信协议和网络架构组合而成,限制条件则主要取 决于应用需求和成本开销,在诸多因素的影响下,n o c 设计是一个多元化问题,仍 然存在着许多未知解。 1 2n o c 研究现状 n o c 技术从提出至今已有十多年的时间,国内外在n o c 的相关领域和各个层面 都展开了广泛且深入的研究。一些比较著名的n o c 项目包括m i t 大学的r a w 网络 【2 0 1 、p h i l i p s 公司的 t h e r e a l 网络 2 1 1 、k t h 大学的n o s t r u m 网络【2 2 1 、g u e r r i e r 等人提出的s p i n 架构吲、m a n c h e s t e r 大学的c h a i n 网络、b j e r r e g a a r d 等人提出 的m a n g o 网络【2 5 】以及j a l a b e r t 等人提出的x p i p e s 网络【2 6 】等。其中c h a i n 和x p i p e s 介绍了基于平台的设计方法学,在特定应用背景下进行异构网络的定制设计; t h e r e a l 、n o s t r u m 和m a n g o 在基本的设计框架内实现了更为复杂的通信 功能,如服务质量保证、容错纠错、自动化设计等;s p i n 网络基于f a tt r e e 架构, 浙江大学博士学位论文 采用无阻塞的网络交换机制以实现稳定的通信性能。这些n o c 项目介绍了相对完整 的设计方法学和切实可行的设计方案,对n o c 的设计实现有着重要的指导意义。 在自顶向下的设计方法学中,系统建模是设计初期的重要步骤之一。在n o c 的 设计、集成和验证流程中,针对不同抽象层次和不同应用背景的通信模型都起着重 要的作用。它们不仅在整体上揭示了系统参数的内在联系,还可以为设计者提供不 同模块和不同粒度的实现细节。另一方面,通信组件和计算组件在设计过程中也应 当遵循分离原则 2 7 1 ,通信架构在设计验证和性能评估方面具有相对的独立性,所以 开发专用的通信模型是有必要的。 n o c 模型可以分为两大类,一是仿真模型,二是解析模型,仿真模型可以根据 设计者的需要模拟不同粒度的架构细节,建模结果相对精确;而解析模型的抽象层 级高,分析速度快,它剔除了不重要参数的干扰,能够有效提高大规模的迭代优化 和空间搜索的效率,在系统设计的早期阶段尤为常用。 网络架构及其应用具有悠久的研究历史,在数学建模方面也有完善的理论分析 方法,包括图论,随机过程,排队系统等。这些模型和方法为设计者分析和量化网 络架构和通信行为提供了坚实的数学基础 2 8 】,例如很多解析模型都是利用统计公 式、排队系统和图论等方法来分析网络行为。此外,在宏观网络和并行计算领域中 使用的设计和评估方法【2 9 - 3 1 1 也逐渐被应用在n o c 中。 针对不同的网络架构和应用特征,已有不少基于解析模型的n o c 性能评估方法 被提出 3 2 - 3 4 。m o a d e l i 等人利用前人针对宏观网络的建模方法 2 9 】分别为m e s h 和 s p i d e r g o n 架构建立了基于排队系统的性能评估模型【3 5 ,3 6 1 。h u 等人为了对路由器的 缓存容量进行优化,提出了一个面向存储转发和虚拟直通交换机制的解析模型【37 1 。 o g r a s 等人设计了一个适用于任意拓扑结构的路由器模型,它为n o c 的优化过程提 供了平均延迟、缓存利用率以及饱和吞吐量等参数,能够快速的评估网络的通信性 能【3 8 】。m o r a v e j i 等人使用d u a t o 设计方法学为使用自适应路由的非规则网络设计了 一个基于概率统计的数学模型 3 9 1 。d u a t o 方法使用了两种相互独立的虚通道类别, 一是为自适应路由算法而设计,二是为避免死锁而设计。为了求解端对端延迟,该 模型需要计算从源节点到目的节点的消息经过特定虚通道的概率,计算过程较繁复。 s a r b a z i a z a d 等人为使用确定性路由的超立方体网络( h y p e r c u b e ) 建立了一个数学 l 绪论 模型,它合理分析了虚通道多路复用的传输方式对网络性能的影响4 0 1 。 和解析模型相比,仿真模型的精确度更高,能够模拟更复杂的网络行为,但是 细粒度的仿真过程要花费较长时间。n o c 和宏观网络在通信行为上非常相似,所以 一些通用的网络仿真器也可以应用于n o c 领域【4 1 ,4 2 1 ,如为电信网络设计的o p n e t 仿真器4 3 1 ,为宏观网络设计的n s 2 仿真器】,以及为并行计算领域而设计的r s i m 工具 4 5 1 。专门为n o c 架构而开发的仿真器有w o r ms i m 4 6 1 、n o c s i m 4 7 1 、p o p n e t 4 8 】 以及n i r g a m 4 9 1 等。大多数仿真工具在网络参数配置方面都提供了一系列可选项, 包括网络规模、拓扑结构、路由器的缓存大小和流量模式等。此外,有些工具不仅 支持基本的仿真功能,还提供了评估、综合、和优化等更复杂的操作。例如c o s i 工具【5 0 】能够根据性能指标从库单元中选择合适的模块来组建n o c 网络;n e t c h i p 平 台酬使用x p i p e s 网络提供的库单元进行拓扑架构的映射和评估;o r i o n 工具【5 2 1 能够 分析n o c 架构的功耗和面积,常嵌入在时钟精确的仿真器中来评估系统功耗。 性能评估模型常用于n o c 的设计空间搜索和参数优化过程【5 3 ,5 4 1 ,在耗时较长的 迭代算法中解析模型更为常用。因为解析模型的运算速度快,而且参数对网络性能 的影响更加直观。王坚等利用基于排队系统的路由器模型来对计算平均延迟,并据 此对路由器缓存进行合理分配 5 5 1 。赖明澈等使用路由器解析模型来提高任务映射的 优化效率5 6 1 。a 1f a r u q u e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年人工智能工程师高级笔试模拟题与解析
- 粮食烘干厂管理办法
- 2025年护士执业资格考试题库有答案分析
- 职业病防治培训考核试题(含答案)
- 2025年供销社农资行业专业知识模拟试题及解答参考
- 衢州甲类仓库管理办法
- 2025年乡村规划师初级必-备知识及面试模拟题答案详解
- 2025年中央空调系统操作员考试指南
- Unit 2 It describes the changes in Chinese society.教学设计-2025-2026学年初中英语外研版2012八年级上册-外研版2012
- 国企社会招聘笔试题及答案-会计、出纳B卷
- GB/T 34487-2017结构件用铝合金产品剪切试验方法
- GB/T 31703-2015陶瓷球轴承氮化硅球
- 绿色黑板卡通风初中数学开学第一课PPT模板
- 水泥熟料生产工艺及设备课件
- 代运营协议合同范本
- 浙美版美术三年级上册全册教案
- 座位表模板(空白)
- 部编版高一语文必修上册教学计划
- 青岛版六三制四年级上册数学1万以上数的认识和读法教学课件
- DB37T 3591-2019 畜禽粪便堆肥技术规范
- 私企接待应酬管理制度(3篇)
评论
0/150
提交评论