(电工理论与新技术专业论文)可配置可监测noc原型平台的研究.pdf_第1页
(电工理论与新技术专业论文)可配置可监测noc原型平台的研究.pdf_第2页
(电工理论与新技术专业论文)可配置可监测noc原型平台的研究.pdf_第3页
(电工理论与新技术专业论文)可配置可监测noc原型平台的研究.pdf_第4页
(电工理论与新技术专业论文)可配置可监测noc原型平台的研究.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(电工理论与新技术专业论文)可配置可监测noc原型平台的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

r e s e a r c ho nt h ec o n f i g u r a b l ea n dm o n i t o r e dn o c p r o t o t y p e p l a t f o r m a b s t r a c t w 池t h ed e v e l o p m e n to fi n t e g r a t i o ns c a l e ,d e s i g n so fb u sb a s e do ns y s t e m - o n - c h i pi s c o n f r o n t i n gs o m ed i s a d v a n t a g e s ,s u c ha sp o o rs c a l a b i l i t y , l o w e rc o m m u n i c a t i o ne f f i c i e n c y a n das i n g l ec l o c ks y n c h r o n i z a t i o n ,e t e i no r d e rt os o l v et h e s ep r o b l e m s ,an e wo nc h i p s t r u c t u r e ,n e t w o r k o n - c h i p ( n o c ) ,i sp r o p o s e d ,a n db e c o m e sam a i n s t r e a md e s i g n t e c h n o l o g yf o r t h en e x tg e n e r a t i o ni n t e g r a t e dc i r c u i tg r a d u a l l y 1 1 1 ec o n f i g u r a b l ea n d m o n i t o r e dn o cn o to n l yi n h e r i t st h ea d v a n t a g e so ft h ec o m m o ns t r u c t u r eo fn o c ,b u ta l s o g r e a t l yi m p r o v e st h ef l e x i b i l i t ya n dc o n t r o l l a b i l i t yo ft h en o cs y s t e m s w er e s e a r c ht h e n o cp r o t o t y p eb a s e do nt h et w o - d i m e n s i o n a lm e s h , a n df o c u so nt h ec o m m u n i c a t i o n a r c h i t e c t u r eo fn o c an e wc o n f i g u r a b l en o ca r c h i t e c t u r ei s p r o p o s e d ,a n d i tc a n i m p l e m e n to n - l i n ec o n f i g u r a t i o no ft h en o cc o m m u n i c a t i o nn e t w o r k ,i n c l u d i n gt h et e r m s o ft h ed e p t ho fi n p u tb u f f e r s ,r o u t i n ga l g o r i t h ma n da r b i t r a t i o na l g o r i t h mi no u t p u tc h a n n e l s a ni n t e l l i g e n tm o n i t o r i n gs y s t e mf o rn o ci sa l s od i s c u s s e d i ti su s e dt oe v a l u a t et h e c o m m u n i c a t i o np o r f o n n a n c co ft h en o c p r o t o t y p eu n d e rt h ef i n i s h e dc o n f i g u r a t i o n 1 f l l e t w op e r f o r m a n c ep a r a m e t e r sa r ea v e r a g et h r o u g h p u tr a t ea n da v e r a g ep a c k e td e l a y a e o n f i g u r a b l et r a f f i cg e n e r a t o rw a sd e s i g n e dt os u b s t i t u t et h ep r o c e s s o rc o r ef o re v a l u a t i o n t h ep e r f o r m a n c eo ft h en o cp r o t o t y p e ,w h i c hc a na c h i e v em o r eb e t t e re v a l u a t i o na n d v e r i f i c a t i o ne f f i c i e n c y 1 f 1 1 em a i n w o r ka n da c h i e v e m e n ta r ea sf o l l o w s : 1 r e s e a r c h e dt h ec o n f i g u r a b l ea n dm o n i t o r e dn o cp r o t o t y p eb a s e do nt h e t w o - d i m e n s i o n a lm e s h , a n df o c u s e do nt h eo n - l i n e c o n f i g u r a b i l i t y a n d o b s e r v a b i l i t yo ft h en o cc o m m u n i c a t i o na r c h i t e c t u r e 2 d e s i g n e dc o n f i g u r a b l en o c ,i n c l u d i n gc o n f i g u r a t i o n so ft h ed e p t ho fi n p u tb u f f e r s , r o u t i n ga l g o r i t h ma n da r b i t r a t i o na l g o r i t h mi no u t p u tc h a n n e l s 3 d e s i g n e dc o n f i g u r a b l et r a l j f i cg e n e r a t o r i tc a nb eu s e da s l o c a ln o d ef o rt h e e o n f i g u r a b l e a n dm o n i t o r e dn o cs y s t e mt oc o m p l e t et h ev e r i f i c a t i o na n d p e r f o r m a n c ee v a l u a t i o ne x p e r i m e n t s 4 v a l i d a t e dt h ed e s i g nb ye x p e r i m e n t 1 1 圮v e r i f i c a t i o ne x p e r i m e n tc o m p o s e so ft h r e e p a r t s ,t h o s ea r ev e r i f i c a t i o n so ft h ec o n f i g u r a t i o ns y s t e m ,t h em o n i t o rs y s t e ma n d t h ec o n f i g u r a b l en o c f p g av e r i f i c a t i o na n dm o d e l s i ms i m u l a t i o nw e r eu s e dh e r e w eu s e ds t r a t i xi ie p 2 s18 0f p g ao fa l t e r aa n dt h ed e s i g nr u na tt h e f r e q u e n c yo f5 0m h z 5 d e s i g n e dp e r f o r m a n c ee v a l u a t i o ne x p e r i m e n t sf o rt h ec o n f i g u r a b l en o c 2 w h e nt h ec o n f i g u r a b l et r a f f i c g e n e r a t o rw a sn o tc h a n g e ,c o m p a r e dt h e p e r f o r m a n c e so fn o c sw i t hd i f f e r e n tc o n f i g u r a t i o n ,a 8w e l la st h es a m e n o cw h e nt h et r a f f i cg e n e r a t o rw a s c o n f i g u r e dd i f f e r e n t l y k e y w o r d s :c o n f i g u r e ,m o n i t o r , t h en o cp r o t o t y p e ,t r a m cg e n e r a t o r , f p g av e r i f i c a t i o n , m o d e l s i ms i m u l a t i o n 3 插图清单 图1 1集成电路设计剪刀差1 图1 2基于2 维m e s h 结构的n o c 原型芯片系统结构图3 图1 3一般通讯节点结构示意图1 5 】【6 1 4 图2 1x y 路由算法传输示意图8 图2 2“死锁”的形成9 图2 3等待路径的最右端( a ) s n 通道( b ) n s 通道9 图2 4二维网络路由实例【1 1 j 1o 图2 5通讯节点示意图【3 】【5 1 1 1 图2 6可配置可监测n o c 原型平台的系统结构1 4 图3 1输入通道结构示意图。1 7 图3 2输出通道结构示意图1 8 图3 3配置系统的架构示意图。2 0 图3 - 4s o p cb u i l d e r 设计的用户界面。2 1 图3 5用户自定义模块与a v a l o n 总线模块的连接示意图2 2 图3 - 6配置参数位分配示意图2 2 图3 7输入配置参数编程模型2 4 图3 8 c o n fs i g n a l 模块与可配置n o c 网络接口信号示意图2 5 图3 - 9c o n fs i g n a l 模块寄存器结构示意图2 5 图3 1 0监测系统的架构示意图2 6 图3 1 l输出监测数据编程模型2 7 图3 1 2监测顶层模块与可配置n o c 网络的接口信号2 7 图3 1 3通讯节点0 0 与计算节点0 0 的接口信号2 8 图3 1 4时钟计数单元状态机2 9 图3 1 5延时监测模块架构图3 1 图3 1 6 c o n fi c 模块结构示意图3 2 图3 1 72 维m e s h 拓扑结构x y 路由算法伪码【1 7 】【5 】。3 2 图3 1 8x y 路由算法链路选择3 3 图3 1 9奇偶路由算法请求转换状态机图。3 5 图3 2 0 最小路径奇偶路由算法链路选择3 6 图3 2 l目的节点位于源节点西侧的链路请求3 6 图3 2 2目的节点位于源节点东侧的链路请求3 7 图3 2 3 c o n fo c 模块结构示意图3 7 图3 2 4八位线性反馈移位寄存器【l 引3 9 图4 1传输过程状态转移图4 3 图4 2报文内容控制状态转移图。4 4 4 图4 3 图4 4 图4 5 图4 6 图4 7 图4 8 图4 9 图4 1 0 图4 1 1 图4 1 2 图4 1 3 图4 1 4 图4 1 5 图4 1 6 图4 1 7 图4 1 8 图4 1 9 图4 2 0 通讯量发生器配置参数格式4 4 可配置可监测n o c 原型验证与实验的系统结构示意图4 6 在线输入配置参数示意图4 7 配置信号的值4 8 节点2 2 的e a s t 输入通道缓存器配置的部分信号波形图4 8 路由节点2 2 实现奇偶路由算法的部分信号波形图4 8 路由算法配置部分信号波形图4 9 r a m 存储的监测系统输出值4 9 在线输出监测值示意图5 0 实验4 1 1 注入率平均吞吐率图5 1 实验4 1 1 平均包延时注入率图。5 1 实验4 1 2 注入率平均吞吐率图5 2 实验4 1 2 平均包延时注入率图5 2 实验二注入率平均吞吐率图5 3 实验二注入率平均包延时图5 3 实验三注入率平均吞吐率图5 4 实验三注入率平均包延时图5 4 可配置可监测n o c 系统原型实验结果5 5 表3 表4 表4 表4 表格清单 从端口的a v a l o n 总线信号【16 1 16 可配置通讯量发生器端口信号4 1 s t r a t i xi ie p 2 s 1 8 0 器件部分资源概览2 2 1 4 5 通讯网络完成通讯的周期数5 0 6 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已经发表或撰 写过的研究成果,也不包含为获得 金目巴王些盘堂 或其他教育机构的学位或证书而使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示谢意。 学位论文作者签字池边签字吼冲年u 月抽日 学位论文版权使用授权书 本学位论文作者完全了解 金目垦王些太堂 有关保留、使用学位论文的规定,有权 保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅或借阅。本人 授权 金日巴工些态堂 可以将学位论文的全部或部分论文内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文者签名: 地调噜 i 签字日期:加f ,年月2 , o 日 学位论文作者毕业后去向: t 作单位: 通讯地址: 名:撅衫刮 签字日期:肋o 年年月2 , o 日 电话: 邮编: 致谢 在论文完成之际,我向所有在研究生学习期间给过我帮助与支持的老师和 同学表示感谢。 首先感谢高明伦教授,感谢他的悉心指导和一贯的鼓励支持。高老师不仅 学识渊博、治学严谨,而且待人诚恳、平易近人。他严谨认真的态度和高尚的 品德,是我学习的榜样。 感谢我的导师张多利副教授,感谢他在研究生期间给予我诚挚的指导和无 私的帮助。本论文是在张老师的悉心指导下完成的。近三年来,在项目实践过 程中,张老师给了我精心的指导,使我在专业学习上有了很大进步。衷心感谢 张老师的培养和教诲。 感谢杜高明老师、宋宇鲲老师和耿罗峰博士在项目实践和论文撰写过程中 所给予的指导和帮助。感谢杜老师在小论文写作过程中耐心指导与反复修改。 他们对工作认真负责的态度深深地感染了我。在此,我向他们表示由衷地感谢。 感谢与我一起奋斗的项目组成员:陈迎春、黄俊俏、肖福明、何莹莹和刘 艳同学,他们谦逊的学习态度和刻苦的钻研精神永远值得我认真学习。 感谢尹勇生老师、邓红辉老师、王晓蕾老师在课程上的指导。感谢已毕业 的师兄师姐以及2 0 0 7 级的全体同学在学习上的帮助。感谢林薇老师、贾靖华老 师、范月红、胡剑和木子一在生活上的关怀。 最后要特别感谢我敬爱的父母,感谢他们多年来对我的教育和培养之恩。 正是他们的支持和鼓励,使我能以最大的勇气和信心面对各种困难和挑战。 作者:温海华 2 0 1 0 年4 月 第一章绪论 1 1 集成电路设计技术的发展 集成电路设计效率的增长率总是滞后于芯片集成度的增长率,造成了芯片 集成度和设计效率之间著名的“剪刀差”( 图1 - 1 ) ,并且他们之间的差距还在继 续增大。随着电路规模越来越大,集成度越来越高集成电路设计遇到了设计 方法上的瓶颈问鼹。面对现有设计方法学的巨大挑战,提出了设计重用技术。 i p ( i n t e l l e c t u a lp r o p e r t y ) 是集成电路知识产权模块的简称,是集成电路重用设计 方法学的产物,对于减小剪刀差发挥着重要作用。l p 复用模型经历了从基于时 序驱动设计( t d d ) 和块的设计( b b d ) ,到系统芯片( s o c ,s y s t e m o n c h i p ) 设 计的演变2 ”。 图i - 1集成电路设计剪刀差 d 韩l p 帆t l v l l y s o c 设计技术始于2 0 世纪9 0 年代中期,随着半导体工艺技术的发展集 成电路( i c ) 设计者能够将愈来愈复杂的功能集成到单硅片上,s o c 正是在集成 电路向集成系统( i s ) 转变的大方向下产生的。它是a s i c ( a p p l i c 8 t i o ns p e c i f i c i n t e g r a t e dc i r c u i t s ) 设计方法学中的新技术,是指以嵌入式系统为核心,以i p 复用技术为基础,集软、硬件于一体,并追求产品系统最大兼容的集成芯片。 随着半导体工艺的进步和s o c 技术的不断完善,现在的s o c 中可包含一 个或多个处理器、存储器、模拟电路、数模混台电路以及片上可编程逻辑等i p 核【l i 。s o c 技术在我国取得了长足的进步,s o c 芯片已经在缀多领域得到了应 用。 基于片上总线的s o c 设计技术解决了大规模集成电路的设计难点,但是 片上总线的应用带来了可扩展性差、平均通讯效率低和单一时钟同步等问题【2 】。 为了使s o c 苍片能够在深亚微米效应下正确工作,s o c 中各物理模块在芯片上 的相对位置是一定的,总线和时钟网络以及其它全局信号走线都是针对应用设 计的。但是纠正设计错误或增加某个功能模块可能会打乱原来的物理布局,新 的物理布局可能导致必须重新设计新的系统,从而约束了s o c 设计的可扩展性。 l 总线结构的s o c 设计中,在一个时间段内只能有一个功能模块独占总线,由于 一个模块控制总线通信时,系统中其他模块必须等待,直到得到总线控制权, 所以系统平均通信带宽非常低。总线结构要求全局同步,但随着工艺特征尺寸 越来越小,工作频率迅速上升,连线延时造成的影响将严重到无法设计全局时 钟树的程度,而且由于时钟网络的庞大,其功耗将占据芯片总功耗的大部分, 所以由单一系统时钟同步全芯片的工作将极其困难【2 j 。并且随着处理器的增多, 这种以嵌入式微处理器为核心而设计的s o c 芯片体现出的以上问题也越来越严 重。 因此,一种全新的片上互连结构片上网络( n o c ,n e t w o r k o n c h i p ) 开始受到关注,并逐渐发展成为集成电路下一代主流设计技术。由于 基于n e t w o r k 的分布式计算机系统是目前为止性能最好的计算机【5 】,按照“计 算机参考系准则”【3 j 的精神,将n e t w o r k 移植到集成电路体系结构中来,以提 高可扩展性和片上通讯效率并解决单一时钟同步等问题。因此提出基于 n e t w o r k 的多核系统,即n o c 技术。 1 2n o c 技术的简介及优势 n o c 是一种全新的片上系统设计方法。它可以定义为在单一芯片上实现 的基于网络通讯的多处理器系统。n o c 包括计算和通讯两类节点,计算节点( 又 称资源) 完成广义的计算任务,它们可以是s o c ,也可以是各种单一功能的i p ; 通讯节点( 又称交换开关) 负责计算节点之间的数据通讯【2 j 。 首先,良好的扩展性。随着集成电路规模的扩大,总线结构成为了设计的 瓶颈。虽然总线也可以挂多个处理器或其它资源,但总线的地址资源受到限制 不能无限扩展。而n o c 技术是通过通讯节点连接资源节点,每个资源节点只要 符合片上通讯协议即可,因此n o c 结构具有良好的扩展性。 其次,提高通讯效率。当前多系统芯片多采用总线作为通讯架构,虽然总 线结构简单,协议简明,相对比较容易实现,但是总线结构要求多个处理器共 享系统带宽,这就限制了通讯效率的提高【5 j 。而n o c 网络提供了良好的并行通 讯环境,使通讯带宽得到了数量级的提高,进而在很大程度上提高了通讯效率。 最后,解决了单一时钟同步问题。随着芯片工作频率迅速上升,工艺特征 尺寸越来越小,特别是进入纳米阶段后,连线延时将严重影响到设计工作的顺 利进行。时钟偏斜( c l o c ks k e w ) 变得很难精确控制,而且时钟网络的功耗将占据 芯片总功耗的大部分。并且,这些问题会随着工作频率的上升和工艺尺寸的减 小变得越来越突出。这样,单一时钟同步全局芯片工作的方式将使芯片整体性 能降低,甚至不能正常工作。n o c 的片内网络通讯方式是通过通讯节点连接资 源节点,所以可以采用全局异步一局部同步( g a l s ,g l o b a l l ya s y n c h r o n o u s l o c a l l ys y n c h r o n o u s ) 的通讯机制:每一个资源节点都工作在自己的时钟域,而 2 不同的资源节点之间则通过通讯节点进行异步通讯,从而很好地解决了时钟偏 斜和功耗等问题。 综上所述,在集成多个处理器单元时,以通讯协议为核心的n o c 设计方 法所特有的优势,为解决总线结构s o c 设计带来的问题提供了一个解决方案。 n o c 的片上通讯技术不仅具有良好的可扩展性,还提供了很好的并行处理能 力,提高了通讯效率,并且可以解决进入深亚微米时代时钟网络功耗过大和单 一时钟难以同步等一系列问题。n o c 技术属于一种新兴的s o c 设计方法,它不 同于原有的设计模式,是对传统设计方法的革新【2 4 1 。 1 3n o c 原型芯片的系统实现方案简介 n o c 系统实现了s o c 系统的互连,它的每个节点均可看作是一个s o c 系 统。n o c 的拓扑结构体现了通讯节点如何在芯片中分布和连接。n o c 拓扑结构 的选择对系统性能和芯片面积具有明显的影响。文献【4 】详细讨论了树形类结 构、m e s h ,t o r u s 类结构、环形类结构和簇型类结构,并分析指出了多种拓扑结 构的优点与不足。树形类结构增加了本地特性,降低了路由查找的时间和复杂 度,但链路复杂,在芯片上部署困难大;m e s h ,t o r u s 类结构部署简单,可扩展 性强,便于设计简单高效的路由算法;环形类结构减少了i p 核之间的通信跳数, 结构简单,易于扩展;簇型类结构继承了m e s h ,t o r u s ,o c t a g o n 3 0 】结构的优点, 同时也增加了本地的特性,降低了路由查找的时间和复杂度【4 】。 本文研究的是基于2 维m e s h 结构的n o c 。下面简要描述2 维m e s h 结构 的n o c 原型芯片的系统实现方案。如图1 2 所示为基于2 维m e s h 结构的n o c 原型芯片系统结构图。 计算节点 曰通讯节点 图1 2基于2 维m e s h 结构的n o c 原型芯片系统结构图 n o c 系统包括计算节点和通讯节点。其中每个计算节点可以是一个s o c 系统或其他i p 资源,它需要通过通讯节点与其它计算节点进行通讯。本文研究 关注于n o c 系统的通讯架构,即实现n o c 通讯网络的配置和性能监测,所以 3 下面只简单描述n o c 系统中一般通讯节点的具体实现。一般通讯节点的结构如 图1 3 所示,由如下几个部件组成1 5 j 【6 j : a 缓存器。硬件结构为先进先出( f i f o ) 缓存器,用于暂存传输数据。通 常,每个通讯节点的输入输出通道均含有相应的缓冲器。 b 交叉开关。交叉开关负责将通讯节点中的输入缓冲器连接到节点的输出 缓冲器。对于每一个输出通道,如果该节点含有n 个输入通道,那么此 输出通道就有n 1 条输入数据线,只有通过路由和仲裁单元给出的选择 信号使一条输入数据线有效。 c 路由和仲裁单元。这一部件实现路由算法,为输入通道选择输出通道并 在相应的位置打开对应的控制开关。如果多个输入通道同时选择一个输 出通道,该部件则对它们仲裁。如果被请求的输出通道正处于忙的状态, 则将数据先暂存入输入缓存器,当该通道被释放并通过仲裁成功获得该 通道后,数据才能重新传输。 d 链路控制器( l c ) 。它用于控制横跨相邻两节点间的数据流,控制并协调 报文的传输。 e 计算节点接口。该接口与计算节点相连,功能上与通讯节点间相连的接 口不同,但硬件实现上一致。 图1 3一般通讯节点结构示意图【5 】【6 】 通讯节点的功能机制如下【5 】:首先,根据报文头帧所含的目的节点地址信 息,以网络中所选用的路由算法自动为待传输数据选择传输路径;其次,以握 手和应答信号与计算节点网络接口( n i ,n e t w o r ki n t e r f a c e ) 或相邻通讯节点连 接,并使用简单握手协议进行链接流控;第三,当数据所请求的输出通道空闲 时,将存在输入缓冲中的报文数据发往输出通道,并在数据传输完成之后关闭 4 输入通道和输出通道之间的通路;第四,当多个输入通道请求同一个输出通道 时,通讯节点会按照所选用的仲裁算法给出各个输入通道优先级和通道仲裁权; 第五,当链路没有开通时,所有数据都会存储在输入通道的缓冲器中。 由以上介绍的n o c 通讯节点实现可知,影响n o c 通讯性能的参数很多, 包括输入通道缓冲器的深度,路由算法和输出通道仲裁算法等。本学位论文在 一般n o c 通讯架构实现的基础上,设计可配置n o c 网络,并将其与监测系统 集成在n o c 原型芯片上。通过监测系统获取网络性能参数,例如吞吐率和通讯 延时。本文研究目的在于最大限度地提高硬件原型的可控性和可观测性,力争 达到整个通讯机制的优化基本可以通过硬件原型完成。 1 4 可配置可监测n o c 的研究进展 自2 0 0 0 年开始,n o c 成为集成电路设计学中备受关注的话题,国际上一 些著名的研究单位,如瑞典皇家技术学院、斯坦福大学和荷兰菲利普研究实验 室等都对n o c 技术进行了逐步深入的研究。随着n o c 技术的不断发展,“配置 这个概念应运而生。可配置n o c 极大地增强了系统的灵活性和可控性,使系统 性能得到了很大提高。2 0 0 5 年,瑞典皇家技术学院电子与计算机系统实验室提 出了通讯配置,讨论了具体通讯配置的方法并说明了为网络性能评估和系统仿 真提供通讯配置方法的重要性【_ 7 1 。2 0 0 6 年,德国吕贝克大学t h i l op i o n t e c k 提 出了基于动态配置s o c s 的可适应性n o c 设计,他提到系统运行过程中,网络 中的s w i t c h s 可以嵌入或者移开,使n o c 适应于当前已配置硬件模块( 可理解为 功能模块) 的数量、尺寸和位置,并通过运用动态路由平台,使得在配置过程中 n o c 系统不用被中断【8 j 。2 0 0 8 年,丹麦科技大学m i k k e lb s t e n s g a a r d 提出拓扑 结构可配置的n o c 体系架构,在他的研究试验中对设计的性能评估显示动态拓 扑结构的功能损耗比静态二维网络拓扑结构降低5 6 t 9 1 。 近几年,国内对n o c 技术的研究也在不断进行,并获得一定成果。沈绪 榜院士的研究团队开展了片上互连体系结构基础理论的研究:西北工业大学研 究了使用片上网络的方法对s o c 测试的问题,在o s i 网络堆栈参考模型的基础 上,提出了面向测试的片上网络协议堆栈以及对应的测试服务1 2 5 1 。2 0 0 6 年以来, 国内许多著名高校,如清华大学和西安电子科技大学等都开展了相关研究,并 获得国家自然基金的资助。但是,至今国内对n o c 系统中的可配置相关研究仍 然很少。2 0 0 8 年,西安邮电学院谢晓燕提出了一个基于电路交换的可配置n o c 路由器,它的主要特点是可配置成多播和广播方式。 1 5 本文的课题来源 ( 1 ) 8 6 3 计划“基于n o c 的片上多处理器系统结构及实现方法研究”( 项目 编号:2 0 0 8 a a 0 1 2 1 3 5 ) ; 5 ( 2 ) 教育部博士点青年基金“基于可重构通讯的m p s o c 硬件原型技术研究 ( 项目编号:2 0 0 7 0 3 5 9 0 3 2 ) 。 1 6 论文结构以及内容安排 本文的研究是基于2 维m e s h 结构的n o c ,研究重点是n o c 网络的通讯 架构。论文提出了一种新的可配置n o c 体系结构,它不同于以往一些参数配置 的方法,而是能系统地实行在线配置。通过在线输入配置参数,实现实时配置 n o c 通讯网络。论文研究的n o c 原型在实现在线配置通讯网络的基础上,提出 了一种新的面向n o c 的智能化监测系统,通过监测参数能够及时了解所配置系 统的网络性能。在实现了这种可配置可监测的n o c 原型后,运用可配置的通讯 量发生器传输数据检测对应系统的通讯性能。根据实验数据比较不同通讯和不 同配置下n o c 网络的性能。论文分为五章,简述如下: 第一章绪论。简要的描述了n o c 技术的发展及优势,说明了n o c 发展 的必然性;介绍了n o c 原型芯片的系统实现方案,具体地给出了n o c 系统通 讯架构的实现,为下文的讨论研究打下基础。 第二章可配置可监测n o c 原型的介绍。介绍了系统体系结构,将整个原 型平台划分为不同功能的小系统。 第三章可配置可监测n o c 原型平台的硬件设计。介绍了各个小系统的硬 件设计,包括可配置n o c 通讯架构中各个参数的功能模块和配置模块设计,配 置系统的设计和监测系统的设计。 第四章可配置可监测n o c 原型平台的验证与实验。介绍了可配置通讯量 发生器的设计。通过实验验证了可配置可监测n o c 原型平台设计的正确性,并 通过实验数据对不同通讯和不同配置下的n o c 网络的性能进行比较。 第五章总结与展望。总结了论文的工作,并对进一步研究做出展望。 6 第二章可配置可监测n o c 原型的介绍 本章将在上一章简述的n o c 原型芯片的系统实现方案基础上,简单讨论可 配置可监测n o c 原型平台设计中的实时配置与监测。确定可配置n o c 通讯网 络中的配置参数,以及监测系统中评估n o c 网络性能的参数。构建可配置可监 测n o c 原型平台,将整个原型平台划分为不同功能的小系统,概述各个小系统 的功能。 2 1实时配置与监测的概述 目前,为增强系统灵活性许多硬件设计都引入了配置的方法,这种方法也 扩大了硬件设计的通用性。芯片设计中可以通过配置的方法解决某些芯片只具 有单一用途的局限性,使其适用于多个领域。硬件设计的配置方法减少了芯片 的重新设计也增强了性能的独特性。 本文所讲的可配置可监测n o c 是指对n o c 的通讯网络的配置及对n o c 网 络通讯性能的监测。以往为了提高硬件的灵活性,在设计中引入了一些参数配 置的方法,但是本文研究的n o c 配置有所不同。本文是实现n o c 通讯网络的 实时在线配置,也可称为动态配置。针对n o c 通讯性能的监测,本文则提出一 种新的面向n o c 的智能化监测系统。该系统中监测参数可以实时输出,从而使 用户能够及时了解所配置n o c 网络的性能。 文中配置与监测的特点在于它的实时在线性。无论n o c 通讯网络处于闲置 状态还是处于正在传输数据的状态,用户都能配置。配置完成并且新的传输完 成时,监测系统能够实时地显示此次配置下n o c 通讯架构的性能参数。通过性 能参数的比较,用户可以及时选择出符合该次应用的最佳n o c 通讯网络。 2 2 可配置n o c 通讯网络的配置参数 本文1 3 节简述了一般n o c 通讯节点的具体实现,并指出影响网络通讯性 能的因素很多。本文设计从输入通道缓冲器的深度,路由算法和输出通道仲裁 算法三方面考虑,使n o c 通讯网络在这三个方面实现配置,极大提高n o c 通 讯网络的灵活性和可控性。 2 2 1n o c 通讯网络的输入通道缓存 n o c 通讯网络中路由器采用输入缓冲的方式,硬件实现为f i f o 存储器。 缓冲器的宽度等于传输报文中帧的宽度,它可以针对不同应用场合调整。缓冲 器的深度与传输报文的长度无关,也可以针对不同应用场合调整。本文只针对 缓冲器的深度实现在线配置,并分析缓存深度对n o c 通讯网络性能的影响。 7 2 2 2n o c 通讯网络的路由算法 本文研究2 维m e s h 拓扑结构的n o c 网络。路由机制为:根据报文头帧含 有的目的节点地址,以选择的路由算法来自动为待传输数据选择传输路径。到 目前为止,研究者已经将很多种比较成熟的路由算法加载到n o c 中。这些路由 算法大致可分为确定性路由和适应性路由。本文将x y 路由算法和奇偶路由算 法集成在一个网络中,通过配置参数选择需要的路由算法。 2 2 2 1x y 路由算法 x y 路由算法是一种确定性、最小路径路由算法。在2 维m e s h 结构中, x y 路由也称有序维度路由。根据该路由算法,进入网络的报文,首先沿着到 达目标节点的x 方向传播,到达目标节点所处的同一列时再沿着y 方向传播。 如图2 1 所示,若源和目标分别为( s x ,s y ) 和( d x ,d y ) ,则路由消息将在x 维度 上走i d x s x l 步,然后在y 维度上走i d 广s y i 步。 由于x y 路由算法是一种确定性的路由算法,在硬件上容易实现,但缺乏 适应性,不能充分发挥网络的通讯性能。 y 图2 1x y 路由算法传输示意图 x 2 2 2 2 奇偶路由算法 适应性的路由算法可以根据网络的通讯状况来实时地决定路由方向,从而 提高通讯网络的灵活性。但路由算法的适应性有可能会导致通讯网络形成活 锁和死锁。活锁是指报文在网络中肆意传播,不能到达目标节点的一 种特殊情况,产生的原因是网络采用了适应性、非最小路径路由算法。将路由 算法设计为最小路径可以有效的规避活锁。死锁是报文在通讯网络中形 成了循环等待而阻塞不前的情况【26 。图2 2 中说明了一种死锁的情况,图 中虚线表示报文需要传播的方向,p a c k e t l 传播的路径被p a c k e t 2 阻塞,p a c k e t 2 被p a c k e t 3 阻塞,p a c k e t 3 被p a c k e t 4 阻塞,p a c k e t 4 被p a c k e t l 阻塞,从而形成 了循环等待。 8 图2 - 2“死锁”的形成 死锁的规避比较麻烦,必须通过一定的分析来解决。g e m i n gc h i u 提 出了一种奇偶转折模型来设计具有部分自适应性的路由算法。下面则具体地分 析奇偶转折模型【1 1 】: 为了说明奇偶模型,定义横坐标为偶数的列为偶列,横坐标为奇数的列为 奇列。以k o 幸k l 的二维网络为例,由坐标为( 2 ,j ) ,o 匀s k l 1 的节点组成的列 就称为一个偶列。 奇偶转折模型的核心思想是使e n 和n w 转折不会同时出现在同一列,同 样e s 和s w 转折也不会同时出现在同一列。具体来说,为了避免死锁,奇偶 转折模型必须满足以下两个规则。 规则1 在偶列上,任何一个报文不能进行e n 转折;在奇列上,任何一个 报文不能进行n w 转折。 规则2 在偶列上,任何一个报文不能进行e s 转折;在奇列上,任何一个 报文不能进行s w 转折。 在实际的应用中,任一个规则中的奇列和偶列都可以对换。根据规则l , e n 和n w 转折不会出现在同一列上;根据规则2 ,e s 和s w 转折不会出现在 同一列上。 j ( a ) j ( ” 图2 - 3等待路径的最右端( a ) s n 通道( b ) n s 通道 从奇偶转折模型中衍生出来的路由算法,无论是最小路径路由算法还是绕 9 道路由算法,只要在路由过程中,报文不会在两个连续节点间来回传播,都可 以避免死锁。利用反证法可以证明这种模型是可以免死锁的。假设按照奇偶转 折模型设计的路由算法产生了死锁,由于报文不会在两个连续节点之间来回传 播,阻塞报文所形成的等待路径必须同时包括行通道和列通道。由于等待路径 是一条闭合回路,那么总会存在靠最右端的列通道,假设这条通道是图2 3 中 的s n 通道,为了形成回路,则e n 和n w 转折必须在同一列存在,违反了规 则1 ;假设这条通道是图2 3 中的n s 通道,为了形成回路,则e s 和s w 转折 必须在同一列存在,违反了规则2 。从而根据奇偶转折模型而设计的路由算法 一定能够免死锁l l 。 根据奇偶转折模型,可以设计出很多种免死锁的部分适应性路由算法。图 2 4 中说明了四种可能的路由路径。s i 和d i 代表报文p i ( 1 s i s 4 ) 的源节点和目的 节点,报文p 1 、p 2 、p 3 采用最小路径的奇偶路由算法,p 4 采用满足奇偶转折 模型的非最小路径路由算法【1 1 1 。但是在实际中,即使运用非最小路径奇偶路由 算法,如果通讯竞争不激烈,非最小路径的传输也可能会不存在,而是所有报 文都选择最小路径传输。根据奇偶转折模型所设计的最小路径奇偶路由算法, 对于任意一对源节点与目的节点,总是能按照最小路径将报文传播到目的节点。 为了避免活锁和死锁现象,本文将实现最小路径的奇偶路由算法,在 第三章中将详细介绍该算法的设计。 ( 1 o ) ( 2 ,o ) 3 o ) ( 4 o ) 5 ,o ) ( 6 o ) ( 7 o ) ( 8 o ) 嚣节点目的节点 图2 4二维网络路由实例f 1 1 l 2 2 3n o c 通讯网络的输出通道仲裁算法 由于本文采用2 维m e s h 结构n o c 通讯网络,所以通讯节点具有五个链路 方向的通讯通道。如图2 - 5 通讯节点示意图所示,五个链路方向分别为:l o c a l 、 n o r t h 、s o u t h 、e a s t 和w e s t 方向【3 】【5 1 。 l o 8 7 6 5 4 3 2 1 0 刚 “ 他 似 他 他 图2 - 5通讯节点示意图 3 1 1 5 j 通讯节点的每个链路由输入通道和输出通道组成,而整个通讯节点运用分 布式体系结构,即各个链路通道的路由功能、仲裁功能和开关功能互不影响, 使得将不用的链路消减掉也不会影响其它链路通道【5 】。当多个输入通道请求同 一输出通道时,通讯节点则会根据仲裁算法做出仲裁,确定输入通道的优先权。 这里仲裁算法的不同直接影响着通讯网络的运行情况,在一定程度上影响着 n o c 通讯网络的性能。 所以本文在n o c 中设计了四种仲裁算法:固定优先级,轮转优先级,随机 优先级和先到先服务。在不同应用中可以根据配置参数选择仲裁算法,极大增 强了n o c 网络的灵活性,提高了n o c 通讯网络性能。 2 2 3 1 固定优先级仲裁算法 固定优先级仲裁算法是指优先级已经事先确定,并且一旦确定后就不再变 化。固定优先级仲裁设计容易,实现简单。它的关键

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论