(计算机科学与技术专业论文)noc关键技术研究与实现.pdf_第1页
(计算机科学与技术专业论文)noc关键技术研究与实现.pdf_第2页
(计算机科学与技术专业论文)noc关键技术研究与实现.pdf_第3页
(计算机科学与技术专业论文)noc关键技术研究与实现.pdf_第4页
(计算机科学与技术专业论文)noc关键技术研究与实现.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(计算机科学与技术专业论文)noc关键技术研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国防科学技术人学研究生院t 学硕士学位论文 摘要 根据国际技术路标半导体预测:2 0 1 0 年时芯片集成度将达到数十亿晶体管,特征尺寸 4 5 n m ,时钟频率将达到1 0 g h z ,一颗芯片内的i p 核数目可达到1 0 0 0 以上。传统互连结构 片上总线( o n c h i p b u s ) o c b 已经不能满足多核中各i p 之间的通信要求,新型的多核芯 片互连结构n e t w o r k o n c h i p ( n o c ) 己经成为当前国际多核芯片研究领域的新热点。n o c 技术的核心思想是将计算机网络技术移植到芯片设计中以解决多核芯片的互连通信问题。 本文首先介绍了片上网络产生的背景,详细描述了片上网络设计方法学,并比较片上 网络和片上系统的特点。对一些n o c 相关重要技术进行了研究与分析,其中包括:片上网 络模拟器的关键技术研究和框架的设计、低延迟n o c 路由器设计、通信局部性对n o c 性 能的影响和通过配置长连线来提高片上网络的性能。 本文着重研究了片上网络模拟器关键技术、整体框架和模拟器的设计,提出了基于信 用值和轮转法结合的仲裁策略。经过模拟,仿真结果表明该策略能有效的提高片上网络的 一 性能。同时研究了虚信道数目、单目标热点、双目标热点对片上网络性能的影响。 本文提出以球形局部性研究通信局部性对n o c 性能的影响。在n o c 中,通信紧密的 结点相互靠近,通信方式是不同程度的区域化。同时针对长距离的通信结点,提出用长连 线机制来提高片上网络的性能。仿真结果表明增大球形局部性因子和引入长连线配置,都 可以明显提高片上网络的性能。 主题词:片上网络,系统芯片,仲裁策略,通信局部性,网络延迟,网络吞吐量 第i 页 国防科学技术大学研究生院工学硕士学位论文 a b s t r a c t i t sf o r e c a s t e db yt h e ( i t r s ) :t h ei n t e g r a t i o no fc h i pw i l la r r i v es e v e r a lb i l l i o ni n2 010 c h a r a c t e r i s t i cd i m e n s i o ni s4 5 n m ,a n dt h ef r e q u e n c yo fc l o c kw i l la r r i v e10g h z t h en u m b e ro f i pn o d e si no n ec h i pc a na r r i v em o r et h a n10 0 0 t h et r a d i t i o n a ls t r u c t u r eo n c h i p - b u sc a nn o t s a t i s f yt h ec o m m u n i c a t i o nb e t w e e nt h ei pn o d e si ns o c n e wc o n n e c t i o ns t r u c t u r eh a sb e c o m e t h eh o tp o i n ti nt h ei n t e r n a t i o n a ls t u d yo f m u l t i p r o c e s s o r t h ek e r n e li d e ai st h a tt r a n s p l a n t i n gt h e n e t w o r kt e c h n i q u et ot h ed e s i g no ft h em u l t i p r o c e s s o ri no r d e rt os o l v et h ep r o b l e mo f i n t e r c o n n e c t e dc o m m u n i c a t i o n 。 t h eb a c k g r o u n do fn o ci si n t r o d u c e df i r s t l yi nt h i sp a p e r t h en o cd e s i g nm e t h o d o l o g y a r ec a r e f u l l ys t u d i e di nt h ep a p e r s o m em a i nt e c h n o l o g i e so fn o ca r ed e s c r i b e da n da n a l y z e d , i n c l u d i n gt h ek e yt e c h n o l o g i e sa n dt h ef r a m eo fs i m u l a t o r ,t h ed e s i g no fl o wl a t e n c yr o u t e r ,t h e i n f l u e n c eo fc o m m u n i c a t i o nl o c a l i z a t i o na n du s i n gt h el o n g r a n g ec o n n e c t i o nt oi m p r o v et h e p e r f o r m a n c eo fn o c t h ed e s i g no fl o wl a t e n c ys i m u l a t o ri sc a r e f u l l ys t u d i e di nt h ep a p e r i nt h i sp a p e rt h e a r b i t r a t i o ns t r a t e g yb a s e do ni n t e g r a t i o no fc r e d i ta n dr o u n d r o b i ni sp r o p o s e d t h es i m u l a t i o n r e s u l ts h o w st h a t ,t h ep r o p o s e ds t r a t e g yc a ni m p r o v et h ep e r f o r m a n c eo fn o ce f f e c t i v e l y i nt h i s p a p e ra l s os t u d i e dt h ei n f l u e n c eo fn o cp e r f o r m a n c ef r o mt h en u m b e ro fv c 、s i n g l ed e s t i n a t i o n n o d e 、d o u b l ed e s t i n a t i o nn o d t h i sp a p e ru s et h es p h e r i c i t yl o c a ld i s t r i b u t i n gt os t u d yt h ei n f l u e n c eo fc o m m u n i c a t i o n l o c a l i z a t i o nt on o c b e c a u s ei nt h en o ct h en o d e sw h i c hc o m m u n i c a t ef r e q u e n t l yw i l lb ep u t c l o s et oe a c ho t h e r ,t h ec o m m u n i c a t i o ni sp a r t i a l t ot h el o n gd i s t a n c ei pt w on o d e s ,w eu s et h e l o n gl i n et oc o n n e c tt h ei pn o d e sd i r e c t l y t h es i m u l a t i o nr e s u l ts h o w st h a t :i n c r e a s i n gt h ev a l u e o fl o c a l i z a t i o na n du s i n gt h el o n gc o n n e c t i o nc a ni m p r o v et h ep e r f o r m a n c eo f n o cc l e a r l y k e yw o r d s :n e t w o r k - o n c h i p ,a r b i t r a t i o ns t r a t e g y ,s y s t e mo nc h i p ,c o m m u n i c a t i o n l o c a l i z a t i o n ,n e t w o r kl a t e n c y ,n e t w o r kt h r o u g h p u t 第i i 页 国防科学技术大学研究生院工学硕+ 学位论文 表目录 表2 1 各款处理器的时钟参数4 表2 2 国际上关于n o c 的主要活动6 第1 v 页 国防科学技术大学研究生院丁学硕士学位论文 图目录 图2 1片上互连方式的演变过程7 图2 2m e s h 结构及其变种8 图2 3 折叠的二维网状结构8 图2 4 胖树形的互连结构9 图2 5 八角形互连结构9 图2 6 片上网络的分层1 0 图3 1p a c m a n 模拟器工作流程1 2 图3 2n o c s i m 下n o c 连接示意图1 3 图3 3 片上网络数据接受过程1 3 图3 4c h a o s 模拟器的框架一1 4 图3 5 模拟器程序的构建过程1 9 图3 6 模拟器机构2 1 图3 7 模拟器中消息分类2 2 图3 8 n o c 模拟器框架结构2 8 图4 1 带虚信道的路由器整体结构图3 0 图4 2 路由器端口结构图31 图4 3m e s h 结构带虚信道的交叉开关结构图3 2 图4 4 路由器工作的原理3 3 图4 5 虚信道缓冲区模块有限状态机3 4 图4 6 仲裁器有限状态机图3 5 图4 7 信用控制逻辑有限状态机3 5 图4 8 信用值变化原理图:3 7 图4 9 路由器仲裁原理3 8 图4 1 0 信用值法与轮转法原理比较3 8 图4 1 1 输入端口和输出端口消息流动时的状态机3 9 图4 1 2n o c 体系结构图4 l 图4 1 3 s p i n 结构在1 6 与6 4 处理结点下的网络延迟4 1 图4 1 4m e s h 结构在1 6 与6 4 处理结点下的网络延迟4 2 图4 1 5s p i n 与m e s h 结构下的网络吞吐量4 2 图4 1 61 6 个处理器结点下虚信道数目对n o c 平均延迟的影响4 3 图4 1 76 4 个处理器结点下虚信道数目对n o c 平均延迟的影响。4 3 图4 1 81 6 个处理器结点下虚信道数目对n o c 吞吐量的影响4 4 图4 1 96 4 个处理器结点下虚信道数目对n o c 吞吐量的影响4 4 第v 页 国防科学技术火学研究生院工学硕士学位论文 图4 2 0 图4 2 1 图4 2 2 图4 2 3 图5 1 图5 2 图5 3 图5 4 图5 5 图5 6 图5 7 图5 9 图5 1 0 图5 1 1 图5 1 2 图5 1 3 图5 1 4 图5 1 5 单目标热点下网络负载对n o c 吞吐量的影响一4 5 单目标热点下网络负载对n o c 网络延迟的影响4 5 双目标热点下网络负载对n o c 吞吐量的影响4 6 双目标热点下网络负载对n o c 网络延迟的影响4 6 均匀分布图4 7 球形局部性分布图4 8 球形局部性分布图4 8 m e s h 与s p i n 结构图4 9 局部性因子o 3 对n o c 网络延迟的影响4 9 局部性因子o 5 对n o c 网络延迟的影响4 9 局部性因子o 8 对n o c 网络延迟的影响5 0 配置长连线的路由策略5 1 单目标热点长连接线结构图5 2 双目标热点长连接线结构图5 2 单目标热点长连接线对n o c 网络延迟的影响5 2 单目标热点长连接线对n o c 网络吞吐量的影响5 3 双目标热点长连接线对n o c 网络延迟的影响5 3 双目标热点长连接线对n o c 网络吞吐量的影响5 3 第v l 页 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它教育机构的学 位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 学位论文题目: ! q 堡羞毽技苤盟窒皇塞理 学位论文作者签名:毒虹 日期:叩年f 乙月吕日 学位论文版权使用授权书 本入完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权国 防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档,允 许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密学位论文在解密后适用本授权书。) 日期:叩年7 乙月牙日 日期:岬年f 月,o 日 国防科学技术大学研究生院t 学硕士学位论文 第一章绪论 1 1课题背景 2 0 1 0 年,单颗芯片集成的晶体管数量将达到数十亿晶体管,特征尺寸4 5n i n ,工作频 率也将达到1 0 g h z ,届时单颗芯片内的i p 核数目可以达到1 0 0 0 以上。传统的基于总线 的互连结构,如i b m 的c o r e c o i l l l e c t l 引,a r m 的a m b a 引,s o n i c s 的m i c r o n e t w o r k s 4 1 , s i l i c o r e 的w i s h b o n e 引,p a l m 的p a l m b u s 6 】等,不支持并发事务,可伸缩性不好,能互连的 部件数为数十个,不再适合未来的片上互连需求。传统的互连结构片上总线( o n c h i p b u s ) o c b 已经不能满足s o c 中各i p 之间的通信要求,新型的多核芯片互连结构己经成为当前 国际多核芯片研究领域的新热点。 集成电路发展到s o c 时代,已经把整个数字计算机系统集成到了一块芯片上,s o c 是 一个简化的p c 机。相对于s o c 的片上系统而言,n o c ( n e t w o r k o n c h i p ) 是更高层次、更 大规模的片上系统,是片上的网络系统。n o c 技术的核心思想是将计算机网络技术移植到 芯片设计中来,彻底解决多c p u 的体系结构问题。由于网络结构的本质就是多c p u 系统, 因此,基于网络的体系结构是多c p u 系统的最有前途的解决方案。 片上网络继承了分布式系统与计算机网络的概念1 7 j 。由于n o c 互连结构具有各i p 之 间并行通信,数据的通信带高,扩展性好,吞吐量大,并且可以在一定程度上可以改善深 超深亚微米条件下的信号传输的线延迟等优点,有专家预测n o c 将代替o c b ,成为下一 代多核互连结构。与n o c 相比,o c b 扩展性不好,某一时刻o c b 只能被一个主设备占 用,易成为多核中各i p 之间的通信瓶颈,很难满足未来多核芯片的应用需要。 n o c 的提出解决了多c p u 系统的体系结构问题,还解决了另一个长期困扰总线结构 的难题:全局时钟问题i s 。总线结构要求全局同步,芯片中必须有全局时钟的支持。随着 工艺技术的提高和系统规模的增大,时钟延迟越来越影响着全局同步的精确。为了克服这 个困难,时钟树技术被广泛应用于各种多核芯片的设计。作为一块独立的电路,时钟树大 量消耗面积资源和功率资源。 近年来,人们围绕可伸缩互连结构和n o c 展开大量的研究1 9 j 。推动着这项新技术发展 的重要单位有美国的斯坦福大学、普林斯顿大学、k t h ;法国的p i e r r ee tm a r i ec u r i e 大学 等。中国在n o c 研究领域中滞后国际先进水平,从这个意义上看,国内对n o c 进行研究 已经到了刻不容缓的地步,n o c 作为一个崭新的多核发展领域,我国若能成功开展n o c 学术领域的前沿工作,将为大量创新新成果的出现提供一个空间。 本文的研究得到国家自然科学基金资助,项目编号:6 0 6 7 6 0 1 0 ,名称:有界延迟服务 片上网络研究。 第1 页 国防科学技术人学研究生院t 学硕士学位论文 1 2 课题研究目标和主要工作 本文介绍了片上网络相关理论和设计方法学,并对片上网络模拟器和片上网络关键技 术进行了研究,包括模拟器框架关键技术研究和框架设计、基于o m n e t + + 模拟器实现、 基于信用值与轮转法结合的仲裁策略、不同虚信道数目对n o c 性能的影响、单目标热点与 多目标热点对n o c 性能影响、通信局部性对n o c 性能的影响和通过配置长连线优化n o c 性能。这些相关方面都是片上网络研究的热点问题。 本文重点研究的内容有: 1 n o c 模拟器关键技术研究与框架设计。在研究了模拟器的基本要素、模拟器结构 和时钟处理等关键技术的基础上,提出了片上网络模拟器框架,该模拟器除了反 映消息从产生到消失的程序模块外,还包括了负载、拓扑结构、路由器以及可视 化等模块。 2 基于o m n e t + + f 氐延迟片上网络模拟器研究。完成片上网络模拟器的设计,提出了 信用值与轮转法结合的仲裁机制以达到提高片上网络性能的目的。研究了不同虚 信道数目对n o c 性能的影响。提出了以单目标热点、双目标热点来研究片上网络 性能。 3 提出球形局部性因子来提高n o c 性能。对于有频繁通信的模块应布置得尽量互相 靠近,缩短频繁通信模块间的距离,从而提高了片上网络的性能。 4 对存在长距离通信的结点,采用对关键路径配置长连线以直接通信的方式提高片 上网络系统的性能。研究了单目标热点、双目标热点对整个系统性能的影响。 1 3 本文组织正文内容 全文共分六章: 第一章介绍课题研究背景、课题目标以及本论文的组织内容。 第二章比较了s o c 与n o c 设计方法,介绍了n o c 研究动态,分析了n o c 互连结构等。 第三章阐述了目前n o c 模拟器的发展状态,介绍了o m n e t + + 仿真平台,研究了片上 网络模拟器设计关键技术和框架设计。 第四章研究了当前n o c 模拟器的仲裁策略,设计了一种n o c 模拟器,提出基于信用 值与轮转法结合的仲裁策略,并研究了不同虚信道数目、单目标热点、双目标热点和仲裁 策略对n o c 性能的影响。 第五章提出用球形局部性方法来研究通信局部性对n o c 性能的影响,提出了通过配置 长连线解决局部通信压力大,提高n o c 的性能。 第六章对本课题所完成的工作进行了总结,并提出下一步所要进行的后续工作。 第2 页 国防科学技术大学研究生院工学硕士学位论文 第二章n o c 基础研究 传统的单芯片多处理器( c m p ) 普遍采用共享总线的方式进行通信【9 】,其实现简单、发 展成熟,并可以使用i p 核来简化设计,最典型的是斯坦福h y d r a ,它采用了l 条6 4 位的 写直达总线和l 条2 5 6 位的读替换总线实现处理器核与片上l 2c a c h e 和内存接口的通信。 随着微电子技术的发展,c m p 1 0 】中i p 核数目的增长( 几十或上百个核) 和向异构化( 即 包含不同类型的核) 方向发展,共享总线结构则面临以下几个问题,逐渐成为了影响c m p 性能的主要瓶颈: - 带宽限制:总线是一种共享介质的互连结构,某一时刻只允许一个设备使用总线。 仲裁逻辑允许高优先级的设备获得总线的使用权,在总线被占用期间,所有其他 的请求被阻塞,直到总线空闲。如果成百上千个不同组件争用一条总线,很难想 象结果会是怎样。这还没考虑由于太多的组件连接到总线上而导致的总线频率降 低等因素。 。 信号集成度:更低的电源电压,更小的线宽,使得整个v l s i 系统对电流中的噪声 更加敏感。而共享介质上的更多功能部件则进一步加重了噪声。 。 信号延迟:随着特征尺寸的下降,连线延迟成为影响信号延迟的主要因素。总线 结构是全局控制的。在1 0 亿晶体管时代,全局的线延迟会大于时钟周期。总线结 构的全局连线使得时钟的偏移很难管理。 - 全局同步:全局连线上的信号延迟决定了系统的时钟周期,为了保持甚至提高系 统时钟频率,只能对全局连线进行分布流水,或者采用全局异步局部同步( g a l s ) 的时钟模式。 2 1n o c 设计方法优点 传统多核芯片设计大都采用全局同步的设计方法,多个功能i p 核通过总线结构集成到 芯片上,这种方法在芯片设计中存在如下问题: ( 1 ) 时钟偏差( s k e w ) 很难控制 在全局同步【1 1 】设计中,为了尽量避免时钟偏差给电路造成同步错误,在时钟网络设计 中大多采用多种时钟分布网络相结合的方法。尽管这样,基本相同的芯片在不同工艺下得 到的时钟偏差仍然不同。表2 1 列出了a l p h a 2 1 0 6 4 芯片在不同工艺流片后得到的时钟偏差 和时钟周期。从表中可以得出,在采用o 1 8 u m 工艺时,时钟偏差竟达到了1 1 0 p s ( 没用采 用时钟偏差处理电路) ,几乎达到了时钟周期1 0 。在增加处理电路后时钟偏差降到2 8 p s , 这是可以接受的范围,但同时也增加了多余的电路,同时也就增加了系统的功耗。根据参 考文献,当工艺降到5 0 n m ,时钟频率将达1 0 2 0 g h z 范围,时钟偏差将会达到不可接受的 第3 页 国防科学技术大学研究生院下学硕+ 学位论文 程度i l 引,在芯片全局内控制时钟偏差几乎是不可能的工作,所以单从时钟角度出发,采用 全局同步设计的设计方法很难适合将来工艺发展和设计的需要。 表2 1 各款处理器的时钟参数 设计类型设计工艺计数器周期时间时钟偏差 a l p h a 2 1 0 6 4 0 8 u m1 6 m5 0 0 n s 2 0 0 p s a l p h a 2 11 6 4 0 5 u m9 3 m3 3 0 n s 8 0 p s a l p h a 2 12 6 4 0 3 5 u m1 5 2 m1 7 0 n s 6 5 p s l t a n i u m0 1 8 u m2 5 4 m1 2 5 n s 2 8 p s ( w i t hd e s k e w i n g ) i t a n i u m 0 1 8 u m2 5 4 m1 2 5 n s 1 1 0 p s ( w i t h o u td e s k e w i n g ) ( 2 ) 可扩展性差 系统设计从系统需求分析开始,确定硬件系统中的各功能模块。为了使系统能够正确 工作,各设计模块在芯片上的相对位置是一定的,总线和时钟网络以及其它全局信号走线 都是针对这一具体需求进行专门的设计,从而才使得芯片能够在深亚微米工艺下正确工 作。一旦在物理设计完毕后,发现了原来设计中的某些错误或是不合理,那么在纠正错误 的过程就可能是再一次的重新设计的过程,不但浪费大量的人力物力,而且还有可能得不 到正确的结果。 在某个己经设计好的芯片中添加某个功能模块是个很困难的问题。因为新增加的功能 模块会可能会打乱原来的物理布局,使得新的物理布局可能不符合时序或不能避免其它物 理效应,导致必须设计新的系统,延缓投放市场的时间。 ( 3 ) 平均通信效率低 采用总线结构,经过总线仲裁器的仲裁后,在一个时间段内只能有一个功能模块独占 总线,其它功能模块只能在得到控制总线的权利后才能和系统中其它模块进行通信。从通 信的局部看,这种结构的通信带宽也很高,实时性很好。但从系统整体考虑,这种通信结 构的平均通信带宽是非常低的,因为一个模块控制总线通信时,系统中其它模块必须等待, 直到得到总线控制权。 n o c 设计采用全局异步局部同步的方式解决了整个芯片全局同步面临的问题,有很好 的可重用性和可扩展性,平均通信带宽较高,n o c 优点具体如下: ( 1 ) 全局异步局部同步 全局异步局部同步( g a l s ) 1 3 】是n o c 解决全局同步面临问题的主要方法。全局同步局 部异步就是把芯片划分成很多个同步功能单元,所有的同步单元都有自己独自的工作时 钟,同步单元之间采用异步的方式进行通信。g a l s 从全局同步问题着手【1 4 】,把全局时钟 划分成很多的局部时钟,从而在一定程度上避免了全局时钟给系统设计时带来的麻烦。 ( 2 ) 可重用性 第4 页 国防科学技术大学研究生院工学硕士学位论文 n o c 设计的一个主要基础是i p 复用。n o c 把系统划分了很多个相对独立的同步单元, 每个同步单元内基本采用己有的i p 模块( 或是已经设计成功的s o c ) ,又由于各个同步单 元工作的时钟不同,所以同步单元之间可以并行设计到最终,直至系统完成。n o c 的可重 用性不只体现在i p 复用上,它的另一个复用基础就是通信系统,其中通信协议、通信开关 和物理信道是完全可重用的。 ( 3 ) 可扩展性 n o c 的各同步单元是在遵守通信协议的大前提下协同工作的,如果现有n o c 系统有 扩展的要求【l5 1 ,只需要增加一个系统中已经存在的通信开关的副本,同时设计一个通信接 口,然后把扩展的功能单元集成到n o c 的网络拓扑中就可完成。n o c 有个可复用可扩展 的通信机制,同时改用g a l s 方式工作,没有全局的控制信号的干预,所以n o c 的可扩 展性好。 ( 4 ) 平均通信带宽较高 n o c 性能衡量的一个主要指标就是通信带宽。n o c 采用全局异步局部同步的通信方 式,虽然得到了很多好处,但是缺点也很明显,就是实时通信带宽不一定能达到很高。但 是,如果从整个n o c 的平均通信带宽上看,全局的平均通信带宽会远比基于总线方式的平 均通信带宽高。 总之随着工艺集成度的逐渐提高,n o c 在解决全局时钟同步问题、深亚微米效应、扩 展性和设计和生产之间的鸿沟上都优于传统的设计方法,所以在不久的将来n o c 可能是芯 片的一个主要设计平台。 2 2n o c 的研究动态 2 2 1n o c 国际的研究动态 随着技术的不断发展,越来越多的研究机构意识到n o c 的潜力,纷纷投入到其中并推 动着它的发展,使得n o c 成为了一个十分活跃的学术前沿领域。国际上部分所大学、研究 所以及工业界的研究单位正积极从事n o c 研究工作。其中影响较大的有瑞典皇家技术学 院、斯坦福大学和荷兰普研究实验室等【l6 】。参与研究的国家还有法国、意大利、芬兰、希 腊、以色列、巴西、印度等。2 0 0 2 年和2 0 0 3 年处于n o c 概念构思时期,因此著述不多; 2 0 0 4 年以来的成果有了稳步的提高,超过了研究的初步阶段;随着各种因素的成熟以及国 外各大n o c 专项的启动,2 0 0 4 年、2 0 0 5 年各出版了一部专著,标志着成规模、成系统的 研究成果的出现。 2 0 0 0 年3 月,法国p i e r r ee tm a r i ec u r i e 大学的p i e r r eg u e r r i e r 等人提出可升级、可编 程的集成网络( s p i n ) 【l7 1 ,将并行计算( p a r a l l e lc o m p u t i n g ) 中分组交换( p a c k e t s w i t c h e d ) 的方法引入系统芯片,以实现数据通讯。2 0 0 0 年1 1 月,瑞典皇家技术学院等单位提出 第5 页 国防科学技术大学研究生院工学硕士学位论文 “n e t w o r ko nac h i p ”概念l l 引,把n o c 定义为在一块芯片上实现的,由交换开关网络互连的 计算机资源、存储资源以及i o 资源。资源结点之间的通信通过交换开关将自带寻址信息 的数据包从源地址传送到目的地址1 1 9 j 。2 0 0 1 年,瑞典皇家技术学院与芬兰v t t 大学联合 启动“n e t w o r k o n c h i pa r c h i t e c t u r e - n o c a r c ”计划,研究n o c 的基础架构。 2 0 0 1 年1 0 月,意大利博洛尼大学的l u c ab e n i n i 与斯坦福大学的g i o v a n n l d em i c h e l i 开始研究5 0 纳米到1 0 0 纳米下的s o c s o c 互连技术,着重于研究在保证服务质量的前提 下如何降低功耗的问题【2 0 j 。他们提出“n o c 是s o c 的新范例”的论断,并论证了将计算机 网络的层次化协议结构移植到芯片中的可行性。2 0 0 1 年6 月,斯坦福大学的w j d a l l y 等 人发表论文【2 ,提出使用片上互连网络通过数据包通讯的方式替代各式各样的连线结构的 构想,将研究重点转到n o c 上来。 在过去的几年中,国际上关于n o c 的一些主要学术活动【矧如下: 表2 2 国际上关于n o c 的主要活动 时间事件主要内容 2 0 0 1第2 7 届欧洲同体电路会议的研a j a n t s c h 做了“n o c 中的物理问题”报告, 年9 月 讨分会“s y s t e mo nc h i p ,s y s t e ml r z h e n g 做了“n o c 体系结构”的报告,j p i np a c k a g e ”召开 s o i n i n c n 做了“一种n o c 设计方法学”的报告 2 0 0 2 “n e t w o r k s - o n - c h i p ”国际研讨 讨论了n o c 的概念与范畴、设计方法学及设 年1 0会在日本京都召开以及计空间探索等问题,汇报了n o c 以及上g 规 月“e x s i t e ”学术研讨模通讯平台体系结构的研究进展。 2 0 0 3瑞典皇家技术学院的研究生课该年的专题以( ( n e t w o r k so nc h i p ) ) 一书的内 年5 月题1 s o c 专题的2 0 0 3 专题是容为蓝本开设1 2 个子专题讲座 “n e t w o r k so nc h i p ” 2 0 0 3斯坦福大学与博洛尼大学的研究n o c 的综合流程:拓扑结构映射、拓扑 年 联合计划“n e t c h i p ”启动 结构选择和拓扑结构生成 2 0 0 4 e l s e v i e rs c i e n c e 的( ( j o u m a lo f 内容包括i p 互连、n o c 数据打包与路由交换、 年2 月 s y s t e m sa r c h i t e c t u r e ) ) 发表 n o c 通讯协议的服务质量以及n o c 设计探索 “n o c ”专题的结构建模等 2 0 0 4i n t e r c o n n e c t c e n t r i cd e s i g n内容包括总线结构作为n o c 的基本单元、多 年8 月 f o ra d v a n c e ds o ca n dn o c ) ) 。_ 。 处理器仿真系统的基于网络的建模等 书由k l u w e r 学术出版社出版 2 0 0 5i e e et r a n s a c t i o n so np a r a l l e l包括设计方法学、拓扑结构、前沿技术、相关 年2 月 a n dd i s t r i b u t e ds y s t e m 将组织 算法、嵌入式系统,专用电路或i p 的n o c 以 一个“o n - c h i pn e t w o r k s ”专题及“o n c h i p n e t w o r k s ”的电路时序等问题 2 0 0 6 w o r k s h o po no n a n do f f - c h i p 内容主要包括设计方法学、拓扑结构如何减少 年i n t e r c o n n e c t i o nn e t w o r k sf o r 延迟、降低功耗、设计e d a 工具、系统管理、 1 1 月m u l t i c o r es y s t e m s应用程序接口、电源功率、可靠性与可重构 从表中可以看出,n o c 作为一个新兴的学术领域已经迅速繁荣起来,活动越来越频繁, 成果也越来越丰富,一个新的理论体系初步形成了。 第6 页 国防科学技术大学研究生院- t 学硕+ 学位论文 2 2 2n o c 国内的研究动态 s o c 技术出现,国家的科技决策果断地设立了国家自然科学基金s o c 重大专项、8 6 3 计划s o c 重大专项等,使国内的s o c 理论研究基本同步于国际水平。n o c 作为一个崭新 的集成电路设计理论体系,如尽早立项支持n o c 相关技术的理论研究工作,一定能够继续 保持与国际前沿同步的局面。近年来,合肥工业大学、西北工业大学、中科院、西安电子 科技大学、国防科技大学、上海交通大学、电子科技大学、清华大学、浙江大学、中国科 技大学、南京大学等围绕n o c 相关技术开展了一些研究工作,中国若能够全面大力开展 n o c 学术领域的前沿工作,将为大量创新成果的出现提供广阔的空间。 2 3n o c 互连结构 2 3 1n o c 的体系结构 2 3 1 1片上互连方式的演变 ( a ) 点到点链接( b ) 基于总线的互联( c ) 片上网络互联 图2 1片上互连方式的演变过程 点对点连接方式【2 4 】如图2 1 ( a ) 将导致每个i p 核的大量的管脚、连线时间和面积以及不 可预测的信号延迟和信号质量等问题。点对点连接的系统可升级性很差,导致大量连线资 源的浪费,并且其中的任何单元都不可重用。 基于总线的互连如图2 1 ( b ) 是目前s o c 设计中最常用的。通过对总线结构的时分复用, 可以减少各个i p 核的管脚,简化连线。多重和层次化的总线架构能给片上众多的i p 核提 供高效、高性能的通讯方式。与点对点连接方式相比,总线方式具有更好的可升级性。但 是,有限的可利用带宽是被所有连接在总线上的设备所共享的,对于大型系统而言,总线 方式较难满足性能上的要求。 因特网的成功以及其良好的可扩展性促使芯片设计者将计算机网络体系结构中基于 路由的网络和基于分组交换的通讯用于n o c 设计,因特网除了能够提供理论上的无限扩展 性之外,同时为通讯构架的重用和标准化提供了可能【2 5 1 。这些特性对芯片设计者而言,在 缩短设计周期,加快新产品的面世方面,无疑具有十分关键的作用。在不久的将来,基于 n o c 的产品将是下一代产品的主流。 2 3 1 2n o c 的拓扑结构 第7 页 国防科学技术大学研究生院丁学硕+ 学位论文 拓扑结构体现了n o c 中通讯结点在芯片中的分布和连接。由于系统需求、结点模块的 尺寸和不同的位置,需要不同类型的拓扑结构,有很多种可供选择的拓扑结构。良好的拓 扑结构必须考虑以下因素:路由结点与处理器结点或者路由结点之间的通信带有明显的局 部性特征;n o c 中资源结点的物理尺寸与通讯结点的物理尺寸相互影响;n o c 使用物理连 线作为通信信道,因此结点之间的连接不能太复杂,且要具有易扩展性。 目前n o c 研究中采用的拓扑结构主要有: ( 1 ) 规则的m e s h 结构、不规则的m e s h 结构、稀疏的m e s h 结构 ( a ) 规则的2 i ) - m e s h( b ) 不规则的2 阻m e s h( c ) 稀疏的2 d m e s h 图2 2m e s h 结构及其变种 规则的m e s h 结构【2 6 】是目前研究中最常用的拓扑结构( 如图2 2 ( a ) ) :每一个资源结点 与一个通讯结点相连,而一个通讯结点与四个相邻的通讯结点和一个资源结点相连;通讯 结点实现路由的功能。 不规则的m e s h 结构是e b o l o t i n 2 7 】等人提出的面向服务质量的n o c 所采用的拓扑结构 ( 如图2 2 ( b ) ) ,根据不同的q o s 要求,实现不同的网络结构。节省i p 结点的数目和芯片 空间,但是不规则的网络架构,资源结点位置和数目的不统一,将会极大地降低可重用性。 稀疏的m e s h 结构【2 8 】是m f o r s e l l 设计e c l i p s e 时所采用的拓扑结构,从( 图2 2 ( c ) ) 中可以看出,通信结点的数目非常多,远远大于资源结点的数目。其方法是:给每个资源 结点均配置满足其要求的存储单元,从而保证资源结点在执行任务期间,不需要与外部的 存储器间交换数据,只需等任务完成后,将最终的结果传输给需要的其他的资源结点。 ( 2 ) 二维环状m e s h 结构 图2 3 折叠的二维网状结构 2 0 0 1 年,斯坦福大学的w j d a l l y l 2 9 1 提出片上互连网络通过数据包通讯的方式取代各 种连线结构的构想,采用了二维环状m e s h 结构如图2 3 ,与m e s h 结构相比,它将处于边 第8 页 国防科学技术大学研究生院工学硕士学位论文 界的通讯结点也连接起来,使所有的通讯结点成为一个环路,增加了互连的通路。由于环 路和环路之间有交叉的地方,这样不可避免地在物理实现时消耗更多的版图布线资源。 ( 3 ) 胖树网络 图2 4 胖树形的互连结构 法国p i e r r ee tm a r i ec u r i e 大学的p i e r r eg u e r r i e r 3 0 1 等人在设计一种被称y g - i 升级、可编 程的集成网络时,采用了如图2 4 所示的胖树形的拓扑结构。与二维网状网络相比,胖树 中的点对点的延迟决定于树的深度,两个资源结点间的通讯最多需要经过三个通讯结点。 ( 4 ) 八角形网络 图2 5 八角形互连结构 f k a r i m 等人在设计网络处理器时提出了一个八角形网络如图2 5 。类似于胖树网络, 该网络中两个资源结点间的点对点的延迟取决于源点与终点的相对位置。任意两个资源结 点问的通讯最多需要通过两个内部的连线。 拓扑结构中彼此关联影响新能的参数有:直径、连接度、带宽和延时。直径是连接任 意源结点与目标结点对之间的最大结点数;连接度是网络中与每个结点直接相邻的结点 数;带宽是网络中信息的最大流量;延时是信息从源传输到目的地所需要的时间。从上述 特征参数来看,规则的m e s h 结构并不是最优的,但因为其结构简单、易于实现和良好的 重用性,所以被大多数的研究人员作为研究对象。 2 3 2n o c 的通讯协议 系统中信息从源地址到目的地址的传输都需要一系列的规则和方法【3 l 】,这些规则就称 为协议。当直接连接的两个单元之间通讯时,通过请求和应答实现硬件握手就是一种简单 第9 页 国防科学技术入学研究生院t 学硕十学位论文 的通讯协议。除了定义各种控制信号和数据信号的时序关系之外,总线协议还要规定物理 连线和传输速率的上限。如果每个单元都具有实现总线协议的接口,那么它们之间就可以 相互通信了。 图2 6 为n o c 实现i s o - o s i 协议层的方法,因为减少了网络缓存数量,数据包的延时 和源端与目的端之间的距离无关,虫孔路由(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论