(计算机科学与技术专业论文)传输触发微处理器异步功能单元的设计与实现.pdf_第1页
(计算机科学与技术专业论文)传输触发微处理器异步功能单元的设计与实现.pdf_第2页
(计算机科学与技术专业论文)传输触发微处理器异步功能单元的设计与实现.pdf_第3页
(计算机科学与技术专业论文)传输触发微处理器异步功能单元的设计与实现.pdf_第4页
(计算机科学与技术专业论文)传输触发微处理器异步功能单元的设计与实现.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(计算机科学与技术专业论文)传输触发微处理器异步功能单元的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国防科学技术大学研究生院硕士学位论文 摘要 日趋复杂化和多元化的嵌入式应用对嵌入式微处理器的性能、功耗、成本等 各项指标提出了更高的需求。已成熟应用的嵌入式微处理器体系结构及设计技术 因此而面临着极大的挑战,嵌入式微处理器设计者必须寻求新的嵌入式微处理器 体系结构以及新的电路设计方法,以灵活满足应用对于嵌入式微处理器越来越高 的要求。 本文针对嵌入式多媒体应用,将传输触发体系结构和异步电路技术有机融合, 首先探讨了面向多媒体应用的传输触发微处理器体系结构,并采用异步电路技术 对其中的关键功能单元进行了设计与实现,最后提出了一种基于异步功能单元的 传输触发微处理器原型结构。 ( 1 ) 首先,本文针对多媒体应用的特点,确定了面向多媒体应用的传输触发微 处理器体系结构参数。传输触发微处理器内核具有模块化、结构简单、设计灵活等 优点。通过对多媒体应用程序进行分析,得到对传输触发微处理器体系结构设计有 意义的特征参数,为设计面向多媒体应用的传输触发微处理器提供了指导信息。基 于应用程序分析结果,本文给出了传输触发微处理器体系结构框架,其功能单元比 例和各种具体参数配置均符合多媒体应用对嵌入式微处理器体系结构的需求。 ( 2 ) 其次,本文采用基于宏单元的异步电路设计流程在0 1 8 9 t m 工艺条件下设 计实现了一款3 2 位异步子字并行乘累加单元。该单元的数据通路采用特殊的部分 积生成电路,通过把累加数作为部分积添加到压缩树,减少了一级累加的延迟;而 且由于采用异步电路设计,该单元的功耗相比对应的同步单元具有较大的优势。 ( 3 ) 同时,本文设计了一款3 2 位异步子字并行a l u 单元。该单元能完成算术、 逻辑、移位和多媒体扩展等运算。由于加法器是a l u 单元的核心功能部件,它的 性能决定着整个a l u 单元的性能,所以本文主要对子字并行加法器进行了设计。 在o 1 8 p m 工艺条件下的评测结果表明,该异步单元在性能上和具有相同数据通路 的同步a l u 单元相当,在功耗方面则具有相当大的优势。 ( 4 ) 最后,本文提出了基于异步功能单元的传输触发微处理器原型结构。在面 向多媒体应用的传输触发微处理器体系结构基础上,通过设计异步功能单元封装模 块,将本文设计实现的异步子字并行乘累加单元和异步子字并行a l u 单元应用到 传输触发微处理器中,提出了基于异步功能单元的传输触发微处理器原型结构。这 种结构融合了传输触发体系结构和异步电路的优点,因而为要求高性能、低功耗的 嵌入式应用领域提供了一种非常好的设计模板。为探讨异步功能单元对传输触发微 处理器各方面参数的影响,本文给出了这种结构的初步评估。 第i 页 国防科学技术大学研究生院硕士学位论文 第i i 页 国防科学技术大学研究生院硕士学位论文 a b s t r a c t a st h ee m b e d d e da p p l i c a t i o n sa r eg r o w i n gm o r ec o m p l e xa n dd i v e r s i f i e d i tp u t s f o r w a r dh i g h e rr e q u i r e m e n t sw i t ht h ep e r f o r m a n c e ,p o w e rc o n s u m p t i o n ,c o s ta n do t h e r t a r g e t so fe m b e d d e dm i c r o p r o c e s s o r s t h ea r c h i t e c t u r ea n dd e s i g nm e t h o d o l o g yo f e m b e d d e dm i c r o p r o c e s s o r sw h i c hh a v ew i d e l yu s e dh e n c ef a c e sw i t hg r e a tc h a l l e n g e s a n de m b e d d e dm i c r o p r o c e s s o rd e s i g n e r sh a v et od i s c o v e rn e wa r c h i t e c t u r ea n dn e w c i r c u i td e s i g nm e t h o d o l o g yt om e e tt h e w e l l i n c r e a s i n gd e m a n d so fd i f f e r e n ta p p l i c a t i o n s i nt h i st h e s i s ,w ec o m b i n e dt r a n s p o r tt r i g g e r e da r c h i t e c t u r ew i t ha s y n c h r o n o u s c i r c u i tt e c h n o l o g yf o re m b e d d e dm u l t i m e d i aa p p l i c a t i o n s w ep r e s e n t e dat r a n s p o r t t r i g g e r e dm i c r o p r o c e s s o ra r c h i t e c m r eo r i e n t e dt om u l t i m e d i aa p p l i c a t i o n ,a n dt h e nu s e d a s y n c h r o n o u sc i r c u i tt e c h n o l o g yt od e s i g na n di m p l e m e n tt h ek e yf u n c t i o nu n i t s a c c o r d i n gt ot h e s er e s e a r c hw o r k s ,w ep r o p o s e dap r o t o t y p es t r u c t u r eo ft r a n s p o r t t r i g g e r e dm i c r o p r o c e s s o rb a s e do na s y n c h r o n o u sf u n c t i o nu n i t s ( 1 ) f i r s to fa l l ,b a s e do ni t sc h a r a c t e r i s t i c s ,w ec o n f i g u r e dt h ep a r a m e t e r so ft h e t r a n s p o r tt r i g g e r e dm i c r o p r o c e s s o ra r c h i t e c t u r eo r i e n t e dt om u l t i m e d i aa p p l i c a t i o n a n d t r a n s p o r tt r i g g e r e da r c h i t e c t u r eh a st h ea d v a n t a g e so fm o d u l a r i t y ,s i m p l es t r u c t u r e , f l e x i b l ed e s i g na n ds oo n w eg e tm em e a n i n g f u lp a r a m e t e r s b ya n a l y z i n gt h e m u l t i m e d i aa p p l i c a t i o n s ,t h e s e p a r a m e t e r sp r o v i d eg u i d a n c et od e s i g n t r a n s p o r t t r i g g e r e dm i c r o p r o c e s s o r b a s e do nt h er e s u l t so fa n a l y s i s ,t h i st h e s i sp r e s e n t e dt h e f r a m e w o r ko ft r a n s p o r tt r i g g e r e dm i c r o p r o c e s s o ra r c h i t e c t u r e ,w h o s ep r o p o r t i o no f f u n c t i o n a lu n i t sa n dc o n f i g u r a t i o n sa r ea l li nl i n ew i t ht h e s p e c i f i cd e m a n d so f m u l t i m e d i aa p p l i c a t i o n s ( 2 ) s e c o n d ,w ed e s i g n e da n di m p l e m e n t e da na s y n c h r o n o u s3 2 b i ts u b w o r d p a r a l l e lm u l t i p l y - a c c u m u l a t eu n i t ( m a c ) b yt h ea s y n c h r o n o u si n t e g r a t e dc i r c u i t s d e s i g nm e t h o d o l o g yb a s e do nm a c r oc e l li n0 18 p mp r o c e s s t h ed a t ap a t ho ft h i su n i t u s e sas p e c i a lp a r t i a lp r o d u c tg e n e r a t o r ,w h i c ht a k e st h ea c c u m u l a t o ra sp a r to ft h e p a r t i a lp r o d u c tt or e d u c et h ed e l a y a n dt h eu n i t sp o w e rc o n s u m p t i o na r es u p e r i o rt ot h e s y n c h r o n o u sc o u n t e r p a r td u et ot h ea s y n c h r o n o u sc i r c u i td e s i g n ( 3 ) a tt h es a m et i m e ,w ed e s i g n e da na s y n c h r o n o u ss u b w o r dp a r a l l e la l uu n i t w h i c hc a nc o m p l e t et h ea r i t h m e t i c ,s h i f t ,l o g i c ,e x p a n s i o no f m u l t i m e d i ac o m p u t i n ga n d s oo n ,n l ea d d e ri st h ec o r eo ft h ea l u a n di t sp e r f o r m a n c eg r e a t l yi n f l u e n c et ot h e p e r f o r m a n c eo ft h ee n t i r ea l u ,s ow el a i das t r o n ge m p h a s i so nt h ed e s i g no fs u b w o r d p a r a l l e la d d e r ma l uw a si m p l e m e n t e di no 18 r t mp r o c e s sa n dt h er e s u l t so ft h e e v a l u a t i o ns h o wt h a tt h ep e r f o r m a n c eo fa s y n c h r o n o u sa l u i sc l o s et os y n c h r o n o u s a l uw h i c hh a st h es a m ed a t ap a t h b u tt h ep o w e r d i s s i p a t i o no fa s y n c h r o n o u sa l u i s m u c hl o w e r 一一一一_ 一一 第i i i 页 国防科学技术大学研究生院硕士学位论文 ( 4 ) f i n a l l y ,w ep r o p o s e d a p r o t o t y p e s t r u c t u r eo f t r a n s p o r tt r i g g e r e d m i c r o p r o c e s s o rb a s e do na s y n c h r o n o u sf u n c t i o nu n i t s a c c o r d i n gt ot h ea r c h i t e c t u r eo f t r a n s p o r tt r i g g e r e dm i c r o p r o c e s s o ro r i e n t e d t om u l t i m e d i a a p p l i c a t i o n s a n dt h e a s y n c h r o n o u sf u n c t i o nu n i te n c a p s u l a t em o d e l ,w ep r o p o s e dap r o t o t y p es t r u c t u r eo f t r a n s p o r tt r i g g e r e dm i c r o p r o c e s s o rb a s e do na s y n c h r o n o u sf u n c t i o nu n i t sb ya d o p t i n g a s y n c h r o n o u sm a ca n da l u t i l i ss t r u c t u r e m i x e dt h ea d v a n t a g e so ft r a n s p o r t t r i g g e r e da r c h i t e c t u r et o g e t h e rw i t ha s y n c h r o n o u sc i r c u i t s ,s oi to f f e r sa ne x c e l l e n t d e s i g nt e m p l a t ef o rh i g h - p e r f o r m a n c e ,l o w - p o w e re m b e d d e da p p l i c a t i o n s w ep r o v i d e d ap r e l i m i n a r ye v a l u a t i o no ft h e s t r u c t u r et os t u d yt l l ei n f l u e n c ew h i c ha s y n c h r o n o u s f u n c t i o nu n i t sa f f e c t st ot r a n s p o r tt r i g g e r e dm i c r o p r o c e s s o r 1 ( e yw o r d s :t r a n s p o r tt r i g g e r e dt 坦i c r o p r o c e s s o r s ,a s y n c h r o n o u sf u n c t i o n u n i t s ,e m b e d d e dm i c r o p r o c e s s o r ,m u l t i m e d i aa p p l i c a t i o n s ,s u b - w o r dp a r a l l e l , m a c ,a l u 第i v 页 国防科学技术大学研究生院硕士学位论文 表目录 表1 1 各异步电路类型的延迟假设1 0 表2 1目标应用程序集19 表2 2 基本操作类型1 9 表2 3目标程序各种基本操作的比例2 0 表2 4 典型多媒体算法的基本运算公式2 3 表3 1乘累加单元面积以及晶体管数目比较3 2 表3 2同步乘累加单元和异步乘累加单元的性能比较3 2 表4 13 2 位子字并行加法器s c 信号3 9 表4 2a l u 单元面积、性能比较4 3 表4 3a l u 单元平均功耗比较4 4 第1 v 页 国防科学技术大学研究生院硕士学位论文 图目录 图1 1 传输触发微处理器核结构3 图1 2 传输触发微处理器核结构框架4 图1 3 一同步电路与异步电路示意图6 图1 4 数据打包协议与双轨编码协议7 图1 5 两段握手协议与四段握手协议7 图1 6cf 8 图1 7 匹配延迟电路9 图1 8 完成检测电路9 图1 9 延迟模型1o 图1 1 0 基于宏单元的异步集成电路设计流程1 2 图2 1面向特定应用定制处理器的设计开发环境1 5 图2 2 并行调度流程17 图2 3 可重定向模拟器工作流程1 7 图2 4目标应用程序集中基本操作类型平均比例2 0 图2 5 整数数据宽度比例2 l 图2 6目标应用程序集中各程序在不同总线数目下获取的性能加速比2 2 图2 7 面向多媒体应用的传输触发微处理器体系结构框架2 4 图3 1异步乘累加单元结构框图2 5 图3 2 部分积生成示意图2 6 图3 3a 0 * b 0 的部分积阵列2 7 图3 44 2 压缩单元结构2 7 图3 5 简单四段握手协议s t g 描述2 9 图3 6 全解耦四段握手协议的s t g 描述3 0 图3 7 综合得到的全解耦锁存控制器电路3 0 图3 8 控制通路结构3 0 图3 9 延迟单元电路结构3 l 图3 10m a c 单元模块版图3l 图3 1 1同步m a c 单元与异步m a c 单元的功耗比较3 3 图4 1异步子字并行a l u 单元结构框图3 5 图4 2 异步a l u 单元数据通路3 6 图4 3 共享加法器示意图3 7 图4 4 数据选择技术3 7 第v 页 国防科学技术大学研究生院硕士学位论文 图4 5 图4 6 图4 7 图4 8 图4 9 图4 1 0 图4 1 1 图4 1 2 图 图 图 图 图5 4 3 并行单元模块结构优化3 7 子字并行加法器原理。3 8 传统子字并行加法器结构3 8 3 2 位子字并行加法器结构4 0 8 位子字模式下移位操作示意图4 1 8 位子字并行重排操作示意4 2 子字并行压缩解压缩操作示意4 2 两级全解耦四段握手协议s t g 描述。4 2 数据输入间隔为2 0 0 n s 时a l u 单元工作电流比较4 4 异步功能单元封装模块4 6 同步互连网络和异步功能单元接口示意图4 6 基于异步功能单元的传输触发微处理器原型结构4 7 分别引入异步功能单元系统功耗降低4 9 第v i 页 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的研 究成果尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它教育机构的学 位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 学位论文题日: 篮箍筮发邀矬垄墨是生边篷兰丞鲍遮进生塞理 学位论文作者签名: 玉益盏 日期: 口p 吕年1 2 月f7 日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权国 防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档,允 许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密学位论文在解密后适用本授权书。) 国防科学技术大学研究生院硕士学位论文 第一章绪论 在过去的几十年中,微处理器凭借体系结构与集成电路技术的进步得到了飞 速的发展。嵌入式微处理器作为微处理器的一个重要分支,同样遵从微处理器的 普遍发展规律。然而随着嵌入式应用日趋复杂化和多元化,对嵌入式微处理器的 性能、功耗、成本等各项指标提出了更高的需求,不仅要求高性能,还要求面积 小、功耗低、设计周期短等。已成熟应用的嵌入式微处理器设计技术,在新的挑 战面前已经开始显露出设计周期长、成本高、灵活性不足、处理器性能不平衡、 验证与测试困难等缺点,因此需要探索设计新的体系结构、新的电路设计方法, 以灵活满足应用对于嵌入式微处理器越来越高的要求。 1 1 研究背景 1 1 1 嵌入式应用对微处理器设计的挑战 嵌入式应用最早局限于工业控制领域,其目的是实现对对象体系的智能化控 制。随着应用需求的发展和嵌入式系统的不断完善,嵌入式应用目前已经渗透到 包括工业、通信、网络、医疗、军事、家电以及与数字多媒体相关的消费领域等 在内的各个行业中,并表现出强劲的发展势头。嵌入式设备正以各种形态分布在 人类的生存环境中,提供更加人性化和自然化的服务。以嵌入式领域的多媒体应 用为例,以前的嵌入式多媒体应用比较单一,大多只涉及到单一多媒体对象的处 理。近年来,各种嵌入式多媒体应用,诸如手持娱乐设备、可视电话、移动无线 产品以及多媒体家庭等,交叉应用了各种多媒体手段,呈现出了越来越广泛和复 杂的趋势;尤其是集通信、娱乐、网络、游戏、个人数字助理等功能于一体的数 字终端,已成为当前i t 硬件产业开发的重点对象。例如,智能手机正是这样一种 数字终端,它将各种不同的多媒体应用都集为一体,不仅具有通话功能,同时具 备文字处理、数码照相、图像传送及处理、音频播放、视频播放等若干强大的功 能。同时,随着数字信号处理与人机交互界面等相关技术的不断成熟,嵌入式多 媒体应用系统的数量也逐渐上升,种类也越来越多。 通过对各类嵌入式应用的详细分析,总结出应用需求对嵌入式微处理器体系 结构设计的需求,大致可以分为以下几个方面: ( 1 ) 高性能:不断扩大的应用领域及不断增加的应用类型,对嵌入式微处理器 的性能要求也越来越高。以多媒体应用为例,多媒体应用程序可以分成两个部分: 控制密集型应用( c o n t r 0 1 i n t e n s i v e ) 部分和计算密集型( c o m p u t a t i o n i n t e n s i v e ) 应用部 分。在以往的嵌入式多媒体系统中,通常采用通用的r i s c 微处理器或者数字信号 第1 页 国防科学技术大学研究生院硕士学位论文 处理器( d s p ,d i g i t a ls i g n a lp r o c e s s o r ) 。随着需求的增大以及技术的发展,嵌入式应 用变得更加复杂,r i s c 微处理器开始加入多媒体扩展指令或者d s p 处理单元; d s p 处理器也适当增加了一些r i s c 微处理器的特征。但目前,嵌入式多媒体应 用的日益复杂,使得单独的r i s c 微处理器或者d s p 都很难同时满足其对控制密 集型应用和计算密集型应用的需求。因此,面向多媒体应用的新的嵌入式微处理器 体系结构,必须既能满足控制密集型应用部分的需求,也能同时满足运算密集型应 用部分的需求。 ( 2 ) 低功耗:随着手持式移动设备功能的日益增强,功耗问题越发凸显。低功 耗意味着在相同的电池容量下,设备所能够支持的运转时间更长。功耗已经成为衡 量嵌入式微处理器的重要指标,也是目前嵌入式微处理器设计的重点和难点。尤其 是靠电池供电的嵌入式设备和移动设备对系统能量消耗的要求越来越高,电池的供 电时间是衡量系统的重要参数。目前,芯片工艺水平的提高在一定程度上减缓了功 耗的增长,但是对于高性能的追求还是使得芯片的功耗不断地增长。 ( 3 ) 结构可扩展:一般来说,芯片面积往往代表着计算资源的多少,同时也是 决定芯片成本和功耗的重要因素,所以追求高性能和减小面积往往是相互矛盾的。 因此,在设计过程中,必须考虑到所设计的微处理器体系结构应该能根据设计目标, 对性能和芯片面积的要求可扩展。而在使用过程中,则希望能够按照应用的需求选 择需要的部件进行工作,不需要的部件则处于空闲状态,从而达到降低芯片功耗的 目的。 ( 4 ) 面积小:尽量减小微处理器芯片面积,一直是各种体系结构设计所追求的 目标。首先,对于嵌入式设备的可移动性来讲,芯片面积小,才能满足最终嵌入式 成品体积小的需求;其次,从芯片设计者与生产者的角度看,面积越小,则单个圆 片上可以制造出更多的芯片,同时也意味着更高的良率,进而降低成本,获得更高 的利润空间和更强的市场竞争力。 1 1 2 传输触发体系结构及其特点 目前典型的嵌入式微处理器习惯于采用基于超标量或v l i w 体系结构的计算 内核。然而,这些内核的译码逻辑、指令发射逻辑、数据通路及其旁路机制却比 较复杂,占用了相当部分的芯片资源,在一定程度上限制了计算密度的提高。特 别是随着应用需求的迅猛增长与功能单元的增加,其寄存器文件的读写端口相应 增加,寄存器文件的设计复杂度越来越高;其次,数据重定向互连网络的交叉开 关复杂性随着功能单元数目的二次方增长,成为限制主频的瓶颈和能量耗费的大 户,其体系结构可扩展性与低功耗等问题也接踵而至。 针对超标量与v l i w 结构自身难以克服的障碍,c o r p o r a a l 等人提出一种传输 第2 页 国防科学技术大学研究生院硕士学位论文 触发体系结构( t r a n s p o r tt r i g g e r e da r c h i t e c t u r e ,t t a ) ,这种结构属于传统v l i w 结 构之超集。通常我们把基于传输触发体系结构的微处理器称为传输触发微处理 器。传输触发微处理器核的结构非常简单,由若干个功能单元和寄存器文件通过 互连总线构成的传输网络连接在一起组成。图1 1 给出了一个典型示例。从图中可 以看出,6 个功能单元( f u ,f u n c t i o nu n i t ) 和2 个寄存器文件( r f ,r e g i s t e rf i l e ) 通过i n p u ts o c k e t 和o u t p u ts o c k e t 互连在5 条总线上。每个f u 包含一个或者多个 寄存器。 图1 1 传输触发微处理器核结构 传输触发体系结构与普通v l l w 结构的区别在于,它将数据的传输和对数据 的操作分离开来,数据的传输在体系结构级是可见的,数据的传输将触发对数据 进行的操作。因此,对传输触发体系结构进行编程是通过指定数据在传输网络中 的传输来进行的,那么也就只存在一种操作:从f u 到f u 的移动操作,称为m o v e 操作。m o v e 操作能够触发数据算术逻辑运算等操作的完成,依赖于f u 所包含的 寄存器的特殊功能。 f u 包含的寄存器分为三类:操作数寄存器( o ) 、触发寄存器( t ) 和结果寄存器 ( r ) 。所有的m o v e 操作都是在这些寄存器间进行。当数据传输到触发寄存器时, 就会触发该功能单元将操作数寄存器和触发寄存器中的值作为源操作数,来完成 相应的操作,并将结果放入结果寄存器。因此,所有的功能单元应该至少包含一 个触发寄存器。同一个功能单元通常可以执行多种操作( 比如加法和减法) ,通 过不同的控制信号来区分。 不同的传输触发微处理器核之间的区别,通过基本功能单元和定制功能单元 来体现。如图1 2 所示,每个传输触发处理器核都被分成两个部分:基本结构部分 ( b a s i ca r c h i t e c t u r e ) 和定制扩展部分( c u s t o m i z e de x t e n s i o n ) 。基本结构部分通常包 括基本的f u ,比如定点a l u 功能单元( i f u ) 、l o a d s t o r e 单元( l s u ) 、定点比较单 i ( i c u ) 等。定制扩展部分则包含为实现定制指令而设计的定制功能单元( s f u ) ,面 向不同的应用,传输触发处理器内核中所包含的f u 以及s f u 等都会有所不同。 第3 页 国防科学技术大学研究生院硕士学位论文 r ui f ui c ul s ul us f u ls f u 2s f u n 土王:工土工王土工土:! 工量圭工量; ji 。i m由r i :i | 工!:1 | = | 眨:f :j : :i | = |川1 17 i ll ! 工 :| i 二1 i !i - 二 i i lj 上i t :iiit i 工 tt ! ;l 二l e- 二一ci l i 二! i !| 工! _ :盯 ti im旺 二i 上,i 忙 i :i :旺i :i :il口:i二了上一 i b a s i ca r c h i t e c t u r e c u s t o m i z e de x t e n s i o n 图1 2 传输触发微处理器核结构框架 从上面对传输触发体系结构的叙述中可以发现其具有一些软件上的特点。首 先,功能单元的结果可以在需要的时候直接移动到其他功能单元,在不需要的时 候则保存到自身的寄存器中,因此减少了中间结果的保存,从而减少了寄存器文 件的大小。其次,程序中的某些数据只使用一次,因此如果发现传递到寄存器的 数据不再使用,编译器会自动将该传递操作删除,从而减少了多余的传输,提高 了性能。当功能单元上执行的多个不同操作使用相同的操作数时,该操作数只需 要移动一次而不是多次,即实现了操作数共享,同时也减少了操作次数,提高了 性能。不同的总线上读取同一个寄存器,或者读取连接在同一个o u t p u ts o c k e t 上 的不同寄存器内容时,多个读操作可以共享同一个s o c k e t 。这样虽然没有减少操 作数量,但是放宽了硬件资源的限制尺度,因此利于编译效能的提高。另外,在 这种体系结构中,操作数的移动和结果的移动是可以完全独立的,因此在调度时 编译器获得了更大的自由度。操作数的传输和结果的传输均可以在不同的时钟周 期完成。 传输触发体系结构在硬件上也具备一定的优势。首先,结构简单、规整,使 得芯片面积较小,且便于快速及自动化设计。其次,每周期只进行数据的移动, 因此时钟周期短,处理器主频高。另外,功能单元和总线的数量可以根据需要增 减,提供了设计的灵活性和性能的可扩展性。功能单元包含寄存器,并且统一编 址,从而旁路了中间结果的保存,不仅减少通用寄存器的数量,而且提高了性能。 1 1 3 异步集成电路的优势 简而言之,异步电路就是无时钟电路( c l o c k l e s sc i r c u i t s ) ,或者自定时电路 ( s e l f - t i m e dc i r c u i t s ) 。异步电路采用局部通信模式,以握手协议取代全局时钟,不 需要设计庞大的时钟分布网络,从根本上解决了时钟问题【2 】。异步集成电路技术为 同步集成电路技术在深亚微米工艺条件下所面临的种种问题,例如时钟扭曲难以 解决,时钟功耗过大等,提供了简便的解决方案。 相对于同步数字电路而言,异步数字电路在v l s i 集成电路设计中具有一些独 特的优势,主要有1 3 j1 4 : 第4 页 国防科学技术大学研究生院硕士学位论文 ( 1 ) 潜在的高性能:同步数字电路的时钟频率耿决于处理数据的关键路径的长 度,所以其性能为最差情况下的性能。对于异步数字电路而言,处理数据的各段不 需要等待时钟信号就可以将操作传递到下一段,因而可以得到平均情况下的性能。 此外,在深亚微米电路工艺中,由于工艺误差的影响,电路延迟散步较大,异步电 路有可能达到比同步电路更好的性能。 ( 2 ) 低功耗:动态电流是决定c m o s 电路功耗的主要因素。同步数字电路在时 钟有效的时候,整个电路都存在动态电流,功耗浪费很大。异步数字电路本质上是 数据驱动的,仅在需要处理数据时才消耗能量,不仅省去了时钟网络功耗,而且以 无需额外硬件开销的方式实现了同步电路中的门控时钟和功耗管理功能。 ( 3 ) 无时钟扭曲问题:异步数字电路中由于不存在全局时钟,所以从根本上解 决了同步数字电路的时钟偏移问题。 ( 4 ) 模块化和可重用性好:在设计高速的同步数字电路时,设计人员需要精心 设计以保证各个模块之间的时钟同步。而在异步数字电路的设计中,各个模块通过 握手协议集成在一起。如果设计出性能更好的模块,直接使用该模块替换掉原有模 块而不需要修改其他设计,即可以得到更好的系统性能。异步数字电路设计方法同 时也为s o c 设计中的i p 重用问题提供了一种较好的解决途径。 ( 5 ) 电磁兼容性好:同步电路中全局时钟的设计使得整个电路在同一时间内发 生翻转,从而导致电路随着时钟的谐波频率而集中向外耗散能量,从而产生电磁兼 容性( e l e c t r o m a g n e t i cc o m p a t i b i l i t y ,e m c ) 方面的问题。由于异步电路中不存在 周期性的时钟信号,产生的宽频分布式干扰横跨了整个频谱段,因而电路会具有更 好的电磁兼容性。 ( 6 ) 鲁棒性强:由于电路的延迟会随着环境温度、工作电压和制造工艺而变化, 同步数字电路将依据各种参数的最坏情况来确定系统时钟。异步数字电路的数据或 者事件驱动的方式使得电路具有更强的鲁棒性,能够以该环境下的最快速度来运 行。 1 1 4 课题来源 本文的工作受到以下项目的支持: ( 1 ) 国家自然科学基金s o c 重大专项面上项目( n o 9 0 4 0 7 0 2 2 ) :异步微处理器 设计关键技术研究。 ( 2 ) 8 6 3 国家高技术研究发展计划项目( n o 2 0 0 7 a a 0 1 2 1 0 1 ) :低功耗异步数据 触发体系结构研究。 1 2 异步电路基本概念 第5 页 国防科学技术大学研究生院硕士学位论文 目自订绝大多数数字集成电路的设计是采用f r d 步的方法。同步电路是时钟驱动 的电路,即电路都通过一个共同的时钟来进行同步,可以认为所有的信号都只在 时钟的上升沿或者下降沿有效。图1 3 ( a ) 给出了同步电路的示意图。在采用硬件描 述语言进行同步设计的时候,设计者专注于数据的交互与变换,假设已经存在一 个统一的全局的时钟。但是当进行具体的物理实现时,情况就复杂的多。由于时 钟信号的负载很大,一般有成千上万个寄存器需要时钟驱动,所以目前芯片中广 泛采用的方法是利用时钟树来传递时钟信号,以驱动多个寄存器。 异步电路是事件驱动的电路,各模块通过握手信号进行交互,保证操作的顺 序,实现模块间的同步和通信。在异步集成电路中,相邻的两个寄存器之间是通 过某种方式的握手信号,而非时钟,来进行同步的。图1 3 ( b ) 所示的就是一个最简 单的请求应答握手协议电路的结构。从握手协议的角度来看,异步集成电路就是 一种数据流的结构。当有新的数据被本级寄存器锁存,并完成相应的组合逻辑运 算以后,才会向下一级发出请求信号。下面对异步集成电路的基本概念进行简单 的介绍。 c i k ( a ) 同步电路 1 - 2 1 握手协议 ( b ) 异步电路 图1 3 同步电路与异步电路示意图 握手协议定义异步模块在通信时的接口信号时序和编码方式,包括数据信号 协议和控制信号协议两部分。 ( 1 ) 数据信号协议 数据信号协议主要包括两类【3 】:数据打包协议( b u n d l e d d a t a ) 和双轨编码协议 ( d u a l r a i l ) 。所谓的数据打包是指数据信号采用普通的二值布尔代数编码,在不同 第6 页 国防科学技术大学研究生院硕士学位论文 寄存器之间传输数据时需要单独的请求( r e q ) 矛w 应答( a c k ) 信号,并将其同数据一起 打包进行传输,以实现不同模块之间的握手,如图1 4 ( a ) 所示。在数据打包协议中, 数据采用与同步电路中相同的模式进行编码。而在双轨编码握手协议中,每一位 信号采用两位数据线进行编码。数据线本身就包含了数据是否有效的信息。对于 双轨编码,数据线上的每位数据用两位表示,0 l 表示0 ,l o 表示1 ,0 0 表示没有 数据,1 l 为无效数据。双轨编码协议如图1 4 ( b ) 所示。对所有数据的两位信号经过 “或”运算再将所有或运算的结果进行“与”运算就可以得到数据线是否有效的信息。 由于双轨编码的数据线本身就包含了数据是否有效的信息,故只需要采用一个应 答信号就可以实现模块之间的握手了。数据打包协议耗费的资源较少,但需要采 用匹配延迟来模拟数据在模块间传递的延迟。双轨编码协议耗费的资源较多,但 可以和完成检测电路配合使用,从而提高流水线的性能。 r e q a c k d a t a 卜 1 2 ) a c k d a t a 卜 2 n s e n d e r r e c e i v e rs e n d e rr e c e i v e r 图1 4 数据打包协议与双轨编码协议 ( 2 ) 控制信号协议 控制信号协议主要包括两类【3 】:两段握手协议( t w o p h a s e ) 和四段握手协议 ( f o u r p h a s e ) ,如图1 5 ( a ) 和( b ) 所示。两段握手协议是基于事件的,数据有效和数 据应答都是通过信号的上升沿或者下降沿来表示。四段握手协议是基于电平的, 控制信号需要归零,数据有效和数据应答信号的上升沿表示有效动作,下降沿表 示归零动作。两段握手协议适合控制边沿触发的寄存器,四段握手协议适合控制 电平敏感的锁存器。 脚 才、1 l 脚、1 也广 触棒! j触 :垒蚪 。a t a ) = 二兰 二o a t a ) = 二二二 爵t 图2 3 可重定向模拟器工作流程 在编译器前端将高级语言程序转换成串行代码之后,需要使用串行模拟器分 析代码的动态执行特征,进一步得到应用程序运行的相关统计信息。进行串行模 拟时,模拟器并不需要读取体系结构描述文件,而是直接在传输触发微处理器基 本体系结构模型上对串行代码进行模拟,输出性能统计和程序特性信息,主要包 括函数的调用次数、运算种类及其所占的比例、活跃的通用寄存器平均数目等, 作为定制传输触发微处理器的参考信息,粗略地讲,大致包含以下几条: ( 1 ) 程序中包含的主要运算操作类型及数量决定了传输触发微处理器体系结 构中功能单元的类型与数量:根据操作类型,设计人员可以确定所需的功能单元; 第1 7 页 国防科学技术大学研究生院

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论