




已阅读5页,还剩108页未读, 继续免费阅读
(微电子学与固体电子学专业论文)定制指令与协处理器加速机制的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着微处理器性能的不断提升,嵌入式系统应用范围的不断扩大,日益增加 的运算量和复杂度已经称为当前嵌入式设计的关键问题。在数字媒体、汽车电子、 可移动电视以及智能手机等领域,复杂多变的应用需求使微处理器的运算能力面 临着巨大的挑战。当前主要的加速机制包括多核处理器加速、专用集成电路( a s i c ) 加速、基于可配置处理器的定制指令加速、协处理器加速( 如f p g a d s p 等) 等。 分析和研究各种加速机制的优缺点,为嵌入式系统加速机制的发展方向做一个有 益的探索是本论文的写作目的。 本学位论文围绕定制指令加速和协处理器加速两种机制的实现和验证工作 展开研究,重点研究了可配置处理器的设计方法学,定制指令和协处理器的设计 方法,两种加速机制的设计实现和加速性能比较,以及以处理器为中心的s o c 验证方法等。 本论文的主要研究工作和创新点包括: ( 1 ) 与项目组成员合作完成了“h 2 6 4 视频解码芯片- - v f l 0 0 0 项目的设 计和验证工作,负责可配置处理器的生成和定制指令的设计实现工作。基于多个 可配置处理器核和硬件加速模块的s o c 架构,实现了v g a 分辨率3 0 f p s 解码速度 的视频编解码系统,成功地在多普达手机和惠普个人数字助理( p d a ) 上通过了测 试。通过a r c 公司的m e t a w a r e 软件编译调试集成环境分析算法瓶颈,并利用 a r c h i t e c t 2 处理器配置工具生成配置c p u ,集成设计的定制指令硬件描述来加速 视频编解码系统。 ( 2 ) 研究了基于可配置处理器的设计方法学和可配置处理器的架构,对 h 2 6 4 视频编码标准的量化和变化算法进行了深入的研究。研究了基于可配置处 理器的s o c 设计方法学,提出了一种针可配置处理器的特性对当前的s o c 设计 方法学进行改进的方法。研究了影响处理器性能提升的因素,定制指令实现对提 高可配置处理器性能的影响,采用优化调度算法和减少关键路径运算级数的方 法,以定制指令方式实现了变换和反变换、量化和反量化算法。在联华电子 ( u m c ) 0 1 3um 工艺下实现,经j v t 参考测试码流测试表明设计满足在2 0 0 m h z 主 频下的实时处理速度,并将该设计方法成功运用于微软亚洲研究院( 北京) 的存 储系统加速项目研究中。 ( 3 ) 与项目组成员合作完成了高性能浮点协处理器的设计和验证,主要负责 协处理器的架构设计和功能验证工作。研究了基于s y s t e m c 的系统级建模方法, 提出了一种综合s y s t e m c ,v e r i l o gh d l 和v h d l 等不同层次描述语言的快速系统 模型设计方法,并设计实现了一种v f p a 协处理器的抽象层模型。该浮点协处理 器通过a r m 协处理器接口与主处理器连接,兼容v f p i i 指令集。在乘法舍入方法 i 摘要 的实现和寄存器堆的读写控制等方面均提出了新的实现方式。乘法舍入的实现通 过将单精度和双精度的舍入实现算法相结合,并将乘法的部分积译码和部分积压 缩紧密结合,从而构成高速流水线乘法器,使乘法运算的速度加快、代价更小。 在寄存器堆的读写控制方面通过给三条流水线分配优先级,使优先级高的流水线 先写寄存器堆,而优先级相对低的流水线先将要写入寄存器堆的数据写入缓冲队 列。当缓冲队列中存在有效数据时先将缓冲队列中的数据写入到寄存器堆中,同 时将流水线中的数据写入到缓冲队列中。如果有多条流水线要进行写操作,但缓 冲队列中没有足够的空间进行存储,那么优先级低的流水线就要先停止工作,直 到有缓冲空间可以使用的实现方案。该方案降低了寄存器堆的功耗和占用面积。 该浮点协处理器在9 0 n mc m o s 工艺下最高时钟频率可以达到6 0 0 m h z ,实现了一 款具有高性能和低成本的浮点协处理器。 ( 4 ) 对比研究了代码覆盖率驱动和功能覆盖率验证方法的优缺点,提出了一 种将代码覆盖率和功能覆盖率两种覆盖率相结合来设计和完善测试用例,依据验 证目的和精确需求来选择验证i p 模型的验证方法。在验证前期的模块功能仿真 验证阶段,基于白盒验证策略对各个模块进行接口时序和内部功能的验证,以代 码覆盖率作为一个衡量验证程度的标准,通过分析覆盖率不断调整激励向量以 提高功能验证效率。在集成验证阶段,采用总线功能模型代替硬件i p 模块,屏 蔽了模块内部具体的逻辑实现。在系统验证阶段,系统内模块的功能需要集成到 验证的验证特性集合中,采用抽象级别较低的设计仿真模型( d s m ) ,可以在时 钟周期级( c y c l ea c c u r a t e ) 来分析指令的执行时序,保证验证的精确性和灵活 性。验证方案有效地提高了验证的效率,具有较高的灵活性和较好的移植性,验 证i p 的设计和选取方法具有通用性。 关键词:定制指令可配置处理器协处理器加速机制功能验证 本文工作得到华为基金项目( h i t c 2 0 0 6 0 1 3 - 1 ) 支持,在此表示感谢。 a b s t r a c t ab s t r a c t a st h em i c r o p r o s s o r sp e r f o r m a n c ei m p r o v e d ,t h ea p p l i c a t i o nf i l e do fe m b e d d e d s y s t e mi sb e i n ge n l a r g e d t h ea p p l i c a t i o n sc o m p l e x i t yh a sb e e nt h ek e yp r o b l e mf o r t h ep e r f o f i n a n c eo fe m b e d d e ds y s t e m d u r i n gt h ed i g i t a lm e i d a ,m o t o re l e c t r i c , m o b i l et va n di n t e l l e c t u a lm o b i l ep h o n e sf i e l d s ,t h ed e m a n dc h a n g e ss of r e q u e n t l y t h a ti t i sh a r df o rt h em i c r o p r o c e s s o rt om e e tt h ep e r f o r m a n c e sc h a l l e n g e c u r r e n t l y m a i na c c e l e r a t i o nm e c h a n i s m si n c l u d em u l t i p r o c e s s o ra c c e l e r a t i o n 。a s i c a c c e l e r a t i o n ,c u s t o mi n s t r u c t i o nb a s e do nc o n f i g u r a b l ec p u ,c o p r o c e s s o r ( f p g a d s p ) a c c e l e r a t i o ne t e t h cp u r p o s eo ft h et h e s i si st oa n a l y z ea n dr e s e a r c ht h e c h a r a c t e r i s t i c so ft h ea c c e l e r a t i o nm e c h a n i s m s ,e x p l o r et h ed e v e l o pd i r e c t i o no ft h e a c c e l e r a t i o n t h ed i s s e r t a t i o nf o c u s e so nt h er e a l i z a t i o na n dv e r i f i c a t i o no fc u s t o mi n s t r u c t i o n a n dc o p r o c e s s o ra c c e l e r a t i o n ,m a i n l yo nt h er e s e a r c ho fd e s i g nm e t h o d o l o g yo f c o n f i g u r a b l ep r o c e s s o r , d e s i g nm e t h o d o fc u s t o mi n s t r u c t i o na n dc o p r o c e s s r , i m p l e m e n t a t i o no ft w o a c c e r a t i o nm e c h n i s ma n dt h e c o m p a r i s o n o ft h e i r p e r f o r m a n c e s v e r i f i c a t i o nm e t h o df o rs o cw h i c hc e n t e r e do np r o c e s s o r t h em a i nr e s e a r c hi n e l u d e s : 1c o o p e r a t ew i t hm e m b e r sa n df i n i s h e dt h ed e s i g na n dv e r i f i c a t i o no fp r o j e c t - ”h 2 6 4c o d e r d e c o d e rs o c v f1 0 0 0 ”,r e s p o n s i b l ef o rg e n e r a t i o no fc o n f i g u r a b l e p r o c e s s o ra n dd e s i g no fc u s t o mi n s t r u c t i o n t h es o cw a sb a s e do nm u l t i p l e c o n f l g u r a b l ep r o c e s s o r sa n ds o m eh a r d w a r ea c c e l e r a t i o nm o d u l e s ,r e a l i z e dv i d e o c o d e d e c o d ew i t h3 0 f p sf o rv g a t h es y s t e mp a s s e df i l n c t i o nt e s to nd o p o dm o b i l e a n dh pp d a t h r o u g ha n a l y z e dt h eb o t t l e n e c k so ft h ea l g o r i t h mw i t ha r c s m e t a w a r e ,g e n e r a t e dt h ec p uw i t ha r c h i t e c t 2 ,a n di m p l e m e n t e dt h eh a r d w a r e d e s c r i p t i o n so ft h ec u s t o mi n s t r u c t i o nt oa c c e l e r a t et h es y s t e m 2a n a l y z e da n dr e s e a r c h e dt h ed e s i g nm e t h d o l o g ya n da r c h i t e c t u r eb a s e do n c o n f i g u r a b l ep r o c e s s o r , d e e p l yr e s e a r c h e dt h et r a n s f o r ma n dq u a n t i z a t i o na l g o r i t h m o n eo p t i m i z e dd e s i g nm e t h d o l o g yf o rc o n f i g u r a b l ep r o c e s s o rh a sb e e np r o p o s e d t h e i m p a c t so fi m p l e m e n t a t i o no fc u s t o mi n s t r u c t i o nf o rp e r l e r m a n c eh a sb e e nr e s e a r c h e d , w i t ho p t i m i z i n gs c h e d u l ea l g o r i t h ma n dr e d u c i n gk e yp a t h sm e t h o d ,i m p l e m e n t e dt h e t r a n s f o r ma n di n v e r s cn a n s f o r m q u a n t i z a t i o na n di n v e r s eq u a n t i z a t i o n t h ed e s i g n h a sb e e ni m p l e m e n t e di nu m c s0 13 u mc m o sp r o c e s s t h et e s tw i t hj v tb i t s t r e a m d e m o n s t r a t e dt h a tt h ed e s i g nc a ng e tr e a lt i m ep e r f o r m a n c ew i t h2 0 0 m h zf r e q u e n c y t h ed e s i g nm e t h o dw a sa p p l i e di n t om i c r o s o rr e s e a r c ha s i a sp r o j e c to fs t o r a g e s y s t e ma c c e l e r a t i o ns u c c e s s f u l l y 3c o o p e r a t e dw i t hm e m b e r sa n di m p l e m e n t e dt h ed e s i g na n dv e r i f i c a t i o no fh i g h p e r f o r m a n c ef l o a t i n gp o i n tc o p r o c e s s o r ,r e s p o n s i b l e f o ra r c h i t e c t u r ed e s i g na n d v e r i f i c a t i o no fc o p r o c e s s o r r e s e a r c h e dt h es y s t e ml e v e lm o d e ld e s i g nm e t h o db a s e d o ns y s t e m c ,o n ed e s i g nm e t h o dw i t hs y s t e m c ,v e r i l o gh d la n dv h d ll a n g u a g e s f o rs y s t e ml e v e lm o d e lw a sp r o p o s e d ,i m p l e m e n t e do n ea b s t r a c t e dl e v e lm o d e lf o r i i i a b s t r a c t v f p a v f p ac o m m u n i c a t e dw i t ha r m sc o p r o c e s s o ri n t e r f a c e ,c o m p l i a n c ew i t h v f p1li n s t r u c n t i o ns e t o n en e wm e t h o df o rm u l t i p l i c a t i o nr o u n di m p l e m e n t a t i o n a n dr e g i s t e tf i l ec o n t r o l l i n gw a sp r o p o s e d t h r o u g hc o m b i n i n gt h es i n g l ea n dd o u b l e p r e c i s i o nm u l t i p l i c a t i o nr o u n da l g o r i t h m ;c l o s e l yi m p l e m e n tt h ep a r t i a lp r o d u c t d e c o d e ra n dp a r t i a lp r o d u c tc o m p r e s s i o n ,o n eh i g hs p e e dp i p e l i n em u l t i p l i c a t i o n i m p l e m e n t e d d r u i n gt h er e g i s t e rf i l ec o n t r o l ,t h r o u g hp r i o r i t yt h et h r e ep i p e l i n e s ,t h e p i p e l i n ew i t hh i g h e s tp r i o r i t yw a sa l l o w e dt oa c c e s st h er e g i s t e rf i l e ,o t h e r w i s et h e p i p e l i n ew i t hl o w e rp r i o r i t yw o u l ew r i t et h ed a t ai n t ob u f f e r w h e nt h e r ei sd a t av a l i d i nb u f f e r t h ed a t aw o u l db ew r i t t e ni n t or e g i s t e rf i l ea n dt h ed a t af r o mt h ep i p e l i n e w a sw r i t t e ni n t ob u f i f e r i ft h e r ea r em u l t i p l ep i p e l i n e sw h i c hw o u l dw r i t t ed a t a 。a n d t h e r ei sn oe n o u g hs p a c ef o rt h ed a t a ,t h e nt h ep i p e l i n ew i t hl o w e rp r i o r i t yw o u l ds t a l l u n t i lt h e r ei ss p a c ef o rt h ed a t a t h em e t h o dr e d u c e dt h ep o w e ra n dt h ea r e ao ft h e i m p l e m e n t a t i o no fr e g i s t e rf i l e v f p - a sf r e q u e n c yc a ng o t6 0 0 m h zi n9 0 n mc m o s p r o c e s s ,o n eh i g hp e r f o r m a n c e a n dl o wc o s t f l o a t i n gp o i n tc o p r o c e s s o rw a s i m p l e m e n t e d , 4c o m p a r e dt h ec h a r a c t e r i s t i c so fc o d ec o v e r a g ea n df u n c t i o nc o v e r a g ed r i v e n m e n t h o d s ,o n em e t h o df o rd e s i g nt e s tc a s ew i t hc o m b i n i n gt h ec o d ec o v e r a g ea n d f u n c t i o nc o v e r a g e ,t h ev e f i c a t i o ni pm o d e ls e l e c t i o nb a s e do nv e r i f i c a t i o np u r p o s ea n d t h ea c c u r a t ed e m a n dw a sp r o p o s e d d u r i n gt h eu n i tt e s ts t a g e ,t h ei n t e r f a c et i m i n ga n d i n n e rf u c n t i o na r ev e r i f i c a t i o n e dw i t hw h i t e b o xv e r i f i c a t i o n ,u s i n gt h ec o d ec o v e r a g e a st h ee x t e n to fv e r i f i c a t i o n t h r o u g ha n a l y i n gt h ec o v e r a g e ,s u p p l e m e n tt h et e s tc a s e t oi m p r o v et h ee f f i c i e n c yo fv e r i f i c a t i o n d u r i n gt h ei n t e g e rt e s ts t a g e ,b u sf u n c t i o n m o d e lc h o s e dt or e p l a c et h eh a r d w a r ei p ;t h er e a ll o g i ci m p l e m e n t a t i o no ft h em o d u l e w a so v e r l e a p e d d u r i n gt h es y s t e mv e r i f i c a t i o ns t a g e ,t h ef u n c t i o n so ft h em o d u l e s h o u l db ei n t e g r a t e di n t ov e r i f i c a t i o nc h a r a c t e r i s t i cs e t , t h ed e s i g ns i m u l a t i o nm o d e l w i t hl o w e ra b s t r a c tl e v e ld e s c r i p t i o nw h i c hs u p p o r tc y c l ea c c u r a t el e v e la n a l y s i sw a s s e l e c t e d ,t h ea c c u r a c ya n df l e x i b i l i t yw e r ee n s u r e d t i l ed e s i g np l a ni m p r o v e dt h e e f f i c i e n c y ,f l e x i b i l t ya n dp o r t a b i l i t y t h em e t h o do fd e s i g na n dc h o o s ev e r i f i c a t i ni p c a ng i v eh i g hg e n e r a l i t y k e y w o r d s :c u s t o mi n s t r u c t i o n ,c o n f i g u r a b l ep r o c e s s o r ,c o p r o c e s s o r , a c c e l e r a t i o nm e c h a n i s m ,f u n c t i o nv e r i f i c a t i o n t h i sd i s s e r t a t i o ni ss u p p o r t e db yh u a w e ir e s e a r c hf u n d ( h i t c 2 0 0 6 0 1 3 - 1 ) t h a n k sf o rt h e i rs u p p o r t s i v 目录 图目录 图1 1 处理器的功耗性能比较2 图1 2m a k i m o t o 曲线图5 图1 3 可配置处理器的定制指令实现结构示意图6 图1 4 高级编程语言实现定制指令流程8 图1 5r 3 0 1 0 与m c 6 8 8 2 的性能对比1 1 图1 6a r m l1 3 6 j f - s 的结构示意图1 2 图1 7a s i cd s p 和f p g a 的性能对比示意图1 3 图1 8 功能验证路径图1 s 图2 1 基于协处理器实现的r i s p 结构图2 0 图2 2 基于a s i p 实现的r i s p 结构图2 0 图2 3 不同实现方式的性能对比2 1 图2 4 典型的s o c 设计流程2 3 图2 5a r c6 2 5 d 结构图2 7 图2 6 典型的处理器配置流程图2 9 图2 7a r c 处理器生成流程图3 0 图2 8 专用指令处理器的指令生成过程3 1 图2 9a r c 定制指令的生成过程3 3 图2 1 0 存储系统结构图3 6 图2 1 l 硬件验证平台图。3 8 图3 1h 2 6 4 编码器框图4 l 图3 2h 2 6 4 解码器框图4 2 图3 3 蝶形计算结构图4 5 图3 4 定制指令执行时序4 8 图3 5 辅助寄存器典型写操作4 9 图3 6 辅助寄存器典型读操作4 9 图3 7 变换操作的硬件实现结构图5 5 图3 8 子块变换的流水操作图5 6 图3 9 量化模块乘法操作实现结构图5 6 图3 i 0a r c 验证环境5 8 图3 1 lh 2 6 4 解码系统验证环境5 9 图4 1v f p 结构图6 6 图4 2a r m 与v f p 交互示意图7 3 图4 3s y s t e m c 语言结构7 5 图4 4v f p - a 参考模型内部结构7 6 图4 5t o k e n 队列缓冲。7 8 图4 6 除法开方流水线结构8 0 图5 1 系统验证环境8 6 图5 2a r m ll 流水线示意图8 7 图5 3a r mv i p 与v f p a 接口时序8 8 v i i i 目录 图5 4a r mv i p 结构组成8 9 图5 5 代码覆盖工作流程9 1 图5 6 协处理器协同验证流程:9 4 i x 中国科学技术大学学位论文相关声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作 所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任 何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究 所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即:学 校有权按有关规定向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 保密的学位论文在解密后也遵守此规定。 作者签名: 砷年 第1 章绪论 第1 章绪论 嵌入式系统是以微处理器为中心的复杂系统。随着应用需求的不断变化, 日益增加的运算量和复杂度对微处理器的处理能力提出了更高的要求。人们提 出了各种加速机制来提高嵌入式系统的处理性能,寻找一种灵活高效的加速机 制成为嵌入式系统的一个研究重点。提高处理器的频率和增加处理器核是个人 计算领域常用的加速机制,但多核处理器需要软件的并行化来充分提高性能, 操作系统和软件现在还无法充分利用多核的高度并行性。提高频率必然会使系 统功耗增加,减小系统的待机时间。嵌入式领域的低功耗和低成本特性决定了 这两种常规加速机制难以广泛使用。而专用集成电路的高性能和低功耗特性作 为处理器的有力补充,可以大幅提高系统的性能。如何充分利用专用硬件电路 的高性能和处理器的高灵活性已经成为研究加速机制的一个重要影响因素。依 据专用硬件电路与处理器的相对关系,我们将加速机制分为以下几类: ( 1 ) 定制指令加速:硬件集成到处理器内部,作为数据通路加速的一部分。 例如可配置处理器,可重配置指令集处理器( r e c o n f i g u r a b l ei n s t r u c t i o ns e t p r o c e s s o r ) 等。 ( 2 ) 通用协处理器核加速:硬件与处理器紧耦合,共享数据通路和存储器 等。例如微处理器集成的浮点协处理器等。 ( 3 ) f p g a d s p 加速:硬件通过处理器的i o 总线与处理器互联,成为通用处 理功能的协处理器。例如d s p 作为音视频处理的协处理器与主处理器通过板上 总线互联,f p g a 作为可重构协处理器与主处理器通过板上总线互联等。 ( 4 ) 专用集成电路加速:为加速某种特定的应用而专门设计的硬件电路, 通过片上互联机制与主处理器相连。 专用集成电路设计过长的设计开发周期,非重复性工程费用n r e ( n o n r e c u r r i n ge n g i n e e r i n g ) 费用,缺乏灵活性等阻碍了其在嵌入式系统中的大规模 应用。基于可配置处理器的定制指令加速和协处理器加速两种机制,分别以较 高的灵活性和高性能的特点成为当前研究领域关注的方向。本文将对定制指令 和协处理器的设计方法及其实现和应用展开研究。本章首先介绍可配置处理器 的研究现状,定制指令的描述方法以及定制指令的设计优势分析,然后回顾了 协处理器的发展,分析了典型的协处理器架构,总结协处理器的加速技术优势, 最后介绍本文的主要工作和论文结构安排。 第l 章绪论 1 1 可配置处理器和定制指令概述 处理器( m i c r o p r o c e s s o r ) 从应用角度可以分为三类:服务器用处理器,桌 面电脑处理器和嵌入式处理器。服务器用处理器主要用于主机( m a i n f r a m e ) 和 巨型计算机( s u p e r c o m p u t e r ) ,其高性能和高可靠性要求,使得这一领域只有 少数几个服务器大厂占据。代表厂商包括i b m ,惠普( h p ) ,太阳( s u n ) 和 戴尔( d e l l ) 等,高端处理器大部分是基于r i s c 架构的多核处理器。桌面处理 器主要指个人电脑( p e r s o n a lc o m p u t e r ) 和桌面计算领域,基于c i s c 的x 8 6 架 构处理器统治着桌面处理器市场。嵌入式处理器指应用于手机、机顶盒、工业 控制、汽车电子和智能家电等领域的处理器,小巧、灵活和低功耗是其主要特 点。这一领域主要被r i s c 处理器所垄断,代表性的处理器为a r m 公司的a r m 处理器系列,m i p s 公司的m i p s 3 24 k ,2 4 k 系列等。近年i n t e l 公司针对嵌入式 市场发布的a t o m 处理器以低功耗和应用软件丰富等优点迅速切入上网本、m i d ( m o b i l ei n t e r n e td e v i c e s ) 等嵌入式领域。r i s c 阵营凭借多年的市场积累,先 进的处理器架构,高性能和低功耗的特点,仍处于该市场的领导地位。 罐 督 服务器用处理器 o 桌面电脑处理器 o 嵌入式处理器 o 性能 趟 ! g 咏 删 驻 可配置处理器 数字信是处理器 o o v 嵌入式通用处理器 。 性能 a 三种处理器的功耗性能比较b 嵌入式处理器的灵活性和性能比较 图1 1 处理器的功耗性能比较 在嵌入式处理器领域,除了通用处理器外,还包括可配置处理器和数字信 号处理器( d i g i t a ls i g n a lp r o c e s s o r ) 等。其中可配置处理器是为保持微处理器的 灵活性和可编程特点,解决微处理器相对于a s i c 以及f p g a d s p 等过低的性能 而出现的一种处理器。a r c ,n x p ,s t r e t c h 和t e n s i l i c a 公司均推出了各自的可配 置处理器,其结合了微处理器的灵活性和硬件电路的高性能低功耗特点,在软 硬件之间取得了较好的平衡。在音视频编解码,d s p 基带处理和网络接入等领 域均表现出了其突出的性能。可配置处理器中还有一种比较特殊的可编程器件 第1 章绪论 专用处理器,如a l t e r a 公司的n i o sl i 系列,x i l i n x 公司的m i c r o b l a z e 和p i c o b l a z e 系列。其中a l t e r a 公司的n i o s 系列还支持扩展定制指令功能。这些软核处理 器由可编程器件公司开发和维护,应用平台局限于现场可编程逻辑阵列 ( f p g a ) ,但其灵活性配合f p g a 的现场可编程特性,使这一类处理器的灵活 性更高。 图1 1 对处理器的性能,功耗和灵活性等进行了对比。嵌入式系统的应用 特点决定了处理器必须具有良好的灵活性,并且提供足够高的性能满足各种应 用需求。可配置处理器的可定制和可扩展特点,促进了其在嵌入式领域应用范 围的扩大。 1 1 1 可配置处理器的研究现状 处理器最初的灵活性只是表现在提供高速缓存( c a c h e ) 大小及其结构配置, 可选的主内存管理单元( m a i nm e m o wu n i t ) ,可选的硬件乘法指令以及总线 接口的配置等。软件层面只需对处理器软核( s o f tc o r e ) 在编译生成最终处理 器代码时进行相应的定义即可实现。随着技术的发展,扩展指令和定制逻辑也 实现了可配置,指令的可定制特性给处理器带来了可与a s l c 相比的高性能,但 扩展指令需要软件、编译器和硬件实现的协同设计,自动化程度也需提高。这 促进了全自动处理器生成原理的形成。当前可配置处理器的研究方向主要为确 定系统功能,定位和自动实现硬件架构,编译器的自动识别指令等技术的相关 算法上。如:( c a r l og a l u z z i ,e ta 1 ,2 0 0 6 ) ;( j a s o nc o n g ,e ta 1 ,2 0 0 5 ) ;( p a ny u , t u l i k am i t r a ,2 0 0 4 ) ;( j a s o nc o n g ,e ta 1 ,2 0 0 4 ) ;( n o z o m ut o g a w a ,1 9 9 9 ) 。 设计者前期根据应用程序的评估,对相应的算法以定制指令方式实现,用 硬件实现定制指令来加速相应的运算瓶颈,从而获得较高的性能。设计后期如 果设计算法发生改变或设计约束发生更改,只需要修改相关算法所影响的程序。 甚至可以直接屏蔽相关定制指令,而采取通过通用指令来实现的方式,与专用 集成电路相比可以节省大笔的非重复性工程费用。 可配置处理器的设计方法根据其应用环境有很大的不同,一般设计环境均 有提供相应的预定义模块,含有通用指令集的处理器模块,软件配置环境和算 法分析工具等。有的设计流程( 例如t e n s i l i c a 公司) 会提供一种类似硬件描述 语言的描述方式,用户可以利用这种接口进行指令扩展和处理器配置的工作。 比较典型的可配置处理器包括t e n s i l i c a 公司的x t e n s a ,a r c 公司的a r c 6 0 0 和 a r c 7 0 0 ,a l t e r a 公司的n i o si i 和s t r e t c h 公司的$ 6 0 0 0 等。下面将对各处理器的 结构和特点进行详细的分析。 3 第1 章绪论 x t e n s a 是3 2 位的可配置和可扩展微处理器,提供一个图形配置接口进行 处理器的参数化配置。指令集包括大约8 0 条基本指令,提供了3 2 个通用寄存 器和3 2 个可选寄存器,并且提供浮点协处理器接口,可选的c a c h e 大小,大小 端配置以及乘累加等指令。t i e ( t e n s i l i c ai n s t r u c t i o ne x t e n s i o n ) 描述语言用来 对定制指令进行功能描述,编译器可以根据提供的参数和t i e ,自动进行处理器 生成。定制指令可以选择3 2 位或6 4 位长度的格式,甚至可以指定操作数的个 数。定制指令格式在指令并行性较大的应用算法中,可以采用类似甚长指令字 ( v e r yl a r g ei n s t r u c t i o nw o r d ) 的指令格式,从而可以压缩代码大小和提高处理 性能。 a r c6 0 0 和a r c 7 0 0 系列是基于a r c o m p a c t 指令集的1 6 3 2 位处理器核。它 将r i s c 与d s p 统一在一个架构中,提供指令、核心寄存器( c o r er e g i s t e r ) 、 辅助寄存器( a u x i l i a r yr e g i s t e r ) 和条件码( c o n d i t i o nc o d e ) 的扩展。并提供外 围设备,主机接口,存储器控制器,数据存储单元( l o a d s t o r eu n i t ) 和中断模 块等的定制。a r c 处理器针对数字信号处理提供了丰富的数字处理指令集( d s p p a c k ) ,包括乘累加,双v i t e r b i 蝶形计算( d u a lv i t e r b ib u t t e r f l y ) ,循环冗余校 验( c y c l i cr e d u n d a n c yc h e c k ) 指令等。提供的多b a n k 结构的y 存储器,支持 1 6 位和3 2 位的寻址方式,支持多个指针同时访问y 存储器。a r c 公司的 m e t a w a r e 工具完成对算法编译,调试和性能分析,并支持对目标处理器的性能 评估。a r c h i t e c t 2 的图形界面支持用户方便的对处理器进行定制和扩展,生成配 置处理器,以及相应的测试环境,仿真,综合和f l o o r p l a n 的运行脚本。 n i o s 是a l t e r a 公司的第二代处理器软核,支持c a c h e 的配置和最多2 5 6 条定制指令的扩展,并且提供可选的乘法和除法指令。s o p cb u i l d e r 提供从处 理器配置到硬件设计生成需要的所有工具。用户通过图形界面可以对处理器进 行外围设备,存储单元,可选指令等的配置,用户通过硬件描述语言v e r i l o g 或v h d l 对定制指令进行功能描述,提供单周期或多周期指令扩展。s o p cb u i l d e r 通过导入h d l 设计文件,将定制指令集成到n i o si i 处理器中。针对f p g a 的硬 件结构进行优化的n i o si i 处理器,使其具有较高的可定制性和可编程性。 $ 6 0 0 0 是s t r e t c h 公司基于t e n s i l i c a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 静脉炎临床表现试题及答案2025年版
- 2025年特色小镇文化旅游产业技术创新项目与旅游人才培训可行性研究报告
- 2025年陶瓷材料3D打印增韧在航空航天发动机涡轮叶片的耐腐蚀创新实践
- 2025煤炭买卖合同(卖方版本)
- 2025年3D打印技术在医疗器械制造中的发展
- 2025年3D打印技术在定制化家具中的应用
- 年产汽车配件200万件、电脑配件100万件扩建项目环评报告表
- ST易购:长沙家乐福超市有限责任公司股东全部权益价值项目资产评估报告
- 2025股权转让合同书律师拟定版
- 锅炉知识培训微课教案课件
- 信息网络安全考题「附答案」
- 2025年反诈骗知识竞赛问答试题及答案
- 矿井建设工程课件
- 消防设备设施操作讲解培训课件P
- 2025年执业医师考试-中医师承及确有专长考核历年参考题库含答案解析(5卷单选一百题)
- 2025年中储粮储运有限公司招聘考试真题+答案
- 蝴蝶粘土儿童课件教学
- 氨水氨气培训课件
- 第9课《天上有颗“南仁东星”》课件 2025-2026学年统编版八年级语文上册
- 早读的好处教学课件
- 2025年生态与环境保护的法律法规考试题及答案
评论
0/150
提交评论