(电子科学与技术专业论文)ftc55lp地址数据流单元的设计与实现.pdf_第1页
(电子科学与技术专业论文)ftc55lp地址数据流单元的设计与实现.pdf_第2页
(电子科学与技术专业论文)ftc55lp地址数据流单元的设计与实现.pdf_第3页
(电子科学与技术专业论文)ftc55lp地址数据流单元的设计与实现.pdf_第4页
(电子科学与技术专业论文)ftc55lp地址数据流单元的设计与实现.pdf_第5页
已阅读5页,还剩87页未读 继续免费阅读

(电子科学与技术专业论文)ftc55lp地址数据流单元的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国防科学技术大学研究生院t 学硕士学位论文 a b s t p a c t f t - c 5 5 l pi sa16 - b i tf i x - p o i n t1 0 w - p o w e rd s p i th a ss u p e rh a r v a r da r c h i t e c t u r e w h i c hi sc o n s i s t e do ff i v ed a t ab u s e sa n do n ep r o g r a mb u s t h ep i p e l i n ei s12s t a g e s d e e p ,a n dt h er e s o u r c ec o n f l i c ti sc o m p l e t e l yr e s o l v e db yh a r d w a r em e c h a n i s m f o rt h e p u r p o s eo ft h ee f f i c a c i o u su s eo ft h eh a r d w a r e f t c 5 5 l pd e s i g n e da l la d d r e s s d a t a f l o wu n i t ( a - u n i t ) w h i c hc o n t a i n sad a t aa d d r e s sg e n e r a t i o nu n i t ( d a g e n la n da n a u x i l i a r ya l ud e s i g n e d l y t h ee x i s t e n c eo ft h i su n i te n h a n c e st h ed a t ap r o c e s s i n g a b i l i t yo ff t - c 5 5 l pg r e a t l y i nt h i sp a p e r , a - u n i ti sd e s i g n e da n di m p l e m e n t e dw i t h t h et o p d o w nm e t h o d o l o g y ,b a s i n go nt h o r o u g hr e s e a r c ho ff t - c 5 5 l pi n s t r u c t i o n s y s t e ma n d m i c r o - a r c h i t e c t u r e d a g e ng e n e r a t e sd a t aa d d r e s so fi n s t r u c t i o n sw h i c hh a v em e m o r ya c c e s s o p e r a t i o n s i t sap r e r e q u i s i t eo ft h ew e l lf u n c t i o n a lp i p e l i n e i t si m p l e m e n t a t i o nr e l i e s o nt h ea d d r e s s i n gm o d e so ff t c 5 5 l p i nt h i sp a p e r ,w ef i r s t l ya n a l y z et h et y p i c a l a r i t h m e t i co fd s pa n dt h e nw ed i s c u s st h er e a s o na n dt h eb e n e f i to ft h es p e c i a l a d d r e s s i n gm o d e si nd s p b a s e do nt h i s 。w ed e s i g nt h ea d d r e s s i n gm o d e si nf t c 5 5 l p a n dt h eh a r d w a r eo fd a g e l q t h e r ea r et h r e eu n i t si nd a g e n a n dt h e yc a l le x e c u t e t h r e em e m o r yr e a do p e r a t i o n so rt w om e m o r yw r i t eo p e r a t i o n sp e rc y c l ea tm o s t w e d e s i g nt h er e u s i n g h a r d w a r ea n dt h er u l e sf o rp a r a l l e l u s eo ft h eh a r d w a r eb y i n s t r u c t i o n s ,w h i c ha r ea 1 1b a s e do ni n g e n e r a t ei l p so ft h ei n s t r u c t i o ns e t t h e s ed e s i g n m e t h o d sc a nr e d u c et h ep o w e rc o n s u m p t i o no ft h es y s t e m t h er e a s o nw ed e s i g nt h ea u x i l i a r ya l ub a s e do nt w of o l l o w i n gf a c t s f i r s t t h et i c 5 410d s p ,w h i c hd o e s n th a v ea u x i l i a r ya l u h a sm a n yc o n v e r s i o no p e r a t i o n sf r o m 4 0 - b i tt o16 - b i t s e c o n d ,d a g e ns u p p o r t st w oi n s t r u c t i o n si s s up e rc y c l e 1 1 1 i sa l u o p e r a t e s16 一b i tr e g i s t e r si na u n i tm o s t l y s oi ti sa l s od e s i g n e di nau n i t w ed e s i g n a n di n p l e m e n tt h eh a r d w a r eo ft h i sa l ub a s e do ni t sf u c t i o n s s o m es i m p l eo p e r a t i o n s c a nb ep e r f o r m e db yt h i sa l uw h e nt h ep r i m a r ya l ui sr u n n i n go rb ed i s p a t c h e dt ot h e l o wp o w e ra l u - - a u x i l i a r ya l u s ot h ee x i s t e n c eo ft h ea u x i l i a r ya l ue n h a n c e st h e p a r a l l e lo ft h ei n s t r u c t i o ns e ta n dr e d u c e st h ep o w e rc o n s u m p t i o no ft h es y s t e m a tt h ee n do ft h i sp a p e r t h ev e r i f i c a t i o ni n v o l v i n gm o d u l ea n du n i to fo u r d e s i g ni s p e r f o r m e da n dw es t a t i s t i c s t h ec o d ec o v e r a g ea tt h es a l t l et i m e t h er e s u l t so f s i m u l a t i o ns h o wt h a to u rd e s i g nc a nf u l l ym e e tt h et e c h n i c a lr e q u i r e m e n t so ff t c 5 5 l p , a n dt h ef u n c t i o ni sc o r r e c t k e yw o r d s - f t c 5 5 l p ,d i g i t a ls i g n a lp r o c e s s o r ,d s p ,a d d r e s s d a t af l o wu n i t , d a g e n ,a d d r e s s i n gm o d e ,a u x i l i a r ya l u ,f u n c t i o n a lv e r i f i c a t i o n 第i i 页 国防科学技术大学研究生院工学硕+ 学位论文 表2 1 表3 1 表3 2 表3 3 表3 4 表3 5 表3 6 表3 7 表3 8 表3 9 表3 1 0 表4 1 表4 2 表 表 表 表 表5 2 表5 3 表6 1 表6 2 表6 3 表6 4 表6 5 表6 6 表6 7 表6 8 表 表 表 表 9 1 0 l 1 1 2 表目录 f t c 5 5 l p 各种访问类型下的总线使用表1 2 常见寻址模式列表- :2 0 两组数据在循环缓冲区中存放位置表2 6 8 点基2 f f t 变换的输入序列和输出序列2 8 绝对寻址:2 9 直接寻址3 0 a r 间接寻址操作数列表31 双a r 间接寻址操作数列表3 4 c d p 间接寻址操作数列表3 4 系数间接寻址操作数列表:3 5 循环寻址寄存器配置表3 5 a 单元指令列表3 7 指令限定符列表3 8 d a g e n 对于各种功能的硬件复用策略3 9 三类输出信号分类列表4 9 第二类信号译码规则4 9 a l u 输入数据信号列表j 5 6 位操作与逻辑操作对应表5 7 四种比较关系的选择输出列表6 5 模块级验证的功能覆盖率和代码覆盖率统计7 1 寄存器初始值列表7 2 直接寻址和绝对寻址输入激励7 2 a r m s = 0 的情况下a r n 间接寻址和系数间接寻址输入激励7 3 a r m s = 0 的情况下双a r 间接寻址和系数间接寻址输入激励7 4 a i 洲s = 1 的情况下a r n 间接寻址输入激励7 5 a i w s = l 的情况下双a r 间接寻址输入激励7 6 a i w s = o 的情况下a r n 间接寻址使用循环寻址的输入激励7 7 部件测试寻址模式时的子模块覆盖率统计7 7 部件测试寻址模式和a 单元指令时的子模块覆盖率统计7 8 部件测试a l u 运算功能时的子模块覆盖率统计7 8 部件测试流水线时序时的子模块覆盖率统计对比7 9 第1 v 页 国防科学技术大学研究生院工学硕士学位论文 图1 1 图1 2 图2 1 图2 2 图2 3 图2 4 图2 5 图2 6 图2 7 图2 8 图2 9 图3 1 图3 2 图3 3 图3 4 图3 5 图3 6 图3 7 图3 8 图3 9 图4 1 图4 2 图4 3 图4 4 图4 5 图4 图4 图4 图4 图目录 方进定律6 r t l 级设计方法典型设计流程7 f t c 5 5 l p 指令的基本格式1o f t c 5 5 l p 总体结构图1 1 i 单元结构图1 3 p 单元结构图1 4 a 单元结构图1 4 d 单元结构图15 取指流水线1 6 执行流水线1 6 地址数据流单元总体结构图1 7 寻址模式使用频率【1 8 】2 0 偏移量和立即数平均值【1 8 】一2 1 三种指令集系统结构的访存数量对比2 3 循环代码2 3 存在变址寄存器的自增自减寻址模式2 4 三种寻址模式的访存数量对比2 4 是否支持系数寻址模式对指令序列的影响2 5 系数寻址对访存次数的影响2 5 8 点基2 f f t 变换流程图一2 7 d a g e n 总体结构示意图3 8 通用数据地址产生模块结构图3 8 寻址模式译码模块总体结构图4 0 a ra u 子模块设计图4 2 1 位双向进位加法器设计图4 3 两位双向进位加法器设计图4 4 u p d a t e 子模块设计图一4 5 地址生成子模块结构设计图4 6 系统堆栈地址产生模块设计图4 7 图4 1 0 寻址方式译码流程图4 8 图5 1 t ic 5 4 1 0 指令混合情况5 2 图5 2 对f i r 指令序列进行并行优化前后的对比5 4 第v 页 国防科学技术大学研究生院工学硕七学位论文 图5 3 图5 4 图5 5 图5 6 图5 7 图5 8 图5 9 图5 1 0 图5 1 1 图5 1 2 图5 1 3 图5 1 4 图5 1 5 图6 1 图6 2 图6 3 图6 4 图6 5 图6 6 图6 7 图6 8 辅助a l u 总体设计结构5 5 核心加法器总体设计结构5 8 串行进位加法器5 9 进位旁路加法器5 9 进位跳跃加法器6 0 超前进位加法器6 0 线性进位选择加法器6 1 1 6 位b r e n t k u n g 树结构6 2 1 6 位s k l a n s k y 树结构6 2 k o g g e & s t o n e 算法进位连接关系。:6 3 各种加法器结构的传播延迟与位数n 的关系6 3 1 6 位超前进位加法器内部电路6 4 条件处理子模块总体设计6 5 模拟系统组成6 8 验证流程6 9 直接寻址和绝对寻址模拟结果7 3 a r m s = 0 的情况下a r n 间接寻址和系数间接寻址模拟结果7 4 a r m s = 0 的情况下双a r 间接寻址和系数间接寻址模拟结果7 5 a r m s = i 的情况下a r n 间接寻址模拟结果7 6 a r m s = i 的情况下双a r 间接寻址模拟结果7 6 a r m s = 0 的情况下a r n 间接寻址使用循环寻址的模拟结果7 7 第v i 页 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示谢意。 学位论文题目:旦! 二竺! ! 坠里地址数堡速皇丞鲍遮过鱼塞理 学位论文作者签名: 王勃 日期:力卵留年月0 日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权 国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子 文档,允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密学位论文在解密后适用本授权书。) 学位论文题目: ! 二堡! i l 里地址熬堡速望丞鲍遮进曼塞理 学位论文作者签名:王受为 作者指导教师鲐啦丝噍 日期:劢面年睑月,7 日日期:枷年? 2 月,7 日 日期:汤秒矿年f 少月7 矿日 国防科学技术大学研究生院t 学硕士学位论文 第一章绪论 d s p 是指数字信号处理( d i g i t a ls i g n a lp r o c e s s i n g ) 或数字信号处理器( d i g i t a l s i g n a lp r o c e s s 0 0 。本文的研究对象是一款专门用于数字信号处理的低功耗处理器 f t c 5 5 l p 。为了让指令能够更为灵活的访问存储器,f t c 5 5 l p 设计了多种访存 方式,同时也为多个运行的程序创造了一个和谐的存储环境。但是,访存方式的 多样性导致了地址计算和生成时间的增加。为减小访存时间,要求一种快速的途 径实现地址计算和生成。因此,在f t c 5 5 l p 处理器中,设计了专门用于执行数据 地址计算和生成的功能部件一地址数据流单元,它是f t c 5 5 l p 的关键组成部分之 一,它的存在可以大大提高流水线效率和指令的并行性。 1 1 课题背景 自从2 0 世纪7 0 年代末第一块d s p 芯片诞生以来,d s p 技术取得了飞速的发 展。在近几十年里,d s p 芯片已经被广泛应用于信号处理、音视频处理、控制、 通信、军事等诸多领域。随着d s p 芯片的速度、单位运算量和性价比不断提高, 以及功耗的显著降低和开发环境的日趋完备,可以预计,d s p 芯片将渗透到更多 的领域,其应用也将更加广泛。美国德州仪器( 简称t i ) 公司作为全球d s p 的领 导者,目前在全球各应用领域主推有三大d s p 平台,其产品占据了全球d s p 市场 的5 0 的份额。它们分别是适合于控制优化的t m s 3 2 0 c 2 0 0 0 系列、低功耗的 t m s 3 2 0 c 5 0 0 0 系列以及高性能的t m s 3 2 0 c 6 0 0 0 系列l l j 。 目前,我国的d s p 产品主要来自国外。1 9 8 3 年t i 公司的第一代产品t m s 3 2 0 1 0 最先进入中国市场,之后t i 公司通过提供d s p 的培训课程,使该公司d s p 产品 的市场份额不断扩大。现在t i 公司的d s p 产品约占国内市场的9 0 ,其余的市场 份额由l u c e n t 、a d 、m o t o r o l a 、z s p 和n e c 等公司占有。对于d s p 的发展,我 国与国外相比不论是在硬件设计方面,还是在软件应用方面都存在着很大的差距, 还有很长的一段路要走。但是,d s p 毕竟还是个新兴的产业,我们对国内d s p 的 开发和应用前景充满希望和信心。 近年来,随着互联网的高速发展、无线应用的日趋成熟以及便携式多媒体设 备的出现,市场和业界对d s p 的性能又提出了新的要求,从以前要求性能要求速 度开始转向更多的要求功耗。业界以及消费者希望购买的手机、便携式音乐播放 器设备等能够有较长时间的待机而不是将时间浪费在充电与更换电池上,这就要 求d s p 的设计者要将目光更多的投向芯片的功耗方面。业界对低功耗类d s p 的基 本应用需求主要有四类【4 】。 第1 页 国防科学技术大学研究生院下学硕+ 学位论文 在保持或略微提高性能的条件下,大大延长电池寿命; 在保持或稍微延长电池寿命的条件下,大大提高性能; 要求很小的尺寸、超低功耗、中低水平的d s p 性能; 高功效的设施( r a s 、v o p 、多通道的网关等) ,要求提高信道密度,但又有 严格的板级功耗和空间的限制。 f t c 5 5 l p 芯片的研制项目正是在这样的背景下产生的,它与t i 公司的 t m s 3 2 0 c 5 5 x 指令级兼容,来源于某预研项目“1 6 位定点低功耗数字信号处理器 c p u 核的研制”。本论文课题是该研制项目的一部分,任务是f t c 5 5 l p 地址数据 流单元的设计与实现。 1 2 相关研究 数字信号处理器( d s p ) 是专门为快速实现各种数字信号处理的算法而设计的, 随着微电子和计算机技术的提高,d s p 技术也得到了日新月异的发展。在当今的 数字化时代背景下,已成为通信、计算机、消费类电子产品等领域的基础器件, 被誉为信息社会革命的旗手。业内人士预言,未来d s p 将彻底变革人们的工作、 学习和生活方式。 1 2 1d s p 的发展历程 d s p 发展历程大致分为三个阶段:7 0 年代理论先行,8 0 年代产品普及,9 0 年 代突飞猛进。在d s p 芯片出现之前,数字信号处理只能依靠m p u 来完成,但是 m p u 处理速度低,难以满足高速实时处理的要求。因此,库利( c o o l e y ) 和图基 ( t u k e y ) 在1 9 6 5 年发表了著名的快速傅里叶变换f f t ( f a s tf o u r i e rt r a n s f o r m ) , 极大地降低了傅里叶变换的计算量,从而为数字信号的实时处理奠定了算法的基 础【5 1 。 在1 9 7 8 年,由a m i 公司生产出了第一片d s p 芯片$ 2 8 1 l 。与此同时,伴随着 大规模集成电路技术的发展,各大集成电路厂商都为生成通用d s p 芯片做了大量 的工作。值得一提的是t i 公司于1 9 8 2 年推出的第一代d s p 芯片- t m s 3 2 0 1 0 。 这种d s p 器件采用微米工艺n m o s 技术制作,虽功耗和尺寸稍大,但运算速度却 比m p u 快了几十倍,尤其在语音合成和编码解码器中得到了广泛应用。至8 0 年 代中期,随着c m o s 技术的进步与发展,第二代基于c m o s 工艺的d s p 芯片应 运而生,其存储容量和运算速度都得到成倍提高,成为语音处理、图像硬件处理 技术的基础。8 0 年代后期,以t i 公司的t m s 3 2 0 c 3 0 为代表的第三代d s p 芯片问 世,运算速度进一步提高,其应用于范围逐步扩大到通信、计算机领域。 9 0 年代d s p 发展最快,这个时期,国际上许多著名的集成电路厂家都相继推 第2 页 国防科学技术大学研究生院工学硕士学位论文 出自己的d s p 产品。如:t i 公司的t m s 3 2 0 c 2 0 、3 0 、4 0 、5 0 系列,m o t o r o l a 公 司的d s p 5 6 0 0 、9 6 0 0 系列,a t & t 公司的d s p 3 2 等第四代和第五代d s p 器件。 现在的d s p 大多数属于第五代产品,它与之前的d s p 芯片相比,系统集成度更高, 将d s p 芯核及更多的外围元件综合集成在单一芯片上【6 j 。 经过2 0 多年的发展,d s p 产品的应用己扩大到人们的学习、工作和生活的各 个方面,并逐渐成为电子产品更新换代的决定因素。 1 2 2d s p 芯片的主要特点 数字信号处理不同于普通的科学计算与分析,它强调运算的实用性。因此, d s p 除了具备普通微处理器所强调的高速运算和控制能力外,针对实时数字信号 处理的特点,在处理器的结构、指令系统、指令流程上做了很大的改进,其主要 特点如下【2 】【5 】 6 1 1 1 0 】: 采用哈佛结构: 该结构采用双存储空间,程序存储器和数据存储器分开,有各自独立的程序 总线和数据总线,可独立编址和独立访问,可对程序和数据进行独立传输,使取 指令操作、指令执行操作、数据吞吐并行完成,大大地提高了数据处理能力和指 令的执行速度,非常适合于实时的数字信号处理。 采用多总线结构: d s p 芯片都采用多总线结构,可同时进行取指令和多个数据存取操作,并由 辅助寄存器自动增减地址进行寻址,使c p u 在一个机器周期内可多次对程序空间 和数据空间进行访问,这就大大提高了d s p 的运行速度。对于d s p 芯片,内部总 线是个十分重要的资源,总线越多,可以完成的功能就越复杂。 采用流水线技术 每条指令可通过片内多功能单元完成取指、译码、取操作数和执行等多个步 骤,实现多条指令的并行执行,从而在不提高系统时钟频率的条件下减少每条指 令的执行时间。利用流水线结构,加上执行重复操作,就能保证在单指令周期内 完成数字信号处理中用得最多的乘法一累加运算。 配有专用的硬件乘法一累加器 为了适应数字信号处理的需要,当前的d s p 芯片都配有专用的硬件乘法一累 加器,可在一个周期内完成一次乘法和一次累加操作,从而可实现数据的乘法一 累加操作。如矩阵运算、f i r 和i i r 滤波、f f t 变换等专用信号的处理。 具有特殊的d s p 指令 为了满足数字信号处理的需要,在d s p 的指令系统中,设计了一些完成特殊 功能的指令。为了实现f f t 、卷积等运算,当前的d s p 大多在指令系统中设置了“循 第3 页 国防科学技术大学研究生院t 学硕士学位论文 环寻址”及“位码倒置”指令和其他特殊指令,使得在进行这些运算时,其寻址、排 序及计算速度都大大地提高。 快速的指令周期 由于采用了哈佛结构、流水线操作、专用的硬件乘法器、特殊的指令及集成 电路的优化设计,使得单指令周期可在1 0 n s 以下。 硬件配置强 新一代的d s p 芯片具有较强的接口功能,除了具有串行口、定时器、主机接 口、d m a 控制器、软件可编程等待状态发生器等片内外设外,还配有中断处理器、 p l l 、片内存储器、测试接口等单元电路,可以方便地构成一个嵌入式自封闭控制 的处理系统。 支持多处理器结构 尽管当前的d s p 芯片已达到较高的水平,但在一些实时性要求很高的场合, 单片d s p 的处理能力还不能满足要求。因此,支持多处理器系统就成为提高d s p 应用性能的重要途径之一。由于支持多处理器结构,可以实现完成巨大运算量的 多处理器系统,即将算法划分给多个处理器,借助高速的通信接口来实现计算任 务并行处理的多处理器阵列。 省电管理和低功耗 d s p 功耗一般为o 2 5 。4 w ,若采用低功耗技术可使功耗降到0 1 w 以下,可 用电池供电,适用于便携式数字终端设备。 1 2 3d s p 的技术展望 在未来的一段时间内,d s p 芯片将越来越多的渗透到各种电子设备当中,成 为各种电子产品尤其是通信类和便携式电子设备的技术核心。在新的形势下,d s p 将向着高性能、低功耗、加强融合和拓展多种应用的趋势发展【3 】【4 1 。 多核d s p 是未来的发展趋势。从过去几年来看,时钟频率己到了一个极点。 而且因为功耗和成本问题,单核d s p 的路已经很难走下去,因此多核一定是d s p 的发展趋势,特别是面向高速、高密度数据处理应用。未来的系统将由众多异构 处理单元组成,每个单元都是一个单时钟域处理器,处理元件的布局风格将类似 于目前的f p g a 。在t i 最近公布的无线基础设施的多核d s p 中,已经有一款6 核 方案,在未来2 5 年内一个d s p 芯片将可能集成百个处理器【7 】。 可编程s o c 和s i p 是未来d s p 的生存之道。对于那些不属于高密度的应用, 将来的发展方向是s o c 。当前的d s p 多数基于r i s c ( 精简指令集计算) 结构,这 种结构的优点是尺寸小、功耗低、性能高,从而使得在一片芯片上集成多个核组 成s o c 系统成为可能。s o c 集成系统将在系统处理器的控制下,同时使用可编程 第4 页 国防科学技术大学研究生院工学硕+ 学位论文 d s p 和可配置d s p 加速器,这些新的s o c 将成为许多创新性产品的开发平台。t i 近年推出的达芬奇平台就是一个s o c 的典型例子,它采用了d s p ( c 6 4 x ) 和 a r m ( a r m 9 ) 双核架构,并采用了视频加速器和具有很强继承性的软件,专门针对 灵活的数字视频实施而进行了精心优化,拥有业界领先的性能并集成了可编程数 字信号处理器( d s p ) 内核、a r m 处理器以及视频加速协处理器。凭借高效的处理 能力、存储器、i o 带宽、平衡的内部互连以及专用外设组合。基于达芬奇技术的 s o c 能够以最低的成本为视频应用提供理想的核心动力1 7 j1 4 们。 然而,t i 的首席科学家方进( g e n ef r a n t z ) 却认为目前所有的s o c 都不是真 正的s o c ,只是s u bs o c ,他更看好系统级封装s i p ( s y s t e mi np a c k a g e ) 技术【1 2 1 。 2 0 0 5 年国际半导体技术发展路线图( i t r s2 0 0 5 ) 【8 】就s i p 的发展和技术路线进行 了相当多的描述,对于s i p 而言,在单一的模块内可以集成不同的有源芯片和无源 器件、非硅器件、m e m s 元件甚至光电芯片等,更加长远的目标则考虑在其中集 成生物芯片等。目前在无线通讯领域,s i p 是非常有潜力的技术。相对于s o c ,s i p 技术具有提供高密度封装、多功能化设计、较短的市场进入时间以及更低的开发 成本等优势。s i p 技术能够节省主板空间、减小组件数目,允许不同技术的集成, 大大简化了开发时间并降低成本。可以预测,未来使用尖端的s i p 技术进行集成将 与s o c 一样普遍【9 1 。 d s p 将会更多的和实时操作系统r t o s 结合。最初的d s p 系统开发者除 了开发需要实时实现的核心算法以外,还要自己设计系统软件框架,并作为目标 代码的一部分一起运行。由于应用的不同,核心算法和控制框架也是多种多样的。 随着d s p 处理能力的增强,芯片结构越来越复杂,越来越多的芯片在其内部集成 了多个芯核,如何充分使用器件的资源,使其物尽其用己成为d s p 开发中的重点 和难点之一。另外,d s p 系统越来越复杂使得软件的规模越来越大,往往需要同 时运行多个任务,各任务之间的通信、同步等问题就变得非常突出。随着d s p 性 能和功能的日益增强,对d s p 应用提供r t o s 的支持已经成为必然的结果【6 j 。 低功耗是永恒的追求。t i 的首席科学家方进( g e n ef r a n t z ) 曾提出过一个 著名的“方进定律”,即半导体的功耗每1 8 个月降低一半,如图1 1 所示1 4 0 1 。当初 进入9 0 n m 时,曾有人对此定律产生怀疑,这是因为9 0 n m 时出现了待机功耗与工 作功耗一样的问题,但是半导体技术进入6 5 n m 后,业界解决了这一难题,功耗又 重新回到下降曲线,继续按方进定律前进。d s p 功耗的降低主要依靠超大规模集 成电路技术和先进的电源管理技术的发展,目前d s p 芯片内核的电源电压已经在 稳步降低,电压的降低直接带来的功耗的减少。此外,业界正在研究能量采集与 能量存储技术来取代电池供电,如从空调的排出热气采集能量,或者从人体的发 热来采集能量,配合芯片功耗的降低,最终将开发出可不间断工作的器件【i 2 。 第5 页 国防科学技术大学研究生院工学硕十学位论文 1 , 0 0 0p 1 2 4 地址数据流单元设计中的关键技术 d s p 面向数据密集型应用,伴随着频繁的数据访问,数据地址的计算时间而也 线性增长。如果不在地址计算上作特殊考虑,有时计算地址的时间比实际的算术 操作时间还要长。因此,d s p 中通常都含有支持地址计算的算术单元地址产 生器( a g u ) 。地址产生器与a l u 并行工作,使得地址计算不再额外占用c p u 的时间,有分析证明,使用独立的a g u 可使流水线效率提高到1 5 倍【1 3 】,从而可 以大大提高d s p 的执行速度。f t c 5 5 l p 地址数据流单元的一个主要功能就是进行 数据地址的计算与生成,其内部集成了三个不同数据地址产生器,分别用于双操 作数的存取和系数操作数的存取,最多可以在1 个周期内进行3 次访存操作,从 而提高指令并行性并减少代码量。 为了进一步提高速度,可以在c p u 内设置多个并行操作的功能单元,如a l u 、 乘累加单元、地址产生器等。t m s 3 2 0 c 6 0 0 0 系列芯片的c p u 内部含有8 个功能单 元,即2 个乘法器和6 个a l u ,这些功能部件可以最多在1 个周期内同时执行8 条3 2 位指令。但是f t c 5 5 l p 的设计目标是高性能低功耗数字信号处理器,如果 在c p u 核内加入过多的功能单元将会增加芯片功耗。在综合考虑性能和功耗因素 之后,f t c 5 5 l p 设计了2 个乘累加单元和2 个a l u ,并将其中的1 6 位辅助a l u 放在了地址数据流单元内部实现,使其可以就近访问包括辅助寄存器、循环缓冲 寄存器和通用寄存器在内的大量1 6 位寄存器,从而降低传输延时,减少舍入操作 的数量,达到提高速度的目的。 1 2 5r t l 级设计方法 2 0 世纪9 0 年代以来,微电子技术以惊人的速度发展,其工艺水平已经达到了 深亚微米级,在一个芯片上已经可集成数百万乃至上千万只晶体管,这为制造出 第6 页 国防科学技术大学研究生院工学硕士学位论文 规模更大、速度更快和信息容量更高的芯片系统提供了基本条件,但是也使工程 师们的工作更加繁重,设计和验证难度大大增加。为了解决这些问题,人们开始 追求贯彻整个设计过程的自动化,这就是e d a 技术,它代表了当今电子设计技术 的最新发展方向。近年来业界普遍应用的e d a 工具已经有了较高的自动化程度, 它们能够在设计人员的概念构思以高层次描述的形式输入到e d a 系统之后以规则 驱动的方式自动完成整个设计,此外还有专门的综合优化工具,可以使芯片的面 积、功耗等品质能够获得较大的优化【l 。 伴随着e d a 技术的迅猛发展,r t l 级设计方法也开始大行其道。这是一种“概 念驱动”形式的设计,设计人员按照“自顶向下”的设计方法,对整个系统进行进行 方案设计和功能划分,不再需要通过门级原理图来描述电路,而只要针对设计目 标采用硬件描述语言( h d l ) 进行功能描述即可,最后通过综合工具生成最终的 目标器件。 采用这种方法,设计人员就可以摆脱电路细节的束缚,把精力集中在具有创造 性的方案与概念的构思上。同时可以把新概念迅速转化成为产品,使产品的研制 周期大大缩短。并且由于在设计中只定义了系统的行为特性,不涉及实现工艺, 所以在厂家综合库的支持下,利用综合优化工具可以将高层次描述转换成为针对 某种工艺优化的网表。这种设计方法的典型流程图如图1 2 所示【1 1 】。 图1 2r t l 级设计方法典型设计流程 1 3 本文的主要工作 f t c 5 5 l p 是一款自主正向设计的低功耗d s p ,为了降低设计的复杂度,利用 已有的编译器,借鉴国外先进的设计技术,它与t i 公司的t m s 3 2 0 c 5 5 x 指令级兼 第7 页 国防科学技术大学研究生院下学硕十学位论文 容。f t c 5 5 l p 的研制,可以分为三个阶段: 第一阶段,对t m s 3 2 0 c 5 5 x 的指令集和体系结构进行研究。在此基础上,进 行自主的体系结构设计,同时进行模块划分; 第二阶段,用v e r i l o g 语言在r t l 级对各个模块进行设计与验证,在各个模 块设计完成之后,将各个模块组合在一起形成c p u 的顶层模块。对c p u 的顶层模 块通过模拟的方式进行功能验证; 第三阶段,优化实现。在第二阶段的功能验证完成之后,对于大多数的模块, 需要面向标准单元进行设计优化。对于乘加部件、桶形移位器和寄存器文件等模 块用全定制的方法设计。在所有模块设计完成之后,通过布局布线工具或者手工 干预的布局布线将所有的模块集成在一起,形成最终的设计。 本课题主要完成的是第一阶段和第二阶段的工作,主要内容如下: ( 1 ) f t c 5 5 l p 芯片体系结构和指令集的研究:本课题对f t c 5 5 l p 的指令集及 微体系结构进行了深入的分析,f t c 5 5 l p 融合了当前许多超低功耗d s p 芯片上常 用的先进技术,并采用了一些性能提升的措施。 ( 2 ) f t c 5 5 l p 寻址模式的分析:针对d s p 芯片所需要支持的典型数字信号处 理算法的特点,分析了d s p 所需要的寻址模式的意义和可得到的好处。并在这些 分析的基础上提出了f t c 5 5 l p 寻址模式的设计。 ( 3 ) f t c 5 5 l p 数据地址产生部件的设计:基于对f t c 5 5 l p 指令集和寻址模式 的分析提炼出了相应的功能需求,并在此基础上提出了数据地址产生部件的设计 实现方案,然后编写了v e r i l o g 代码实现。 ( 4 ) f t c 5 5 l p 辅助a l u 的分析与设计:从对d s p 的指令行为、指令并行性 和系统功耗等方面分析了增设辅助a l u 的原因以及可得到的好处,然后根据对 f t c 5 5 l p 指令集的分析得出了辅助a l u 的功能需求,在此基础上提出了辅助 a l u 的设计实现方案,并编写了v e r i l o g 代码实现。 ( 5 ) f t c 5 5 l p 地址数据流单元的功能验证:本课题对包含数据地址产生部件 和辅助a l u 在内的地址数据流单元进行了功能验证,包括各个底层模块的模块级 验证和整个地址数据流单元的部件级验证。 1 4 本文的结构 本文共分为七章,各章组织如下: 第一章绪论:主要分析了课题的背景以及相关技术研究,指出了课题研究的 内容,并介绍了课题所完成的工作以及取得的成果。 第二章f t c 5 5 l p 体系结构概述:概述f t - c 5 5 l p 的总体结构,主要介绍了其 指令系统、流水线结构和c p u 的各重要部件。 第8 页 国防科学技术大学研究生院工学硕士学位论文 第三章f t c 5 5 l p 寻址模式分析:简单介绍了通用微处理器中常用的几种寻 址模式,并针对典型数字处理算法程序内核的原理详细分析了d s p 处理器指令集 系统结构的实际原因各种专用寻址模式的设计意义和可得到的好处,并详细介绍 了在此基础上设计的f t c 5 5 l p 的各种寻址模式。 第四章f t c 5 5 l p 数据地址产生部件的设计与实现:简单介绍了f t c 5 5 l p 数据地址产生部件需要支持的一部分指令,在相应的功能需求的基础上提出了数 据地址产生部件的总体结构设计以及内部子模块的详细设计描述,提出了一种双 向进位加法器的设计方案。 第五章f t - c 5 5 l p 辅助a l u 的设计与实现:分析了在f t - c 5 5 l p 中增设辅助 a l u 的原因和可得到的好处,并由此得出其功能需求,然后对提出了其总体结构 设计。对几种核心加法器技术进行了探讨与分析,提出了辅助a l u 的核心加法器 设计方案,还对它内部的其他子模块的设计进行了详细描述。 第六章f t c 5 5 l p 地址数据流单元的设计验证:对各种寻址方式、a 单元指 令和辅助a l u 所支持的运算功能进行了功能验证。 第七章结束语:对本论文的主要工作及贡献进行了总结,并对下

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论