(电路与系统专业论文)fpga资源动态重构及低功耗研究.pdf_第1页
(电路与系统专业论文)fpga资源动态重构及低功耗研究.pdf_第2页
(电路与系统专业论文)fpga资源动态重构及低功耗研究.pdf_第3页
(电路与系统专业论文)fpga资源动态重构及低功耗研究.pdf_第4页
(电路与系统专业论文)fpga资源动态重构及低功耗研究.pdf_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江人学博l 学位论史申请浙江大学博十学位论文 摘要 随着可编程逻辑门阵列( f p g a ,f i e l dp r o g r a m m a a l eg a t ea r r a y ) 应用的不断普 及,便携式设备和无线设备的涌现,过去对于f p g a 主要关心的速度、单片容量、费 用以及可靠性等,现在对于低功耗f p g a 的需求,与速度、容量、费用等到了一样的 高度,成为f p g a 设计者和使用者主要关心的问题之一。 功耗分析和优化是f p g a 低功耗分析的两大主要问题。功耗分析主要关心如何准 确估计设计过程中的能量消耗,确保设计不违反设计要求的功耗指标,关于v l s i 功 耗估计方法和e d a 工具较多,本文是针对可编程逻辑而有所不同,本文主要研究 f p g a 的静态重构和动态重构的功耗问题,以及f p g a 布局布线的面积利用率提高而 间接对功耗的影响。 本文的主要工作如下: 首先分析了c m o s 电路功耗的组成和相应的功耗模型,总结了功耗估计的静态 方法和动态方法。 其次,分析了f p g a 架构,动态可重构机理。利用传统模拟退火算法对f p g a 进行布线轨道分布的研究,利用布线轨道在f p g a 内部的不同分布,考察对于f p g a 实现逻辑占用面积的影响,来达到低功耗的目的。 第三,将先进的f p g a 结构与高效的低功耗方法结合起来,经过分析和实践,建 立电容模型,再成功利用统计方法,实现f p g a 资源重构的低功耗估算方法。设计人 员可以根据估计结果,修改设计。通过设计专门的利于降低功耗的电路模块,以减小 电路的功耗。 第四,通过对于f p g a 资源动态重构的分析,修改对于静态使用f p g a 重构低 功耗估算框架模型,提出一种适合f p g a 资源动态使用的低功耗模型,实现了动态重 构的f p o a 的低功耗计算方法。 由于此方法与f p g a 的体系结构紧密结合相连,在整个的方法中,无疑也给f p g a 体系结构方面提供许多新的思路、建议和指导。进一步在论文的最后对以后的工作和 有待解决的问题也提出讨论。 关键词:v l s if p g a v p rt v p a c k 动态重构算法功耗估计门控时钟遗传算法 低功耗 浙江大学博士学位论文申请新江大学博士学位论文 a b s t r a c t o nt h eb a s ei n t r o d u c t i o no ft h e p r i n c i p a lt e c h n o l o g y o ff p g a d y n a m i c r e c o n f i g u r a t i o na n dm e t h o d so fl o wp o w e ri ni cc i r c u i t s ,t h ei m p o r t a n c ea n di m p e r i o u s r e q u i r e m e n tf o rl o wp o w e ri nd y n a m i cf p g ar e c o n f i g u r a t i o na r es t a t e d ,w h i c hm e t h o d s a r ed i f f e r e n tl e v e l sf r o mp h y s i c a lo n e s ,g a t eo n e s ,c i r c u i to n e s ,s y s t e mo n e st oa b s t r a c t o n e s a f t e rd e t a i ld i s c u s s i o na n dr e s e a r c hf o rv a r i o u sl e v e l s ,af u l ls e to fl o wp o w e r m e t h o d o l o g yf o ra p p l i c a t i o no fb a s i so fd y n a m i cf p g ar e s o u r c e sh a sb e e nf o r m e da n d b a s i c a l l yai n i t i a lt h e o r ys y s t e mh a sa l s ob e e nf o r m e d t ob e g i n 谢t 1 1b a s i cg e n e r a ll o wp o w e rm e t h o d s ,g e n e r a lm e t h o d s ,a p p r o a c h e sa n d m e a s u r e sa r ei n t r o d u c e d r e s o u r c e sa n ds t r u c t u r e so ff p g at h e nc o m b i n e da n dt h e d e v e l o p i n gt r e n do fi t sn e ws t l - u c t m e s ,f u r t h e r m o r ea st om o r eh i 曲r e q u i r e m e n t st h a ti sf o r d y n a m i cr e c o n f i g u r a t i o ni no r d e rt oe x p l o r ea n dr e s e a r c haa p p r o a c ha n dm e t h o d o l o g yo f t h en e w e s tl o wp o w e re s t i m a t i o ns u i t e df u rd y n a m i cf p g ar e c o n f i g u r a t i o nt e c h n o l o g y i n p r o c e s so ft h et h e s i s ,s o m es t a t i s t i cw a y ss u c ha sp o s s i b i l i t y ,c a p a c i t a n c em o d e la n d s w i t c ha e t i v i t yh a v eb e e ni n t r o d u e e d ,u s i n gan e ww a yt oe s t i m a t et h ed i s s i p a t i o no fv l s i f p g as t r u c t u r e s ,w h a ti sm o r e ,i nt h ec a s eo fu t i l i z a t i o no fd y n a m i cf p g a r e s o u r c e s ,s t a t i s t i c ss e e m se s p e c i a l l yi m p o r t a n ta n de f f f i c i e n c yd u r i n gt h ea n a l y s i s i nt h e t h e s i sw eh a v ea d o p t e ds o m ea n a l y s i se d at o o l s m a i n l yv p r ( v e r s a t i l ep l a c e m e n ta n d r o u t i n g ) a n d v p a c k ( v e r s a t i l ep a c k i n g ) ,a n ds t a t i s t i c sm o d e l sa r ee m b e d d e di nt h ee d a a n a l y s i sf l o w , w i t ha n a l y s i sa n dc o m p a r i s o n p o r t i n ga n di m p r o v i n gt h o s em e t h o d ss oa st o b es u i tf o rr e q u i r e m e n t so fe n v i r o n m e n tf o rd y n a m i cf p g ar e c o n f i g u r a t i o n ,ap e r f e c tl o w p o w e rm e t h o d o l o g yf o rd y n a m i cf p g ar e c o n f i g u r a t i o nh a sb e e nc o m eo u ta n di th a sb e e n p r o v e di t se f f i c i e n c ya f t e rt h e o r ye x a m i n a t i o n i ti sc o n c l u d e dt h a tt h o s ea p p r o a c h e sa n d m e t h o d sa l ea c t u a la n dp r a c t i c a l a l s os o m em a i na s p e c t sl i k ea r e a , s p e e da n dp o w e r d i s s i p a t i o no f c i r c u i ts y s t e ma r ea l ls u b s t a n t i a l l yi m p r o v e d n l e b f i e f j o b so f t h i sd o c t o r a lt h e s i sa r ea sf o l l o w i n g : f i r s to fa l l ,t h ec o m p o s i t i o nf u rc m o sc i r c u i ta n di t sc o r r e s p o n d i n gp o w e rd i s s i p a t i o n m o d e lh a v eb e e na n a l y z e d ,a n dt h em e t h o d sf o rs t a t i ca n dd y n a m i cp o w e re s t i m a t i o na r e a l s os h r l u t i a r i z e d s e c o n d l y ,a n a l y z c d t h ea r c h i t e c t u r eo ff p g a a n di t s d y n a m i cr e c o n f i g u r a b l e m e c h a n i s m ,a d o p t e dt h er e s e a r c hf u rd i s t r i b u t i o no fr o u t i n gt r a c k si n f p g aw h i c hu t i l i z e t r a d i t i o n a ls i m u l a t i n ga n n e a la l g o r i t h m a c c o r d i n gt ot h er e s u l t so fd i f f e r e n td i s t r i b u t i o no f r o u t i n gt r a c k si nf p g a , t a k i n gi n t oa c c o u n tt h ee f f e c to fl o g i ci m p l e m e n t a t i o ni nf p g at o r e a c ht h ea i mf o rl o w e rp o w e rd i s s i p a t i o n 塑至查兰堕主兰竺丝塞 皇堕塑垩查兰堡主兰竺堡苎 t h i r d l y , c o m b i n e dt h ea r c h i t e c t u r eo ff p g aa n dt h em e t h o d so fe f f i c i e n tl o w e r d i s s i p a t i o n ,a f t e ra n a l y z i n ga n dp r a c t i c i n go nt h e m ,o n ec a p a c i t a n c e b a s em o d e lh a sb e e n c r e a t e da n di n t e g r a t e dw i t hs t a t i s t i c s ,ap r i m a r yl o wp o w e rd i s s i p a t i o nm e t h o df o rf p g a r e s o u r c er e c o n f i g u r a t i o nh a sb e e nr e a l i z e d i tm e a n st h a tt h ed e s i g n e r sm a ym o d i f yt h e d e s i g no fp r o j e c ta c c o r d i n gt o t h el o wp o w e re s t i m a t i n gr e s u l t sa n dl e s s e nt h ep o w e r d i s s i p a t i o nf o rw h o l ec i r c u i ts y s t e mb yd e s i g n i n gs p e c i a lc i r c u i tm o d u l e st h a ta r er e l a t i v e t op o w e rr e d u c t i o n f o u r t h l y , w i t ha n a l y s i sf o rd y n a m i cf p g a r e s o u r c er e c o n f i g u r a t i o n , m o d i f i c a t i o nf o r e s t i m a t i o nm o d e lo fl o wp o w e rd i s s i p a t i o nh a sb e e nu n d e r t a k e n o n es u i t a b l el o wp o w e r e s t i m a t i o nm o d e lf o rd y n a m i cf p g ar e s o u r c er 靶o n f i g u r a t i o ni sp u tf o r w a r da n dal o w p o w e rd i s s i p a t i o nm e t h o d o l o g yi sa c h i e v e d o na c c o u n to ft h em e t h o d o l o g yi st i g h t l yl i n k e dw i t ht h ea r c h i t e c t u r eo ff p g a ,i nt h e w h o l em e t h o d o l o g yi ti sn od o u b tt h a tt h i sw o u l db r i n gm a n yn e wt h o u g h t ,s u g g e s t i o na n d i n s t r u c t i o n sf o r r e s e a r c ho ff p g aa r c h i t e c t u r e t h e r e b y , s o m ed i s c u s s i o n sa b o u tt h o s ea r e i n t r o d u c e da tt h ee n do ft h et h e s i sa n dw h a tn e x tj o b so nt h es u b j e c tw i l lb e k e y w o r d s :v l s i v p rt v p a c kd y n a m i cc o n f i g u r a t i o ng a t e dc l o c kg e n e t i c a l g o r i t h ml o wp o w e r 浙江大学博士学位论文 图表目录 图表目录 图1 1 半导体器件设备允许的最大功耗规划3 图1 2f p g a 和c p l d 分类5 图1 3f p g a 概念模型6 图l _ 4 基于逻辑块结构的f p g a 7 图1 5 基于s r a m 的f p g a 使用的三种可编程开关7 图1 6 逻辑块结构8 图1 7 基本逻辑元素的结构8 图1 8 基于逻辑块的f p g a 布线结构9 图1 9 肋骨和脊椎式的时钟分配网络1 0 图1 1 0 典型门控逻辑1 2 图1 1 l 防护技术1 2 图1 1 2 总线复用技巧1 2 图2 1 典型的f p g a 动态可重构原理示意1 7 图3 1v p r 架构2 3 图3 2 具有功率模型的v p r 架构2 4 图3 3 六管s r a m 单元原理图2 4 图3 4 基于两个l u t 和四输入簇逻辑块的电路原理图2 5 图3 5 一个逻辑块描述例子2 6 图3 6v p r 假设的高层f p g a 模型2 7 图3 7 逻辑块、布线轨道和i 0 块之间的连接2 8 图3 8s r a m 控制的传输管和三态缓冲器2 8 图3 9 五倍最小尺寸的三态缓冲器原理图2 9 图3 1 0 灵活的开关盒连线2 9 图3 1 1v p r 支持的三种开关盒拓扑2 9 图3 1 2i m r a n 开关盒3 0 图3 1 3 导线段例子3 1 图3 1 4 两个逻辑块连线的布线资源图3 2 图3 1 5 计算未用开关数的伪代码3 3 图3 1 6h 一树时钟分布网络3 4 图3 1 7 时钟长导线段分布r c 梯形网络模型3 4 图4 1 抽象级别在功率分析中对计算资源和精度的影响3 9 图4 2 蒙特卡洛功率估计4 0 图4 3 四个样本信号的转换密度和静态概率4 2 图4 4f p g a e v a _ l p 构架4 5 图4 5f p g a 基元的等效电路4 6 图4 6 不同f c ,i n p u t ( a ) 和f c ,o u t p u t ( b ) 下基准电路的平均功耗4 8 图5 1f p g a 中逻辑功能的实现5 0 浙江大学博士学位论文图表目录 图5 2 转换密度算法的伪代码5 2 图5 3 晶体管版图5 4 图5 4 动态功率研究的导线假设5 5 图5 5 计算布线网络动态功率算法的概貌5 5 图5 62 5 m h z 时一个段的动态功耗5 5 图5 7 逻辑块的详细原理图5 6 图5 8 用2 一输入选择器构建2 一输入l u t 模型5 7 图5 9 较差情况函数时3 一输入l u t 的例子5 7 图5 1 04 一输入l u t 平均输入转换密度与功率的关系5 8 图5 1 l 输入转换密度为0 5 的不同大小l u t 与功率的关系5 8 图5 1 2 用2 一输入选择器构建4 一输入选择器5 9 图5 1 31 6 一输入选择器不同平均转换密度与功率的关系5 9 图5 1 4 平均输入转换密度0 5 的不同大小选择器与功率的关系6 0 图5 1 5 带有异步置位和复位端的d 一触发器6 0 图5 1 6d 一触发器动态功率与输入密度的关系6 l 图5 1 7 最小尺寸反相器短路功耗百分数6 2 图5 1 8 一个段长的短路功耗百分数6 3 图5 1 9 漏电流与温度的关系6 4 图5 2 0 漏电流与不同大小p m o s 管温度的关系6 5 图5 2 l 改进的f p g a 动态功耗评估结构( a d vf p g a e v a 图5 2 2 不同f c ,i n p u t ( a ) 和f c ,o u t p u t ( b ) 下基准电路的平均功耗6 8 图6 1 基于熵分析的组合电路功耗估计7 2 图6 2 均匀布线轨道图7 4 图6 3 不均匀轨道分布图7 4 表1 1 半导体器件功率管理系统2 表1 2 三种s r a m 家族器件的比较6 表1 3f p g a 器件7 表3 1 逻辑块结构参数2 5 表3 2 图3 5 例子中逻辑块参数2 6 表3 3 通道参数2 7 表3 4 开关盒参数2 8 表3 5 开关盒内有旁路导线时不同的连线3 0 表3 6 导线段参数3 1 表3 7 图3 1 3 导线段例子一些参数3 2 表3 8 时钟网络参数3 3 表4 1 几个常用的仿真和概率统计功率分析技术3 9 表4 2 表示信号转换密度和静态概率的例子4 3 表4 3 不同f 。下的功耗估算值( 归一化) 4 7 表4 4 不同f 。下的功耗估算值( 归一化) 4 7 表5 1 逻辑功能实现列表5 0 浙江大学博士学位论文图表目录 表5 2 假设的转换密度和概率列表5 0 表5 3 静态概率计算5 0 表5 4 布尔微分和转换密度计算5 1 表5 54 一输入l u t 动态误差计算6 l 表5 6 不同f 。下的功耗估算值( 归一化) 6 8 表5 7 不同f c 。下的功耗估算值( 归一化) 6 8 表6 1f p g a 面积使用率( 布通优先) 7 7 表6 2f p g a 面积使用率( 时间优先) 7 8 绪论 1 1 课题背景 第1 章绪论 随着数字逻辑系统功能复杂化的需求,单片系统的芯片正朝着超大规模、 高逻辑密度的方向发展。对于个大规模的数字系统而言,系统规模是基于各 种逻辑功能模块的组合。但是,无论对于一个时序逻辑系统,还是组合逻辑系 统,或者组合、时序混合系统,从时间轴上来看,系统中的各个功能模块并不 是任何时刻都在激活或工作,而是根据系统外部的整体要求,轮流或循环地激 活或工作。并且,随着数字逻辑规模的扩大,在相同速度的条件下,在一定的 时间区间,其功能模块的平均使用率将下降。换言之,随着系统规模的扩大, 单片电路的资源利用率反而下降。 另一方面,随着数字系统规模的逐渐增大,功能的不断增强,使用的逻辑 门数不断增多,不仅仅有面积的扩大,更直接的将是系统功耗的迅速上升。而 功耗的增加会带来一系列的问题,比如,温度的升高,会引起温度漂移,甚至 造成芯片损坏;同时对于移动设备,便携设备等,低功耗会是永久性的话题, 低功耗能加长设备离线的使用时间,对于野外操作十分有利;众所周知,个人 移动设备由于功耗问题使用起来也十分的不方便。而且系统的发展趋势是片上 系统s o c ( s y s t e m0 1 1c h i p ) ,虽然s o c 还没有一个国际标准的统一的定义,但是 可以引用最新的权威人士对于s o c 的定义。在德州仪器f f i ) 去年的亚洲开发商 大会( r id e v e l o p e rc o n f e r e n c e ,t i d c ) 上,t i 的首席战略科学家g e n ea f r a n t z 先生阐述了s o c 的概念和应用趋势。而在2 0 0 6 年的t id c 上,他对s o c 进行 了新的阐释,他将s o c 定义为:采用多种专利技术在同一硅片上集成个系统 或子系统,它要求具备模拟、数字及r f 的通用工艺,各种连接接口和终端设备 系统的专业技能 1 】。从此定义可以看出,s o c 已经强调软件在系统中的地位, 因此系统的效率以及功耗不仅仅只是硬件的任务,同样也是软件的任务了。对 于嵌入式系统应用中一种对于存储器使用的低功耗的方法学已经展开并已经到 实用化的阶段【2 】。 1 2 研究动机 g o r d o nm o o r e 在1 9 6 5 年就曾预言集成电路规模每年将翻一倍,他还预占 浙江大学博士学位论文:资源动态重构及低功耗研究 1 9 7 5 年会出现内含6 5 ,0 0 0 个元件的单芯片器件。现在,移动设备存储卡所用的 每个芯片包含的晶体管数量已接近i 0 0 亿个。 由摩尔定律驱动的集成有助于功耗问题的解决。通常采用新的工艺可以容 纳二倍数量的元件,而且与前一代工艺相比,由于供电电压的降低,这些元件 所需的功耗可以下降一半以上。但随着9 0 n m 工艺时代的到来,供电电压的线性 下降趋于停止。未来的6 5 n m 及以下工艺也不可能再恢复供电电压的线性下降趋 势。 集成电路的待机功耗一直是个大问题。待机功耗推动业界从双极电路向 n m o s 、并随之快速向c m o s 转变。从2 微米直到o 1 3 微米工艺期间,静态c m o s 电路的待机功耗都非常小乃至于可忽略不计。但事实上,即使是很小的数字, 如果增长迅速,也会很快变成大数字。c m o s 晶体管中的待机电流在不同的工艺 之间可能会增加6 到1 0 倍。在0 1 3 微米工艺时代,随着基于电池的移动产品的 爆炸性增长,待机功耗问题越来越突出。 功耗正在成为半导体供应商和消费者的主要关切的问题,图1 1 和表1 1 显 示了2 0 0 1 年国际半导体技术的预测的三种半导体产品的最大可允许功耗规划 3 。 表i i 半导体器件功率管理系统 l 半导体器件类型功耗管理 l 高性能( 如台式机) 允许在封装之上加散热片 l 高性价( 如膝上型) 提供经济型功耗管理系统 l 便携式功耗由电池限制且无冷却系统 善 篆 k 薹 盘 簧 2 0 0 12 0 0 42 0 0 7 2 0 1 0 2 0 1 3 2 0 1 6 年份 图1 1 半导体器件设备允许的最大功耗规划 正如图示的那样,高性能和高性价比产品的可允许功耗至u 2 0 1 6 年将增长一 倍。但是,如果继续现在设计的趋势,典型的微处理器( m p u ) 的耗能与可以支 持的成本效率封装技术相l l 至u 2 0 1 6 年将消耗5 0 倍的功耗 4 。取代设计复杂性, 功耗已成为在当今信息处理年代最重要的设计要考虑的要素 5 。 功耗尤其是要在f p g a 中关心的问题,提供给器件的后制作的灵活性是由大 量前制作的布线轨道( t r a c k ) 和可编程开关( s w i t c h ) 实现的。这些轨道可以很 长,每次在开关进行动作时这些轨道消耗相当数量的能量。另外,可编程开关 增加了每个轨道的电容,进一步也增 j h f p g a 的功耗。每个f p g a 的心脏可配 置逻辑块( c l b ,c o n f i g u r a b l el o g i cb l o c k ) 消耗着比专用集成电路( a s i c ) 中专门电路更多的功耗。所有这些原因,f p g a 功率消耗是消费者最关心的要素 之一。 已经有不少研究工作者在低功耗f p g a 结构和低功耗f p g ac a d 算法的研究 上面做了大量的工作 6 7 儿8 儿9 1 0 儿1 1 。然而,研究工作都只是特定的f p g a 结构或是f p g ac a d 程序的“点问题”解决上,都不是很全面。而且,这些工作 倾向于用非常粗陋的模型去估算功耗的节省,往往不去考虑许多重要的细节, 这些细节只是消除某个局部范围的功耗。 1 3 现场可编程门阵列( f p g a ) 本章先对可编程逻辑进行回顾,然后对在本论文中即将要用到的术语列出清 单,接着谈当前可编程逻辑市场需求。简要描述可重构计算,包括阐明其与在 论文中一些概念的联系。要实现f p g a 使用的低功耗或是对其使用时的低功耗估 暮| 蓦| 暑 抛m m 。 浙江大学博士学位论文:资源动态重构及低功耗研究 算,首先就得全面了解f p g a 本身的结构和工作性质和特点。 1 3 1 可编程逻辑发展简史 首次提出可实现可编程逻辑器件的大概就是s v e nw a h l s t r o m ,在1 9 6 7 年他 提出包含用于定制集成电路阵列的附加门。然而,硅资源在当时是非常稀少的 资源,一块大面积的集成电路专用于可定制的可互联结构的想法被认为是异想 天开。 后出现了可编程逻辑器件( p l d ) ,开始是简单可编程逻辑器件( s p l d ) , 后来是复杂的可编程逻辑器件( c p l d ) 。1 9 8 4 年创建的x i l i n x 于1 9 8 5 年推出了 世界上第一款f p g a 。 成为f p g a 市场第一人,x i l i l l ) 【一直较好主宰着这个市场直到现在,尽管它 的主要竞争对手a l t e r a 偶尔会取代它的地位而成为这个市场的领袖。另外值得关 注的可编程逻辑制造厂家包括有a c t e l 、a t m e | 、c y p r e s s 和l a t t i c e 等。在9 0 年代以 及以后,可编程逻辑开始被认为是除- f a s i c 和微处理器的第三种实现数字电路 和系统的途径,但有时是介于两者之间的中坚力量。由于其独特作用,现今可 编程逻辑己发展到千兆门片,速度已经超过6 0 0 m h z ,充斥着电子行业的各个 领域。 1 3 2 可编程逻辑术语 鉴于p l d 和f p g a 在前面已经引入,在这里还是值得指出它们之间的主要区 别,在于内部结构。 p l d 具有数十个输入的基于宽度的二级开关函数的结构,而f p g a 是用典型 的4 输入的可编程查找表( l u t ) 和带有可选的输出寄存器的基本结构 2 5 】。此 外,f p g a 基于可挥发性的s r a m ,而p l d 是基于典型的e p r o m e e p r o m 技术。 f p g a 的时间特性与p l d 相比更多地依赖于信号的布线情况,体系结构也更加多 层次。然而,f p g a 和c p l d 的区别有时是很模糊的,因为现在有这样一种趋势, 就是将基于f p g a 的逻辑块应用到现代的c p l d q b ,如a l t e r a 的m a xi i 产品线 2 6 】a 术语“可编程逻辑”用于包含所有逻辑器件,包含广泛的可编程性,因此c p l d 和f p g a 都包括。 可编程性和重构性:在所有提及的场合这两个术语意义等同,进一步“f p g a ” 4 常常是“可编程逻辑( 器件) ”的代名词。这也是遵守我们的初衷或是基于一种 假设,我们讨论的主题特别地面向f p g a 而不是c p l d 。 可重构计算:定义在运行时间可以修改系统结构和资源利用的能力。 粒度:可编程逻辑结构的粒度定义为基本计算块的大小和复杂度。一般地, 细粒度商用结构更易于逻辑上的实现,但是需要更长的可编程时间和在繁重算 术性的数据路径实现上效率较低。 1 4 f p g a 结构详述 f p g a 和c p l d 是当今高容量可编程器件市场的两个主要可选器件 3 2 1 。 c p l d 实现作为s o p ( 积之和) 的逻辑而绝大多数f p g a 用包含l u t ( 查找表) 来实现逻辑 3 3 1 。图i 2 表示了用在f p g a 和c p l d 中技术的分类图。基于熔丝的 器件配置后不可擦除或再配置,而e p r o m 、e e p r o m 和f l a s h 器件可再编程和 非易失性的,基于s r a m 的器件提供的是在电路再配置能力,但是易失性的【3 4 】。 我们的研究计划主要是基于s r a m 的f p g a 器件。 f p g a 具有非常低的可重复利用设计成本并且研发周期短。只需用硬件描述 语言编写系统功能并由e d a 工具转化为下载文件,下载到f p g a 中即可实现该系 统功能。如果要再次实现其他电路功能,只需修改源程序重新产生下载文件即 可,f p g a 可以反复利用。电路的调试、修改也非常方便,只需修改源程序重新 下载即可。由以上特点可知使用f p g a 开发产品的研发设计成本非常低,这一特 点使得f p g a 得到了广泛的应用,特别是小型和中型的设计。 图1 2 f p g a 和c p l i ) 分类 浙江大学博士学位论文:资源动态重构及低功耗研究 最早的f p g a 包括三个主要部件:输入输出焊盘、逻辑资源( 逻辑块) 和布 线网格,它们表示在概念模型中,见图1 3 ( a ) 【3 5 3 6 】。而今,供应商在他们 的f p g a 中也嵌入了存储器和特殊模块,其概念模型图l _ 3 ( b ) 。表1 2 表示的是 来自a l t e r a ,x i l i n x 和l a t t i c e 三家基于s r a m 的f p g a 主导系列的比较 3 7 3 8 3 9 1 , 目前最大的时钟速度已超过6 0 0 m h z ,这个频率已接近非可编程芯片。然而, f p g a 的关键优势是其可编程性和灵活性。表1 ,3 提供了主要f p g a 元件的简要概 况。我们的研究主要集中在f p g a 的核心部分,只包括逻辑资源和布线网格。 图1 3f p g a 概念模型 表1 2 三种s r a m 家族器件的比较 供应商 a i t e r a x i l i n xl a t t i c e 掣号 s t r a t i xv i r t e xi ip r oo r c as e r i e s4 c m o s 工艺( u m ) 0 1 30 1 301 6 最大时钟速度( m h z ) 2 5 03 0 02 5 0 电源电压( v ) 】51 5 , 1 5 查找表( l u t ) 数量1 0 ,5 7 0 到1 1 4 ,1 4 0 3 ,1 6 8 到1 2 5 ,1 3 6 4 9 9 2 到1 6 1 9 2 每l u t 的输入数 444 片上存储器( k b i t s ) 9 2 0 到1 0 1 1 82 1 6 到1 2 5 1 3 67 4 到1 4 7 1 1 3 引脚数 4 2 2 到1 3 1 02 0 4 到1 2 0 04 0 0 到7 2 0 全局网络数 多达1 6多达1 2多达8 争门模块d s p 块 p o w e r p c 处理器 嵌入式微处理器接口 绪论 表1 3f p g a 器件 成分 功能 输入或输出焊盘连接片外电子器件的通信接口 逻辑资源 一块用于实现逻辑功能可编程资源 布线网格 逻辑块、片上存储器和嗷入式专门模块的连接 存储器基于r a m 的片上存储器分散或单独的模块 专门模块 专门的元件,如嵌入处理器,数字信号处理( d s p ) 模块 l ,4 1 逻辑资源 大部分f p g a 模型基于岛型逻辑块结构,每个逻辑块被布线轨道所包围, 如图1 4 所示,f o 单元围绕在f p g a 的四周。每个可编程逻辑块实现一定的数 字功能,可编程布线又将这些逻辑块的输入和输出端口相连来形成更大功能的 电路。每个f o 可以是输入或者输出1 2 1 ,通过可编程布线和逻辑块相连。 布线网络 图圈l l 图团 囫圉 豳l | 囹 图豳l 囵团 一一 f p g a 的可编程通过三种方式来实现【4 0 】【4 l 】。使用最多的是利用s r a m 单 元来控制传输门、多路选择器和三态缓冲器把可编程布线和逻辑块配置成所需 广 2 个黜m 靳田 罡鼎琴八韩叱 图1 5 基于s r a m 的f p g a 使用的三种可编程开关 以逻辑块阵列为基础的f p g a 的结构中,每个逻辑块由n 个基本逻辑元素 7 浙江大学博士学位论文:资源动态重构及低功耗研究 ( b l e ) 组成,如图1 6 所示。每个b l e 又由一个k 输入的l u t 和一个寄存器 组成,根据l u t 的输出是否通过寄存器,b l e 输出可以是寄存器类型或不寄存 类型,如图1 7 所示。这样可以实现各种各样的组合电路或者时序逻辑。每个逻 辑块含有b l e 的个数( n ) 以及基本逻辑元素含有l u t 的输入个数( k ) 对f p g a 的速度、面积、功耗等性能有很大的影响。4 2 分析了逻辑簇与l u t 大小对f p g a 面积和速度性能的影响,4 3 分析了每个逻辑块含有b l e 个数与每个基本逻辑 元素含有l u t 输入个数对f p g a 功耗的影响,找出了实现低功耗的最优n 值和 k 值。 , 人 时钟 图1 6 逻辑块结构 卧矿蛐 图1 7 基本逻辑元素的结构 1 4 2 布线网格 影响f p g a 性能的因素除了基本逻辑块结构以外,布线结构也决定着f p g a 性能的优劣。改变f p g a 布线结构参数将会得到不同性能的f p g a 。图1 8 为基 于逻辑块结构的f p g a 布线结构图。每个逻辑块的引脚可以通过连接块中的连 接开关和线段相连。水平布线轨道和竖直布线轨道相交的地方称作开关盒( 或 称开关矩阵) ,开关盒由传输门和三态缓冲器组成,控制传输门和三态缓冲器的 开、关来实现可编程布线。 绪论 匈抽贮毪盘井甓 图1 8 基于逻辑块的f p g a 布线结构 r o s e 和b r o w n 在【4 4 提出了描述f p g a 布线结构的一些参数。它们分别是: 布线宽度( ) :每个布线通道中包含的线段的数目; 丌关块复杂度( 尽) :丌关盒中,每条输入导线可以连接其他导线的数目; 连接块复杂度( f c ) :连接块中,每个逻辑块可以连接导线的数目; 线段长度:每条线段所跨越逻辑块的个数等。 这些参数对分析f p g a 的面积、速度、功耗等性能具有很大的帮助。 布线网格对f p g a 是必要的部分,因为其可以将内部所有部件按需要任意连 在一起。f p g a 中布线网格主要分为两个部分: _ 分段局部网线,用于逻辑块之间的连接; 专用全局网线,用于全局网络布线,如时钟。 1 4 2 1 分段局部网线 从互连的模块结构f p g a 中可见,布线的资源主要有以下三个方面组成: _ 分段的导线( s e g m e n t e dw i r e ) 是预先制作好的,用于实现在开关盒 ( s w i t c hb o x ) 、连接块( c o n n e c t i o nb l o c k ) 和逻辑块( l o g i cb l o c k ) 之间可编程连接的。 连接块随机连接逻辑块输入输出与分段导线。 开关盒能被编程为连接横向和纵向的分段导线在一起。 每个布线导线跨过的逻辑块数定义为段长( s e g m e n t l e n g t h ) 。比如,如果 一根导线跨过四个逻辑块,那么导线的段长就是4 。短线能提供布线的灵活性, 但是带缓冲的长线对于长连接的速度优化是必需的。用不同长度的分段导线的 混合使用已经出现在商用的f p g a q 6 4 5 4 6 4 7 4 8 。 1 4 2 2 专用全局网线 9 浙江大学博士学位论文:资源动态重构及低功耗研究 专门的布线轨道提供给像时钟、复位和置位等信号,并且扇出给整个的芯 片和获得最低偏移传送。图1 9 展示了典型时钟分配网络。全局时钟信号以肋骨 和脊椎式布满整个器件。f p g a 的供应商确定肋骨和脊椎的数目。x i l i n x 的v i r t e x e 在其顶部和底部具有一个2 4 根脊椎秘1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论