(精密仪器及机械专业论文)动态可重构协处理器研究.pdf_第1页
(精密仪器及机械专业论文)动态可重构协处理器研究.pdf_第2页
(精密仪器及机械专业论文)动态可重构协处理器研究.pdf_第3页
(精密仪器及机械专业论文)动态可重构协处理器研究.pdf_第4页
(精密仪器及机械专业论文)动态可重构协处理器研究.pdf_第5页
已阅读5页,还剩132页未读 继续免费阅读

(精密仪器及机械专业论文)动态可重构协处理器研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 自2 0 世纪8 0 年代以来,随着各种可重构技术的出现,一种建立在电路重构原理上韵 可重构计算成为国际学术界研究的热点,基于可重构计算概 念的可重构计算机更是目前高性能计算机研究的一个重要方向。学术界逐渐达成的一 个共识认为,由动态可重构协处理器阵列组成的多核c p u 将是未来高性能计算机的主要特 征,它集成了多核技术、分布式计算技术、可重构技术等重要前沿技术。其中,作为核心 技术之一的可重构协处理器的重构模式研究具有重要的战略意义。 可重构协处理器的重构模式可分为两个大的类别:阵列并行模式和流水模式。两种重 构模式的硬件基础都是相似的可重构单元组成的阵列,但至今尚未见到将两种模式统一在 一起的报道。本文首次尝试了这项工作,设计了一款兼有上述两种工作模式的动态可重构 协处理器一一d r e a c ( d y n a m i c a l l yr e e o n f i g u r a b l ea r r a yc o p r o c e s s o r ) 。论文详细阐述了 d r e a c 的结构、重构方式以及阵列的优化技术,同时也研究了d r e a c 的应用问题。 论文从下列角度研究了d r e a c 本身: 给出了d r e a c 的结构模型和行为模型,在此基础上建立了一个完整的可重构协处 理器,为整个论文的工作提供了研究平台; - 研究了d r e a c 协处理器的主要组成部分:全局管理器、可重构处理单元和可重构 计算阵列之间的有效整合问题,建立了一套独立的2 级重构管理机制,该机制赋予d r e a c 强大的m i m d ( m u l t i p l ei n s t r u c t i o nm u l t i p l ed a t a ) 数据处理能力,同时赋予d r e a c 丰富 多样的重构形式; 设计了全局管理器的功能,定义了控制指令字格式: 讨论了可重构处理单元的逻辑功能与优化过程,并定义了可重构处理单元的配置指 令格式: 研究了可重构计算阵列内部互连网络的拓扑形式和优化问题; 建立了有回绕2 维网格结构模型,并使用该模型研究在不同延迟情况下的阵列利用 率,为探索可重构阵列的参数优化提供了实验依据。 论文从下列角度研究了d r e a c 的应用问题: 初步探讨了应用算法在d r e a c 协处理器中运行的优化问题建立了可重构计算阵 列的利 = j 率模型,并使用该模型作为工作模式选择的判据,为各种应用问题选择在d r e a c 中的最佳实现方式提供了依据,并通过实验证明了该判据的有效性; 利用d r e a c 实现了儿种典型算法,并与同类可重构协处理器的性能做了对比。实 验结果显示d r e a c 协处理器的性能全面超过了同类其他系统。 向。 最后,文中还指出了d r e a c 协处理器有待完善的地方,为下一步研究- 作指明了方 关键词:可重构协处理器,阵列并行,并行流水,2 维网格结构模型,优化实现,阵列利 用率 a b s t r a c t w i t ht h e d e v e l o p m e n to f a l lk i n d s o f p r o g r a m m a b l ed e v i c et e c h n i q u e ss i n c e 19 8 0 s , r e c o n f i g u r a t i o nt h e o r yb a s e dr e c o n f i g u r a b l ec o m p u t i n gb e c o m e sac e n t r a li s s u ei nt h e i n t e r n a t i o n a lr e s e a r c hf i e l d r e c o n f i g u r a b l ec o m p u t e rb a s e do nt h ec o n c e p to fr e c o n f i g u r a b l e c o m p u t i n gi sa tt h et o pi nt h eh i g h - p e r f o r m a n c ec o m p u t e rf i e l d a f t e rt w e n t yy e a r s r e s e a r c h ,t h ei n d u s t r yh a sa g r e e dt h a tt h er e e o n f i g u r a b l eh a r d w a r ec a nb e e m b e d d e di nt h ec o m p u t e r ( o rs o c ) a st h ec o p r o c e s s o ri st h ei m p o r t a n tc h a r a c t e r i s t i co ft h e h i g h 。p e r f o r m a n c ec o m p u t e r ( o rs o c ) i nt h ef u t u r e m e a n w h i l et h er e c o n f i g u r a b l eh a r d w a r e s t r u c t u r eh a sb e c o m et h ef o c u si nt h er e e o n f i g u r a b l ec o m p u t e rr e s e a r c h n o wt w om a i nb r a n c h e so n n e x t g e n e r a t i o nr e c o n f i g u r a b l ec o p r o c e s s o r i s a r r a y p a r a l l e lm o d ea n dp i p e l i n em o d es e p a r a t e l y b o t ho ft h e s et w ot e c h n i q u e sa r e b a s e do ns o m es i m i l a ra r r a yo fr e c o n f i g u r a b l ec e l l h o w e v e r , t h et e c h n i q u ew i t l l c o m b i n i n gt h e s et w os t r u c t u r e si n t oo n ed e s i g nh a sn o tb e e np r e s e n t e dy e t t h ea u t h o r d e s i g n e dak i n do fd y n a m i c a l l yr e c o n f i g u r a b l ea r r a yc o p r o c e s s o r ( d r e a c ) w i t ht h e c o m b i n a t i o no ft h e s et w ok i n d so fs t r u c t u r e s t h i sp a p e ri st h ef i r s tr e s e a r c ho nt h e m t h ea u t h o r p r e s e n t st h er e c o n f i g u r a b l em o d ea n dt h er e c o n f i g u r a t i o na r r a y o p t i m i z a t i o n a n dt h ea p p l i c a t i o no f d r e a c t h es t r u c t u r em o d e la n dt h eb e h a v i o rm o d e la r e p r e s e n t e d a n dt h ew h o l e r e c o n f i g u r a b l ec o - p r o c e s s o ri ss e t u po nt h e s et w om o d e l s t h i sp r o v i d e st h er e s e a r c h p l a t f o r mi nt h i sd i s s e r t a t i o n d r e a cc o p r o c e s s o r sm a i ns t r u c t u r ei sp r e s e n t e d :t h ee f f e c t i v ei n t e g r a t i o no fg l o b e m a n a g e m e n tm o d u l e ,t h er e c o n f i g u r a b l eu n i ta n dt h er e e o n f i g u r a b l ec o m p u t i n ga r r a y t h e nt h ea u t h o rs e t u pas e to fi n d e p e n d e n tt w o - s t a g er e c o n f i g u r a t i o nm a n a g e m e n t m e c h a n i s m t h i sr e a l i z e st h em i m d ( m u l t i p l ei n s t r u c t i o n m u l t i p l ed a t a ) d a t a p r o c e s s i n ga b i l i t ya n dm a n yk i n d so fr e c o n f i g u r a t i o ni m p l e m e n t a t i o n so f t h ed r e a c t h ea u t h o rd e s i g n e dt h ef u n c t i o no fg l o b a lm a n a g e m e n tm o d u l ea n dd e f i n e dt h e f o r m a to fc o n t r o li n s t r u c t i o n t h el o g i cf u n c t i o ns e l e c t i o na n d o p t i m i z a t i o np r o c e d u r eo f t h er e c o n f i g u r a b l e p r o c e s s i n gu n i ta r ed i s c u s s e d t h e c o n f i g u r a t i o ni n s t r u c t i o nf o r m a to ft h er e c o n f i g u r a b l ep r o c e s s i n gu n i ta r ea l s o d e f i n e d ,t h et o p o l o g ys e l e c t i o na n di t so p t i m i z a t i o no ft h er e c o n f i g u r a b l ec o m p u t i n g a r r a yi n n e ri n t e r c o n n e c tn e t w o r ka r ed i s c u s s e d t h et w o d i m e n s i o n a lm e s hs t r u c t u r em o d e li ss e t u pa n du s e di nt h ea p p l i c a t i o no ft h e a r r a y u t i l i z a t i o nu n d e rt h ec o n d i t i o no fd i f f e r e n t d e l a y s ,w h i c hp r o v i d e s t h e e x p e r i m e n t a ld a t af o rt h ee x p l o r a t i o no ft h ep a r a m e t e r o p t i m i z e dr e c o n f i g u r a t i o na r r a y d e s i g n a tt h es a m et i m e 。t h ea p p l i c a t i o no fd r e a c c o p r o c e s s o ri sd i s c u s s e d i v 合肥工业大学博士学位论文 t h e o p t i m i z a t i o no fa p p l i c a t i o na l g o r i t h mm o d e li nd r e a cc o - p r o c e s s o ri sp r e s e n t e d t h ea u t h o rb u i l tt h eu t i l i z a b l er a t em o d e lw i t ht h er e c o n n g u r a t i o na r r a yu n d e rd i f f e r e n t w o r k i n gm o d e s ,w h i c hc a nj u d g et h eb e s tr e a l i z a t i o no fa l l k i n d s o fa p p l i c a t i o n p r o b l e m si nd r e a ca st h ew o r km o d es e l e c t i o nj u d g m e n t t h ej u d g m e n te f f i c i e n c yi s p r o v e di nt h ee x p e r i m e n t s o m ek i n d so fc l a s s i c a l a l g o r i t h m s a r ei m p l e m e n t e di nd r e a c ,w h i c ha r ea l s o c o m p a r e dw i t hi na n yo t h e rr e c o n l i g u r a b l ec o - p r o c e s s o lt h er e s u l t s h o w st h e p e r f o r m a n c eo f d r e a c i sh i g h e rt h a na n yo t h e rs y s t e m a tl a s t ,t h ef u r t h e rs t u d yo nd r e a ci sd i s c u s s e d ,w h i c hr e l e a s e st h et h er e s e a r c ht ob ed o n ei n t h ef u t u r er e s e a r c h k e y w o r d s :d y n a m i c a l l yr e c o n f i g u r a b l ea r r a yc o p r o c e s s o r ;a r r a y - p a r r a l l e l ; p a r r a l l e l p i p e l i n e ;2 d - m e s hm o d e ho p t i m i z a t i o nr e a l i z a t i o n :a r r a yu t i l i z a b l e r a t e 插图清单 图1 - 1 半导体产品特征循环规律3 图1 - 2 多核c p u 组成框图4 图l 一3ge s t r i n 提出的“固定+ 可变结构”计算机模型可重构计算机原型5 图1 - 4 两种粒度的可重构电路结构6 图1 - 5 可重构硬件互连线的选通方式6 图1 6 可重构硬件内部互连线结构7 图1 7 查找表型可重构逻辑单元7 图1 - 8 粗粒度的m o r p h o s y s 可重构逻辑单元8 图1 - 9 可重构系统的三种设计流程9 图1 - 1 0 三种重构方式实现示意图1 0 图1 - 11 空间延拓和时间延拓计算方式求解y = a x 2 + b x + c 一1 0 图1 - 1 2 在f p g a 中空间使用延拓方式求解y = a x 2 + b x + c 1 1 图1 1 3时间与空间双延拓求解y = a x 2 + b x + c 1 2 图2 - 1可重构硬件在可重构计算机中位置和功能一1 7 图2 2d r e a c 结构框图一1 8 图2 - 3d r e a c 协处理器工作流程。2 0 图2 - 4g c u 端口信号与结构框图2 l 图2 - 5g c u 对p n a 的控制流程图2 3 图2 - 6d b 结构框图2 4 图2 - 7p n 结构框图和指令编码2 5 图2 - 8 处理节点阵列内部互连结构2 7 图2 - 9p n a 内部2 种数据流路径2 7 图2 - 1 0p n a 内部2 种主要工作模式2 8 图2 - 1 1d r e a c 的三种重构方式2 9 图3 - 1p i n 的输入、输出端口信号3 2 图3 - 2 p n ( i ,) 结构框图3 3 图3 - 3p n 控制逻辑结构3 4 图3 - 4 描述p n p c 功能的伪码3 4 图3 5 设定p n 工作状态的伪码3 5 图3 - 6p n 的c - r a m 内容修改算法( 伪码) 3 6 图3 7a l u 组成结构框图4 0 图3 - 8 数据调整电路4 1 图3 - 9 单比特逻辑单元结构图4 1 图3 - 1 0k 比特c s l a 加法器4 2 图3 - 1 1 优化的1 6 比特c l s a 加法器结构4 3 合肥工业大学博士学位论文 图3 1 2 乘法器结构4 4 图3 1 3 优化的2 8 比特c l s a 加法器4 5 图4 - 1p n a 的端口信号。4 9 图4 - 2p n a 内部配置指令总线布局5 0 图4 - 3 可重构处理阵列内数据输入输出总线布局5 1 图4 4阵列内部输入数据总线工作模式5 2 图4 5p n a 内部输出数据总线工作模式5 3 图4 6p n a 内部配置s i m dm 总线布局5 4 图4 7 互联网络的分类5 6 图4 - 8 从低维到高维网格结构5 6 图4 9 一维网格的2 种形式5 7 图4 1 0 两种改进型可重构计算阵列5 8 图4 - 1 ld r e a c 可重构阵列内部数据互连网络6 0 图4 1 2d r e a c 阵列水平总线连接形式6 1 图4 1 3 、d r e a c 阵列垂直总线互连形式6 1 图4 1 4 坐标( 3 ,3 ) 的处理节点输入和输出关系6 2 图4 - 1 5 三种基本2 维网格阵列互连结构6 3 图4 - 1 6 数据传输延迟模型d m 0 6 4 图4 - 1 7 数据传输延迟模型d m l 6 4 图4 1 8d m 0 模型下不同网格模型执行相同任务的周期数6 7 图4 1 9d m 0 模型f 不同网格模型执行相同任务的p n a 效率6 7 图4 2 0d m i 模型不同网格模型执行相同任务的周期数6 9 图4 2 1d m l 模型不同网格模型执行相同任务的p n a 效率7 0 图4 2 28 8 7 1 网格结构相对加速比和相对p n a 效率一7 1 图4 2 3 将1 维网格映射到d r e a c 可重构阵列中7 3 图4 2 43 级完全2 叉树完全映射到d r e a c 阵列中一7 3 图4 2 5 在d r e a c 的p n a 中分时重构形成完全2 叉树7 4 图4 2 6d r e a c 阵列内部z i g z a g 编码方式一7 5 图5 12 种丁作模式下任务执行方式对比7 9 图5 - 2 行s i m d 工作模式下阵列内部的数据流和指令流8 0 图5 3 行s i m d 阵列并行模式下p n 内部指令流状态8 0 图5 4 列s i m d 工作模式时,阵列内部的数据流和指令流8 2 图5 5m i m d 阵列并行模式f 的p n a 内部数据路径8 2 图5 - 6 三种并行流水线形式8 4 图5 7 并行互连形式下p n a 具有的1 6 种连接方式8 6 图5 - 8 并行流水形式下具有8 个输入互连的可重构阵列8 6 图5 - 9 并行流水形式下具有8 个输出互连的可重构阵列8 7 图6 1实验环境和流程9 4 图6 。2 正序输入、正序输出的8 点f d c t 流图9 5 图6 - 3 使用行列法执行2 维d c t 过程:9 6 插图清单 图6 4 图6 5 图6 6 图6 7 图6 8 图6 9 图6 1 0 图6 1 1 图6 1 2 图6 1 3 图6 1 4 图6 1 5 图6 1 6 图6 1 7 图6 1 8 图6 1 9 图6 2 0 图6 2 1 图6 2 2 图6 2 3 圈6 2 4 图6 2 5 圈6 2 6 图6 2 7 不同工作模式下单位d c t 变换周期9 8 不同工作模式下d c t 变换阵列利用效率9 8 d r e a c 协处理器完成2 维d c t 变换的流程1 0 1 阵列并行工作模式下p n a 的数据输入和输出过程1 0 3 并行流水工作模式下p n a 的输入,输出形式1 0 5 不同工作模式下单位2 维d c t 变换周期理论值与实际值的对比1 0 6 不同工作模式下单位2 维d c t 变换阵列利率理论值与实际值的对比1 0 7 不同器件完成2 维d c t 变换周期数1 0 8 d r e a c 完成2 维d c t 变换的加速比1 0 8 全搜索块匹配( f s b m ) 算法1 0 9 f s b m 算法在d r e a c 上的实现流程图i1 0 m a d 在第f 行p n a 上的实现1 1 0 使用i 总线广播方式的数据输入操作1 1 2 数据输入和m a d 列向量计算过程在d r e a c 中的实现。1 1 2 m a d 列向量中间结果累加操作1 1 2 m a d 结果输出形式。1 1 3 不同器件完成一个标准搜索窗口运动评估消耗周期1 1 4 不同器件完成一个标准搜索窗口的运动评估的加速比1 1 4 i d e a 流程图1 1 6 i d e a 在d r e a c 中执行过程117 i d e a 的一次循环在1 行p n 中的映射。1 1 8 一次i d e a 过程在1 行p n 中的映射1 1 8 完成6 4 位数据i d e a 过程周期数比较1 2 0 d r e a c 完成6 4 位数据i d e a 加密过程的加速比1 2 0 表格清单 表2 一i 1 3 c u 内部控制寄存器与输出信号列表2 1 表2 - 2g c u 指令格式2 2 表2 3g c u 指令表2 2 表3 1典型的4 种应用算法的操作次数3 6 表3 - 2 多媒体和d s p 典型算法操作分解3 7 表3 - 3p i g 指令编码结构3 7 表3 - 4p n 配置指令集3 8 表3 - 5 不同加法算法的延迟与面积4 2 表3 - 6 位移器对i d c t 计算精度的影响4 5 表4 一lp n a 端口工作方式设定信号说明5 3 表4 2 阵列工作模式信号组合定义说明一5 4 表4 3 常见阵列结构及其计算功能5 9 表4 4 几种2 维网格阵列特征6 3 表4 - 53 种典型d s p 算法计算规模6 5 表4 - 6d m 0 模型下4 4 1 4 型网格模型性能6 5 表4 7d m 0 模型下4 4 3 4 型网格模型性能6 6 表4 8d m 0 模型下8 8 1 1 型网格模型性能6 6 表4 9d m 0 模型下8 8 7 1 型网格模型性能6 6 表4 1 0d m 0 模型下不同网格模型执行周期汇总6 6 表4 1 ld m 0 模型下不同网格模型的p n a 效率6 7 表4 1 2d m l 模型下4 4 1 4 型网格模型性能6 8 表4 1 3d m i 模型下4 4 3 4 型网格模型性能一6 8 表4 1 4d m l 模型下8 8 11 型网格模型性能。6 8 表4 1 5d m l 模型下8 8 7 1 型网格模型性能6 9 表4 1 6d m l 模型下不同网格模型执行周期汇总6 9 表4 1 7d m l 模型不同网格模型的p n a 效率7 0 表4 - 1 8 不同延迟模型下8 8 7 1 网格模型执行周期加速比7 l 表4 1 9 不同延迟模型下8 8 7 1 网格模型阵列效率比7 l 表4 2 03 种可重构阵列拓扑重构能力7 6 表5 - 1典型可重构协处理嚣的重构方式7 7 表5 - 2g c u 的阵列重构管理指令7 8 表5 - 3g c u 阵列控制信号s w 和p n am o d e 的组合功能说明7 9 表5 - 4p n 的m u x l 选通规律8 1 表5 - 5p n 的m u x 2 选通规律8 l 表5 - 6p n 的m u x 3 选通规律8 1 合肥工业大学博士学位论文 表6 1 表6 2 表6 3 表6 4 表6 5 表6 6 表6 7 表6 8 表6 9 表6 1 0 表6 1 1 表6 1 2 表6 1 3 表6 1 4 表6 1 5 2 种工作模式完成k 个8 8 方阵2 维d c t 的性能理论值9 7 以行为单位实现f d c t 时p n a 的配置指令流9 9 以列为单位实现f d c t 时p n a 的配置指令流9 9 阵列并行模式下2 维d c t 变换时g c u 的操作流程1 0 0 阵列并行工作模式下d r e a c 完成k 个8 x 8 方阵2 维d c t 变换的性能1 0 2 并行流水模式下实现f d c t 时的p n a 配置指令流1 0 4 并行流水模式下2 维d c t 变换时g c u 的操作流程。1 0 4 并行流水工作模式下d r e a c 完成k 个8 8 方阵2 维d c t 变换的性能1 0 6 不同器件完成标准规模2 维d c t 变换周期和加速比1 0 7 一个搜索窗口的f s b m 算法实现过程的g c u 操作流程1 1 1 不同起器件完成标准搜索窗口运动评估的周期和加速比1 1 3 i d e a 第f 次循环操作时空关系表。1 1 5 2 种工作模式完成i d e a 的理论效率对比一1 1 7 阵列并行模式执行i d e a 时g c u 的操作流程1 1 9 不同器件完成6 4 位数据i d e a 过程的执行周期和加速比1 1 9 独创性声明 本人声明所早交的学位论文是本人在导师指导f 进行的研究: 作及取得的研究成果。据我 所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究 成果,也不包含为获得 盒目b 工些盍堂或其他教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:索亨g 毛签字日期:五。f 年工月日 学位论文版权使用授权书 本学位论文作者完全了解盒目b : = 些盘堂有关保留、使用学位论文的规定,有权保留并向 国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅平借阅。本人授权合肥工业 烂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权邶) 学位论文作者签名: 耒一亨i 屯 导师签名 签_ - 7 - 日期:j s , f 年,2 月,日 学位论文作者毕业去向 l :作单位 通讯地址 舞甩 签字日期:加;年以月 日 电话 邮编 致谢 首先感谢我的导师高明伦教授,没有他的悉心指导和一贯的支持鼓励也就没 有d r e a c 项目乃至本论文的完成。高老师渊博的学识、活跃的思维、对学科的 深刻认识和对产业的深入理解给我留下了深刻的印象,他实事求是的治学态度和 平易近人的工作作风对我也有潜移默化的影响。高老师是我永远学习的楷模。在 我攻读博士学位期问,师母潘剑宏教授对我的工作给予了精心指导,对我的生活 给予了充分的关心和帮助,在此表示衷心的感谢。 特别感谢中电集团第58 研究所许居衍院士对我博士论文研究工作的关心和 指导。 感谢微电子所胡永华副教授以及周干民、王毅在项目中的合作。感谢胡永华 一直以来的有益指导,他勇于探索的开拓精神对我是一种鞭策。 感谢南京大学李丽副教授、东南火学博士生古海云以及合工大微电子所的同 事杜高明和尹勇生在d r e a c 项目中的精诚合作与无私帮助。 感谢王锐、张多利、程作仁、孙海平等微电子所同事在不同研究方向上的有 益探讨,与程作仁进行的论文细节方面的争论直接促进了本论文的写作进度。 感谢曾经的同事栾铭在本论文写作中所给予的直接帮助。 感谢哈尔滨工业大学喻明艳教授、微电子所同事刘聪、王晓营以及曾经的同 事曹华锋、唐世庆、谢钦、张红莉。 感谢张溯副教授以及唐世庆、徐诺、许晓琳在d r e a c 项目中的指导和帮助。 感谢微电子所同事邓红辉、林微、贾靖华以及先行公司的杜艳英帮助我在申 请博士学位过程中完成各种手续和文书工作。 感谢南京大学何书专和李伟,他们让我在南京的日子永远温暖。 感谢国家自然科学基金( 6 0 3 7 3 0 7 6 ) 和( 9 0 3 0 7 0 1 1 ) 对d r e a c 项目的资助。 最后,感谢父母和家人多年来对我的培养,感谢他们对我选择攻读博士学位 的支持。 作者:宋字鲲 2 0 0 6 年1 0 月2 0 日 第一章绪论 计算是贯串人类历史的一个重要话题,进入数码消费时代之后,人们对计算的要求在传 统的高速和准确的基础上,新增加更小实现成本和更低功耗的要求,显然现有的s o c 架构不 能同时满足这些要求 1 】。 经过近2 0 年来的探索,人们普遍认为在当前技术条件下,可重构计算技术是能够同时 满足数码消费产品对速度、功耗、成本和计算品质等诸多约束的一个理想方案。本章将简要 介绍可重构计算技术出现的背景、技术基础和当前发展状态与趋势。 1 1 常用术语和概念 “可重构电路”指的是在运行过程中可以根据需要随时改变硬件结构的电路,在本文中 特指计算电路。而可重构计算电路又可分为可重构的计算系统、计算机、协处理器、阵列、 节点五个层次,其中,每一个前面的概念包含后面的所有概念。本文研究的重点在可重构节 点p n ( r e c o n f i g u r a b l ep r o c e s s i n g n o d e ) 和可重构节点阵列p n a ( r e c o n f l g u r a b l e p r o c e s s i n g n o d e a r r a y ) ,后者由前者组成。 本小节介绍一些描述p n 和p n a 特征的术语,包括配置、编程和重构等基本概念,以及 说明可重构计算系统特征的粒度、重构深度、重构方式、接口和计算模式。首先对上述术语 给出如下定义: 配置:对一个具有多种功能的电子单元内的控制开关进行设置,以选择某种特定功能。 控制开关的控制信号称为配置数据,而承载配置数据的文件称为配置文件; 编程:使用编程的方法对一批电子元件进行批处理式的配置; 重构:通过批量电子单元的配置使系统具有新的硬件结构,从而实现新的系统功能。 配置、编程和重构是三个不同层次的概念,每层都是更高一层的基础,同时又是更低一 层的发展。从规模上看,配置是对有限多的单元功能进行选择,是在一个较小功能范围内改 变单元属性;编程是针对大范围配置需要而制定的配置信息规则的应用;重构则是系统通过 自身结构的改变而实现新功能的过程。 粒度:依据p n 所能处理的最大数据宽度,p n 分为细粒度和粗粒度两类,在重构技术研 究中粗粒度和细粒度也代表两种不同的p n 架构。细粒度p n 可处理的配置数据宽度不超过1 个比特,即仅能够设置一个电子单元中的一个控制开关的状态。典型的细粒度p n 有触发器、 查找表和逻辑门电路等。当p n 处理的数据宽度超过1 个比特时,称之为粗粒度,通常粗粒 合肥工业大学博士学位论文 度p n 可处理若干字节宽度的配置数据。粗粒度p n 中至少包括一个a l u 和一组寄存器,部 分可重构系统的p n 还添加了乘法器。如果一个可重构系统中同时存在粗粒度和细粒度p n , 则称该系统是混合粒度。 重构深度:指p n 能够保存的配置文件的数量。一个p n 可以保存一个或多个配置文件, 分别称为单配置型p n 和多配置型p n 。有效配置文件指被激活的配置文件,它决定p n 实现 的具体逻辑功能。单配置型p n 仅能保存一个配置文件所以该配置文件永远为有效配置。多 配置型p n 可以任意从己载入的配置文件中选择一个作为当前有效配置,通过简单地选择不 同的有效配置文件,多配置型p n 可以快速实现不同功能间的转换。多配置型p n 具备前后 台并行操作能力,有效配置文件决定了前台操作,而非有效配置文件则是后台操作( 通常是 更新文件内容) ,前后台操作并行节约了可重构系统完成大型算法的执行时间。 重构模式:如果有效配置文件变更时系统暂停所处理的任务,称可重构计算系统的重构 方式为静态重构,反之称为动态重构。显然,单配置型可重构系统仅能被静态重构,而多配 置型可重构系统可在多个配置文件间快速切换有效配置,这种特征赋予其动态重构能力。同 时,多配置型p n 的前后台操作特性提高了可重构系统的重构效率。 接口:如果可重构协处理器独立于主处理器之外,可重构协处理器有独立接口与外部通 讯:如果可重构处理器集成到主处理器内成为主处理器内部数据流的一部分,则两者共用同 一接口。 计算模式:多数可重构系统架构按照某一特定计算模式优化,例如阵列并行或阵列流水。 但也有部分系统可选择s i m d ( s i n g l ei n s t r u c t i o nm u l t i p l ed a t a ) 或m i m d ( m u l t i p l ei n s t r u c t i o n m u l t i p l ed a t a ) 模式处理不同任务,也有部分系统执行v l l w 计算模式。 可重构计算:即在可重构系统上执行的计算工作,本文特指在硬件可重构单元上通过硬 件加速执行的计算任务【2 】。 需要说明的是,由于电路的重构操作一般都会同时涉及配置、编程和重构,因此本文不 刻意斟酌可配置、可编程和可重构三个术语的使用场合,通常读者都可以容易地从上下文中 了解术语的当时含义。 1 2 半导体产品特征循环对下一代半导体产品特征的预测 1 9 8 7 年,我国工程院院士许居衍先生从“造”与“用”的对立统一运动出发,以“应用” 为矛盾的主要方面,总结出了“半导体产品特征循环规律”,如图1 - 1 所示,其中上面一张图 显示了在1 9 8 7 年首次提出时的情况,下面一张图显示了在2 0 0 0 年第一次修订时的情况。该 规律指出,“半导体产品的主特征一直遵循着通用与专用交替发展,每十年左右波动 一次。目前正在进入以嵌入式可编程s o c 为特征的专用( 可称为专用可编程产品,a s p p ) 波动阶段,预计今后将在a s p p 发展中,向用户可重构片上系统( u - s o c ,u s e r - r e c o n f i g u r a b l e s o c ) 方向发展,进入传统微电子技术的最后一次通用波动” 3 】。 笙= 里堕丝 :! : 曼字瓜饿腧瓜 1 1 誉 。溉。嬲。蹴。 肝篓胛虻 旧 加转厢吣腼e b i c 溅a s p p 赢 5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论