




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、复用器重构降低FPGA成本 摘 要: 本文介绍了一种新的复用器重构算法,能够降低FPGA实际设计20的成本。该算法通过减少复用器所需查找表(LUT)的数量来实现。算法以效率更高的4:1复用器替代2:1复用器树。算法性能的关键在于寻找总线上出现的复用器数量。新的优化方法占用一定的逻辑,这些逻辑由总线进行分担,从而减少了总线上每个比特位所需的逻辑。 (本站编者:该算法已经集成在QuartusII4.2软件中,使用QuartusIi进行综合HDL语言时会自动调用该算法进行综合,本文介绍该算法的详情,本文适合希望深入了解算法的用户阅读) 关键词: FPGGA;复复用器;重构;重新编编码;总总线;逻逻辑
2、优化化;综合合 1. 引言言 - 复复用器是是数据通通道常用用的构建建模块,被被广泛应应用在处处理器1、处处理器总总线、网网络交换换,甚至至是资源源共享的的DSPP设计中中。据估估计,复复用器一一般要占占用一个个FPGGA设计计2 255%以上上的面积积。因此此,优化化FPGGA设计计的关键键在于怎怎样优化化复用器器。 - 本本文介绍绍了一种种新的复复用器重重构算法法,该算算法减小小了复用用器在基基于4输输入查找找表(44-LUUT)FFPGAA体系结结构中所所占用的的面积。基基准测试试结果表表明复用用器平均均减少了了17%,在一一些设计计中,44-LUUT整体体减少220%。 - 22.1节
3、节阐述了了复用器器是如何何由行为为级VHHDL4或或Verriloog55代码码产生的的,2.2和22.3节节阐述复复用器树树和复用用器总线线在设计计中是怎怎样生成成的。22.4节节说明这这些结构构怎样由由4-LLUT实实现,阐阐述如何何采用两两个4-LUTT有效实实现一个个4:11二进制制复用器器。 - 第第3节介介绍了一一种叫做做压缩的的新技术术,该技技术附加加一些控控制逻辑辑,将多多个2:1复用用器重新新组合为为有效的的4:11复用器器,从而而减少了了为总线线上每一一个比特特位实现现复用器器所需要要的4-LUTT数量,所所附加的的控制逻逻辑代价价由整个个总线来来分担。优优化复用用器总线线
4、是复用用器重构构算法的的核心。 - 44.1节节阐述复复用器重重构算法法如何构构建设计计中的复复用器树树总线。44.2节节的重构构方法用用于执行行4.33节中定定义的均均衡算法法。均衡衡增加了了由压缩缩生成的的有效44:1复复用器的的数量。 - 第第5节总总结了在在Altteraa Quuarttus II集集成综合合中运行行的整个个算法。第第6节列列出了来来自1220个AAlteera真真实用户户设计实实例的基基准测试试结果,测测试表明明面积减减少超过过20%,平均均节省了了4.22%。 2. 背景景知识 - 22.1 复用器器在设计计中是怎怎样实现现的 - 行行为级HHDL设设计中的的任何
5、条条件代码码通常会会综合为为复用器器。本节节阐述两两个最常常用的复复用器生生成代码码实例。 - 图11是VHHDL的的casse声明明及其22:1复复用器树树的实现现。采用用Verriloog ccasee声明的的“paaralllell caase”指指令55可产产生相似似的结果果。 图1 - 注注意,并并不是所所有的ccasee声明都都能将可可能的事事件描述述清楚,需需要依靠靠“deefauult”或或者“ootheers”条条件来进进一步说说明。在在这些情情况下,可可以继续续将caase声声明表征征为2:1复用用器树,但但是这种种树结构构可能达达不到平平衡。 - 图图2显示示了“iif-
6、tthenn-ellse”声声明是怎怎样产生生一个22:1复复用器链链的。VVeriilogg的“?:”和和非平行行casses可可同样产产生相似似的结构构。注意意,复用用器链确确保如果果第一个个if条条件为“真真”,将将选择“aa”数据据输入,而而复用器器其他部部分将被被忽略。 - 本本文阐述述的复用用器重构构算法应应用于22:1复复用器。综综合工具具由行为为级代码码开始通通常会生生成较大大的复用用器。较较大的复复用器总总是被分分解为22:1复复用器树树,如何何实现这这种分解解已经超超出本文文讨论范范围。 图2 iff-thhen-elsse声明明生成的的逻辑 图3 HDLL生成的的复用器器
7、材 图图4 生生成复用用器总线线 - 22.2 复用器器树 - 设设计中复复用器之之间的馈馈入是常常见的现现象。例例如,在在一段HHDL代代码中,如如下面的的图3所所示,iif-tthenn-ellse声声明中含含有caase声声明就会会产生这这种现象象。 - 在复用用器重构构算法中中,识别别出较大大的复用用器树对对于尽可可能减少少面积是是非常重重要的。 - 22.3 复用器器总线 - VVHDLL信号或或Verriloog线宽宽通常会会超过一一个比特特位。当当采用iif-tthenn-ellse和和casse声明明时,将将会生成成大量具具有不同同数据输输入的相相同复用用器树,图图4是一一个实
8、例例。一组组具有相相同结构构的复用用器称为为复用器器树总线线。 - 本本文阐述述的复用用器重构构技术采采用了新新的对整整个复用用器总线线进行优优化的方方法,它它通过由由4.11节中进进一步阐阐述的总总线识别别和形成成技术来来实现。 - 22.4 复用器器代价 - 在在许多情情况下,每每个2:1复用用器都需需要一个个单独的的4-LLUT。这这样,图图1和图图2中的的复用器器结构都都需要三三个4-LUTT。尽管管这些结结构控制制编码不不同,但但是它们们都具有有4个不不同的数数据输入入,因此此可以当当作4:1复用用器。本本节阐述述如何实实现只需需要两个个4-LLUT的的4:11复用器器。 - 图图5
9、是控控制输入入S0低低电平时时,一个个有效的的4:11复用器器是如何何工作的的。4:1复用用器由两两个链接接在一起起的4-LUTT(阴影影框所示示)构成成。每个个4-LLUT被被设置为为含有阴阴影框中中的逻辑辑功能。如如白框所所示,复复用器含含有四个个输入a、bb、c和和d,以以及两个个控制输输入S0和和S1。 图5 - SS0低电电平时,低低位控制制比特SS1在输输入c和和d中进进行选择择,其结结果通过过第二个个4-LLUT,将将a或者者b输入入旁路。 图6 - 图图6是控控制输入入S0高高电平时时,一个个有效的的4:11复用器器是如何何工作的的。低位位控制比比特S11旁路cc和d输输入,直
10、直接进入入第二个个4-LLUT,对对a或者者b输入入进行选选择,其其结果成成为第二二个4-LUTT的输出出。 - 第第3节描描述的压压缩算法法采用这这种有效效的4:1复用用器,重重新实现现复用器器结构,达达到了减减小面积积的目的的。 3. 压缩缩 - 压压缩是将将低效的的4:11复用器器实现转转换为高高效实现现的过程程。复用用器重构构算法的的面积节节省由压压缩实现现。但是是,在不不同的复复用器表表征中进进行转换换,通常常需要附附加控制制逻辑。实实际上,由由于附加加逻辑结结构抵消消了使用用高效复复用器结结构的优优势,这这种转换换很少能能够产生生真正的的面积节节省。而而复用器器重构算算法采用用新颖
11、的的将整个个复用器器总线进进行转换换的方法法,这样样,总线线上的多多个复用用器可以以共享控控制逻辑辑,因此此,改善善后的复复用器结结构优势势可通过过总线上上的每个个复用器器来实现现。 图7- 图图7显示示了如何何将三个个2:11复用器器组成的的优先级级链转换换为一个个4:11二进制制复用器器。假设设控制输输入由不不相关的的逻辑馈馈入,那那么这种种转换至至多需要要两个额额外的44-LUUT控制制逻辑。如如果最初初的复用用器至少少占用三三个4-LUTT,而44:1复复用器只只需要两两个即可可实现,那那么这种种转换将将节省33宽度或或者更宽宽总线的的面积。 图8- 图图8显示示了如何何将一组组排列成
12、成树的22:1复复用器转转换为一一个4:1复用用器。在在这种情情况下,通通过仔细细为4:1复用用器选择择编码方方式,使使S0在在(A、BB)和(CC、D)之之间进行行选择,限限制附加加控制逻逻辑,只只加入最最多一个个4-LLUT。此此时,这这种转换换将节省省2宽度度或者更更宽总线线的面积积。 - 一一般来讲讲,任何何的三个个2:11复用器器组都可可以通过过图7或或图8的的方式转转换为一一个4:1复用用器。但但是,这这两种转转换必须须在宽度度大于22的复用用器总线线上进行行,以减减小所需需4-LLUT的的数量,实实际上,如如果这两两种转换换不在总总线上进进行,将将没有意意义。 - 总总线上22:
13、1复复用器三三联重新新编码是是复用器器重构算算法的核核心。 第4节节将阐述述形成数数量最多多三联的的新方法法。 4. 复复用器总总线 4.1 “库库”的构构造 - 压压缩减小小了其所所编码的的每一个个2:11复用器器三联面面积,因因此,压压缩应用用在较大大的复用用器树上上最有效效。本节节阐述大大型复用用器树是是如何构构建的。设设计中所所有的总总线都将将被存储储在一种种称为“库库”的数数据结构构中。 - 复复用器树树采用下下面的方方法构建建。设计计中所有有2:11复用器器以反向向深度顺顺序排列列。这意意味着那那些离寄寄存器或或者输出出引脚最最近的复复用器将将排在列列表前面面。然后后从头至至尾扫描
14、描列表,寻寻找每一一个2:1复用用器,如如果其输输出仅与与另一个个2:11复用器器相连,则则将该复复用器和和与其相相连的复复用器一一起加到到复用器器树中。否否则,将将此2:1复用用器作为为一个新新复用器器树的首首复用器器。以此此方式来来构建的的复用器器树含有有最大数数量的复复用器。 - 如如果复用用器树中中复用器器的所有有数据输输入均不不是由同同一个树树中其他他的2:1复用用器馈入入,则称称此复用用器为初初级输入入(对整整个树而而言)。 - 一一旦所有有的复用用器树已已经形成成,则将将其合并并成总线线。如果果两个复复用器树树要并入入同一个个总线,它它们必须须具有相相同的结结构,即即2:11复用
15、器器的排列列相同,并并且都有有完全一一致的控控制输入入。这可可以通过过根据复复用器结结构,对对所有复复用器树树列表排排序来实实现,在在列表中中将结构构相同的的树靠近近排列。总总线可直直接由结结构相同同的树构构成。 - 通通过规则则选取来来实现总总线宽度度最大化化。宽总总线可以以将由压压缩引入入的控制制逻辑开开销降低低到最小小。- 44.2 重构 - 44.3节节描述均均衡方法法,该方方法能够够使压缩缩得到的的面积减减小最大大化。均均衡建立立在重构构的基础础上,其其概念由由本节给给出。 - 通通过2:1复用用器所馈馈入的一一个2:1复用用器,重重构移动动该复用用器及其其一个输输入。图图9显示示了
16、阴影影复用器器与其“ff”输入入的重构构。为保保持原始始复用器器总线的的功能,需需要附加加一些控控制逻辑辑。这些些控制逻逻辑同样样可以由由总线上上的每一一个复用用器树来来分担。 图9- 图图9中,重重新编码码逻辑(c6 ANDD (NNOT c3)必须须确保当当c1、cc3为“假假”而cc6为“真真”时,选选择输入入“f”(与与转换前前的情况况一致)。同同样,当当c1、cc3、cc6为“假假”时,选选择输入入“g”,即即(c66 ANND (NOTT c33)也也是“假假”。 - 重构构转换将将选中的的复用器器进一步步向复用用器树顶顶端移动动。因此此,不断断重复重重构转换换,可以以将任意意位置
17、的的复用器器向顶端端移动。- 44.3 均衡 - 压压缩通过过转换22:1复复用器三三联,能能够减少少实现复复用器总总线所需需的4-LUTT数量。但但是,如如果不进进行复用用器树重重构,有有些结构构是不可可能得到到最佳三三联分组组的。例例如,无无法将图图10中中所有的的2:11复用器器进行分分组,这这是因为为每一种种可能的的分组都都将会剩剩余一个个2:11复用器器而无法法处理。 - 均均衡的目目的在于于通过最最少的重重构得到到最佳的的压缩。对对于图110的例例子,可可以采用用图111所示的的方法,得得到两组组2:11复用器器三联。- 均均衡算法法由图112的递递归定义义。由首首复用器器开始,算
18、算法首先先均衡复复用器树树左面和和右面数数据输入入。均衡衡返回还还没有连连接为三三联的22:1复复用器的的数量。均均衡确保保形成尽尽可能多多的三联联,这样样只会剩剩余一个个或者两两个2:1复用用器,甚甚至没有有剩余。- 均均衡中的的任何阶阶段,都都需要对对155个2:1复用用器进行行均衡(从从左侧分分支开始始最多两两个,从从右侧分分支开始始为两个个,还要要算上当当前的22:1复复用器本本身)。11或2个个复用器器不会形形成更多多的三联联,而33个复用用器总是是能够形形成三联联。4或或5个复复用器则则需要进进行重构构,以免免剩余无无法处理理的复用用器,这这种重构构方法在在图133和图114中示示
19、出。 图10 复复用器树树次优压压缩的例例子 图图11 由均衡衡未完善善压缩 图122 均衡衡算法 图 113重构构4个复复用器实实现均衡衡 图114 重重构5个个复用器器实现均均衡 5. 算法法总结 - 本本文引入入了复用用器树总总线概念念,描述述了可用用来提高高压缩性性能的均均衡方法法,压缩缩以效率率更高的的4:11复用器器来替代代2:11复用器器三联。图图15显显示了全全部复用用器重构构算法。 - 复复用器重重构算法法性能依依赖于对对较大复复用器树树总线的的识别。由由于复用用器重构构算法在在整个总总线上分分担控制制逻辑,因因此,总总线越宽宽,压缩缩的效果果就越明明显。优优化会减减小复用用
20、器树间间的相似似性,从从而减小小所寻找找的总线线宽度,因因此在复复用器重重构之前前,应尽尽量避免免优化。- 复复用器重重构以分分解大的的复用器器为2:1复用用器开始始。设计计中所有有2:11复用器器都用于于形成44.1节节所描述述的复用用器树。结结构相似似的复用用器树然然后合并并形成44.1节节中的总总线结构构。- 算算法的主主要部分分依次优优化每一一个总线线。均衡衡将2:1复用用器重新新排列为为三联,这这样在压压缩阶段段,每个个三联能能够重新新编码为为效率更更高的44:1复复用器。 图16 复复用器重重构基准准测试结结果 6. 结果果 - 本本文所阐阐述的算算法已经经集成到到Altteraa
21、 Quuarttus II 4.22综合软软件中。图图16显显示1220个真真实用户户设计中中,Allterra基准准测试的的面积减减小结果果。 - 结结果表明明,一小小部分设设计所需需的LUUT数量量减小了了20%,超过过四成的的设计面面积减小小了5%以上。所所有设计计面积平平均减小小了4.2%。 - 据据估算,面面积减少少平均44.2%意味着着复用器器平均减减少了117%。 - 复复用器重重构主要要集中在在减小面面积上(例例如,减减少所需需4-LLUT的的数量),而而且对电电路速率率影响不不大,电电路平均均速率仅仅降低11%。 7. 结论论 - 本本文阐述述了复用用器重构构算法,该该算法能
22、能够将设设计中实实现复用用器所需需的4-LUTT数量平平均减少少17%。 - 复复用器重重构算法法的关键键在于优优化复用用器总线线。即使使附加了了控制逻逻辑,新新优化算算法仍能能够减小小总线上上每个比比特位的的面积。这这是由于于控制逻逻辑可以以由总线线共享,其其面积代代价可以以抵消。 - 压压缩将22:1复复用器三三联转换换为有效效的4:1复用用器。尽尽管可能能需要附附加LUUT对44:1复复用器控控制线进进行重新新编码,这这种代价价可以通通过采用用复用器器总线整整体压缩缩方法来来抵消。此此外,通通过构建建最大的的复用器器树,可可对大量量的2:1复用用器三联联进行转转换。- 本本文还引引入了能能够提高高压缩算算法效率率的均衡衡方法。本本文描述述了面向向基于44-LUUT的FFPGAA算法,例例如Allterra SStraatixx I和和Cycclonne器件件。新的的FPGGA体系系结构可可使用不不同大小小的查找找表(如如Strratiix III体系系结构能能够采用用4、55、6输输入LUUT)。可可采用本本文阐述述的方法法来进一一步减小小这些体体系结构构的面积积。 参考文献 1 A HHighh Peerfoormaancee 322-biit AALU forr Prrogrrammmablle LLo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年烟草福建公司招聘考试真题及答案
- 安龙县招聘教师笔试真题2024
- 石大学前儿童保育学课件1-8新生儿
- 能耗优化控制算法研究-洞察阐释
- 重庆硅砂生产线项目可行性研究报告
- 污水处理厂建设项目可行性研究报告
- 财务年度总结和工作计划金色烫金帆船励志
- 2025至2030年中国瓦楞包装纸箱行业投资前景及策略咨询报告
- 增强基层劳动关系服务的多元化与精准化
- 2025至2030年中国烟用粘合剂行业投资前景及策略咨询报告
- 2025年普通高等学校招生全国统一考试数学试题(全国二卷)(有解析)
- 2025年安庆宿松县县属国有企业招聘57人笔试参考题库附带答案详解析集合
- 消防考试基础试题及答案
- 临时用电施工方案技术交底
- 儿童意外异物吞食课件
- 富民银行笔试题库及答案
- 2025年高考第二次模拟考试数学(新高考Ⅱ卷)(参考答案)
- 低血糖的相关试题及答案
- 2025年下半年广东省中山市东凤镇人民政府雇员招聘9人易考易错模拟试题(共500题)试卷后附参考答案
- 2025-2030中国花店行业市场发展分析及发展趋势与投资前景研究报告
- ai训练师笔试题及答案
评论
0/150
提交评论