(水声工程专业论文)基于fpga的数字信号处理算法研究与高效实现.pdf_第1页
(水声工程专业论文)基于fpga的数字信号处理算法研究与高效实现.pdf_第2页
(水声工程专业论文)基于fpga的数字信号处理算法研究与高效实现.pdf_第3页
(水声工程专业论文)基于fpga的数字信号处理算法研究与高效实现.pdf_第4页
(水声工程专业论文)基于fpga的数字信号处理算法研究与高效实现.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(水声工程专业论文)基于fpga的数字信号处理算法研究与高效实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

哈尔滨。翻弩大学硕十学位论文 a bs t r a c t m o d e m s i g n a lp r o c e s s i n gi sr e q u i r e dt oh a v eh i g hp e r f o r m a n c eo fr e a lt i m e p r o c e s s i n g w h e nt h ef a s td i g i t a ls i g n a lp r o c e s s o r ( d s p ) i ss t i l lu n a b l et om e e tt h e s p e e dr e q u i r e m e n t s ,t h eo n l yc h o i c ei st oi n c r e a s et h en u m b e ro fp r o c e s s o r so r a d o p tc u s t o m e r sc u s t o m i z e dg a t ea r r a yp r o d u c t s w i t ht h ed e v e l o p m e n to f p r o g r a m m a b l el o g i cd e v i c et e c h n o l o g y ,f i e l dp r o g r a m m a b l eg a t ea r r a y ( f p g a ) w i t h m a s s i v e l yp a r a l l e lp r o c e s s i n gc a p a b i l i t y s h o w s s u p e r i o r i t y i n c o s t , p e r f o r m a n c e ,s i z ee t c i nt h i sp a p e r , s i g n a lp r o c e s s i n ga l g o r i t h m ,s u c ha sf a s t f o u r i e rt r a n s f o r m ,d i g i t a lf i l t e r i n g ,a n dc o r r e l a t i o na l g o r i t h ma r er e s e a r c h e da n d e f f i c i e n t l yr e a l i z e d f i r s t l y , a c c o r d i n gt ot h er e a l t i m er e q u i r e m e n to fi m a g i n gs o n a ra n dt h e r e s o u r c ec o n s t r a i n t so ft h ef p g a ,f f tp r o c e s s o rw i t hc a s c a d ea n dp a r a l l e l r e c u r s i v es t r u c t u r ei sd e s i g n e d t h em e t h o dt oi n c r e a s ec a l c u l a t i o ns p e e dw i t h p i p e l i n i n ga n dp a r a l l e lp r o c e s s i n gt e c h n o l o g yi sd i s c u s s e di nd e t a i l s u b s e q u e n t l y , s o m eo p t i m i z a t i o na n di m p r o v e m e n to fb u t t e r f l ya r i t h m e t i cu n i ti sp r o p o s e d s e c o n d l y ,t h ec h a r a c t e r i s t i c so ft h ed i g i t a l f i l t e r i n ga r ea n a l i z e d ,s oi st h e c o r r e l a t i o nc a l c u l a t i o nw i t ht h es a m es t r u c t u r e t h es t r u c t u r ew i t hm u l t i p l i e ra n d t h es t r u c t u r ew i t hn o n m u l t i p l i e ra r ea d o p t e di nm u l t i p l y - - a c c u m u l a t ec a l c u l a t i o n ( m a c ) d i s t r i b u t ea l g o r i t h m ( d a ) i sa d o p t e di nt h en o n m u l t i p l e rs t r u c t u r e , w h i c hc a ng r e a t l yi m p r o v et h ec o m p u t i n ge f f i c i e n c yb yc o n v e r t i n gm u l t i p l i c a t i o n t ol o o ku pt a b l ei np f g a i na d d i t i o n ,t h ec o r r e l a t i o na l g o r i t h mi nf r e q u e n c y d o m a i ni sr e s e a r c h e di nt h ep a p e r f i n a l l y ,t h ep r e t r e a t m e n ts y s t e mo fi m a g es o n a ri sc o m p l e t e d ,a n dt h e r e c e i v i n g ,f i l t e lo r t h o g o n a lt r a n s f o r m a t i o na n dt r a n s m i to f16 0c h a n n e l ss i g n a la r e r e a l i z e do no n ep i e c eo fe p 2 s 6 0 a c c o r d i n gt ot h et e s t i n gr e s u l t s ,t h ea l g o r i t h m r u n sw e l li nt h ee x p e r i m e n ta n di tf u l f i l l st h ep r e d e f i n e dr e q u i r e m e n t k e yw o r d s :f p g a ;p a r a l l e lp r o c e s s i n g ;f f t ;f i l t e r i n g ;c o r r e l a t i o na l g o r i t h m 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导下由作 者本人独立完成的。有关观点、方法、数据和文献的引用己在文 中指出,并与参考文献相对应。除文中已注明引用的内容外,本 论文不包含任何其他个人或集体已经公开发表的作品成果。对本 文的研究做出重要贡献的个人和集体,均已在文中以明确方式标 明。本人完全意识到本声明的法律结果由本人承担。 作者( 签字) :洳艾嘣 日期:i o p 年3 月r 7 日 哈尔滨工程大学 学位论文授权使用声明 本人完全了解学校保护知识产权的有关规定,即研究生在校 攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨 工程大学有权保留并向国家有关部门或机构送交论文的复印件。 本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据 库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本 学位论文,可以公布论文的全部内容。同时本人保证毕业后结合 学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈 尔滨工程大学。涉密学位论文待解密后适用本声明。 本论文( 口在授予学位后即可口在授予学位1 2 个月后 口 解密后) 由哈尔滨工程大学送交有关部门进行保存、汇编等。 作者( 签字) :哿艾明 日期:z q o 年多月叩日 导师( 签字) ; ,y 年7 月叮 哈尔滨l :程人学硕十学位论文 1 1 引言 第1 章绪论 f p g a ( f i e l dp r o g r a m m a b l e g a t ea r r a y ) 即现场可编程门阵列和 d s p ( d i g i t a ls i g n a lp r o c e s s o r ) 数字信号处理芯片发展至今已经有了二十多年 的历史,但和d s p 很早就确立数字信号处理领域的霸主地位相比,f p g a 由 于成本、功耗和性能限制,一直被使用在系统外围,从最初用于胶合逻辑, 到控制逻辑,再到用于数据通路,慢慢地接近系统的核心。 进入2 1 世纪后,随着9 0 和6 5 纳米工艺的采用,f p g a 在成本、功耗和 性能上大幅改善,具备成为系统核心的条件;另一方面,3 g 和互联网时代的 来临,要求复杂和大量并行处理,d s p 在做并行处理时不如f p g a ,这为具 有强大并行处理能力的f p g a 带来了需求。正因为如此,x i l i n x 、a l t e r a 公司 最近推出的多款f p g a 都具备了强大的数字信号处理能力,在通信、消费、 嵌入式等领域,并丌始行使d s p 的功能。 x i l i n x 于2 0 0 8 年初向市场推出的针对高性能数字信号处理而优化的6 5 纳米v i i r c e x 5 s x t 现场可编程门阵列口1 ,最高d s p 性能达到3 5 2 g m a c ( 每秒 十亿次乘累加) ,1 9 2 至6 6 0 个专用1 8 2 5 位d s ps l i c e s 。同时该公司又推出 低成本s p a r t a n d s p 系列新型x t r e m ed s p 组合,可提供超过 3 0 g m a c 2 2 0 0 g b p s 存储器带宽,与同类的其它高性能可配置d s p 器件相比, 动态功耗降低多达5 0 ,而价格不到3 0 美元。 与此同时,a l t e r a 公司也推出了6 5 纳米低成本c y c l o n ei i i 系列产品, 它含有2 8 8 个数字信号处理乘法器,其性能可达2 6 0 m h z ,存储器能达到 4 m b ,适合宽带并行处理应用,而功耗与上一代9 0 纳米c y c l o n ei i 相比降低 了5 0 。 f p g a 强大的并行处理能力也给水声信号处理领域注入了新的活力。如 在图像声纳h 1 、多波束测深等系统中需要对几十路甚至上百路信号进行处理, 运算量十分庞大,对实时性的要求也非常高,如果利用f p g a 实现则可能极 大的减小系统的功耗,体积和成本。 哈尔滨。l :程火学硕十学位论文 有理由相信f p g a 将应用到更广阔的领域,并在数字信号处理中发挥越 来越大的作用。 1 2f p g a 在d s p 中的优势 在数据通讯和图像处理这样的应用中,由于成本、系统功耗和上市时间 等原因已无法简单地利用d s p 处理器来实现,基于f p g a 的信号处理器已广 泛应用于各种信号处理领域。与d s p 相比,f p g a 实现数字信号处理的主 要优越性有: ( 1 ) f p g a 的高度并行处理能力。f p g a 相对d s p 芯片的最大优势是其内 在的并行机制,即利用并行架构实现数字信号处理的功能。这一并行机制使 得f p g a 特别适合于完成滤波这样重复性的d s p 任务。对于高度并行的数字 信号处理任务来说,f p g a 性能远超通用d s p 处理器的串行执行架构p 1 。 下面以完成乘累加速度最快的t i 的c 6 x 和c 5 5 x 系列州_ 1 d s p 处理器以 及f p g a 完成同一算法( 8 位2 8 8 阶f i r 滤波器) 进行比较。结果见表1 1 。 表1 1f p g a 与d s p 处理器运算速度的比较 器什选择 t m $ 3 2 0 c 5 5 0 9t m $ 3 2 0 c 6 4l6a l t e r ae p 2 s 6 0 阶数2 8 82 8 82 8 8 乘累加器数 18 2 8 8 ( 3 6 个d s p 模块) 内部时钟速度2 0 0 m h z 6 0 0 m h z 2 5 0 m h z 所需时钟周期数2 8 83 61 所需时间1 4 4 u s0 0 6 u s0 0 0 4 u s 每秒乘加运算次数 0 2 g m a c s4 8 g m a c s7 2 g m a c s 由表1 1 可见,e p 2 s 6 0 型的f p g a 的乘累加速度最快峰1 ,每秒为7 2 千兆 个乘j j i j ( m a c ) 操作,是t m s 3 2 0 c 6 4 1 6 的1 5 倍,t m s 3 2 0 c 5 5 0 9 的3 6 0 倍。 而f p g a 中采用的内部时钟速度还不到t m s 3 2 0 c 6 4 1 6 的1 2 。此外f p g a 中 有数以万计的逻辑宏单元可供随意组合成各种类型的硬件电路功能模块,能 够完成单片c 6 x 几乎无法完成的运算任务。 ( 2 ) f p g a 具有重配置能力。d s p 处理器可以通过加载不同的软件来实现 不同的功能,但这相对于a s i c 系统十分灵活的功能并没有实用价值。因为 2 哈尔滨t 程大学硕十学位论文 仅仅通过对d s p 处理器加载不同的程序代码,并不能有效地改变d s p 系统 的诸如吞吐量、数据总线宽度、d s p 加速模块的数量与功能。这是因为这一 切必须靠改变硬件结构、硬件功能才能实现。 由于不同的配置文件下载到f p g a 后,能获得不同的硬件结构和硬件功 能,因此基于f p g a 的系统具有良好的系统结构可重配置特性。 ( 3 ) 在高速、高性能要求的应用场合,使用f p g a 方案的系统成本、功 耗、集成度比使用d s p 方案更优越。由于c p u 的灵活性,对于低速、低吞 吐量和大量复杂运算的情况,d s p 处理器方案的系统成本要比f p g a 系统低 很多,而且此方案具有不可替代性。然而在高端应用领域,大多数的情况中 不但需要尽可能高速、高性能的d s p 处理器,而且多片d s p 连用的情况也 十分普遍。在多片d s p 系统中,每一片d s p 处理器都必须配置完整的辅助 器件才能正常工作,如数据r a m 、程序r a m 和r o m 、f i f o 、双口r a m 、 f p g a c p l d 辅助接口器件等等。该系统的成本将成倍提高,功耗、集成度 与可靠性等性能指标也都将不同程度地下降,但是如果使用f p g a 来构成 d s p 系统,在d s p 处理器系统中存在的问题将迎刃而解。目前拥有大规模逻 辑资源的f p g a 完全能容纳必须由多片d s p 处理器构成的系统,从而使得单 片f p g a 构成的系统在各项技术指标大幅度提高的前提下,成本和功耗大幅 度下降,集成度与可靠性则大幅度提高。 1 3f p g a 在d s p 领域的应用 1 3 1 视频图像领域 视频和图像处理技术可谓日新月异,新需求不断催生技术革新和新标准, 主要体现在以下几个方面:从标清( s d ) 到高清( h d ) ,分辨率越来越高,需要 实时处理的数据量越来越大;视频和图像压缩技术日趋复杂,如m p e g 一4 , h 2 6 4a v c ,j p e g 2 0 0 0 等;对视频系统智能的要求提高,如智能拍摄、运 动检测、对象识别、多通道、画中画、透明叠加效果等;消费者欣赏能力的 提高,希望图像更稳定、更清晰、色彩更艳丽、亮度更符合人眼的感官需求。 如果单纯使用现成的专用视频图像处理芯片( a s s p ) ,根本无法设计出具 有自主知识产权的产品,无法体现产品的差异化。而且,使用a s s p 很难做 3 哈尔滨丁程火学硕十学位论文 到灵活、易升级、以及紧跟技术发展的潮流。厂商自己丌发a s i c 的周期又 太长,前期投入太大,风险很高,无法保证投资回报,也无法保持技术领先。 目自 f ,功能最为强大的单片d s p 处理器也不能实时压缩( h 2 6 4 ) 高清视 频。而使用d s p 阵列的成本让人难以接受,同时多片d s p 处理器将带来系 统分割和调试的困难,增加系统的不稳定性,增加p c b 成本。如果使用单片 f p g a ,或采用f p g a 加d s p 处理器协同工作的方案,这些困难可迎刃而解。 使用f p g a 技术可以帮助用户在保证合理成本的前提下,丌发高性能的 产品。利用f p g a 的可灵活升级性,用户可以满足千变万化的市场需求,使 自己的产品迅速推陈出新,紧跟业界发展趋势,做出有自己特色、自主知识 产权的产品,始终保持产品的差异化和领先性。 1 3 2 软件无线电领域 软件无线电( s d r ) 是具有可重配置硬件平台的无线设备,可以跨越多种 通信标准。因为具有更低的成本、更大的灵活性和更高的性能,软件无线电 已迅速成为军事、公共安全和商用无线领域的事实标准。软件无线电的基带 处理通常需要处理器和f p g a 。在这类应用中,处理器处理系统控制和配置 功能,而f p g a 实现大计算量的信号处理数据通道和控制,让系统延迟最小。 当需要从一种标准切换至另种标准时,处理器能够动态地在软件的主要部 分问切换,而f p g a 能够根据需要完全重新配置,实现特定标准的数据通道。 f p g a 可以作为协处理器同d s p 和通用处理器相连,这样具有更高的系 统性能和更低的系统成本。自由地选择在哪实现基带处理算法为实现s d r 算 法提供了另一种方式的灵活性。基带部件也需要足够灵活让所需的s d r 功能 支持在同一种标准增强版本之间的移植,并能够支持完全不同的标准。可编 程逻辑结合软核处理器( 如a l t e r a 公司推出的基于f p g a 平台的n i o si i ) 和i p , 具有了提供在现场远程升级的能力。图1 1 是一个框图,其中f p g a 能够通 过i p 功能如t u r b o 编码器、r e e d s o l o m o n 编码器、符号交织器、符号映射 器和i f f t ,很容易地重配置支持w c d m a 、h s p d a 或8 0 2 1 6 a 标准的基带 发送功能。 4 哈尔滨工程人学硕+ 学位论文 d i 口l : 图1 1 两种无线信号的s d r 基带数据通道重配置 1 3 3 水声信号处理领域 高分辨率图像声纳和多波束测深等领域需要对水声换能器阵列输出的几 十路甚至上百路信号进行处理,这要求声纳信号处理系统具有很高的数据吞 吐能力。以往的声纳系统通常采用高速信号处理器( d s p ,如t i 公司生产的 t m s 3 2 0 c 6 4 1 6 ) 作为核心处理部件。为满足实时性的要求,常需要采用多片 d s p 处理器组成并行处理系统。 现在,随着可编程逻辑器件技术的发展,具有强大并行处理能力的f p g a 在性能、成本、体积、功耗等方面部显示出了其优势。若采用f p g a 作为d s p 的协处理器,专门执行实时性强、运算量大、算法结构规整的算法,d s p 将 从重复繁琐的工作中解脱出来,整个系统的性能也将显著提高。 在水声信号处理中,快速傅立叶变换、数字滤波、相关运算是应用得最 为广泛的几种数字信号处理算法,高效地实现上述算法具有很高的实用价值。 本文将结台水声信号处理领域的超短基线定位系统和高分辨率图像声纳系 统,探讨这些算法在f p g a 平台上的实现。 14 国内外研究现状 世界上第一片f p g a 由美国x i l i n x 公司于1 9 8 5 年发明,因而f p g a 技 5 哈尔滨t 程火学硕十学位论文 术在国外发展较早,基于f p g a 的数字信号处理算法的研究也取得了长足的 进步。 两大f p g a 巨头x i l i n x 和a l t e r a 除了f p g a 的生产外还与其第三方合作 伙伴致力于i p ( i n t e l l e c t u a lp r o p e r t y ) 核的丌发。这些i p 核中包含了基本的数字 信号处理模块,如f f t 、f i r 等。由于f p g a 芯片厂商对自己公司生产的芯 片的性能非常了解,因此设计的模块能最大限度的发挥芯片的性能。 目前a l t e r a 公司提供的f f t 模块采用4 引擎结构,在实现1 0 2 4 点f f t 时所需时间已经降低至5 u s 以下唧。使用i p 核构建数字信号处理系统具有诸 多优点,如丌发周期短;性能稳定、可靠;维护方便等。但也存在以下的缺 点:1 ) i p 核价格昂贵( a l t e r a 公司的f f ti p 核售价为7 9 9 5 美元) ,且i p 核源 代码不对外开放,不利于二次开发。2 ) i p 核针对通用的设计,在某些特殊的 应用场合不一定最优。 国内f p g a 技术起步较晚,将f p g a 应用于数字信号处理还处于最初的 阶段,但发展十分迅猛。2 0 0 2 年罗雪苟、詹阳分析了使用f p g a 实现f f t 的几种方法,对这几种方法的优缺点进行了讨论”们。2 0 0 8 年刘在爽、卢莹莹 对f p g a 实现f i r ( f i n i t ei n p u l s ei n s p o n s i b l e ) 数字滤波器也进行研究,讨论了 乘累加和基于c s d ( c a n o n i cs i g n e dd i g i t a l ,标准有符号数) 编码的数字滤波器 的设计1 。 1 5 论文的主要工作 本文以数字信号处理算法在f p g a 平台中的实现为背景,结合图像声纳 和超短基线应用系统,研究了f f t 、f i r 、相关运算等f p g a 的实现方法。 论文的主要工作有以下几个方面: ( 1 ) 可编程逻辑器件常用思想和方法的研究:常用的算法有数字坐标计 算机旋转算法( c o r d i c ) ,分布式算法( d a ) 。常用的方法有乒乓操作、串并转 换、流水线技术和数据接口同步等。 ( 2 ) 高速f f t 处理器的设计。针对图像声纳实时性的要求,设计基于 f p g a 平台的高速f f t 处理器,为图像声纳数字板器件的选型提供参考。设 计的难点是既要满足高速的要求,又要使消耗的资源达到最少。 ( 3 ) 数字滤波和相关运算的实现。分析数字滤波和相关运算的特点,找 6 哈尔滨t 程大学硕十学位论文 到乘累力i ( m a c ) 在f p g a 中实现的有效方法。此外,针对多通道和高实时性 信号处理的要求,给出f p g a 的并行处理解决方案。 ( 4 ) 工程应用。包括两方面的工作:1 、超短基线定位系统多通道滤波器 的设计。在一片e p i c 6 ( 6 0 0 0 个l e ) 上设计一个8 通道、2 5 6 阶、采样率为2 0 0 k 的带通滤波器。2 、图像声纳预处理模块的实现。在单片f p g a 上完成对1 6 0 路信号的接收、滤波、正交变换以及发送等处理。 7 哈尔滨t 程火学硕十。- 些j - 位论文 第2 章f p g a 设计基础 2 1f p g a 发展概述 现场可编程门阵列f p g a 是八十年代中期出现的新型高密度可编程逻辑 器件,它是在p a l ,g a l ,e p l d 等可编程器件的基础上进一步发展的产物。 它将定制a s i c 的高集成度,高性能的优点与用户可编程器件( p a l ,g a l ) 的灵活方便的特点结合在一起,从而避免了用定制a s i c 设计的高成本、高 风险、设计周期长和使用可编程器件低密度的缺点。通过编程可以立刻把一 个通用的f p g a 芯片配置成用户需要的硬件数字电路,因而加快了电子产品 的研发周期,降低研发成本,缩短产品的上市时间2 。 自1 9 8 5 年x i l i n x 公司推出第一片f p g a 至今,f p g a 已经经历了2 0 多 年的发展历史。在这2 0 多年的发展过程中,以f p g a 为代表的数字系统现场 集成技术取得了惊人的发展:现场可编程器件从最初的1 2 0 0 个可利用门,发 展到9 0 年代的2 5 万可利用门,直至最新推出的千万门的单片f p g a 芯片甚 至集成了中央处理器( c p u ) 或数字处理器( d s p ) t 为核,在一片f p g a 上进行软 硬件协同设计,为实现片上可编程系统( s o p c ,s y s t e mo np r o g r a m m a b l ec h i p l 提供了强大的硬件支持。将现场可编程器件的集成度提高到一个新的水平。 2 2f p g a 的查找表原理 f p g a 与c p l d ( c o m p l e xp r o g r a m m a b l el o g i cd e v i c e ,复杂可编程逻辑器 件) 最大的不同之处是f p g a 采用l u t ( l o o ku pt a b l e ,查找表) 结构2 1 ,而 c p l d 采用的是乘积项结构。u j t 本质上就是一个r a m 。大多数f p g a 采 用4 输入的l u t ,所以每一个l u t 可以看作一个有4 位地址线的1 6 1 的 r a m 。当用户通过原理图或h d l 语言描述了一个逻辑电路以后,f p g a 开 发软件会自动计算逻辑电路的所有可能的结果,并把结果事先写入r a m ,这 样每输入一个信号进行逻辑运算就等于输入一个地址进行查表,找出地址对 应的内容,然后输出即可。图2 1 给出了一个四输入与门的例子。利用一个4 输入的查找表可以实现功能较简单的组合逻辑。对于一个l u t 无法完成的电 8 哈尔滨工 ¥人学硕士学位论文 路,就需要通过进位逻辑将多个单元相连,这样f p g a 就可以实现复杂的逻 辑。采用l u t 只能实现组合逻辑电路,对于时序逻辑电路还需要加上d 触 发器共同实现。 由下l u t 主要适合s r a m 工艺生产,所以目酊大部分f p g a 都是基于 s r a m 工艺的,而s r a m 工艺的芯片在掉电后信息就会丢失,一定需要外加 一片号用配置芯片,在上电时,由这个专用配置芯片把数据加载到f p g a 中, 田为配置时问很短,不会影响系统正常工作。 一:“型1 i _ i _ 艄 :巨 二士卜一w 兰丁面卜l a 一一n j i f 】| l 。o o 。 w 川 。 图2 14 输入与门l u t 实现 23f p g a 器件的结构 2 3lf p g a 基本构成 目前生产f p g a 的j 商主要有x i l i n x 、a l t e r a 、l a t t i c e 以及a c t e l 。这四 家公司生产的f p g a 各有特色。采用的工艺主要有s r a m 和f l a s h 这两种, 此外a c t e l 还生产反熔丝结构的f p g a ,在军事和航天领域得到了广泛的应 用。尽管f p g a 的生产厂商和产品种类较多,但它们的基本结构大致相同, 简化的f p g a 由6 部分组成”,分别为可编程输入输出单元、基本可编程逻 辑单元、嵌入式块r a m 、丰富的布线资源、底层嵌入功能单元和内嵌专用硬 核。每个单元的基本概念介绍如下。 ( 1 ) 可编程输入输出单元:输入输出单元简称i o 单元。i 0 单元提供了 器件; 脚和内部逻辑阵列之间的连接,通常排列在芯片的四周。i 0 单元主 哈尔滨t 稃人学硕十学位论文 要由输入触发器、输入缓冲器、输出触发锁存器和输出缓冲器组成ji o 单 元通常被设计为可编程模式,通过软件的灵活配置,可以适配不同的电气标 准与i o 物理特性。 ( 2 ) 基本可编程逻辑单元:可编程逻辑单元是f p g a 的主要组成部分, 是实现逻辑功能的基本单元。可编程逻辑单元主要由查找表和触发器组成。 查找表一般完成纯组合逻辑功能。f p g a 内部的寄存器通常完成同步时序逻 辑设计。 ( 3 ) 嵌入式块r a m :大多数f p g a 都具有内嵌的块r a m ,这极大地拓 展了f p g a 的应用范围和灵活性。块r a m 可被配置为单端口r a m 、双端口 r a m 、内容地址寄存器( c a m ) 及f i f o 等常用存储结构。 ( 4 ) 布线资源:布线资源包括各种长度的连线和一些可编程连接开关, 它们将各个基本可编程逻辑单元和输入输出之间互相连接起来,构成各种复 杂功能的系统。布线资源分为分段互连型和连续互连型。分段互联资源中具 有多种不同长度的金属线,各金属线段之间通过开关矩阵或反熔丝编程连接, 走线灵活方便,但走线延时无法预测;连续互联资源是利用相同长度的金属 线,连接与距离远近无关,布线延时是固定和可预测的。 ( 5 ) 底层嵌入功能单元:底层嵌入功能单元指的是那些通用程度较高的 嵌入式功能模块,如p l l ( p h a s el o c k e dl o o p ,锁相环) ,d l l ( d e l a yl o c k e d l o o p ) 、d s p 、c p u 等。随着f p g a 的发展,这些模块被越来越多地嵌入到 f p g a 的内部,以满足不同场合的需求。 ( 6 ) 内嵌专用硬核:这旱指的内嵌专用硬核主要指那些通用性相对较弱, 不是所有f p g a 器件都包含硬核。如a l t e r a 的s t r a t i xg x 器件族内部集成了 3 1 8 7 5 g b i t ss e r d e s ( 串并收发单元) 。 2 3 2a l t e r a 器件概述 a l t e r a 公司的可编程产品可以分为高密度f p g a 、低成本f p g a 和c p l d 等3 类。在a l t e r a 近几年的产品系列中,高端高密度f p g a 有s t r a t i xi i 、s t r a t i x i i l 系列;低成本f p g a 有c y c l o n e 和c y c l o n ei i 以及c y c l o n e l i i 系y l j “。根据 不同的应用场合选择不同系列的芯片,在充分理解其结构特点的情况下,才 能最大程度地发挥它们在系统中的作用,从而使设计达到最优化。 哈尔滨 i 程火学硕十学位论文 c y c l o n e 系列器件是a l t e r a 公司在2 0 0 2 年1 2 月份推出的。它采用0 1 3 u m 、 全铜s r a m 工艺,1 5 v 内核,容量从2 9 1 0 个逻辑单元到2 0 0 6 0 个逻辑单元, 并嵌入了4 级最多为6 4 个r a m 块( 1 2 8 3 6 b i t ) 。c y c l o n e 器件具有以下特性: ( 1 ) 新的可编程构架通过设计实现低成本; ( 2 ) 嵌入式存储资源支持各种存储器应用和数字信号处理应用; ( 3 ) 集成了专用外部存储接口电路和各种通信协议; ( 4 ) 使用p l l 管理片内和片外系统时序。 表2 1 给出了c y c l o n e 器件系列的特性。 表2 1c y c l o n ef p g a 系列 特性 e p l c 3e p l c 4e p l c 6e p l c l 2e p l c 2 0 l e 2 9 1 04 0 0 05 9 8 01 2 0 6 02 0 0 6 0 m 4 k1 31 72 05 26 4 锁相环 12222 s t r a t i xi i 器件采用1 2 v 、9 0 n m 、9 层金属走线、全铜s r a m 工艺制造的。 s t r a t i xi i 的内部主要特性有内嵌r a m 块、d s p 块、锁相坏和外部存储器接 口。s t r a t i xi i 器件具有以下特性。表2 2 给出了s t r a t i xi i 器件系列的特性。 ( 1 ) 采用了自适应逻辑模块为基本的逻辑结构; ( 2 ) 增加了源同步通道的动态相位对准电路; ( 3 ) 支持高速存储器; ( 4 ) 支持1 2 8 位a e s 密匙对配置文件加密。 表2 2s t r a t i xi if p g a 系列 特性 e p 2 s 1 5e p 2 s 3 0e p 2 s 6 0e p 2 s 9 0e p 2 s 1 3 0e p 2 s 1 8 0 a l m6 2 4 01 3 5 5 22 4 1 7 63 6 3 8 45 3 0 1 67 1 7 6 0 等效l e1 5 6 0 0 3 3 8 8 06 0 4 4 09 0 9 6 01 3 2 5 4 01 7 9 4 0 0 m 5 1 21 0 4 2 0 23 2 94 8 86 9 99 3 0 m 4 k7 8 1 4 4 2 5 54 0 8 6 0 97 6 8 m r a m01246 9 d s p 块1 2 1 63 64 86 39 6 表2 1 和表2 2 给出了c y c l o n e 和s t r a t i xi i 系列器件内部资源。从中可以 哈尔滨t 程人学硕+ 学位论文 看出两者之间明显的区别。s t r a t i xi i 系列的存储器资源除m 4 k 外,还有m 5 1 2 和m r a m 两种。采用三种类型的r a m 可以使存储单元的利用率达到最高。 在s t r a t i xi i 系列芯片中还嵌入了d s p 块。在数字信号处理中,最常用的 功能函数包括有限脉冲响应滤波器( f i r ) 、无限冲击响应滤波器( i i r ) 、快速傅 立叶变换等。用这些函数可以构成功能更复杂的系统。虽然这些系统非常复 杂,但它们都有相似的功能单元,如乘累加器等。s t r a t i xi i 中的d s p 块集成 了乘、加、减、累加这几种算术操作,并且在这些计算的路径中,集成了可 选的寄存器级,可以实现高性能的d s p 算法。一个d s p 块最多可以配置成8 个9 9 、4 个1 8 18 或者1 个3 6 3 6 的乘法器,支持有符号数、无符号数或 混合计算。 2 4f p g a 设计流程 f p g a 的设计流程包括以下几个部分:设计输入、综合、适配、时序仿 真、编程下载引。 ( 1 ) 设计输入:将电路系统以一定的方式输入给e d a 工具。最为常用的 设计输入有图形法和h d l 文本输入法。 ( 2 ) 综合:综合是指将h d l 语言、原理图等设计输入翻译成由与、或、 非、r a m 、触发器等基本逻辑单元组成的逻辑连接,并根据目标与要求( 约 束条件) 优化所生成的逻辑连接,输出标准格式的网表文件,供f p g a c p l d 厂家的布局布线器进行实现。 ( 3 ) 适配:适配的功能是将综合器产生的网表文件配置于指定的目标器 件之中,使之产生最终的下载文件。 ( 4 ) 时序仿真:将布局白线后的时延信息反标注到设计网表中,所进行 的仿真叫做时序仿真,简称后仿真。 ( 5 ) 编程下载:设计的最后步骤就是在线调试或者将生成的配置文件写 入芯片中进行测试。示波器和逻辑分析仪是主要的调试工具。逻辑分析仪的 特点是专业、高速、触发逻辑可以相对复杂。缺点是价格昂贵,灵活性差。 使用f p g a 开发工具内嵌的逻辑分析仪可以较好的解决上述矛盾。如a l t e r a 公司的s i g n a l t a pi i 和x i l i n x 公司的c h i p s c o p e 等。 1 2 哈尔滨j r 稃火学硕士学位论文 2 5 开发及调试工具 随着f p g a 容量的增大及设计的r 益复杂,f p g a 的丌发与调试成为一 个很繁重的任务。本文主要内容是基于f p g a 的数字信号处理算法的实现, 为验证所设计算法的正确性,通常需要对大量数据进行处理,再将计算结果 与理论值比较。因而选择一款编译时间少,调试方便的丌发工具能起到事半 功倍的效果。 本文选择m o d e l s i m 6 1 和q u a r t u si i 作为开发和调试工具列。m o d e l s i m 作为综合前仿真的工具,q u a r t u si i 用于后仿真和最终的编程下载。采用 m o d e l s i m 进行综合前仿真,可以利用其编译速度快,强大的文件操作能力以 及图形显示功能,从而迅速定位错误。q u a r t u si i 中集成的在线调试工具 s i g n a l t a pi i 能够捕获和显示可编程单芯片系统设计中实时信号的状态,这样 丌发者就可以在整个设计过程中以系统级的速度观察硬件和软件的交互作 用。 2 6 本章小结 本章主要对f p g a 的发展历程、工作原理、结构进行了简要的概述。此 外还介绍了a l t e r a 公司的c y c l o n e 和s t r a t i xi i 系列芯片,对其内部资源构成 进行了比较。最后介绍了f p g a 的设计开发流程和调试工具。 1 3 哈尔滨一r 科人学硕+ 学位论文 第3 章高效f f t 处理器的f p g a 设计 3 1 选用f p g a 实现f f t 的原因 图像声纳系统通常要求信号处理过程具有实时性,这要求信号处理系统 具有很强的处理能力”。其中波束形成又是图像声纳信号处理部分最主要的 工作,主要包括聚焦、加权、f f t 及求模这几个部分q 。f f t 又是其中最复 杂、消耗时间最多的环节,其运算时间和精度决定了最终系统的性能。通常 可以采用d s p 处理器、专用的f f t 处理器芯片及可编程逻辑器件( 以f p g a 为代表) 这三种方法来实现。 ( 1 ) 采用d s p 处理器:该实现方法具有软件设计的优点,能够适用于各 种信号处理场合,灵活方便。但单片d s p 芯片的处理能力有限,在要求实时 运算的应用中,执行f f t 的同时还必须在规定的时间内完成其它的操作。增 强d s p 运算能力的方法是采用多个处理器,但缺点是成本昂贵、需要众多附 加部件,并且功耗很大,此外丌发和调试多处理器的难度很大。 ( 2 ) 采用专用f f t 芯片或用户定制的专用集成电路来实现( a s i c ) :针对 f f t 的固定点数的算法,用专用的集成芯片来实现f f t 。a s i c 在一些特殊功 能的表现上相当好。该方案运算速度快,可靠性高,非常适合实时和对可靠 性要求较高的信号处理系统,但专用f f t 芯片不能重新组态,可编程能力有 限,它的功能无法任意修改或改进。 ( 3 ) 采用f p g a 来实现:随着f p g a 技术的普及,以及f f t 算法在各个 领域的广泛应用,使用f p g a 芯片设计f f t 正在世界范围内兴起。f p g a 芯 片具备在线可编程能力,具有硬件结构可重构的特点,适合于算法固定、运 算量大的前端数字信号处理。最新推出的f p g a 产品都采用多层布线结构, 更低的核心电压,更丰富的输入输出管脚,更大容量的逻辑单元,内置嵌入 式r a m 资源,内部集成了多个数字锁相环,嵌入多个硬件乘法器,所有这 一切都使得f p g a 在数字信号处理领域显示出自己特有的优势。 从以上各种因素的考虑,在图像声纳系统中采用f p g a 来实现f f t ,设 计要求是在1 0 u s 内实现1 0 2 4 点的f f t 。 1 4 哈尔滨t 程人。予:硕十。子:何论文 3 2f f t 算法原理 3 2 1 快速傅立叶变换原理 设x ( n ) 是一个有限长序列,x ( n ) 的d f t 可表示为: 1 x ( 后) = x ( ,7 ) 吲,k = o ,1 ,- 一l ( 3 - 1 ) n = o 上式中x ( n ) 和昨都是复数。因此,每计算一个x ( k ) 值,必须要进行 次复数相乘,和一1 次的复数相加。x ( 七) 一共有个点,因此要完成全部 d f t 运算则需要进行2 次复数相乘和( n 1 ) 次复数相加1 8 1 。其中每一个 复数相乘将包括4 个实数相乘和2 个实数相加。将x ( k ) 展丌如3 2 所示。 v l x ( k ) = ( r e x ( n ) r e w f f 卜i m x ( n ) i m w f f 】) + j ( r e x ( n ) i m w f f 】+ i m 【z ( 胛) r e 哆 ) ) ( 3 - 2 ) 这样每运算一个x ( 拓) 值需要进行4 次实数相乘和2 ( 2n 1 ) 次实数相 加。因此整个d f t 运算需要4 n 2 次实数相乘和2 ( 2 一1 ) 次实数相加。当 较大时,实时信号处理对处理器计算速度有十分苛刻的要求,于是如何减少 计算量变得至关重要。 为减少运算量,提高运算速度,就必须改进算法。利用系数畔以下固 有特性7 1 ,就可以减小d f t 的运算量。 ( 1 ) 嘴的对称性: k 庸= ( 嘭) = 昭脚 ( 3 3 ) ( 2 ) 孵的周期性: 哗= 暇肿址= 睇“m ( 3 4 ) ( 3 ) 暇的可约性: 嘭= 哎胪畋= w k 吲他= - 1 ,嘴州坨) = 一畋 ( 3 5 ) 利用哪的上述特性,可以将长序列的d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论