(微电子学与固体电子学专业论文)基于fpga的fft信号处理器的设计与实现.pdf_第1页
(微电子学与固体电子学专业论文)基于fpga的fft信号处理器的设计与实现.pdf_第2页
(微电子学与固体电子学专业论文)基于fpga的fft信号处理器的设计与实现.pdf_第3页
(微电子学与固体电子学专业论文)基于fpga的fft信号处理器的设计与实现.pdf_第4页
(微电子学与固体电子学专业论文)基于fpga的fft信号处理器的设计与实现.pdf_第5页
已阅读5页,还剩77页未读 继续免费阅读

(微电子学与固体电子学专业论文)基于fpga的fft信号处理器的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 现场可编程门阵列( f p g a ) 是作为专用集成电路( a s i c ) 领域中的一种半定 制电路而出现的,它结合了微电子技术、电路技术和e d a ( e 1 e c t r o n i c sd e s i 趴 a u t o m a t i o n ) 技术。随着它的广泛应用和快速发展,使设计电路的规模和集成度 不断提高,同时也带来了电子系统设计方法和设计思想的不断推陈出新。 随着数字电子技术的发展,数字信号处理的理论和技术广泛的应用于通讯、 语音处理、计算机和多媒体等领域。离散傅立叶变换( d f t ) 作为数字信号处理 中的基本运算,发挥着重要作用。而快速傅里叶变换( f f t ) 算法的提出,使离 散傅里叶变换的运算量减小了几个数量级,使得数字信号处理的实现变得更加容 易。f f t 已经成为现代数字信号处理的核心技术之一,因此对f f t 算法及其实 现方法的研究具有很强的理论和现实意义。 本文主要研究如何利用f p g a 实现f f l 算法,研制具有自主知识产权的f f t 信号处理器。该设计采用高效基1 6 算法实现了一种4 0 9 6 点f f t 复数浮点运算 处理器,其蝶形处理单元的基1 6 运算核采用两级改进的基一4 算法级联实现,仅 用8 个实数乘法器就可实现基一16 蝶形单元所需的8 次复数乘法运算,在保持处 理速度的优势下,比传统的基一1 6 算法节省了7 5 的乘法器逻辑资源。 在重点研究处理器蝶形单元设计的基础上,本文完成了整个f f t 处理器电 路的f p g a 设计。首先基于对处理器功能和特点的分析,研究了f f t 算法的选 取和优化,并完成了处理器体系结构的设计;在此基础上,以提高处理器处理速 度和减小硬件资源消耗为重点研究了具体的实现方案,完成了1 2 万行i 汀l 代码 编程,并在x i l i n x 公司提供的i s e9 1 i 集成开发环境中实现了处理器各个模块 的r t l 设计:随后,以x i l i n xs p a r t a n 一3 系列f p g a 芯片x c 3 s 1 0 0 0 为硬件平 台,完成了整个f f t 处理器的电路设计实现。 经过仿真验证,本文所设计的f f t 处理器芯片运行速度达到了1 0 0 m h z ,占 用的f p g a 门数为5 5 2 8 0 6 ,电路的信噪比可以达到5 0 d b 以上,达到了高速高 性能的设计要求。 关键词:快速傅立叶变换;现场可编程门阵列; d l a b s t r a c t a b s t r a c t f i e l dp r o 盯a m 瑚a b l eg a t ear r a y ( f p g a ) ,as e m i c u s t o mi n t e 蓼a t e dc i r c u i ti nt h e a r e ao fa s i c ,h a si n t e 孕a t e dt h et e c h n 0 1 0 9 yo fm i c r o e l e c t r o i l i c ,c i r c u i t sa n de d a w i t hm ew i d e l y 印p l i c a t i o na n dr 印i dd e v e l o p m e n t ,m es c a l e a n di n t e 伊a t i o no f e l e c 仃o n i cd e s i 印a r eb e i n ge i l l a r g e d 1 1 1 e 1 1m em e t h o da n di d e a so fe l e c 仃o n i cs y s t e i i l d e s i 伊a r ei m p r o v e d 台o m t i m et ot i m e t l l e o r ya i l dt e c h n o l o g yo fd i 百t a ls i 印a 1p r o c e s s i n ga r ew i d e l yu s e di nm a n y 6 e l d s ,s u c ha u sc o m m u m c a t i o n ,v o i c ep r o c e s s i n g ,c o m p u t e ra 1 1 dm u l t i m e d i aw i t hm e a d v a l l c e m e n to fd i 西t a lt e c l u l 0 1 0 9 y d i s c r e t ef b 嘶e rt r 觚s f o n n ( d f t ) p l a y s a 1 1 i m p o r t a n tr o l ei nd i 酣a ls i g a n a lp r o c e s s i n 甙d s p ) a u sab a s i cc a l c u l a t i o n e s p e c i a l l y f a s tf o 研e rt r a n s f o 册( f f t ) a l g 耐廿1 r nr e d u c e sn l ec a l c u l a t i o nq u a n t i t 弘w h i c h m 狄e si tm u c he a s i e rt oi m p l e m e n t f f ti st h 宅c o r et e c h n i q u eo fd s p s ot h e r ei s s 仃o n 西ym e o r e t i c a l a 1 1 dp m c t i c a ls i 嘶f i c 趾c ei nd e v e l o p i n gf f ta l g 嘶t h ma n d i m p l e m e n t t h ep u r p o s eo fm i sp a p e ri ss t u d 姐n gt 1 1 ea 订t h m e t i co ff f tu s i n gf p g a ,a n d d e v e l o p i n gi n t e l l e c t u a lp r o p e t ) ,( i p ) o no u ro w nb a s i s o fr e a lt i m ef f ts i 弘a l p r o c e s s o r - a4 0 9 6p o i n to fn o a t i n g - p o i n tc o m p l e x f f tp r o c e s s o ri sp r e s e n t l 讨i n “s p a p m eb u t t e m yp r o c e s s i n gu n i ti si i i l p l e m e n t e db y a 1 1e f j i c i e n tr a d i x - 16a l g 耐t h m , 砌c hi sa c c o m p l i s h e db yt w ol e v e li m p r o v e dr a d i x - 4a l g o r i t h m t h ep r o p o s e d r a d i x 16b u t t 硼yu s e se i g h tr e a l 珈【u l t i p l i e r s ,w h i c h1 e a d st or e d u c em u l t i p l i e r so f c o n v e n t i o n a lb y7 5 w h a t ,sm o r e ,缸sp a p e ra l s oa c c o m p l i s h e dt h ew h o l ec i r c u i td e s i 印o ff f t p m c e s s o r b a s i co nf p g a f i r s n y ,m ea r c h j t e c t i l r ep 枷t i o n i sb r o u g h tu pb a s e do nm e a i l a l y s i sa b o u tm ec b j pd e s i 盟r e q u i r e m e n ta n d 印p l i c a t i o ne n v i r o n m e n ta n d t h ef f t a l g o r i t h m ;s e c o n d l y w i mr e s p e c tt op e r f i o 眦a n c eo p t i m i z a t i o n ,1 2m o u s a n d1 i n e s c o d ea r ec o m p i l e df o ri 玎li m p l e m e n t a t i o n ,a n da c c o m p l i s h e dt h er t ld e s i 萨o fa l l m o d u l e sb a s i co nx i l i n xi s e9 1 ii n t e 铲a t e dd e v e l o p e 1 1 v i r o 衄e i l t t h e i m p l 锄铋t a t i o nw a sc 痢甜o u ti nm e 1 撖s p a r t 跚3x c 3 s 1 0 0 0f p g ac h i p t h es 曲u l a t i o nr e s u l ts h o w sm a tm e 五眙q u e n t c yo ft h i sf f tp r o c e s s o rc a na t t a i n 1o o m h z ,a n dm et o t a le q u i v a l e n tf p g ag a t ec o u n tf o rt h i sd e s i 朗i s5 5 2 8 0 6 ,i tc a l l a l s oo b t a i naf f tr e s u l ta b o v e5 0 d bb ya na _ l y z _ i 芏l gm e s i m u l a t i o nr e s u l tu s i n gm a t l a b s oi ta c h i e v e sm er e q u e s to fh i 班s p e e da n dh i 曲p e 响m a n c e k e y w o r d s :f a s tf o u r i e rt r a l l s f o 肌; f i e l dp r o 伊锄m a b l eg a t ea r r a y ; v h d l i i i 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 签名:白德凤日期:沪酩,r 加 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 答名:白德风签名:留绍灿 导师签名:孬址日期:臣缈 第1 章绪论 第l 章绪论 1 1 课题背景及课题意义 随着数字技术与计算机技术的发展,数字信号处理( d i 西t a ls i 龋a lp r o c e s s i n 岛 d s p ) 技术已深入到各个学科领域,其应用又是多种多样,但数字信号处理基本 上从两个方面来解决信号的处理问题:一个是时域方法,即数字滤波;另一个是 频域方法,即频谱分析。处理的任务大致分为三类:卷积,用于各种滤波器,对 给定频率范围的原始信号进行加工( 通过或滤出) 来提高信噪比;相关,用于信号 比较,分析随机信号的功率谱密度;变换,用于分析信号的频率组成,对信号进 行识别。其中,离散傅立叶变换( d i s c r e t e t i m ef o u r i e rt r a l l s f o m ,d f t ) 和卷积是 信号处理中两个最基本也是最常用的运算,它们涉及到信号与系统的分析与综合 这一广泛的信号处理领域【l 】。由数字信号处理的基本理论可知,卷积可以转化为 d f t 来实现,实际上其他许多算法,如相关、谱分析等也都可以转化为d f t 来 实现;此外,各种系统的分析、设计和实现中都会用到d f t 的计算问题。所以, d f t 在各种数字信号处理中起着核心作用,而d f t 的快速算法快速傅立叶变换 ( f a s tf o 证e rt r a n s f o m ,f f t ) 就成为了数字信号处理的最基本技术之一,对f f t 算法及其实现方式的研究是很有意义的 2 】。 目前,f f t 己广泛应用在频谱分析、匹配滤波、数字通信、图像处理、语音 识别、。雷达处理、遥感遥测、地质勘探和无线保密通讯等众多领域。在不同应用 场合,需要不同性能要求的f f t 处理器。在很多应用领域都要求f f t 处理器具 有高速度、高精度、大容量和实时处理的性能【3 】。因此,如何更快速、更灵活地 实现f f t 变得越来越重要。 在过去很长一段时间,d s p 处理器是d s p 应用系统核心器件的唯一选择。 尽管d s p 处理器具有通过软件设计能适用于实现不同功能的灵活性,但面对当 今速度变化的d s p 应用市场,特别是面对现代通信技术的发展,d s p 处理器在 处理速度上早已力不从心。面向d s p 的各类专用集成电路( a p p l i c a t i o ns p e c i 丘c i n t e 孕a t e dc i r c u i t ,a s i c ) 芯片虽然可以解决并行性和速度的问题,但其高昂的开 发费用、耗时的设计周期和不灵活的纯硬件结构,使得d s p 的a s i c 解决方案日 益失去其实用性【4 】。 近几年,随着现场可编程门阵列f p g a ( f i e l dp r o 目a 瑚m a b l eg a t e 蛔) 技术 的迅速发展,采用并行度更大、速度更快的f p g a 芯片来实现f f t 己成为必然 趋势。f p g a 技术的关键就是利用强有力的设计工具来缩短开发周期,提供元器 件的优质利用性,降低设计成本,并能够并行处理数据,容易实现流水线结构, 且升级简便,提高设计的灵活性,这些都非常适合实现f f t 算法【5 】。 北京工业大学工学硕士学位论文 因此,自主研发基于f p g a 芯片的f f t ,把f f t 实时性的要求和f p g a 芯 片设计的灵活性结合起来,实现并行算法与硬件结构的优化配置,提高f f t 处 理速度,满足现代信号处理的高速度、高可靠性要求,成为了现今我国数字信号 处理的一个研究点。鉴于此种趋势,作者将基于f p g a 的f f t 设计与实现作为 了研究课题。 1 2 离散傅立叶变换及其快速算法 在数字信号处理领域,基本理论和依据主要是d f t ( 离散傅立叶变换) 和卷 积,它们也是信号处理中两个最基本也是最常用的运算,同时离散傅立叶变换 ( d f t ) 是对信号作数字频谱分析及实现数字滤波的基本方法,由数字信号处理的 基本理论可知,卷积和相关也都可以转化为d f t 来实现;此外,各种系统的分 析、设计和实现中都会用到d f t 的计算问题,所以,d f t 在各种数字信号处 理中起着核心作用。特别是1 9 6 5 年c 0 0 1 e y 和t l 墩e y 发表的关于f f t 的著名论 文,使计算n 点的d f t 运算量从2 降为l o g ,使d f t 的运算效率提 高了1u2 个数量级,引起了各国学者的广泛关注。四十多年来,d f t 各种快速 算法相继出现,成为数值数学方面最活跃的一个领域【6 1 。 快速傅立叶变换的提出,是数字信号处理发展的一个里程碑,解决了数字信 号处理实现和应用的瓶颈,它的意义远远超过了一个算法的范围,具有很强的理 论和工程意义。在使用数字信号处理技术的各种应用领域里,f f t 算法都起着 极为重要的作用,主要表现在: 1 f f t 作为时域和频域转换的基本运算,是频谱分析的必要前提,在数字 通信、语音信号分析、图象处理、雷达、地震、生物医学工程等数字信号处理领 域有着极为广泛的应用。 2 处理场合要求实时快速进行f f t 运算,如数字语音编码、雷达信号处理、 声纳信号分析、数字滤波、射电干涉阵等情况,这些都需要使用专用的f f t 计 算设备进行实时处理。 3 使用f f t 的专用硬件,可以使成本降低,速度大幅度提高。例如6 0 年 代末,国外制作的一部f f t 处理专用机,这种系统每小时计算所需费用比一台 大型通用机少5 倍,而计算速度快2 0 倍。 4 f f t 作为数字信号处理的关键技术之一,具有极为广泛的应用,过去通常 用d s p 实现,随着超大规模集成电路的发展,专用a s i c 芯片无论在性能还是 成本上都具有更大的优势,美国r a d i x 公司提供的f f t 专用芯片就得到了极为 广泛的应用,得到了很大的收益。但是高性能的f f t 技术对中国限制出口,因 此自主研发这一技术,不仅将具有很高的经济效益,还将在国家安全等方面发挥 巨大的社会效益。 第1 章绪论 1 3f f t 算法的研究现状 自1 9 6 5 年美国库利( ( j w c 0 0 1 e 奶和图基( ( j w t u k e y ) 提出f f t 快速算法以 来,f f t 己有了多种算法。从f f t 算法理论的发展上看,主要有两个方问: ( 1 ) 组合数f f t 算法,针对f f t 变换点数n 等于2 的整数次幂,如基2 算 法、基4 算法、基8 算法、实因子算法、分裂基算法及任意组合因子算法,利 用系数的周期性和对称性,使长序列的d f t 分解成更小点数的d f t ,从而大大 减少运算工作量。 ( 2 ) n 不等于2 的整数次幂的算法,以威诺格兰德( s w i n o 酉a d ) 为代表的一 类傅立叶变换算法( w i n o 伊a df o 嘶e rt r a n s f o m 砧g o r i 伽n ,简称w f l a 算法, p r i m ef a c t o ra l g o r i t l u n ,简称p f t a 算法) ,利用下标映射和数论以及近代数学的 知识,去掉级间的旋转因子,从而减少运算量。 p f t a 和w f t a 在运算量上占优,用的乘法器比c 0 0 1 e y - t u k e y 算法少,但控 制复杂,控制单元实现起来相对麻烦。在硬件实现中,需要考虑的不仅仅是算法 运算量,更重要的是算法的复杂性、规整性和模块化。控制简单、实现规整的算 法在硬件系统实现中要优于仅仅是在运算量上占优的算法。分裂基算法具有一定 的优势,综合了基一4 和基一2 的运算特点,但其蝶形运算结构在控制上要复杂 些。基4 和基2 算法是目前普遍采取的两种算法 7 】。 1 4 f f t 处理器的研究现状 f f t 处理器是f f t 算法的硬件实现,针对其硬件实现方案,主要有三种途 径: ( 1 ) 利用通用数字信号处理芯片来实现( d s p 处理器) 针对一般数字信号处理算法的实现,采用通用可编程硬件处理器技术来实现 f f t 。这种实现方法具有软件设计多用性的优点,能够适用于各种需要f f t 运算 进行信号处理的应用场合,灵活方便。但是,通用d s p 处理器构成的f f t 处理 机采用循环编码算法,程序量小,但存在大量的冗余运算,需要许多跳转操作, 处理速度较慢,难以满足现代数字信号处理高速、大规模、实时性的要求【8 1 。在 进行大点数f f t 计算时,并行算法与d s p 处理器的寻址能力不相适应,不能有 效利用数据传输的带宽和运算能力,造成硬件资源的浪引9 1 。 ( 2 ) 利用专用f f t 芯片或用户定制的专用集成电路来实现( a s i c ) 针对f f t 的特有算法,用专用的硬件组成专用的f f t 芯片来实现f f t 。a s i c 在一些特殊功能的表现上相当好。这种方案运算速度快,可靠性高,非常适合实 时和对可靠性要求较高的信号处理系统,但专用f f t 芯片不能重新组态,可编 程能力有限。在产品发展过程中,它的功能无法任意修改或改进。因此,任何的 北京工业大学工学硕十学位论文 线路改版都需要重新设计并且重新制造,这不仅增加开发成本,而且造成产品快 速上市的障碍,不太适合处理算法和参数经常改变的场合【1 0 】。 ( 3 ) 利用可编程逻辑器件来实现( 以f p g a 为代表) 随着f p g a 技术的普及,以及f f t 算法在各个领域的广泛应用,使用f p g a 芯片设计f f t 正在世界范围内兴起。f p g a 芯片具备在线可编程能力,具有硬件 结构可重构的特点,适合于算法固定、运算量大的前端数字信号处理。新近推出 的f p g a 产品都采用多层布线结构,更低的核心电压,更丰富的输入输出管脚, 更大容量的逻辑单元,内置嵌入式r a m 资源,内部集成多个数字锁相环,嵌入 多个硬件乘法器,所有这一切都使得f p g a 在数字信号处理领域显示出自己特有 的优判1 1 1 。 目前在国际市场上,专用f f t 处理器可以达到的速度数量级普遍为1 0 2 4 点 1 6 位字长定点、块浮点、浮点运算在几十和数百u s 量级,其中采用t i 公司的 d s p 6 2 x 定点系列实现1 0 2 4 个复数点f f t 达到6 6 u s 量级处理速度,d s p 6 4 x 系 列达到3 6 u s 量级【1 2 】。 现在,以f p g a 芯片生产厂商为主的公司在基于f p g a 设计f f t 的综合研 究方面处于领先地位,而且由于f p g a 芯片生产厂商对本厂生产芯片性能上的了 解,设计的f f t 处理器可以最大限度的发挥芯片的性能。f p g a 厂商l i n x 公 司和a l t e r a 公司都研制了f f tm ( i n t e l l e c t u a lp r o p 酣y ) 核,性能非常优越。 采用x i l i n x 公司的d s pc o r e 中的f f ti p 核处理1 6 位1 0 2 4 点数据,在r t e xi i 系列基2 结构、2 4 6 m h z 外频时钟下,速度达到2 5 4 9 u s 量级;a l l e r a 公司2 0 0 6 年4 月推出的f f ti p 核,全面支持a l t e r a 公司的最新器件,使用此f f ti p 核计算1 6 位1 0 2 4 点数据,在3 3 2 m h z 外频时钟下仅需要6 3 u s 【1 3 】。f f t 口核通 常专为要求高可靠性的应用场合而设计,如雷达、地面和高空通信、声学、石油 和医疗信号处理等,且价格十分昂贵,难以在基层应用领域普及。 国内外学者在用f p g a 实现f f t 处理器方面做了大量的工作,并取得了良好 的效益。我国的f p g a 技术起步相对较晚,但进入2 1 世纪后,发展非常迅速。 目前不少大学及研究所都使用f p g a 芯片设计开发具有自主知识产权的f f t 。 1 5f p g a 实现f f t 的优越性 由于成本、系统功耗和面市时间等原因,许多通讯、视频和图像系统已无法 简单地利用d s p 处理器来实现,基于f p g a 的信号处理器已广泛应用于各种信 号处理领域。f p g a 所固有的灵活性和性能可让设计者紧跟新标准的变化,并能 提供可行的方法来满足不断变化的标准要求。 与d s p 相比,f p g a 实现f f t 的主要优越性有: ( 1 ) f p g a 实现数字信号处理最显著的特点就是高速性能好。f p g a 有内置 4 第1 苹绪论 的高速乘法器和加法器,尤其适合于乘法和累加等重复性的d s p 任务。 ( 2 ) f p g a 的存储量大。d s p 内部一般没有大容量的存储器,但是f f t 实时 处理运算需要存储大量的数据,只能外接存储器,这样往往会使运算速度下降, 同时电路也会更复杂和不稳定。目前,高档的f p g a 中有大量的高速存储器,不 用外接存储器便可实现f f t 实时处理运算,其速度更快,电路更简单,集成度和 可靠性也大幅度提高【1 4 】。 ( 3 ) f p g a 是硬件可编程的,比d s p 更加灵活。d s p 往往需要外部的接口 和控制芯片配合工作,f p g a 则不需要,这样使得硬件更简单和小型化【”】。 ( 4 ) 在比较f p g a 和d s p 时,一个极为重要的系统参数是输入输出( i o ) 带宽。除了一些专用引脚外,f p g a 上几乎所有的引脚均可供用户使用,这使得 f p g a 信号处理方案具有非常高性能的i o 带宽。大量的i o 引脚和多块存储器 可让系统在设计中获得优越的并行处理性能【1 6 1 。 1 6 本文研究的主要内容 本文主要针对基1 6 顺序处理的f f t 处理器的f p g a 实现进行了研究,涉及 算法选取、处理器结构设计、寄存器传输级( r t l ) 设计、系统仿真、f p g a 实 现和系统测试。本论文共5 章,各章的具体内容如下: 第1 章阐述了选题的意义及f f t 的发展现状和论文内容。 第2 章主要讨论了f p g a 技术及硬件描述语言的相关内容,详细介绍了 x i l i n x 公司的s p a r t a l l 3 系列产品的主要电路结构。 第3 章探讨了f f t 算法原理和f f t 处理器的硬件实现结构,并在处理速度、 硬件消耗和精度方面提出了优化措施。 第4 章阐述了应用f p g a 实现f f t 的具体设计,包括蝶形运算单元设计、 地址产生单元设计、双口洲乒乓结构设计、旋转因子计算、r o m 模块设计、 时序控制单元设计和数字时钟管理单元( d c m ) 的设计。最后设计出4 0 9 6 点复 数的f f t 处理系统。 第5 章介绍了f f t 系统的仿真测试,给出了反映对芯片资源利用情况的实 现报告。设计了几种信号进行测试,并与m a t l a b 计算的理论结果进行了比较。 最后对整篇论文进行了总结和讨论。 第2 审现场可编程逻辑门阵列技术 第2 章现场可编程逻辑门阵列技术 2 1 f p g a 器件简介 f p g a 即现场可编程门阵列,它是作为a s i c 领域中的一种半定制电路而出 现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。 x i l i ( 公司于1 9 9 5 年发明了第一片f p g a ,并不断创新,推出一代又一代集成 度更高、速度更快的新型器件。从x c 3 0 0 0 、x c 4 0 0 0 到s p 砒a n 3 和n e x i i 、 v i r t e x i ip r o 系列,x i l i n x 公司一直保持着f p g a 领域的全球领先地位 r 7 1 。 f p g a 结合了微电子技术、电路技术、e d a ( e 1 e c 仃o n i c sd e s i 盟a u t o m a t i o n ) 技术,使设计者可以集中精力进行所需逻辑功能的设计,缩短设计周期,提高设 计质量。f p g a 己经在计算机硬件、工业控制、遥感遥测、雷达声纳、数据处理、 智能仪器仪表、广播电视、医疗电子和现代通信等多种领域中得到广泛应用, f p g a 开发技术,己经成为数字系统的教学实践、科研试验、样机调试和中小批 量生产的首选方案。进入2 0 世纪9 0 年代以后,f p g a 己经成为半导体集成电路 中销售量增长最快的部分。 2 1 1f p g a 的基本结构 f p g a 采用了逻辑单元阵列l c a ( l o 百cc e l la 玎a y ) 这样一个新概念,内部 一般是由可配置逻辑模块c l b ( c o n f i g u r a b l el o 西cb l o c k ) 、可编程输入输出模 块i o b ( 1 1 1 p 洲o u t p u tb l o c k ) 和互连资源i c r ( n e r c o r u l e c tc a p i t a lr e s o u r c e ) 及一个 用于存放编程数据的静态存储器s r a m ( s t a t i cr a n d o m a c c e s sm e m o r y ) 组成 1 8 】, 以l i n x 公司的v i r t e x 系列产品为例,基本结构如图2 1 所示【1 9 1 。 ( 1 ) c l b 是实现用户功能的基本单元,多个逻辑块通常规则地排成一个阵列 结构分布于整个芯片。 ( 2 ) 1 0 b 完成芯片内部逻辑与外部管脚之间的接口,围绕在逻辑单元阵列四 周。 ( 3 ) i c r 包括各种长度的连线线段和一些可编程连接开关,它们将各个c l b 或i o b 连接起来,构成特定功能的电路。 ( 4 ) s r a m 型f p g a 的突出优点是可反复编程。 用户可以通过编程决定每个单元的功能以及它们的互连关系,从而实现所需 的逻辑功能。不同厂家或不同型号的f p g a ,在可编程逻辑块的内部结构、规模、 内部互连的结构等方面经常存在较大的差异。 :! 量士些奎兰:! 茎墼圭薹堡耋圣 块状s e l b o 专用来法器 数字时钟管理【口c 帅 图2 一lx i l i n x n e x n 系列f p g a 基本结构 f 1 9 2 - 1 t h e s 打l l c 仙eo fx i l xv i n e x l j 除了上述构成f p g a 基本结构的四种资源以外,随着工艺的进步和应用系统 需求的发展,一般在f p g a 中还可能包含| 三i 下可选资源:存储器资源( 块r a m 、 分布式r a m 、r o m ) ;数字时钟管理单元( 分频倍频、数字延迟、时钟锁定) : 算术运算单元( 高速硬件乘法器、乘加器) ;多电平标准兼容高速串行的u o 接口: 特殊功能模块( 以太网等硬i p 核) :微处理器( p o w 舯c 4 0 5 等硬处理器t p 核) 。 212f p g a 器件的性能特点 f p g a 器件的性能特点主要有: ( 1 ) 采用f p g a 设计a s i c 电路,用户不需要投片生产,就能得到台用的芯 r 。 ( 2 ) f p g a 提供丰富的i 0 引脚和触发器集成度远远高于可编程阵列逻辑 ( p m 掣a r r l i l l a b l e a 丌a yl o g l c ,p a l ) 器件。 ( 3 ) f p g a 器件结构灵活,内部的c l b 、i o b 和l c r 均可以编程,可阻实现 多个变量的任意逻辑。 ( 4 ) 某些器件提供片内高速r a m ,可用于f o 等设计。 ( 5 ) 基于s r a m 编程技术,具有高密度、高速度、高可靠性和低功耗的特性。 ( 6 ) f p g a 是a s i c 电路中设计周期最短、开发费用最低、风险最小的器件 之一。 目前大部分f p g a 都是基于s r a m 工艺,而s r a m 工艺的芯片在掉电后信 息会丢失,因此需要外加一片专用的配置芯片。在上电的时候由这个专用配置 芯片把数据加载到f p g a 中,f p g a 就可以正常工作。少数f p g a 产品采用反焙 丝或f 1 a s h 工艺,掉电后配置信息不会丢失,这种f p g a 芯片不需要外加的专用 第2 章现场可编程逻辑门阵列技术 配置芯片川。 随着微电子技术、e d a 技术、以及应用系统需求的发展,f p g a 正在逐渐 成为数字系统开发的平台,并将在以下方面继续完善和提高: ( 1 ) 向更高密度、更大容量的千万门系统级的方向迈进i ( 2 ) 向低成本、低电压、微功耗、微封装和绿色化发展; ( 3 ) 向系统内可重构、高速可预测延时的方向发展: ( 4 ) 适用于片上系统,各种软硬i p 核将成为f p g a 应用的核心。 2 2s r t a n 一3 系列f p g a 结构 s p a r t a n 一3 系列f p g a 产品是) ( i l x 公司推出的大规模新型高端f p g a 产 品。该系列产品采用最新的9 0 - n m 技术,来以突出的价格点实现重大特性。器件 的密度范围为5 万至5 0 0 万系统门:多达18 m b i t 的b l o c kr 哪;从1 2 4 至7 8 4 个管脚每种逻辑密度的嚣件都有多种“o 选择;用数字时钟管理单元去除 了分立的d l l 胛l l 和移相器:嵌入式1 8 x1 8 乘法器支持高性能d s p 应用。 其产品的主要技术参数如表2 1 所示。 袁2 _ 1s p a r t a n 一3 系列f p o a 技术参数 1 曲l e 2 - 1 1 缸l 】1 l q u ep 彻e t 盯。f s p a r t a n - 3f p o a s p 甜a n 一3 系列产品结构主要由c l b ,1 0 b ,b l o c kr a m 、数字时钟管理器 p 4 i m 4 _ 咖明 似州 o o 咖 州龇 , 胁 球附 ;, 似阱 附o o 。 烈嚣黧嚣 i ! 塞:,些奎耋耋薯圭茎堡尘蚤 ( d i 目伽a o c km 柚a g nd c m ) 、乘法器( m 出t l p l l 神以及全局时钟多路缓冲器 ( g 1 0 b a l c j o c k m u x ) 组成,如图2 2 所示。 li | ii 一。b s j | lj llii f 氍髓 | 三 三 l 口口j 口口 三 口口口口口口广 口口 二 ! 图2 2s m n 3 系列f p g a 产品结构 h g 21 1 l es 帆c t l l mo f 卸姗3f p g a ( 1 ) c l b 在s p a i t a i l 一3 系列产品中c l b 结构如图2 3 所示,每个c l b 含有4 个相 似的s 1 1 c e ( 片) ,在结构的安排上,采用阵列的安排,从而提高产品的逻辑容量 和资源利用率。每个s l i c e 都与一个开关矩阵紧密相接以便连到通用布线阵列 ( g r m ) 。在c l b 中,还有内部的快速互联线,保证4 个s i j c c 之间快速的互联。 图2 3c l b 结构 h g2 - 3 t h es 帅c m r eo f c i b 习 十1_lri士lf“ * 十 型黾一 第2 章现场可编程逻辑f j 阵列技术 ( 2 ) b l o c kr a m s p a n a n 3 系列f p g a 中,b l o c k r a m 资源丰富,单位容量为l8 k b l t 。其 数据宽度和深度可以自由设定,通过c o ”g e n e r a i o r 可将其配置成双口或单口 r a m 、r o m ,同步异步f t f o 。 如图2 4 所示,b l o c k r a m 作为_ 舣口r a m 时具有两套完全独立的端口, 所有数据可被每个端口进行读写,读写时需要有时钟沿触发。 图2 4b l 0 c k r a m 项层模块 f 1 9 2 4n et 0 p m o d u i e o r b l o c k r a m 在进行读操作时,数据地址被寄存在地址端口,当r a m 被时钟沿触发后, 数据被装载进输出锁存器上;在进行写操作时,写数据地址被寄存在地址端口, r a m 被时钟沿触发后,数据被写入相应的地址空间,并支持三种读写模式。 ( 3 ) 数字时钟管理( d c m ) 在进行f p g a 设计时,如何处理和设计可靠的时钟信号是非常关键的。好的 时钟设计方案是逻辑设计成功的一半,它不仅可以简化逻辑和系统设计,而且会 有效地提高设计的可靠性。 在s p a n 纽4 系列芯片中,d c m 提供了非常好的时钟解决方案其主要功能 包括时钟同步、频率综合和相位调整,从而去除了分立的d l l 巾l l 和移相器。 d c m 的标准原型如图2 5 所示。 q m ? 。 一 北京工、l p 大学下学硕士学侍论文 d c m c l k 0 c l k 8 0 c l k 2 7 0 e l k f 8e l 髓x e l k l ne l k 2 x 8 0 d s s e ne l k 9 0 p s e l ke l k d v p s 乏隧e l k f x p s l 粼e ee - k f x 鼍8 0 r s tl o e k 匿d p s 0 0 氏 s t a t o s f :链 图2 5d c m 模块标准原型 f i g 2 5t h es 伽1 d a r dp r o t o t y p eo fd c mm o d u l e s p a r t a l l - 3 系列产品与x i l i n x 公司以前推出的f p g a 产品相比,其内部结 构有较大的改进。基于本系列产品完成f f t 处理器的优越性主要体现在【2 5 】: 内嵌更大容量的b l o c kr a m ,适应当前f f t 设计对大容量片内存储的 要求,根据需要决定容量,双端口等,可以完成乒乓r a m 对数据存取的要求, 这不但可简化设计,而且可提高系统性能。 内嵌高速专用乘法器硬件电路,支持1 8 b i t s 1 8 b i t s 有符号乘法,这对需要 高性能乘法器的f f t 处理器很有利。 将锁相环d l l ( d e l a y l o c k e dl o o p ) 和p l l ( p h a s e l o c k e dl o o p ) 改为 d c m ,提供更灵活的时钟解决方案。 大量的片内同步寄存器、锁存器、查找表、多路选择器等灵活的逻辑资源, 便于实现流水结构和逻辑运算。 内部含有更加丰富的布线资源,保证f p g a 逻辑资源的最大利用率。 2 3基于f p g a 的系统的开发 以l i n x 公司的f p g a 系统开发为例,f p g a 设计的一般流程包括系统功 能设计定义、设计输入、功能仿真、逻辑综合、前仿真、设计实现( 包括翻译、 映射、布局布线) 、时序仿真、下载配置与器件编程、测试验证等几个步骤 2 6 1 。 设计流程图如图2 6 所示。 第2 章现场可编稗逻辑门阵列技术 图2 - 6f p g a 设计流程 f i g 2 - 6 f p g ad e s i 弘f l o w ( 1 ) 系统功能定义:分析项目完成的功能和总体方案以及对整个项目初步规 划,对设计面积、功耗、i o 和口核使用等的估算; ( 2 ) 设计输入:主要输入方法有硬件描述语言和原理图,结构向导 ( a r c h i t r c t u r ew i z a r d ) 和核生成器( c o r eg e n e r a t o r ) 可以辅助设计输入; ( 3 ) 功能仿真:功能仿真没有器件内部逻辑单元和连线的实际延时信息,只 是初步验证系统的逻辑功能; ( 4 ) 逻辑综合:将设计描述变换成满足要求的电路设计方案,并产生网表, 供布局布线使用; 一 ( 5 ) 设计实现:实现包括转换、映射、布局布线、时间参数提取,同时产生 各种报告和文件; ( 6 ) 时序仿真:时序仿真中使用了电路延时的最坏情况,分析时序关系,检 查和消除竞争冒险、并对器件的实际工作性能进行估计: ( 7 ) 器件编程与测试:设计实现以后,建立f p g a 可识别文件,将编程数据 下载到相应的f p g a 器件中去。 在f p g a 设计的各个环节都有不同公司提供的不同的e d a 工具。一般由 f p g a 厂商提供集成开发环境,如a l t e r a 公司的q u a r t o si i 和x i l i n x 公司的 i s e 。为提高设计效率,优化设计结果,很多厂家提供了各种专业软件,用以配 合f p g c p l d ( c o m p l e xp r o 蓼a m m a b l el o 百cd e v i c e ) 芯片厂家提供的工具进行 更高效的设计。比较常见的使用方式是:集成开发环境,专业逻辑仿真软件和专 业逻辑综合软件一起使用,进行多种e d a 工具的协同设计。本设计采用i s e 、 m o d e l s i i i l 、s y l l p l i 母p r o 设计方式。 北京工业大学t 学硕士学位论文 i s e 是集成综合环境的简称,是x i l i n x 公司提供的一套工具集,该工具可 以完成上述整个f p g c p l d 的开发过程;m o d e l s i m 是硬件语言仿真工具,由 m o d e l t e c h 公司提供,m o d e l s i m 是业界较好的仿真工具,其仿真功能强大,图形 化界面友好;s y n p l i 匆s y n p l i 匆p r o 是综合工具,由s ”p l i c 时公司提供,该工 具具备硬件描述语言的编译、综合、时序约束等功能,使用方便,综合速度快。 2 4 硬件描述语言v h d l h d l 是硬件描述语言( h a r d w a r ed e s 谢p t i o nl a n g u a g e ) 的缩写,是一种用形 式化方法来描述数字电路和系统的语言。利用这种语言,数字电路系统的设计可 以从抽象到具体逐层描述自己的设计思想,用一系列分层次的模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论