(信号与信息处理专业论文)dsp阵列在信号处理中的应用.pdf_第1页
(信号与信息处理专业论文)dsp阵列在信号处理中的应用.pdf_第2页
(信号与信息处理专业论文)dsp阵列在信号处理中的应用.pdf_第3页
(信号与信息处理专业论文)dsp阵列在信号处理中的应用.pdf_第4页
(信号与信息处理专业论文)dsp阵列在信号处理中的应用.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(信号与信息处理专业论文)dsp阵列在信号处理中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

堕签鎏三堡奎堂堡主堂垡笙壅 摘要 随着现代水声技术的飞速发展,尖端科学计算、巨量数据处理、大型工 程设计、实时系统模拟及智能推理等领域迫切需要不断提高计算机的性能, 依靠并行处理技术提高计算机的运算速度越来越受到人们的重视。 同时声纳信号处理始终是信号处理领域中最复杂的分支之一。当前,声 纳技术发展的最重要的一个特征是大量采用数字信号处理s v ) 技术。但是, 现代计算机的处理速度仍然与实际应用的需求存在较大的差距。由于并行处 理蕴含着提高处理速度和解决大规模问题的巨大潜力,因而其信号处理机的 出路在于体系结构的并行化。 本论文采用当前国际上较流行的t i 公司d s p 器件t m s 3 2 0 v c 5 4 1 6 和 t m s 3 2 0 v c 3 3 ,设计和实现了一个八片d s p 并行信号处理机。设计结合了松 耦合和紧耦合的特点,形成了拓扑结构可以灵活设置的硬件体系。 整个系统具有相当高的数据处理能力。设计开发的并行处理机具有良好 的可扩展性,可扩展成具有复杂拓扑结构的信号处理机以适应不同规模的并 行算法的要求。 本论文主要研究内容包括: 1 八片d s p 并行信号处理机的研制。其中包括板子的总体设计,原理 图设计、电路板设计,电路板焊装与调试。 2 八片d s p 的串口,并口,d m a 的设置。 3 用v h d l 语言编写c p l d 的仲裁逻辑。 4 f f t 算法的程序编写。 关键词:信号处理:并行处理;t m s 3 2 0 v c 5 4 1 6 :t m s 3 2 0 v c 3 3 哈尔滨丁程大学硕士学位论文 a b s t r a c t a l o n gw i t ht h er a p i dd e v e l o p m e n to ft h em o d e mu n d e r w a t e ra c o u s t i c s t e c h n o l o g y ,t h ep e r f o r m a n c eo fc o m p u t e r sm u s tb ei m p r o v e du r g e n t l yi nm a n y f i e l d ss u c ha ss o p h i s t i c a t e ds c i e n t i f i cc o m p u t a t i o n ,m a s s i v ed a t ap r o c e s s i n g ,a l a r g e s c a l ee n g i n e e r i n gd e s i g n , s i m u l a t i o na n dr e a l - t i m ei n t e l l i g e n tr e a s o n i n g s y s t e ma n ds oo n ,a l s ot h eo p e r a t i n gs p e e do ft h ec o m p u t e re n h a n c e db yp a r a l l e l p r o c e s s i n gt e c h n o l o g yw o u l db et a k e ni n t oa c c o u n tm o r ea n dm o r eb yp e o p l e s o n a rs i g n a lp r o c e s s i n gi st h em o s tc o m p l e xb r a n c ho fs i g n a lp r o c e s s i n g f i e l d t h em o s ti m p o r t a n tc h a r a c t e r i s t i co ft h es o n a rt e c h n o l o g yi st h ea p p l i c a t i o n o ft h ed i g i t a ls i g n a lp r o c e s s i n g0 9 s p ) t e c h n o l o g y h o w e v e rt h em o d e mc o m p u t e r p r o c e s s i n gs p e e dc a nn o ts a t i s f yt h ep r a c t i c a la p p l i c a t i o nd e m a n d s b e c a u s et h e p a r a l l e lp r o c e s s i n gc o n t a i nt h eg r e a tp o t e n t i a lo fs o l v i n gl a r g e s c a l ep r o b l e m sa n d a d v a n c i n gp r o c e s s i n gs p e e d ,t h es o l u t i o no ft h es i g n a lp r o c e s s o rl i e d i nt h e p a r a l l e lo ft h ea r c h i t e c t u r es t r u c t u r e s i nt h i s p a p e r ad s p p a r a l l e ls i g n a lp r o c e s s i n g b o a r dw h i c hh a v e c h a r a c t e r i s t i co fc o m b i n i n gl o o s ec o u p l i n ga n dc l o s ec o u p l i n ga n dw h i c h t o p o l o g yo fh a r d w a r es y s t e mc a l l b ef l e x i b l yd e p l o y e d ,c o n t a i ne i g h tp i e c e so f d s pu s i n gt m s 3 2 0 v c 5 4 1 6a n dt m s 3 2 0 v c 3 3o f t i t h i se n t i r es y s t e mh a sah i l g hc a p a b i l i t yo fd a t ap r o c e s s i n ga n dt h ep a r a l l e l p r o c e s s o rd e v e l o p e dh a sah i g hs c a l a b i l i t yw h i c hc a nb ee x t e n d e ds i g n a lp r o c e s s o r c o n t a i n i n gc o m p l c xt o p o l o g ys t r u c t u r e i no r d e rt o a d a p t i n gt o t h ep a r a l l e l a l g o r i t h mr e q u e s to fd i f f e r e n ts c a l e t h ep a p e ri n c l u d e s : 1 ad s pp a r a l l e ls i g n a lp r o c e s s i n gb o a r dc o n t a i n i n ge i g h tp i e c e so fd s pi s d e s i g n e dw h i c hi n c l u d et h eb o a r dd e s i g n ,t h es c h e m a t i cd i a g r a md e s i g n ,t h e e l e c t r i cc i r c u i tb o a r dd e s i g n ,t h ee l e c t r i cc i r c u i tb o a r dw e l da n dt h e d e b u g g i n g 2 t h es e t t i n go fd m a , s e r i e sa n dp a r a l l e lp o r to ft h ed s po ft h ed s pp a r a l l e l 哈尔滨工程大学硕士学位论文 3 s i g n a lp r o c e s s i n gb o a r d 4 ,t h ep r o g r a m m i n go fc p l d u s i n gv h d l 5 t h ep r o g r a m m i n go ff f ta l g o r i t h m k e yw o r d s :s i g n a lp r o c e s s i n g ;p a r a l l e lp r o c e s s i n g ;t m s 3 2 0 v c 5 4 1 6 ; t m $ 3 2 0 v c 3 3 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导 下,由作者本人独立完成的。有关观点、方法、数据和文 献等的引用已在文中指出,并与参考文献相对应。除文中 已经注明引用的内容外,本论文不包含任何其他个人或集 体己经公开发表的作品成果。对本文的研究做出重要贡献 的个人和集体,均已在文中以明确方式标明。本人完全意 识到本声明的法律结果由本人承担。 作者( 签字) :主金绁遂 日期:w ) 年专月何日 哈尔滨工程大学硕士学位论文 第1 章绪论 1 1 概述 数字信号处理是5 0 年代末发展起来的一门现代信号处理技术,它不仅具 有自身的特点,而且强调处理的实时性。数字信号处理相对于模拟信号处理 有很大的优越性,表现在精度高、灵活性大、可靠性好、易于大规模集成等 方面。随着人们对实时信号处理要求的不断提高和大规模集成电路技术的迅 速发展,数字信号处理技术也发生着日新月异的变革。数字信号处理器( d s p ) 正是适应这种需要出现的,并处于蓬勃发展之中,这反过来又为数字信号处 理技术的迅猛发展提供了动力。 随着数字信号处理器d s p 芯片逐年增多和芯片价格的降低,多个d s p 芯片并行处理的实用化研究,成为近年来d s p 研究热点之一。欧美各工业发 达国家已把d s p 并行处理系统中结点处理器个数扩展到1 2 8 个,试图获得更 高的信号处理速度。 1 2 并行处理技术 1 2 1 并行处理技术的开发途径 提高计算机系统的并行性,可通过多种技术途径来实现,主要有时间重 叠、资源重复和资源共享三种方法。 时间重叠( t i m ei n t e r l e a v i n 9 1 这种技术是在并行性概念中引入时间因素。 让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个 部分,以加快硬件周转而赢得速度。如指令内部各操作步骤采用重叠流水的 工作方式。一条指令的解释分为取指、分析、执行三大步骤,分别在相应的 硬件上完成。只要不出现相关,则每过一个出时间,就可以得出结果。这种 执行方式加快了程序的执行速度。这种时间重叠技术原则上不需要增加更多 的硬件设备就可以提高计算机系统的性能价格比。 资源重复( r e s o u r c er e p l i c a t i o n ) 这种技术是在并行性概念中引入空间因 素,通过重复设置的硬件资源来提高系统的可靠性或其他性能。例如,通过 使用两台或多台完全相同的处理器或计算机完成同样的任务来提高性能。 哈尔滨工程大学硕士学位论文 资源共享( r e s o u r c es h a r i n g ) 这种技术是利用软件的方法让多个用户按一 定时间顺序轮流地使用同一套资源,以提高其利用率,这样相应地提高整个 系统的性能。例如多道程序分时系统,它是利用共享c p u 、主存资源以降低 系统价格,提高设备利用率的一个实例。 在一个计算机系统中,可以通过多种技术途径,采取多种并行措施,既 有执行程序的并行性,又有处理数据的并行性,它是一种信息处理的有效形 式。 1 2 2 并行处理技术发展 计算机系统并行处理的发展体现了计算机系统结构的演变。图1 1 表示 了单处理机到多计算机两级向并行处理发展的趋势。 图1 1 并行处理发展 在单处理机范围内采取上述时间重叠,资源重复和资源共享三大计算机 结构学的措施发挥并行性,以提高处理速度和系统使用效率。但其主要技术 2 哈尔滨工程大学硕士学位论文 只是停留在功能部件一级,即在单处理机内部千方百计改进各种功能部件( 例 如使用流水线处理部件,多处理单元,相联存储器等) 。实现系统并行性的进 一步提高,需开发程序、任务、作业一级的并行,因此要摆脱单处理机的束 缚,把多台独立离散的计算机相连,相互协调和配合,发展各种不同耦合度 的多计算机系统( m u l t i c o m p u t e rs y s t e m ) ,达到更高的并行处理水平,获得更 高的系统效率和处理速度。即采用功能专用化、机间互连和网络化三项基本 技术措施,促使多计算机系统向并行处理系统进一步发展。多计算机采取各 种措施,实现不同类型的多处理机系统( m u l t i p r o c e s s o rs y s t e m ) 。即有同构型 多处理机、异构型多处理机和分布处理系统。 在发展高性能的单处理机中,主导作用的是时间重叠这个途径。实现时 间重叠的基础是部件功能专用化,就是不断地对功能部件进行分离和细化以 及平衡好它们之间的频带,尤其是注意克服信息流运行过程中影响速度的“瓶 颈”来发展出高并行度的系统。如为了取得主存和中央处理器的速度匹配, 先后发展了指令重叠、先行控制、并行主存系统,在c p u 内部设置较多的通 、用寄存器、指令和数据缓冲寄存器、高速缓冲存储器c a c h e 等。如果把功能 专用化深入到处理机的执行部件内部,将该部件再分成多个专用功能段,进 行流水线处理,就是操作流水线。如果在指令内并行的基础上,增加指令阃 并行性,这就是向量处理机。此时单处理机就进入了并行处理领域。把时间 重叠原理应用于任务一级,对各任务设置专用处理机,按流水线方式工作, 就构成了宏流水线( m a c r o p i p e l i n e ) ,即由单处理机发展成多处理机系统。例 如,将语言编译过程分为扫描、分析、生成等部分,分别设立专门的处理机, 与执行机器语言的通用处理机相连,进行流水线处理;又如,系统的测试诊 断、终端信息的预处理、数组运算,数据库管理等,都分别由专用处理机作 为系统的选配件与主机相连,而各处理机之间应流水地处理以便有效提高整 个系统的工作效率。这种多处理机称为非对称型( a s y m m e t r i c a l ) 或异构型多处 理机系统( h e t e r o g e n e o u sm u l t i p r o c e s s o rs y s t e m ) ,它们由多个不同类型担负不 同功能的处理机构成,按照作业要求的次序,利用时问重叠原理,依次执行 多个任务,各自实现规定的操作。 在高性能的单机系统中,随着硬件价格下降,资源重复逐渐增多。最初 是将按位串行改成按字并行,后来用多操作部件和多存储体。资源重复主要 3 哈尔滨丁程大学硕士学位论文 是为了提高系统可靠性,同时也为了提高系统的速度。进一步发展,可把原 来具有各个专门功能的操作部件演变成通用处理单元,为向量并行处理创造 了条件。通过重复设置多个相同的处理单元,在一个控制器的指挥下,按照 同一指令要求,各处理机同时对向量各元素进行操作,这即是并行处理机。 它在指令内部实现了数据处理的全并行。如果并行处理机普遍采用阵列结构 形式,因此也称之为阵列机。相联存储器是一种按内容寻址的、具有信息处 理功能的存储器,能按字串行或全并行方式对所有存储单元的内容进行操作。 以相联存储器为核心,加上中央处理器、指令存储器、控制器和i 0 接口, 就可以构成以存储器并行操作为特征的相联处理机。它是把并行处理机思想 运用于相联存储器内部。发展到相联处理机( a s s o c i a t i v ep r o c e s s o r ) 和并行处理 机( p a r a l l e lp r o c e s s o r ) 等多种按单指令流多数据流方式工作的多处理( 器) 机 系统,就进入了并行处理的领域。如要进一步提高到任务级并行,则每个处 理单元配备自己的控制器,能独立地解释、执行指令而成为一台处理机,这 就进入了多机系统范畴。由于每个处理( 器) 机是同类型的,而且完成同样 的功能,能同时处理同一作业中能并行执行的多个任务,这种多机型的,能 完成同样的功能,能同时处理同一作业中能并行执行的多个任务,所以这种 多机系统称为对称型( s y m m e t r i c a l ) 或同构型多处理机系统( h o m o g e n e o u s m u l t i p r o c e s s o rs y s t e m ) 。这种同构型多处理机系统可以是基于处理机一级冗 余的容错多处理机,让多个处理机中的一部分作为备用处理机以随时顶替出 故障的工作处理机,从而提高系统工作的可靠性。在此类系统中,平时几台 机器都正常工作,像通常的多处理机一样,如果某个处理机出故障就被“切” 掉,让系统重新组织,降低规格继续运行,直到故障排除为止。 在单机系统中,要达到任务或作业级并行,也可利用资源共享。最初在 单处理机上采用多道程序和分时操作,其实质是单处理机模拟多处理机功能, 发展形成了虚拟存储器、虚拟处理机。分时系统适用于多终端情况,对于远 地用户,可配接远程终端。随着远程终端、计算机网络和微型机、小型机的 发展,采用真正的处理机代替虚拟处理机,构成以分散为特征的多处理机系 统。如果在终端内配上微处理器,使其不仅有f o 功能和通信功能,还具有 一定的信息存储、分析、处理的能力,就成为智能终端。智能终端的出现, 使原来“集中”的形态向“分布”形态方向发展。这里将这种有大量分散、重复 4 哈尔滨工程大学硕士学位论文 的处理机资源( 一般是具有独立功能的单处理机) 相互连接在一起,在操作 系统( 可以是集中的也可以是分散的) 的全盘控制作用下统一协调地工作而 最少依赖于集中的程序、数据或硬件的系统称为分布处理系统( d i s t r i b u t e d p r o c e s s i n gs y s t e m ) 。 上述仅从并行性角度反映了单机系统的发展趋势和技术途径。对具体的 计算机系统,可以是单机也可以是多机系统,可有几种技术途径的综合,采 用多种技术措施,以实现系统各部分负荷平衡。关于多机系统中并行处理的 结构及应用将在后边章节进一步介绍。 1 2 - 3 并行处理中需研究的课题 ( 1 ) 在处理机数目很多的情况下,要把任何一个问题分解成足够多的并 行过程( 即任务分配) 是非常困难的,并且也不是所有问题都能做到这一点。 ( 2 ) 现有的并行算法绝大多数是由串行算法发展而来的,因此很难摆脱 传统串行算法的思维和处理方式方法的约束。 ( 3 ) 现有算法语言对并行性限制很大。现行的s i m d 和m i m d 系统结构 仍然没有摆脱传统的以指令流为主导的v o nn e u m a n n 模式。因指令相关和地 址空间相关等矛盾的出现,使并行效率受到严重的限制。 ( 在并行处理过程中,各处理机间的通信开销有可能使并行处理技术 得不偿失,降低了并行处理的效率。 ( 5 ) 并行处理技术的主要困难是软件,软件的关键在于如何高效地进行 存储管理和机间通信,尤其是并行编译程序发展,对发挥硬件特性改善系统 性能影响更大。 并行处理技术是一门综合技术,其并行算法和程序是与并行计算机结构 和软件密切联系相辅相成的。 1 3 数字信号处理器( d s p ) 概述 1 3 1d s p 芯片的发展 世界上第一个单片d s p 芯片是1 9 7 8 年a m i 公司宣布的$ 2 8 1 1 ,1 9 7 9 年 美国i n t e l 公司发布的商用可编程器件2 9 2 0 是d s p 芯片的一个主要里程碑。 这两种芯片内部都没有现代d s p 芯片所必须的单周期芯片。1 9 8 0 年,日本 5 哈尔滨工程大学硕士学位论文 n e c 公司推出的z p d 7 7 2 0 是第一个具有乘法器的商用d s p 芯片。第一个采 用c m o s 工艺生产浮点d s p 芯片的是同本的h i t a c h i 公司,它于1 9 8 2 年推 出了浮点d s p 芯片。1 9 8 3 年,日本的f u i i t s u 公司推出的m b 8 7 6 4 ,其指令 周期为1 2 0 n s ,且具有双内部总线,从而处理的吞吐量发生了一个大的飞跃。 而第个高性能的浮点d s p 芯片应是a t & t 公司于1 9 8 4 年推出的d s p 3 2 。 存众多的d s p 芯片种类中,最成功的是美国德克萨斯仪器公司( t e x a s l n s t r u l l l e n t s ,简称t i ) 自q 一系列产品。t i 公司于1 9 8 2 年成功推出启迪一代 d s pj 醛片t m $ 3 2 0 1 0 及其系列产品t m s 3 2 0 1 1 、t m s 3 2 c 1 0 c 1 4 c 1 5 c 1 6 c 1 7 等,之后棚继推出了第- 2 代d s p 芯片t m s 3 2 0 2 0 、t m s 3 2 0 c 2 5 c 2 6 c 2 8 ,第 三代d s p 芯片t m s 3 2 c 3 0 c 3 1 c 3 2 ,第四代d s p 芯片t m s 3 2 c 4 0 c 4 4 ,第五 代d s t ,芯片t m s 3 2 c 5 i f c 5 1 c 5 2 c 5 3 第六代t m s 3 2 0 v c 6 2 6 4 6 7 以及集多个 d s p 于一体的高性能d s p 芯片t m s 3 2 c 8 0c 8 2 等。如今,t i 公司的一系列 d s p 产品已经成为当今世界上最有影响的d s p 芯片。t i 公司也成为世界上 最大的d s p :b 片供应商,其d s p 市场份额占全世界份额近5 0 。 美国模拟器件公司( a n a l o gd e v i c e s ,简称a d ) 在d s p 芯片市场上也占 有一定的份额,相继推出了一系列具有自己特点的d s p 芯片,其定点d s p :占片有a d s p 2 1 0 1 1 2 1 0 3 1 2 1 0 5 、a s d p 2 1 1 1 2 1 1 5 、a d s p 2 1 6 1 ,2 1 6 2 2 1 6 4 以及 a d s p 2 1 7 1 2 1 8 1 ,浮点d s p 芯片有a d s p 2 1 0 0 0 - 7 2 1 0 2 0 、a d s p 2 1 0 6 0 2 1 0 6 2 等。 自1 9 8 0 年以来,d s p 芯片得到了突飞猛进的发展,d s p 芯片的应用越 来越广泛。从运算速度来看,m a c ( 一次乘法和一次加法) 时间已经从8 0 年代初的4 0 0 n s ( 如t m s 3 2 0 1 0 ) 降低到4 0 n s ( 如t m s 3 2 c 4 0 ) ,处理能力提 高了1 0 多倍。d s p 芯片内部关键的乘法器部件从1 9 8 0 年的占模区的4 0 左 右下降到5 以下,片内r a m 增加一个数量级以上。从制造工艺来看,1 9 8 0 年采用缸的n 沟道m o s 工艺,而现在则普遍采用亚微米c m o s :艺。d s p 芯片的引脚数量从1 9 8 0 年的最多6 4 个增加到现在的2 0 0 个以上,引脚数量 的增加,意味着结构灵活性的增加。此外,d s p 芯片的发展,是d s p 系统的 成本、体积、重量和功耗都有很大程度的下降。 1 3 2d s p 芯片的分类 d s p 的芯片可以按照以下的三种方式进行分类。 哈尔滨工程大学硕士学位论文 1 按基础特性分 这是根据d s p 芯片的工作时钟和指令类型来分类的。如果d s f 芯片在 某时钟频率范围内的任何频率上能正常工作,除计算速度有变化外,没有性 能的下降,这类d s p 芯片一般称之为静态d s p 芯片。 2 按数据格式分 这是根据d s p 芯片工作的数据格式来分类的。数据以定点格式工作的 d s p 芯片称之为定点d s p 芯片。以浮点格式工作的称为d s p 芯片。不同的 浮点d s p 芯片所采用的浮点格式不完全一样,有的d s p 芯片采用白定义的 浮点格式,有的d s p 芯片则采用i e e e 的标准浮点格式。 3 按用途分 按照d s p 芯片的用途来分,可分为通用型d s p 芯片和专用型的d s p 芯 片。通用型d s p 芯片适合普通的d s p 应用,如1 1 公司的一系列d s p 芯片。 专用型d s p 芯片是为特定的d s p 运算而设计,更适合特殊的运算,如数字 滤波、卷积和h 丌等。 1 3 3d s p 芯片的选择 设计d s p 应用系统,选择d s p 芯片是非常重要的一个环节。只有选定 了d s p 芯片才能进一步设计外围电路及系统的其它电路。总的来说,d s p 芯 片的选择应根据实际的应用系统需要而确定。一般来说,选择d s p 芯片时考 虑如下诸多因素: 1 d s p 芯片的运算速度。运算速度是d s p 芯片的一个最重要的性能指标, 也是选择d s p 芯片时所需要考虑的一个主要因素。d s p 芯片的运算速度可以 用以下几种性能指标来衡量: ( 1 ) 指令周期。就是执行一条指令所需要的时间,通常以n s 为单位。 ( 2 ) m a c 时河。即一次乘法加上一次加法的时间。 ( 3 ) f f t 执行时间。即运行一个n 点f f t 程序所需的时间。 ( 4 ) m i p s 。即每秒执行百万条指令。 ( 5 ) m o p s 。即每秒执行百万次操作。 ( 6 ) m f l o p s 。即每秒执行百万次浮点操作。 ( 7 ) b o p s 。即每秒执行十亿次操作。 哈尔滨工程大学硕七学位论文 2 d s p 芯片的价格。根据一个价格实际的应用情况,确定一个价格适 的d s p 芯片。 3 d s p 芯片的硬件资源。 4 d s p 芯片的开发工具。 5 d s p 芯片的功耗。 6 其它的因素。如封装的形式、质量标准、生命周期等。 1 3 4d s p 芯片的应用 自从d s p 芯片诞生以来,d s p 芯片得到了飞速的发展。d s p 芯片高速 发展,一方面得益于集成电路的发展,另一方面也得益于巨大的市场。在短 短的十多年时间,d s p 芯片已经在信号处理、通信、雷达等许多领域得到广 泛的应用。目前,d s p 芯片的价格也越来越低,性能价格比日益提高,具有 巨大的应用潜力。d s p 芯片的应用主要有: 1 信号处理如数字滤波、自适应滤波、快速傅里叶变换、相关运算、 频谱分析、卷积等。 2 通信一如调制解调器、自适应均衡、数据加密、数据压缩、回波抵消、 多路复用、传真、扩频通信、纠错编码、波形产生等。 3 语音如语音编码、语音合成、语音识别、语音增强、说话人辨认、 说话人确认、语音邮件、语音储存等。 4 图像,图形如二维和三维图形处理、图像压缩与传输、图像增强、动 画、机器人视觉等。 5 军事一如保密通信、雷达处理、声纳处理、导航等。 6 仪器仪表如频谱分析、函数发生、锁相环、地震处理等。 7 自动控制如引擎控制、深空、自动驾驶、机器人控制、磁盘控制。 8 医疗一如助听、超声设备、诊断工具、病人监护等。 9 家用电器一如高保真音响、音乐合成、音调控制、玩具与游戏、数字 电话电视等。 随着d s p 芯片性能价格比的不断提高,可以预见d s p 芯片将会在更多 的领域内得到更为广泛的应用。 8 哈尔滨工程大学硕士学位论文 1 4 高速实时d s p 与并行体系结构 当前,高速实时数字信号处理( d s p ) 技术已经取得了飞速的发展,单片 d s p 芯片的速度已经可以达到每秒1 6 亿次定点运算( 1 6 0 0 m i p s ) 。高速实时 d s p 芯片的主要特点就是采用了各种并行处理技术,包括片内并行和片问并 行等。其中,主要的并行d s p 芯片包括美国1 1 公司的t m s 3 2 0 c 8 x 和 t m s 3 2 0 c 6 x ,以及美国a d 公司的a d l 4 0 6 x 及a d s p 2 1 0 6 x 等等。 1 4 1t m s 3 2 0 c 8 x :片内并行,m i m d 体系结构 在每一片t m s 3 2 0 c 8 0 内部,有1 个浮点r i s c 类型d s p ,称为主处理器 ( m p ) ;还有4 个定点d s p ,称为并行处理器( p p ) 。每个d s p 配有1 0 k - b y t e s 片内存储器( r a m ) ,因此片内r a m 总容量为5 0 k - b y t e s 。主处理器、并行处 理器和片内r a m 之间通过交叉开关( c r o s s b a r ) 互连,并通过1 个专用的传输 控制器( t c ) 控制处理器之间及c 8 0 与片外器件之间的互连在总线互连的系统 中,各个d s p 之间需要申请总线,并需要总线仲裁机构分配总线。 在c 8 0 内部还有1 个视频控制器( v c ) ,可用于视频接1 2 1 、时序的控制; 因此这种芯片特别适用于视频信号的处理,故称m v p 芯片。从并行处理的 角度分析,t m s 3 2 0 c 8 x 是一个紧耦合多指令多数据流( m i m d ) 的单片多处理 器系统。这一系统的运行速度等效于每秒2 0 亿次r i s c 类型的操作。在这个 系统中,一个显著的特点是采用交叉开关( c r o s s b a r ) 代替了传统的总线互连。 1 4 2 t m s 3 2 0 c 6 x :片内并行,删体系结构 t m s 3 2 0 c 6 x 是9 0 年代中后期美国1 1 公司推出的划时代的超级d s p 芯 片。这种芯片是定点、浮点兼容的d s p 系列,其中首先推出的是定点系列 t m s 3 2 0 c 6 2 x 。 r i m s 3 2 0 c 6 2 x 片内有8 个并行的处理单元,分为相同的两组。d s p 的体 系结构采用超长指令字( v l i w ) 方式,单指令字长为3 2 b i t s ,8 个指令组成一 个指令包,总字长为8 x 3 2 b i t s = 2 5 6 b i t s 。芯片内部设置了专门的指令分配模块, 可以将每个2 5 6 b i t s 的指令包同时分配到8 个处理单元,并由8 个单元同时运 行。它的最高时钟频率可以达到2 0 0 m i - l z ,当芯片内部8 个处理单元同时运 行时,其最大处理能力可以达到1 6 0 0 m i p s ,即1 6 亿次定点运算,秒。 9 哈尔滨工程大学硕士学位论文 从并行处理的角度分析,t m s 3 2 0 c 6 2 x 的主要特点是采用了v l i w 的体 系结构。v l l w 处理机的另一个特点是指令获取、指令分配、指令执行、数 据存储等阶段需要进行多级流水,而且不同指令执行的流水延迟时间也不相 等,因此各种指令的安排要尽量不破坏指令流水的执行,否则处理机运行的 效率也会大大降低。 1 4 3a d s p 2 1 0 6 x :片间多片并行,多种体系结构 a d s p 2 1 0 6 x 是美国a d 公司推出的可并行扩展的超级哈佛指令计算机 ( s h a g c ) 阿。这种芯片片内有四套独立的总线,可完成双向数据存取、指令 存取、非指令性f o ,因此与一般哈佛结构计算机相比被称为s h a r c 。 这种芯片的主要型号包括a d s p 2 1 0 6 0 、a d s p 2 1 0 6 1 、a d s p 2 1 0 6 2 等, 其主要特点是在一个a d s p 2 1 0 2 0 的浮点d s p 核心基础上集成了片内大容量 双口r a m 和并行处理接口,因此是一个可并行扩展的s h a r c 结构。 a d s p 2 1 0 6 x 的最大特点就是支持多d s p 系统,可以方便地构成各种体 系结构的多d s p 系统。本系统便是采用a d s p 2 1 0 6 0 ,设计完成基于p c i 总 线的并行处理机。相关内容将在后面的章节中详细说明。 1 5 论文的研究内容 1 5 1 主体思想 本论文的主体思想是设计一块通用的、基于公司d s p 高速并行处理 机,用作复杂的水声信号处理的试验平台。基于这种考虑,整个硬件的设计 要求任意两d s p 之间可以相互通信,拓扑结构可以根据用途软件设定,数据 可以灵活输入,该板采用四片1 r i 公司的t m s 3 2 0 v c 5 4 1 6 、四片1 r i 公司的 t m s 3 2 0 v c 3 3 ,t i 公司的d s p 程序下载可由a r m 控制;用户程序可在a r m 主控界面下进行调试、下载;预留数据采集扩展接口,采集的大量数据可通 过“位总线传到并行处理机,由并行处理机进行高速实时处理。 1 5 2 研究内容 1 硬件电路方面,完成了总体硬件电路的设计 数字信号处理机电路的设计,包括:四片定点d s p ( t m s 3 2 0 v c 5 4 1 6 ) 和四片浮点d s p ( t m s 3 2 0 v c 3 3 ) 的硬件电路及其外设接口的电路 1 0 赊尔滨工程大学硕士学靛论文 设计 控制电路的设计:主要是p l d 与d s p 之间的接口电路,电子开关和 d s p 之间的接口电路。电子开关在总线仲裁中起到了关键的住燃, 逶过p l d 霹能控裁嚣关,使d s p 片阗逶信避免7 冷突。 2 软件方面 八片d s p 数据通信软件的设计 控裁转载豹p l d 簸箨懿浚谤骧及调试瘸f p g a 款移熬设谤 同时还完成了d s p 程序麟化及程序上电引导即b o o f l o a d e r 。 f f t 的程序的编写在硬件带台上的实现 l l 哈尔滨工程大学硕士学位论文 第2 章硬件的数字器件介绍及其资源介绍 1 1 公司的t m s 3 2 0 v c 5 4 1 6 和t m s 3 2 0 v c 3 3 主频高、处理速度快、稳定 性好、价格便宜、便于低成本开发,同时接口方便,可构成各种体系结构的 多d s p 系统。1 1 系列可通过串口通信,允许某一处理器直接访问其它处理器 的内部r a m ,并且这种访问一般不影响被访问处理器的正常工作,为避免总 线冲突,采用片外仲裁。 我们的目的就是利用t m s 3 2 0 v c 5 4 1 6 和t m s 3 2 0 v c 3 3 的以上特性设计 一个并行处理系统,完成高速数据处理。同时用a l t e r a 公司的7 0 0 0 系列 大规模可编程器件( c p l d ) e p m 7 0 6 4 做总线仲裁。下面对这些芯片的性能 特点做一下详细的介绍,为下一章的系统设计做铺垫。 2 1t m s 3 2 0 v c 3 3 简介 自从2 0 世纪7 0 年代末,第一代数字信号处理芯片( d i g i t a ls i g n a l p r o c e s s o r s ,d s p s ) i n 世以来,d s p 就以数字器件特有的稳定性、可重复性、 可大规模集成等特点给数字信号处理的发展带来了巨大机遇,使得各种数字 信号处理算法得以实现。实际上,d s p 器件不仅使数字信号处理从仅限于理 论研究推广到实际应用,而且拓宽到系统控制领域,从而诞生了一大批新型 的电子器件”。 面对d s p 的巨大市场和广阔发展前景,世界上最大的几个半导体公司都 在d s p 上开展竞争川。如t i 、a d i 、s i m e n s 、m o t o l o r a 等公司都在全力开发 和生产d s p 器件。其中美国1 r i 公司的d s p 产量最大,占全世界d s p 器件总 产量的6 0 ,品种也最多。t m s 3 2 0 系列由定点型、浮点型和多处理器型数 字信号处理器组成。 根据技术指标对信号处理精度和数据宽度的要求,本系统的信号处理器 采用t i 公司近年推出的浮点系列d s p 产品一t m s 3 2 0 v c 3 3 ,它是浮点芯片系 列t m s 3 2 0 c 3 x 中最新的一种。其指令代码兼容t m s 3 2 0 c 3 x 系列d s p ,作 为一种性能价格比较高的浮点处理器己得到了较广泛的应用”。 t m s 3 2 0 v c 3 3 的主要特点 3 2 位浮点处理器,指令宽度3 2 位。 哈尔滨= r = 程大学硕士学位论文 c p u 主频1 5 0 m h z ( 1 3 n s 的指令周期) 。 , 8 个扩展精度寄存器( r 0 r 7 ) 。 内部集成3 4 k x 3 2 b i t 的双存取r a m 块,自带四个内部页译码逻辑输 出 p a g e o p a g e 3 ,简化了与外部i 0 或存储器的接口。 3 2 位并行接口,2 4 b i t 寻址范围。 一 其它片上外设:p u 。,s p 、g p i o 、t i m e r 等。 低功耗,功耗小于2 0 0 m w 。 2 21 m s 3 2 0 v c 5 4 1 6d s p 简介 t m s 3 2 0 v c 5 4 1 6 ( 简称v c 5 4 1 6 ) 是公司的c 5 4 xd s p 家族的成员之 一,它是基于先进的改进哈佛结构的1 6 位定点d s p ,拥有一条程序总线和 三条数据总线。片内集成有一个具有高度并行性的算术逻辑单元( a l u ) 、专 用硬件逻辑、片内存储器和片内外设等几部分。以下主要介绍v c 5 4 1 6 的一 些主要特点”1 : 先进的多总线结构:三条1 6 位数据总线和一条程序总线; 4 0 位桶形移位器和4 0 位累加器; 可寻址1 m x l 6 b i t 的程序空间; 6 4 k x l 6 b i t 的片内d a r a m 和6 4 k x l 6 b i t 的片内s a r a m ; 片内外设包括: o 软件可编程的等待状态发生器 口软件可编程的锁相环( p l l ) 口三个多通道缓冲串行口( m c b s p ) o 增强型8 位主机接口( h p l 8 ) o 两个1 6 位定时器 口六通道d m a 控制器 软件设置进入省电模式: 指令周期6 2 5 n s ( 1 6 0 m i p s ) ; 内核电压1 6 v ,i ,o 电压3 3 v 。 片内可屏蔽r o m 中固化有启动装载程序( b o o t l o a d e r ) 和中断向量表等。 哈尔滨t 程大学硕士学位论文 系统上电时,b o o t l o a d e r 自动把用户代码从外部搬移到程序空l 甸。复位后, 中断向量表可被重新映射到程序空间的任何页的开始处。 为了与慢速的外设打交道,v c 5 4 1 6 提供等待状态发生器。通过软件设 置等待周期的个数,不仅降低了系统硬件设计的复杂性,而且为系统带来了 很大的灵活性”1 。 v c 5 4 1 6 片内集成了软件可编程的锁相环时钟电路,它只需要一个参考 时钟输入,就可以得到3 1 种不同频率的输出时钟,最大的乘率因子( 在寄存 器c l k m d 中设置) 为1 4 ,最小的为0 2 5 。这样,一方面可利用较低频率的 外部时钟源产生较高频率的c p u 时钟,另一方面在不工作时可降低c p u 时 钟频率到外部时钟频率的1 4 ,从而降低c p u 功耗。 2 3d s p 的外部总线接口 t m s 3 2 0 v c 5 4 1 6 的外部接口由数据总线、地址总线和一组存取片外存储 器和i ,0 口控制信号组成,以下列出了外部接口的关键信号嗍。 a 0 一a 1 5 地址总线 d o d 1 5数据总线 m s t r b外部存储器存取选通脉冲 p s程序空间选择信号 d s数据空间选择信号 j d s t r by o 存取选通信号 i si 0 空间选择信号 r w读写信号 r e a d y数据就绪 h o l d保持请求 h o l d a保持确认 m s c微状态完成 l a a 指令获取 i a c 茁中断确认 并口接口是由丽西面和瓦而信号控制的两个互斥的接口组成。存取 器存取( 程序和数据存储器) 时,砀i 面西被激活,而i o s t r b 用与i o 端1 2 1 1 4 哈尔滨丁程大学硕士学位论文 存取,r w 信号控制存取的方向。 外部就绪信号( r e a d y ) 和软件产生的等待状态信号相配合,可以处理 与不同速度的存储器和i 0 设备进行连接聊。当c p u 和速度较慢的设备进行 通信时,它等到该设备完成其功能并且发回一个r e a d y 信号之后,才继续 进行操作。在某些情况下,只有当数据传送发生在两个外部存储设备之间时, 等待状态才有必要使用,这时可编程的切换逻辑可以自动插入等待状态。一 外部设备可以通过保持模式来获得c 5 4 x d s p 外部总线控制权,以便访问 c 5 4 x d s p 外部程序、数据以及i o 存储空问中的资源。有两种保持模式可以 选择:普通模式和并发d m a 模式”。 当c p u 对内部存储器进行寻址时,数据总线置于高阻状态,但地址总线 和存储器选择信号( 程序选择( - f g ) 、数据选择( - f i g ) 和i 0 选择( i - g ) ) 保持前面状态不变,m s t r b 、r w 、l 4 q 、丽茹信号保持为不激活状态。 如果p m s t 中的地址可见模式位( a v i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论