(信号与信息处理专业论文)基于dspfpga的图像处理电路板硬件设计.pdf_第1页
(信号与信息处理专业论文)基于dspfpga的图像处理电路板硬件设计.pdf_第2页
(信号与信息处理专业论文)基于dspfpga的图像处理电路板硬件设计.pdf_第3页
(信号与信息处理专业论文)基于dspfpga的图像处理电路板硬件设计.pdf_第4页
(信号与信息处理专业论文)基于dspfpga的图像处理电路板硬件设计.pdf_第5页
已阅读5页,还剩85页未读 继续免费阅读

(信号与信息处理专业论文)基于dspfpga的图像处理电路板硬件设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西南交通大学硕士研究生学位论文第1 页 摘要 波前处理机是自适应光学系统中实时信号处理和运算的核心,随着自适 应光学系统得发展,波前传感器的采样频率越来越高,这就要求波前处理机 必须有更强的数据处理能力以保证系统的实时性。在整个波前处理机的工作 流程中,对c c d 传来的实时图像数据进行实时处理是第一步,也是十分重要 的一步。如果不能保证图像处理的实时性,那么后续的处理过程都无从谈起。 因此,研制高性能的图像处理平台,对波前处理机性能的提高具有十分重要 的意义。 论文介绍了本研究课题的背景以及国内外图像处理技术的应用和发展状 况,接着介绍了传统的专用和通用图像处理系统的结构、特点和模型,并通 过分析d s p 芯片以及d s p 系统的特点,提出了基于d s p 和f p g a 芯片的实 时图像处理系统。该系统不同于传统基于p c 机模式的图像处理系统,发挥了 d s p 和f p g a 两者的优势,能更好地提高图像处理系统实时性能,同时也最 大可能地降低成本。 论文根据图像处理系统的设计目的、应用需求确定了器件的选型。介绍 了主要的器件,接着从系统架构、逻辑结构、硬件各功能模块组成等方面详 细介绍了d s p + f p g a 图像处理系统硬件设计,并分析了包括各种参数指标选 择、连接方式在内的具体设计方法以及应该注意的问题。 论文在阐述传输线理论的基础上,在制作p c b 电路板的过程中,针对高 速电路设计中易出现的问题,详细分析了高速p c b 设计中的信号完整性问题, 包括反射、串扰等,说明了高速p c b 的信号完整性、电源完整性和电磁兼容 性问题及其解决方法,进行了一定的理论和技术探讨和研究。 论文还介绍了基于f p g a 的逻辑设计,包括了图像采集模块的工作原理、 设计方案和s d r a m 控制器的设计,介绍了s d r a m 的基本操作和工作时序, 重点阐述系统中可编程器件内部模块化s d r a m 控制器的设计及仿真结果。 论文最后描述了硬件系统的测试及调试流程,并给出了部分的调试结果。 该系统主要优点有:实时性、高速性。硬件设计的执行速度,在高速d s p 和f p g a 中实现信号处理算法程序,保证了系统实时性的实现;性价比高。 自行研究设计的电路及硬件系统比较好的解决了高速实时图像处理的需求。 关键词:图像处理;硬件设计;d s p ;f p g a ;逻辑设计 西南交通大学硕士研究生学位论文第1 i 页 a b s t r a c t i na d a p t i v eo p t i c ss y s t e m ( a o s ) ,w a v e f r o n tp r o c e s s o ri st h ec o r ee l e m e n to f t h er e a l - t i m es i g n a lp r o c e s s i n g w i t ht h ed e v e l o p m e n to fa o s ,h i g h e rf r a m er a t e o ft h ew a v e f r o n ts e n s o ri sn e c e s s a r y , w h i c hr e q u i r e st h ew a v e f r o n tp r o c e s s o rh a s m o l ep o w e r f u ld a t ap r o c e s s i n gt oc t l s i l r et h er e a l - t i m eo ft h es y s t e m i nt h ew h o l e w o r k i n gs t e po ft h ea o s ,d e a lw i t ht h er e a l - t i m ei m a g ef r o mc c di st h ef i r s ta n d i m p o r t a n ts t e p a l ls u b s e q u e n c e sp r o c e s s i n gc a nn o tg oo nw i t h o u tt h ei m a g e p r o c e s s i n g t h e r e f o r e ,t h ec o m p r e h e n s i v ep e r f o r m a n c eo fi m a g ep r o c e s s o ri sa g r e a ts i g n i f i c a n c et oa o s n o to n l yt h eb a c k g r o u n do ft h er e s e a r c hp r o b l e ma n dt h eu s es t a t eo f i m a g e p r o c e s s i n gt e c h n o l o g yt h r o u g ht h ew o r l db u ta l s ot h ef l a m e ,c h a r a c t e r i s t i ca n d m o d e lo ft r a d i t i o n a ls p e c i a la n du n i v e r s a li m a g ep r o c e s s i n gs y s t e ma r ed i s c u s s e d i nt h et h e s i s a f t e ra n a l y z i n gt h ec h a r a c t e r so fd s p sc h i pa n dd s ps y s t e m , t h e t h e s i si n t r o d u c e sar e a lt i m ei m a g ep r o c e s s i n gs y s t e mb a s e do nt h ed s p & f p g a t h i ss y s t e mc a nv a r yf r o mt h et r a d i t i o n a li m a g ep r o c e s s i n gs y s t e mb a s e do np c m o d ei nc h a r a c t e r , i m p r o v e si t sp e r f o r m a n c ei nt h ef i e l do fr e a lt i m et h a ne v e ra n d r e d u c e st h ec o s to ft h es y s t e mi nm o s tp o s s i b l e t h et h e s i sc o n f i r m st h ep a r t so fa na p p a r a t u ss e l e c tf r o mt h ed e s i g np u r p o s e a n da p p l i a n c er e q u i r e m e n t t h et h e s i sp a r t i c u l a ri n t r o d u c e st h ei m a g ep r o c e s s i n g s y s t e md e s i g n a b o u th a r d w a r eb a s e do nd s p & f p g af r o mi t s s y s t e m b u i l d - u p ,l o g i c1 匦t 1 n ea n de a c hf u n c t i o nm o d u l eo ft h es y s t e ma n da n a l y z e dt h e d e s i g nt e c h n o l o g ya n dt h em e t h o do f r e a l i z a t i o ni nd e t a i l s i nt h en e x tc h a p t e r , b a s e do nt h ei n t r o d u c t i o no fb a s i ct r a n s m i s s i o nl i n e t h e o r yi nt h et h e s i s ,a i ma tt h ep r o b l e mi nh i g h - s p e e dc i r c u i t ,h i ! g hf r e q u e n c ys i g n a l i n t e g r i t yp r o b l e mi ss t a t e d , i n c l u d i n gr e f l e c t i o n , c r o s s t a l k , e t c a n de x p l a i n s f o c u s e so nh o wt os o l v es i , p ia n de m c p r o b l e m si nh i g h - s p e e dp c bd e s i g n l a s t l y , t h et h e s i si n t r o d u c st h el o g i cd e s i g nb a s e do nf p g a i n c l u d i n gt h e w o r k i n gp r i n c i p l ea n dd e s i g np r o j e c to ft h ei m a g ei n c e p tm o d u l e t h et h e s i s i n t r o d u c e st h eb a s i co p e r a t i o na n dt h eo p e r a t i o nt i m i n go fs d r a m e x p a t i a t e st h e s d r a mc o n t r o l l e rm o d u l a r i z a t i o nd e s i g nb a s e do nf p g a l a s t l y , t h et h e s i s 西南交通大学硕士研究生学位论文第l ii 页 s h o w su st h ee m u l a t o rr e s u l t l a s t l y , t h et h e s i sd e s c r i b e st h eh a r d w a r et e s t i n ga n dd e b u g g i n g , a n ds h o w su s s o m er e s u l t s 硼1 es y s t e mi ss p e c i a l i z e di nt w oa s p e c t s :o n ei sh i g h - s p e e da n dr e a l - t i m e b e c a u s eo ft h ed e v i c e s ,t h ep r o g r a m m ec a nr u n n i n gi nd s pa n df p g aa s s u r et h e d e s i g np u r p o s e 1 1 1 eo t h e ro n ei sh i g h - p o w e r e da n db e t t e rc o s t e f f e c t i v e t h e h a r d w a r ed e s i g nc a nr e s o l v et h ep r o b l e m so ft h er e a l - t i m ei m a g ep r o c e s s i n g s y s t e m k e yw o r d s :i m a g ep r o c e s s i n g ;h a r d w a r ed e s i g n ;d s p ;f p g a ;l o g i cd e s i g n 西南交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。 本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。 本学位论文属于 1 保密口,在年解密后适用本授权书: 2 不保密v4 ,使用本授权书。 ( 请在以上方框内打“一) 学位论文作者签名: 日期:啪子6 、够 指导老师签名:艺“幺聚指导老师签名:t 辽水 日期:多弼多,眵 西南交通大学学位论文创新性声明 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作 所得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体, 均已在文中作了明确的说明。本人完全意识到本声明的法律结果由本人承担。 本学位论文的主要创新点如下: 本文完成了针对自适应光学系统中波前处理机图像处理平台的硬件设 计,首先分型了应用的要求,并在满足要求的条件下进行了硬件选型,绘制 了原理图;在分析了高速电路p c b 设计容易出现的问题基础上,针对该电路 板的设计提出了解决方案,绘制了p c b 图,完成了电路板的硬件设计。接着 针对该图像处理板的应用要求,用v h d l 硬件描述语言进行了基于f p g a 的 图像接收模块和s d r a m 控制器的逻辑设计,并进行了仿真,验证了设计功 能的正确性。最后,完成了电路板的基本测试调试,并对d s p 的e m i f 接口 及s d r a m 、f l a s h 进行了调试,实现了d s p 对外部存储器的正确读写。 西南交通大学硕士研究生学位论文第1 页 1 1 图像处理概述 第1 章绪论 图像处理技术在信息处理技术中占有非常重要的地位,涉及到工业检测、 医疗设备、军事、消费电子的诸多领域。采用成像技术( 如电视摄向、数码相机、 扫描仪) 获取的图像中,包含大量的信息,对这些信息采用不同的方法进行加工 处理,使得图像技术可以应用在不同的领域和行业。图像处理技术在医学上的 应用十分广泛,对生物医学的显微图像处理分析,如红白细胞和细菌、染色体 分析、以及超声波图像的分析等。图像处理技术在工业自动化、工业检测方而 的应用也相当广泛,如在毛纺厂,采用图像处理技术,不但可以检测出纺织品 中存在的孔洞等方而的明显疵点,还可以检测出它在纹理、图案方面的毛病。 利用高速图像处理技术,可以在秒量级每至在更短的时间内对流水线上运动的 零部件进行检测,可以进行器件的内结构分析、失效分析和可靠性筛选。图像 处理技术在公安方面的应用有两个突出的成果,即指纹的查询、识别以及人像 组合、查询和识别。人的指纹具有唯一性,可用来做身份的鉴别。把现场收集 到的指纹录入计算机,提取指纹的特征后再和指纹库里的指纹进行比对,就可 以提供破案的线索。指纹识别也可用于出入海关的身份检验及指纹密码锁等方 面。 近年来,图像处理的发展非常迅速,不断有新的概念和新的技术产生。随 着计算机技术的发展,人们普遍利用计算机进行图像处理。而在对系统成本和 体积要求较高的场合,基于普通计算机的图像识别系统仍然不能满足需求,因 此基于d s p ( d i g i t a ls i g n a lp r o c e s s o r ) 数字信号处理器的新一代图像识别系统就 具有很高的研究和使用价值。 1 2 选题背景 随着计算机及通信技术的发展,图像和视频的应用愈加广泛。大部分图像 数据在实际应用前皆需进行有针对性的预处理,如根据图像数据特点和应用领 域对图像进行增强、除噪、锐化和识别等。此外,为了有效实时地传输信息, 西南交通大学硕士研究生学位论文第2 页 还必须对图像进行压缩。图像处理技术尤其是实时处理,现已成为一个热门的 研究课题。 在自适应光学系统中,波前处理机是最为重要的部件之一,是实时波前运 算的核心,波前处理机的运行情况对自适应光学系统的校正效果有着重要的影 响。 整个波前处理机的工作流程如图1 1 所示,接收到的图像先要经过图像处 理才能进行后续的一系列操作。可见,图像处理是自适应光学系统波前处理机 工作流程的前提和保障,并且,随着波前传感器的采样频率越来越高,自适应 光学系统对图像处理的实时性要求也越来越高。 图像处理 图1 - 1 波前处理机工作流程 在自适应光学系统中,对图像处理有着其独特的需求特点: 1 由于大气湍流变化速度的影响,自适应光学波前探测要求高帧频,一般 为数百赫兹到数千赫兹,实时性要求很高。 2 背景较强,随时间、位置的变化而变化,强弱不定,难以分辨,目标对 比度低,运算量大,对算法有很高的要求。 由于自适应光学系统中这些不利因素和需求特点的存在,所以对图像处理 平台部分的实时性和运算处理速度提出了很高的要求。如果不能提高图像处理 的速度,那么图像处理模块势必会成为整个波前处理过程中的瓶颈,会对整个 系统的性能产生制约,出现不可忽略的影响。所以,提高图像处理模块的性能 是改善波前处理机性能的重要前提。 目前,在项目提供者所在单位的波前处理机中,并没有专门针对图像处理 的平台。所以,研制专门的高速图像处理平台势在必行。 1 3 现状分析 目前图像处理系统的实现方法一般有下面几种f 3 m ,: 1 在通用计算机上用软件实现。软件可以由用户自己编写,也可以使用现 成的软件包。这种方法的缺点是速度慢,一般只能用于算法验证、仿真研究或 西南交通大学硕士研究生学位论文第3 页 信号的离线处理,而不适合于实时系统,一般可用于d s p 算法的模拟。 2 在通用计算机系统中加上专用的加速卡实现。加速卡可以是通用的加速 处理机,也可以是由用户使用d s p 开发的加速卡。如果加速卡是用户开发的, 随着d s p 芯片价格的下降和性能的提高,这一方法比较常用。但当数据处理量 较大时,加速卡和计算机之间的数据交换速度就成为瓶颈,因而通用计算机一 般只能起到管理者的作用,而不直接参与图像的实时处理。 3 用通用单片机实现。这种方法可用于一些不太复杂的数字信号处理,如 数字控制等。由于单片机普遍采用的是总线结构,数据运算速度慢,在运算量 大的实时控制系统中很难有所作为。 4 用通用可编程d s p 芯片实现。与单片机相比,d s p 芯片具有更加适合 于数字信号处理的优点:普遍采用改进的哈佛总线结构,内部有硬件乘法器、 累加器,使用流水线结构,具有良好的并行特性,并有专门设计的适合于图像 信号处理的指令系统等。这种方法在实时d s p 领域居于主导地位。 5 用专用的d s p 芯片实现。在一些特殊的场合,要求的信号处理速度极 高,用一般的通用d s p 芯片也很难实现。但有一些专用芯片将常用的信号处理 算法( 如f f t 、卷积相关等) 在芯片内部用硬件实现,无须进行软件的编程。这 种方案的缺点是灵活性差、成本高,专用性强,主要用于要求图像信号处理速 度极高的特殊场合。 6 用d s p + f p g a 实现。随着数字信号处理器( d s p ) 和现场可编程门阵列器 件( f p g a ) 的发展,采用d s p + f p g a 结构的信号处理系统显示出其优越性,正 得到越来越多的重视。f p g a 是在a s i c 的基础上发展起来的,采用d s p + f p g a 结构最大的特点就是结构灵活、通用性强、适于模块化设计,从而提高了算法 效率;同时具有开发周期短、系统易于维护和扩展等特点,适合于高速实时图 像信号处理。 由于采用d s p 和f p g a 取代了计算机,使得设计的图像识别系统具有体积 小、成本低的特点,也能够很好的解决系统体积、成本在实际应用中带来的问 题,有些成果已经取得了较好的社会经济效益和广阔的应用前景。 柯丽嘲等针对在通用计算机上用软件实现图像处理几乎要占用c p u 全部 开销,且速度相对慢的问题,指出数字信号处理器( d s p ) 的可编程性和强大的处 理能力使其可用于快速实现各种数字信号处理算法,在图像处理领域,尤其在 实时图像处理系统中得到了广泛应用和发展,并且介绍了d s p 芯片及其在实时 图像处理系统中的开发、应用及发展方向。 马锐 8 1 等针对在卫星观测系统中c c d 相机对高精度图像实时跟踪时,为得 西南交通大学硕士研究生学位论文第4 页 到高信噪比高分辨率的图像,必须对图像进行实时相关处理,而现有软件实现 速度不高,不能实现其实时性这一问题,提出并设计了基于d s p + f p g a 的实时 数字图像处理系统。仿真和调试结果表明:用f p g a 与高速数字信号处理算法 的结合,可以满足系统对图像进行实时处理的要求。 吕亮1 6 1 等指出d s p + f p g a 系统最大优点是结构灵活,有较强的通用性,适 合模块化设计;同时开发周期较短,系统易于维护和扩展,因此特别适合应用于 实时信号处理系统。同时也指出了设计d s p + f p g a 实时信号处理系统的关键问 题和需要注意的问题。 在本系统实时图像信号处理中,低层信号预处理算法处理的数据量大,对 处理的速度要求高,但运算结构相对比较简单,可以采用f p g a 硬件实现,这 样同时兼顾速度和灵活性。而本系统高层处理算法的特点是其算法的控制结构 复杂,处理的数据量不算太大,可以采用运算速度高、寻址方式灵活、通信机 制强大的d s p 芯片来实现。基于上述方案的分析,本系统采用d s p + f p g a 的 硬件方案,既可以充分发挥d s p 和f p g a 的优点,又可以充分利用d s p 和f p g a 的资源。在本设计中,采用了优良的硬件结构,使得系统配置更加灵活,易于 扩展和升级;高性能的集成p c i 接口控制器提高了与主机的数据交换速度,从 而提高了整个系统运行的效率。通过p c b 制作和调试仿真,最终实现一个高性 能的图像处理系统硬件平台。 1 4 论文工作 本文提出了基于d s p 和大规模可编程器件f p g a 的硬件实现方案和相关的 软件实现方案。在项目开发过程中,高速图像处理平台的设计被划分为三个部 分:即硬件系统设计、硬件系统的主机驱动程序设计、图像处理的d s p 软件设 计。本人主要负责硬件系统设计,为系统功能的实现提供硬件支持。主要工作 如下: 1 完成了图像处理硬件模块方案和整个电路的设计,构建了满足应用要求 的整体系统; 2 深入分析各部分原理,并结合高速p c b 理论,完成整个原理图和p c b 图的绘制; 3 用v h d l 语言编写可编程器件内部程序,可以实现f p g a 对c c d 实时 数据的接收及控制s d r a m 的读写操作; 西南交通大学硕士研究生学位论文第5 页 4 完成了硬件系统的测试及部分调试。 1 5 论文安排 本文着重讨论了高速图像处理系统的硬件平台的实现方案与设计细节。本 论文章节安排如下: 第一章:论文绪论部分,包括课题研究意义、任务、国内外研究现状及相 关技术发展动态。 第二章:分析图像处理板的需求,确定主要器件的选型和与主机接口方式 的选择,并介绍了主体器件的突出特点和功能。 第三章:图像处理板的设计方案,和硬件系统中关键模块的实现。主要包 括d s p 的接口设计、f p g a 的电路设计及一些重要的外围电路的设计。并给出 了部分重要的原理图。 第三章:介绍了p c b 设计的一些基本概念,阐述了进行高速p c b 电路设 计时要遵循的原则及在本次设计中实际的应用于实现。 第五章:图像处理板的f p g a 逻辑设计,主要包括了图像接收模块和 s d r a m 控制器的设计,介绍了上述模块的工作原理并详细阐述了设计方案, 最后给出了仿真图。 第六章:硬件系统的测试调试过程及部分结果。 结束语:总结了论文的工作并提出了今后的工作重点。、 西南交通大学硕士研究生学位论文第6 页 第2 章图像处理板硬件选择方案 设计一个功能完善的图像处理硬件平台,除了要有正确的电气连接、合理 的p c b 布局布线以及优化的图像处理算法外,在设计的最初,根据该平台的设 计功能及待处理图像数据的特点进行主要器件的选型,深入的了解器件的功能 和结构,是整个设计过程中的第一步。 2 1d s p 器件的选型及芯片介绍 2 1 1d s p 芯片的选型 d s p 是整个图像处理板的核心器件,对图像处理平台的性能有至关重要的 影响,对图像处理技术而言,由于要处理的数据量大,计算复杂,计算中间结 果精度要求高,因此需要选择合适的d s p 芯片。d s p 芯片的选择根据实际的应 用系统的需要确定。以下介绍在d s p 器件选择设计时考虑的一些因素。 1 确定选择定点或浮点d s p 。数字信号处理算法的数据格式有定点和浮 点之分,而数字信号处理系统采用的数据格式决定了它所处理信号的处理精度、 动态范围和信噪比,且不同数据格式的易用性和开发难度也不一样。选择定点 或浮点d s p ,首先要看模数转换时需要的比特数,如果图像的每个像素小于 1 6 b i t ,则用1 6 b i t 定点d s p 即可:如果大于1 6 b i t ,则需要用浮点d s p 来捕捉 更大的动态范围。其次考虑算法的复杂度和经济问题。一般说来,浮点d s p 芯 片的运算精度高,动态范围大,寻址空间大,指令运算能力较强,但功耗大、 成本高、体积较大。定点d s p 芯片的运算精度与浮点d s p 芯片相同( 数据位数 和浮点芯片相同的情况下) ,而功耗、成本、体积与浮点d s p 芯片相比较小, 且易于实现,稳定性好。 在本设计中,主要处理的图像数据来自d a l a s 公司的d s 1 2 1 6 k 5 h c c d 相 机,图像信号的每个像素量化为1 2 b i t ,波前处理机的图像采集模块将其处理成 1 6 b i t 的数字图像,以供d s p 处理,因此,选择定点d s p 完全可以满足设计的 要求。 2 根据d s p 芯片运算速度选择具体芯片。运算速度是d s p 芯片的一个最 西南交通大学硕士研究生学位论文第7 页 重要的性能指标,也是选择d s p 芯片时所需考虑的一个主要因素。d s p 芯片的 运算速度一般采用d s p 的指令周期、单周期的乘加次数或采用数字信号处理中 的基准程序,如用h 叮和数字滤波等的执行时间来测评d s p 芯片的速度性能。 最新的t m s 3 2 0 c 6 4 1 6 为3 2 b i t 定点d s p ,主频最高可达1 1 g h z 。在c p u 时钟 频率为7 2 0 m h z 时,其运算能力高达5 7 6 0 m i p s ( 百万条指令秒) ,在提高主频 的情况下运算能力还会更高,能够满足图像数据处理的实时性要求。 2 1 2t m s 3 2 0 c 6 4 1 6 的结构与工作原理 除了对定点、浮点以及运算速度的选择外,t m s 3 2 0 c 6 4 1 6 还有其他的一些 特点成为了本设计考虑的重要因素: 1 两级c a c h e 缓存结构( l 1 l 2 ) ,片内集成大容量s r a m ,可达到1 0 5 6 m ; 2 6 4 16 b i t 高性能外部存储器接口( e m i f a 和e m i f b ) : 3 片内提供多种集成外设。 下面给出的是t m s 3 2 0 c 6 4 1 6d s p 的内部结构图,如图2 2 所示。 由图2 2 可知,t m s 3 2 0 c 6 4 1 6d s p 由c p u 内核、二级c a c h e 缓存结构的 片内存储器、e d m a 控制器、片内集成外设、e m i f 接口以及时钟、j t a g 接 口、p l l 锁相环、省电逻辑等部件组成,下面对芯片的关键部分做一介绍。 2 1 2 1t m s 3 2 0 c 6 4 1 6 内核 d s p 核心部件就是c 6 4 x c p u 内核。c 0 4 x c p u 内核包括以下三个组成部分: 1 程序读入及指令译码、分配机构 包括程序取指单元( i n s t r u c t i o nf e t c h ) 、指令分配单元( i n s t r u c t i o nd i s p a t c h ) 和指令译码单元( i n s t r u c t i o nd e c o d e ) 。程序取指单元通过程序总线与片内程序存 储器相连1 7 1 。 2 程序执行机构 包括两个对称的数据通路( d a t ap a t hl ,p a t h2 ) ,两个对称的通用寄存器组( a br e g i s t e rf i l e ) ,两边对称的功能单元( l 1 ,l 2 ,s l ,s 2 ,m 1 ,m 2 ) 。 3 控制逻辑 包括控制寄存器组( c o n t r o lr e g i s t e r s ) 、仿真逻辑( l o g i ce m u l a t i o n ) 以及中断 控 j ( i n t e r r u p tc o n t r 0 1 ) 。 西南交通大学硕士研究生学位论文第8 页 嘲b - 瞅d l 一期喇_ i 一- w ,t 卜+ + 一点巍 l 豫_ h 嚣一 i - l t a i i _ 聃咖 i i - 姒一 毒一 1 f i g 卜 + lz f 酞l b p 嘲 if n n - tb - 一f - 口触 - - ii 嘲k 撕,k 一 - 一 h 蛔t 瞳 l 翻啊t 枷h + - - 一一一o _ _ t i p l 帕- _ h1 _ - k l 瞳哺哺b _ a 知幽r f - l 羁b 妇啊 j l l i - - a 1 ll _ i 蜘- 蕾1 翔一 i a t 4嗍 i矗制埘i i n 4 :w a t 一4 - - r ll;卜一时lll n o 瞅 , 4 - - l a l 上 i i nl期 盥盥越上l u d m m d 簟一一 u o a n k 一 r l i e o h , l 0 融_ l 撼 嘲- r _ 讲n -a n m e a - 4 - - i h t w 帆 : r 1 e 1 :盯o m m e e , o n e m 嘲o _ _ 矗i 秘棚- - - 、_ - 一m 1 q k 白- 1 一 二 嘲 a 叼雠 毒l 一- 一- 哪i 札f q m i s m m 臼山斌蚋置 0 _ - q l 。 _ j a i l 柚r l 图2 - 2t m s 3 2 0 c 6 4 1 6 内部结构【l 刁 t m s 3 2 0 c 6 4 1 6 采用新的v c l o c i t i 2 甚长指令字扩展结构,比上一代的 c 6 2 x c 6 7 x 系列相比,在以下的几个方面有所改善 1 寄存器组增强 寄存器组增强到两倍,c 6 2 x 的a ,b 两寄存器分别为1 6 个,而c 6 4 x 分 别为3 2 个:c 6 2 x 利用a 1 、a 2 、b 0 、b 1 和b 2 作为条件寄存器,而c 6 4 x 也 可利用a 0 作为条件寄存器,使寄存器有了6 个;c 6 2 x 寄存器组支持1 6 b i t 、3 2 b i t 、 4 0 b i t 包数据类型,而c 6 4 x 寄存器组又增加了8 b i t 和6 4 b i t 包数据类型 2 扩展了数据通路 c 6 4 x 的每个d 单元用单指令可以加载和存储双字( 6 4 b i d ,而c 6 2 x 不能在 单指令中夹杂和存储6 4 b i t 值;c 6 4 x 的d 、l 、m 、s 等功能单元都能通过交叉 西南交通大学硕士研究生学位论文第9 页 通路访问操作数,而c 6 2 x 只能在d 单元的地址交叉通路访问;c 6 4 x 可以用流 水线方式进行数据交叉通路访问,利用同一指令包的多个功能单元,这一访问 使得同一寄存器可用于数据交叉通路的操作数,而c 6 2 x 中,每边只允许一个 交叉操作数。 3 数据打包处理 有一些指令已直接加到包数据上,使得数据流更有效且增加了指令集的效 率。c 6 4 x 广泛的收集了4 个8 b i t 和2 个1 6 b i t 的扩展指令集;大量的收集了一 些打包和不打包的指令,从而简化了包数据类型的操作管理。特别是在图象处 理中,对于8 位和1 6 位的图像像素的处理提供了很大的可并行执行度。 2 1 2 2 s 3 2 0 c 6 4 1 6 的存储器及c a c h e 组织结构 t m s 3 2 0 c 6 4 1 6 采用的是两级c a c h e 结构 2 0 l ,第一级包括程序c a c h e ( l i p ) 和数据c a c h e ( l 1 d ) ,各1 6 k 字节,第二级( l 2 ) 大小为1 0 2 4 k 字节,可配置为 不同大小的c a c h e 和s r a m ,为程序和数据共用。l i p 采用的是直接映射( d i r e c t m a p p e d ) 机制,即l 2 中的某个地址只能被缓存到l 1 p 的某个固定位置,映射块 大小为1 6 k 字节。l 1 d 采用的是两路组联想映射( 2 w a ys e ta s s o c i a t i v e ) 机制, 即l 2 中某个地址可被缓存到l i d 的两个位置,映射块大小为8 k 字节。当c p u 访问数据或取指令时,如果l i p 或l i d 命中,只需要一个时钟周期。如果l 1 p 不命中而l 2 命中,需要8 个时钟周期,如果l i d 不命中而l 2 命中,根据l 2 配置为c a c h e 或者s r a m 的不同而需要8 或6 个时钟周期。如果l l 和l 2 都 不命中,需要的时间由外部存储器类型而定,如果在执行流水线某条指令的过 程中发生l i p 或l 1 d 不中,则不仅时访问的数据的时间消耗更多,而且会导致 流水线无法进行直到取到所需要的数据。 因此,最快速执行程序的关键是使核心循环代码和要访问的数据在第一次 访问后全部发生l 1 p 和l 1 d 命中。一般图像处理中核心循环代码所占用的空间 都很小,执行过1 次后,完全可以全部缓存在l i p 中。 2 1 2 3 扩展内存直接访问e d m a 工作原理及应用 直接存储器访问( d m a ,d i r e c tm e m o r ya c c e s s ) 是c 6 0 0 0d s p 中一种重要的 数据访问方式,它可以在没有c p u 参与的情况下,由d m a 控制器完成d s p 存储器空间内的数据搬移。数据搬移的源目的可以是片内存储器、片内外设或 者外部器件。 图像处理系统的最大特点是就是运算数据量大,数据量往往大于片内存储 器容量。不仅如此,图像处理系统之中,运算过程产生的中间数据往往与源数 据大小相当,这也限制了片内高速存储区的使用。然而为了提高处理的速度, 西南交通大学硕士研究生学位论文第10 页 计算源数据、中间数据必须尽可能多地在片内高速存储区进行,因此,必须使 用d m a 在片内高速存储区与片外低速存储区之间进行数据交换,以提高数据 处理速度。 另外,数据的排列往往不符合程序的要求;必须对数据进行重排达到程序 要求;使用d m a 对数据重排,可以满足程序要求。与数据重排如出一辙,图 像处理中许多操作的基础都是对多重数组的操作,也就是矩阵运算。诸如求逆、 取子图等图像处理中经常用到的运算,也可以通过d m a 完成。这些运算当然 可用c 语言编程实现,但是,如果程序实现是一个多重循环,不利于软件流水, 而且随着数据量的增加,消耗的时钟周期也会成比例增加;即使使用并行汇编 在时钟消耗上可以有所减少,这都是不符合系统实时性要求的。如果通过d m a 数据重排,可以轻而易举地实现,而且这个过程c p u 只占有一个时钟周期,通 过巧妙程序安排,安全可以使数据的传输过程在c p u 的后台进行,根本感觉不 到d m a 的存在。 而扩展直接内存访f - ( e d m a ) 是c 6 2 1 x c 6 4 x 特有的访问方式。e d m a 控制 器负责片内l 2 存储器与其它外设之间的数据传输。与d m a 在结构上有很大不 同。t m s 3 2 0 c 6 4 1 6 的e d m a 增强之处包括:提供了“个通道( c h a n n e l ) ,每个 通道之间相互独立,因此,e d m a 具有多通道数据迸发传输能力,以充分利用 e d m a 带宽:通道间的优先级可以设置;支持不同结构数据传输的链接 ( c h a i n i n g ) t q 。 使用e d m a 配合c p u 进行图像处理时,经常会用到的是一种乒乓缓冲的 处理方式,每次数据传输都存在乒和乓两个用于输入输出的数据流缓冲区。当 e d m a 对乒缓冲区进行数据的输入和输出时,c p u 处理乒缓冲区的数据。当 e d m a 将数据传输和c p u 将数据处理都完成后,乒缓冲区的数据就乓缓冲区 的数据指针进行交换。因此e d m a 输入的数据被c p u 处理之后马上将输出的 地址改为另外一个缓冲区的首地址,这样交替进行,完全实现了数据传输和数 据处理的并行执行,增强了图像数据处理的实时性。 2 1 2 4e m i f 总线 d s p 访问片外存储器时必须通过外部存储器接口( e x t e r n a lm e m o r y i n t e r f a c e ,e m i f ) ,t m s 3 2 0 c 6 4 1 6 的e m i f 具有很强的接口能力,不仅具有很 高的数据吞吐率( 最高可达1 2 0 0 m b s ) ,而且几乎可以与目前的所有类型的存 储器直接接口,包括: p i p e l i n e 结构的同步突发静态r a m ( s b s r a m ) 同步动态r a m ( s d r a m ) 西南交通大学硕士研究生学位论文第1 1 页 异步器件,包括s r a m 、r o m 、f i f o 等 外部共享存储空间的设备 t m s 3 2 0 c 6 4 1 6 具有2 个独立的e m i f 接口ge m i f a 和e m i f b 。其中,e m i f a 提供6 4 b i t 宽度的外总线数据接口,e m i f b 提供1 6 b i t 宽度的外总线数据接口。 它增强了原有的s b s 删接口,提供了可编程的同步接口模式,可以支持以 下类型器件的无缝接口: z b t s r a m 同步f o p i p e l i n e 结构和f l o w - t h r o u g h 结构的s b s r a m 0 3 1 。 e m i f 时钟e c l k o u t x 基于e m i f 的输入时钟在片内产生。用户可以选择 三种时钟源:1 6 x c p u 主频、l “c p u 主频和外部输入e c l k i n 。所有的e m i f 接口都由e c l k o u t x 同步。e c l k o u t i 等于e m i f 输入时钟,e c l k o u t 2 可 以设置为e m i f 输入时钟的l 、2 或4 分频。 2 1 2 5p c i 接口 芯片内部结成了一个主从模式的p c i 接口,通过p c i 总线可以实现d s p 和p c i 主机的互连,对于c 6 2 x c 6 7 x ,p c i 接口由辅助d m a 通道和d s p 相连, 对于c 6 4 x ,由e d m a 的地址产生硬件与d s p 相连,辅助d m a 通道或者e d m a 资源仍然可以被其他片内资源调用1 2 9 1 。 3 2 b i t 地址数据总线,3 3 m h z 时钟,功过p c i 接口可以访问d s p 整个片内 r a m ,集成外设以及片外存储器。支持存储器读、存储器多行读、存储器一行 读和存储器写命令。主模式访问b u r s t 长度最大为6 4 k b ,从模式访问b u r s t 长 度可以无限1 2 7 1 2 1 1 。 p c i 接口支持以下4 种类型的p c i 数据交换: 1 从模式写:外部p c i 主设备通过p c i 接口写数据到d s p 从设备。 2 从模式读:外部p c i 主设备通过p c i 接口从d s p 从设备读取数据。 3 主模式写:d s p 主设备通过p c i 接口写数据到外部p c i 从设备。 4 主模式读:d s p 主设备通过p c i 接口从外部p c i 从设备读取数据。 在后面的章节将对本设计为什么选择p c i 接口实现与主机的连接进行分 析。 西南交通大学硕士研究生学位论文第1 2 页 2 2f p g a 的选择及实现功能 2 2 1f p g a 在设计中实现的功能 在本设计中,f p g a 内部主要集成了图像接收模块、图像预处理模块、 s d r a m 控制器模块、板上功能控制模块等。下面介绍一下各个主要模块的功 能。 1 图像接收模块 7 该模块的主要功能是把c c d 相机输入的图像信号缓存到板上的存储器中。 2 图像预处理模块 虽然采用了高性能的d s p ,但是它仍难以单独胜任大量图像数据的实时处 理任务,所以,要选择有强大运算能力的f p g a ,要求可以通过并行处理的方 式处理如中值滤波等大量耗时的累乘加运算。这个步骤大大减小了d s p 的工作 量,提高了系统的运算速度,满足了实时性的要求。 3 s d r a m 控制器模块 在本系统中,f p g a 对s d r a m 的控制是一个重要环节。f p g a 通过状态 机实现对s d r a m 的控制。从外部c c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论