已阅读5页,还剩61页未读, 继续免费阅读
(控制理论与控制工程专业论文)基于dsp的图像识别系统.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
贵州大学硕士学位论文 摘要 本文对机器人视觉系统的实用性方面展开研究和开发。利用3 2 位微处理器 t m s 3 2 0 c 6 4 1 6 d s p 作为硬件开发平台,进行图像采集,实现图像处理,以便向机器人 控制软件提供目标信息,构成视觉闭环控制系统。 数字信号处理器( d s p ) 运行速度快,能够完成复杂的控制算法,建立高精度控 制系统。本课题是以一个单片t m s 3 2 0 c 6 4 1 6 为核心处理器,主要针对高速数据采集 和高速密集数据处理,基于d s p 在嵌入式机器人视觉系统的应用研究。本论文主要 觯决了以下几个问题:( 1 ) 基于v c + + 建立一个通过p c i 接口实现d s p 与p c 之间的 通信,进行p c 与d s p 的高速大数据量数据交换;( 2 ) 进行视频信号的数据采集及转 化,获取图像。并在p c 机上以位图的形式显示出来;( 3 ) 模式识别。在p c 机上用 v c + 十建立一个通用图像处理系统实现通用图像处理算法。提出了种新的算法, 通过对物体标识,然后对物体进行特征抽取及分类,能够自动识别出目标物体,并获 取其空间坐标、方向、姿态针对摄取的图像较大,像素较多,因此要处理的数 据量非常大的特点,此算法通过遍历三邻域就能够取得很好的效果。 关键词:机器视觉数字信号处理器( d s p ) 模式识别图像采集 数字图像处 理 自动识别 中图分类号:t p 2 2 9 贵州大学硕士学位论文 a b s t r a c t 1 1 1 ep a p e rr e s e a r c h e sa n dd e v e l o p st h eu t i l i t yo ft h em a c h i n ev i s i o ns y s t e m t h e o p t i c a li n s t r u m e n tp r o j e c t sa s c e n eo n t ot h ei m a g ep l a n e t h ec o m p u t e rm u s ts a m p l et h e i m a g e a taf i n i t en u m b e ro fp o i n t sa n dr e p r e s e n te a c hs a m p l ew i t h i nt h ef i n i t ew o r ds i z eo f t h ec o m p u t e r t h r o u g hi m a g ep r o c e s s i n gw h i c hp r o c e s sa b o v ed a t a , t h eh o s tc o m p u t e r o f f e rt h er o b o tt h ei n f o r m a t i o no ft h eo b j e c t w h i c hc a nb u i l dad o s e d c i r c l ev i s i o nc o n t r o l s y s t e m t h eh i g hp r o c e s s i n gs p e e do fd s pa l l o w ss o p h i s t i c a t e dc o n t r o lt e c h n i q u e st ob eu s e d t ob u i l dah i g h - p r e c i s i o nc o n t r o ls y s t e m t h ep a p e rr e s e a r c h e sm a i n l yh o wt os a m p l ed a t a s p e e d i l ya n dp r o c e s st h e s ed e n s ed a t aw i t hu s i n g3 2 - b i td i g i t a ls i g n a lp r o c e s s o r ( d s p ) t m s 3 2 0 c 6 4 1 6a tt h eb a s i co fe m b e d d e dm a c h i n ev i s i o ns y s t e m i tp e r f o r m sp r i m a r i l yt h e f o l l o w i n g w o r k s :( 1 ) p e r f o r mt h ec o m m u n i c a t i o nb e t w e e nd s p m a dt h eh o s tc o m p u t e rw i t h t h ep c ip r e f a c e ,a n dc a nt r a n s f e rq u a n t i t yd a t a ;( 2 ) s a m p l ea n dq u a n f i t a t et h ed i 百t a l i n f o r m a t i o no n t oi m a g ep l a n e ,a n dd i s p l a yi to nb i tm a po ft h eh o s tc o m p u t e r ;( 3 ) b u i l da g e n e r a li m a g ep r o c e s s i n gs y s t e mo nh o s tc o m p u t e r , w h i c hc a l lu t i l i z et h ea r i t h m e t i co f i m a g ep r o c e s s i n g t h r o u g hm a r k i n g t h e s eo b j e c t so nt h ei m a g e ,o b t a i n i n ga n d c l a s s i n gt h e t r a i t so ft h eo b j e c t s t h ea l g o r i t h m so ft h ep r o c e s s i n gc a ni d e n t i f yt h eo b j e c ta u t o m a t i c a l l y a n do b t a i nt h ec o o r d i n a t e ,o r i e n t a t i o n ,m o v e m e n to ft h eo b j e c t , e t c b e c a u s et h ep r o c e s s e d d a t ao ft h ei m a g ei ss oe x c e s s i v e ,g e n e r a la l g o r i t h m sc a nn o ta p p l yi ni to rs p e n dal o to f t i m ei ni t t h ea l g o r i t h m sw h i c hr e s e a r c ht h et h r e ea d j a c e n ta r t :ac a ng e tt h es a t i s f i e d p u r p o s ec o m p a r a t i v e l y k e y w o r d s :m a c h i n ev i s i o n ,d i g i t a ls i g n a lp r o c e s s o r ( d s p ) ,p a t t e r nr e c o g n i t i o n ,i m a g e s a m p l i n g ,d i g i t a li m a g ep r o c e s s i n g , a u t o m a t i ci d e n t i f i c a t i o n 贵州大学硕士学位论文 第一章绪论 1 1 引言 数字图像处理,即用计算机对图像进行处理。与人类对视觉机理着迷的历史相比, 它是一门相对年轻的学科。但在其短短的历史中,它却广泛应用于几乎所有与成像有 关的领域。由于其表现方式( 用图像显示) 所固有的魅力,它几乎吸引了从科学家到 平民百姓的普遍关注。 数字图像处理技术从广义上可看作是各种图像加工技术的总称。它包括利用计算 机和其它电子设备完成的一系列工作,如图像采集、获取、存储和传输,图像的合成 和产生,图像的显示、绘制和输出,图像变换、增强、恢复和重建,特征的提取和测 量、表达和描述,序列图像的校正,图像数据库的建立、索引、查询和抽取,图像的 分类、表示和识别,图像模型的建立,图像知识的利用和匹配,图像和场景的解释和 理解,以及基于它们的推理、判断、决策和行为规划,等等。另外图像处理技术还包 括为完成上述功能而进行的硬件和系统的设计及制作等方面的技术。 图像处理和模式识别的结合扩展了人的视觉功能,并且打开了一个新的计算机应 用领域计算机视觉。计算机视觉起源于5 0 年代的统计模式识别,真正的应用研 究是在1 9 7 5 年以后,进入8 0 年代以后,机器视觉的理论和算法的研究进展迅速,新 的观点及方法层出不穷。 计算机视觉的主要任务是开发具有类人视觉能力的计算机控制系统,用各种成像 系统代替视觉器官作为输入,由计算机代替大脑完成处理。近年来,计算机视觉理论 和机器人之问的融合更加紧密,高性能的视觉传感器逐渐成为机器人感受外部信息的 主要单元,从面使机器人能够获得更完整的外部环境信息,具有更高的自主性,从而 在各行各业取得了广泛的应用。面向机器人的计算机视觉系统研究围绕系统的实用性 和实时性正在广泛展开,一个快速、高效的机器人视觉系统往往是图像处理、光学成 像、机电设计、智能控制多项技术综合协调作用的产物。 1 2 图象处理技术应用概况 图象处理技术起源比较早,但真正发展是在八十年代后,随着计算机技术的高速 发展而迅猛发展起来。到目前为止,图象处理在图象通讯、办公自动化系统、地理信 息系统、医疗设备、卫星照片传输及分析和工业自动化领域的应用越来越多。但就国 内的情况而言,应用还是很不普遍,人们还在忙于理论研究,诸如探索图象压缩编码 等,而对于将成熟技术转化为生产力方面似乎认识不够。 目前国内应用最多的方面是多媒体方面,由于受到带宽的限制,可视电话及会议 系统方面的应用并不成熟。而目前技术最成熟、应用面最广的工业自动化领域及医疗 设备方面,国内应用较少。 贵州人学硕士学位论文 现在国内集中了一批图象技术公司,但他们主要以销售一些图象卡和代理国外的 图象产品为主,而在技术含量最高的软件开发包方面,他们做得很少。 目前基于图象处理的工业自动化设备采用摄像头的控制系统较常用的结构如图 1 所示。通过摄像头获取目标的图像,取得的视频信号通过图象卡数字化后存储到内 存中,经计算机处理,然后发信号给控制器,控制器再驱动步进或伺服电机,从而形 成一个闭环控制。作为一个带闭环的工业自动化系统,一般都包括机械部分、下位机 ( 单片机) 及上位机( p c 机) 。采用图象处理技术的控制系统一般将图象处理的结果 作为电机微调或一些信号量的输入。例如点胶机,在工件进给后,对其进行位置检测, 然后进行微调。在对点胶量进行检测后,决定下一次点胶的时间。在这样一个系统中, 图象处理是关键,所有的反馈量都是经图象处理后得出。 图1 1 系统结构简图 “1 油工业领域在基于视觉的机器人控制技术方丽已取得了显著成果,具有潜在巨 大的发展空间,采用视觉对机器人操作手进行控制的研究正在世界范围内广泛开展 目前计算机视觉系统的图像处理系统主要利用高速a d 卡( p c i b u s ) 进行图像的输入, 基于p c 来完成图像识别、处理。 自从上世纪7 0 年代末第一片数字信号处理器芯片( d i g i t a ls i g n a l p r o c e s s o r s ,d s p s ) 问世以来,d s p s 就以数字器件特有的稳定性、可重复性、可大规 模集成,特别是可编程性高和易于实现自适应处理等特点,给数字信号处理的发展带 来了巨大机遇,并使信号处理手段更灵活,功能更复杂,其应用领域也拓展到所有领 域。近年来,随着半导体制造工艺的发展和计算机体系结构等方面的改进,d s p s 芯 片的功能越来越强大,使信号处理系统的研究重点又重新回到软件算法上,特别是在 贵州大学硕士学位论文 图像实时处理领域能够实时处理的信号带宽已经有了长足进展,由于4 8 亿次 ( 4 8 0 0 m 1 p s ) d s p 数字信号处理器的出现,人工视觉信号的处理已经成为可能,绝大 部分应用也由最初的非实时应用转向高速实时应用。 所以,用带有d s p 的图橡卡来代替传统的图像卡将成为图像处理领域发展的一个 新方向。 1 3 数字信号处理器( d s p ) 的特点 d s p s 在实时处理速度上要远远地快于普通的微处理器。而它们带进电子市场的 最有价值的则是可与时钟赛跑的超高速的运算能力。其具有最高速性能: r i m s 3 2 0 c 6 4 xd s p 平台将向市场提供速度可快达1 1g h z 性能的d s p s ,这个性能可 为如无线宽带网络和数字化图像处理等方面提供良好的实时性应用。它同时也继承了 从易到难的具有世界上最好的c 编译器的效率的d s p s 传统。 d s p 芯片,是一种具有特殊结构的微处理器。它的内部采用程序和数据分开的哈 佛总线结构,具有专门的硬件乘法器,辅助算术逻辑单元以及广泛采用流水线操作, 提供特殊的d s p 指令,使d s p 芯片的运行速度明显加快,成为实现各种复杂算法首 选的微处理器。同时,它还具有以下优点: ( 1 ) 接口方便。d s p 系统与其它以现代数字技术为基础的系统或设备都是相互兼 容的,便于相互间通信和交换数据。 ( 2 ) 编程方便。d s p 系统中的可编程d s p 芯片可使设计人员在开发过程中灵活方 便地对软件进行修改和升级。 ( 3 ) 稳定性好。d s p 系统以数字处理为基础,受环境温度以及噪声的影响较小, 可靠性高。 ( 4 ) 精度高。 t m s 3 2 0 c 6 4 1 6 为t m s 3 2 0 c 6 0 0 0 系列的高性能定点d s p 处理器,板上d s p 的计 算能力可达到4 g i p s ,可以做实时的视频和音频的采集、压缩和播放,或其它高速的 d s p 心用。其工作频率可为4 0 0 ,5 0 0 ,6 0 0 ,7 2 0 m h z 。 1 4 总体方案与研究目标 本课题作为贵州省科技基金研究项目“嵌入式计算机视觉研究”的基础部分,对 机器人视觉系统的实用性和实时性方面展开研究和开发。利用3 2 位微处理器 t m s 3 2 0 c 6 4 1 6 d s p 作为硬件开发平台,将图像采集在d s p 中高速完成,并将图像通 过p c i 总线传送到主机,利用v c + + 构建图像识别系统,以便向机器人控制软件提供 目标信息,构成视觉闭环控制系统,并为今后的图像处理的完全嵌入式实现打下基础。 本课题是以一个单片t m s 3 2 0 c 6 4 1 6 为椽b 处理器,主要针对高速数据采集和高 速密集数据处理,基于d s p 在嵌入式机器人视觉系统的应用研究。本论文的主要内 容为; 贵州大学硕士学位论文 ( 1 ) 基于v c + + 建立一个通过p c i 接口实现d s p 与p c 之间的通信,进行p c 与 d s p 的高速大数据量数据交换。 ( 2 ) 进行视频信号的数据采集及转化,获取图像。并在p c 机上以位图的形式 显示出来。 ( 3 ) 模式识别。在p c 机上用v c + + 建立一个通用图象处理系统,实现通用图象 处理算法。能够自动识别目标物体,并获取其空间坐标、姿态。 本方案的硬件系统设计: 硬件分为两大模块( 如图1 2 所示) 1 视频模块 能够捕捉和产生鼢i l 和w r s c 制式的模拟视频信号。模拟视频输入到视频解码芯 片( b t 8 3 5 ) ,通过f p g a 进行图像的预处理,转换成数字信号,再传输到视频f i f o 中,d s p 通过d m a 方式读取数据。f p g a 回路中有两个作用:把数据写入f i f o ;控制 帧的输入比率。 2 。d s p 处理器模块 t m s 3 2 0 c 6 4 1 6 为高性能定点d s p 处理器,在本系统中工作时钟为6 0 0 m h z 。外部 总线:e m i f a 和e m i t ( e x t e n a lm e m o r yi n t e r - f a c e ) ,总线时钟为1 0 0 m h z 。以2 2 版 本的p c i 接口作为主机接口。图像处理结果在主机c r t 3 7 显示。 图1 2 系统硬件框图 4 贵州大学硕士学位论文 本方案的软件系统设计的流程图如图1 3 所示。 p c 端程序 d s p 端程序 初始化d a m 6 4 1 6 p c i 接口 取得d s p 板卡句柄 l e l d 血n d l e j 且i 救d s p 执行文件( 图像采集及处 理) 到d s p 主机发命令使d s p 执行图像处理 及识别程序 - 等待接收d s p 图像处理及识别结果 ( 中心坐标、姿态) f 订士机薹轰赣南嚣茎图像处e 图1 3 系统软件流程图 5 贵州大学硕士学位论文 第二章数字信号处理器及其与主机通讯 2 1 实时数字信号处理 信息社会的发展,在很大程度上取决于信息与信号处理水平的先进性。数字信号 处理技术的出现改变了信息与信号处理技术的整个面貌,而数字信号处理器作为数字 信号处理的核心技术,其应用已经深入到航空、通信、家电等各个领域,成为电子系 统的心脏。 自从上世纪7 0 年代末第一片数字信号处理器芯片( d i g i t a ls i g n a l p r o c e s s o r s ,d s p s ) 问世以来,d s p s 就以数字器件特有的稳定性、可重复性、可大规 模集成,特别是可编程性高和易于实现自适应处理等特点,给数字信号处理的发展带 来了巨大机遇,并使信号处理手段更灵活,功能更复杂,其应用领域也拓展到所有领 域。近年来,随着半导体制造工艺的发展和计算机体系结构等方面的改进,d s p s 芯 片的功能越来越强大,使信号处理系统的研究重点又重新回到软件算法上,特别是在 图像实时处理领域能够实时处理的信号带宽已经有了长足进展,由于4 8 亿次 ( 4 8 0 0 m i p s ) d s p 数字信号处理器的出现,人工视觉信号的处理已经成为可能,绝大 部分应用也由最初的非实时应用转向高速实时应用。 信号处理的实质是对信号进行变换,目的是获取信号中包含的有用信息,并用更 直观的方式进行表达。数字信号处理就是用数字的方法对信号进行变换来获取有用信 息,如离散傅里叶变换( d f r ) 就是最常用的d s p 算法。这里介绍的实时信号处理就是 实时数字信号处理。 实时指的是系统必须在有限的时间内对外部输入信号完成指定的处理,即信号处 理的速度必须大于等于输入信号更新的速度,而且从信号输入到处理后输出的延迟必 须足够小。不同类型的信号所要求的实时信号处理速度相差很大。例如对一个音频信 号,假设用4 0 k h z 时钟采样,样本数据字长1 6 b i t ,则该信号的输入数据率就是8 0 k b s , 它对安时处理速度的要求是大于等于8 0 k b s 。对于一个每帧数据字长5 1 2 x s l 2 x 1 6 b i t 、 输速率为3 0 帧秒的图像信号,其输入数据率是1 5 m b s ,因而它对实时处理速度 的婴求足大于等于1 5 m b s 。由此可知,对实时信号处理速度的要求与原始模拟信号 带宽以及数据格式( 字长、维数) 等因素是密切相关的。 自从2 0 世纪8 0 年代初d s p s 投入市场以来,实时d s p 技术的国民经济和社会 生活的各个方面得到了广泛的应用。特别是随着信息技术的发展和互联网的普及,多 媒体服务器、网络可视电话( i n t e r a c tv i d e op h o n 0 以及以数据流处理为主数字化业务 的发展如雨后春笋。实时d s p 技术有了更广阔的消费品市场,其发展又有了一次空 前的机遇。 d a m 6 4 1 6 p 是基于t i 公司t m s 3 2 0 c 6 4 x 系列d s p 芯片的实时视频和音频处 贵州大学硕士学位论文 理平台。d a m 6 4 1 6 的d s p s 芯片为t m s 3 2 0 c 6 4 1 6 ,系统核心组成的应用系统具有 以下优点: 能够快速制造原理样机和进行验证,加快产品上市时间。 高度可编程性使产品能够迅速应用新算法、新标准或新协议。 可以通过软件更新,快速地进行产品升级。 1 实时d s p 系统的构成 实时信号处理系统所要处理的信号多为自然信号,因此首先需要通过传感器将自 然信号转换为电信号。另外要对自然界的信号进行数字处理,就必须通过a d 子系 统将其转换为数字形式。d s p 子系统对数字信号处理完成后,有时还需要通过d a 子系统把处理后的数字信号重新转换为模拟信号。图2 1 是一个完整的实时d s p 系统 框图,其中,d s p 予系统是整个系统的核心。下面主要介绍d s p 子系统的实现和构 成。 篡咂囝臣) 叵乎t 善 图2 1 实时d s p 系统 2 - d s p 子系统 在当前技术条件下,d s p 子系统一般有6 种实现方法: 在通用计算机上用软件实现。 在通用计算机系统中加入专用的加速处理模块。 利用通用单片机( 用于数字控制等不太复杂的数字信号处理,如i n t e l 的m c s 5 1 系列) 。 利用通用可编程d s p s 芯片。 利用专用d s p s 芯片。 利用基于通用d s p s 内核的a s i c ( 在用量较大的通信、硬盘控制等领域,一些 d s p s 厂商提供了一种通用d s p s 核的a s i c 设计和生产服务,即用户可以在通用 d s p s 的c p u 基础上选用所需要的外设接口和存储器等资源,并在片内固化所需 要的软件) 。 上述方法中,第一种方法的缺点是速度相对较慢,不适合于实时d s p ,一般只用 于d s p 算法的研究;第二种不适合于嵌入式应用,而且和第五种方法一样具有专用 性较强的特点,应用受到很大限制;第三种不适合于以乘法、加法运算为主的运算密 集型d s p 算法;第四种通用可编程d s p s 芯片,由于其可编程性和强大的处理能力, 贵州大学硕士学位论文 在实时d s p 领域居于主导地位。另外在批量应用中,基于通用d s p s 核的a s i c 由于 其较好的系统性价比在近几年得到了广泛应用。 3 以通用d s p s 为核心的实时d s p 子系统 基于d s p s 的d s p 子系统一般由控制处理器( 其控制功能可由通用微处理器或 d s p s 实现) 、d s p s 、数据传输网、存储器和输入输出接口构成。其结构框图如图2 2 所示。 图2 2 基于d s p s 的d s p 予系统结构 控制处理器完成系统控制功能,包括主机命令解释、数据传输控制和数据输 入,输出等控制功能。控制处理器可以使d s p s 专注于高速实时d s p 算法的实现。 根据具体的系统不同,控制处理器可以用通用微处理器或d s p s 独立实现,也可 以放在图1 2 中的d s p s 内实现。 d s p s完成实时信号处理算法。 数据传输网实现各个模块之间的互联,以传输数据。对于模块之间有大量数 据传输的高速d s p 系统设计,数据传输网的设计是个关键环节,它很可能成为 系统的瓶颈。 存储器支持数据存储。它的主要参数指标有存储器容量、存储器字长、访 1 日速度、对特殊寻址方式的支持和存储器管理控制能力。 输入输出接口 用于输入待处理或处理结果。输入,输出接口的主要参数有接 l 1 带宽、缓冲存储能力、数据字长、接口规程和接口所支持的输入输出个数。 上述d s p 子系统,对具体应用说其复杂程度会有很大的差异。其硬件平台可能 是以单个d s p s 为核心的个板卡,也可能是围绕多个d s p s 组成的一个分布式d s p 系统。同时由于所选用的d s p s 速度不同,以及软件d s p 算法等方面的差异,其设计 和实现难度也千差万别。 2 2d s p s 芯片的特点 数字信号处理任务通常需要完成大量的实时计算,如在d s p 中常用的f i r 滤波 贵州大学硕士学位论文 和f f t 算法。数字信号处理中的数据操作具有高度重复的特点,特别是乘加操作 y = a * b + c 在滤波、卷积和f f t 等常见d s p 算法中用的最多。d s p s 在很大程度上就 是针对上述运算特点设计的。与通用微处理器相比,d s p s 在寻址和计算能力等方面 作了扩充和增强。在相同的时钟频率和芯片集成度下,d s p s 完成f f t 算法的速度比 通用微处理器要快2 到3 个数量级( 如对于1 0 2 4 点的h 叮算法,时钟相同,集成度 相仿的i b mp c a t - 3 8 6 和t m s 3 2 0 c 3 0 ,运算时间分别为o 3 s 和1 5 m s ,速度相差2 0 0 倍) 。 d s p s 的结构特点在很大程度上体现了d s p 算法的需求。下面介绍d s p s 在结构 上的主要特点。 1 算术单元 ( 1 ) 硬件乘法器 由于d s p s 的功能特点,乘法操作是d s p s 的一个主要任务。而在通用微处理器 内通过微程序实现的乘法操作往往需要1 0 0 多个时钟周期,非常费时,因此在d s p s 内部都设有硬件乘法器来完成乘法操作,以提高乘法速度。硬件乘法器是d s p s 区别 于通用微处理器的一个重要标志。 ( 2 ) 多功能单元 为进一步提高速度,可以在c p u 内设置多个并行操作的功能单元( a u j 、乘法 器和地址产生器等) 。如e 6 0 0 0 的c p u 内部有8 个功能单元,包括2 个乘法器和6 个a l u 。这8 功能单元最多可以在1 个周期内同时执行8 条4 2 位指令。由于多功能 单元的并行操作使d s p s 在同一时间内能够完成更多的操作,因而提高了程序的执行 速度。 针对乘加运算,多数d s p s 的乘法器和a l u 都支持在1 个周期内同时完成1 次 乘法手| j1 次加法操作。另外很多定点d s p s 还支持在不增加操作时间的前提下对操作 数或操作结果的任意位移位。 另外,d s p 的算法特点和数据流特点还可以使现代d s p s 采用指令比较整齐划一 的精简指令集( r i s c ) ,有利于d s p s 结构的简化和成本的降低。 2 总线结构 通用微处理器是为计算机设计的。基于成本上的考虑,传统的微处理器通常采用 冯诺曼总线结构:统一的程序和数据空间,共享的程序和数据总线。由于总线带宽 的限制,微处理器执行指令时,取指和存取操作数共享内部总线,因而程序指令只能 串行执行。 对于面向数据密集型算法的d s p s 而言,冯诺曼总线结构使系统性能受到很大 限制。因此d s p s 采用了程序总线和数据总线分离的哈佛总线结构,这样d s v s 就能 够同时取指和取操作数了。而且很多d s p s 甚至有2 套或2 套以上的内部数据总线, 这种总线结构称为修正的哈佛结构。对于乘法或加法等运算,1 条指令要从存储器中 9 贵州大学硕士学位论文 取2 个操作数,如果采用多套数据总线就可以同时取得2 个操作数,因此提高了程序 效率。 c 6 0 0 0 系列d s p s 则采用了新的v i l w ( 甚长指令字) 结构,片内提供8 个独立 的运算单元、2 5 6 位的程序总线、2 套3 2 位的数据总线和1 套3 2 位的d m a 专用总 线。灵活的总线结构大大缓解了数据瓶颈对系统性能的限制。 3 专用寻址单元 d s p s 面向的是数据密集型应用,随着频繁的数据访问,数据地址的计算时间也 线性增长。如果不在地址计算上作特殊考虑,有时计算地址的时间比实际的算术操作 时间还长。例如,8 0 8 6 做一次加法需要3 个周期,但是计算一次地址确需要5 1 2 个 时钟周期。因此,d s p s 通常都有支持地址计算的算术单元地址产生器。地址产 生器与a l u 并行工作,因此地址的计算不再额外占用c p u 时间。由于有些算法通常 需要一次从存储器中取2 个操作数,所示d s p s 内的地址产生器般也有2 个。 d s p s 的地址产生器一般都支持问接寻址,而且有些d s p s 还能够支持位反转寻 址( 用于h 呵算法) 和循环寻址,如c 6 0 0 0 就支持循环寻址。 4 片内存储器 由于d s p s 面向的是数据密集型应用,因此存储器访问速度对处理器的性能影响 很大。现代微处理器内部一般都集成有高速缓存器( c a c h e ) ,但是片内一般不设存储 程序的r o m 和存储数据的r a m 。这是因为通用微处理器的程序一般都很大,片内 存储器不会给处理器性能带来明显改善。而d s p 算法的特点是需要大量的简单计算, 相应地其程序就比较短小,存放在d s p s 片内就可以减少指令的传输时间,并有效缓 解芯片外部总线接口的压力。除了片内程序存储器外,d s p s 内一般还集成有数据 r a m ,用于存放参数和数据。片内数据存储器不存在外部存储器的总线竞争问题和 访问速度不匹配问题,因此访问速度快,可以缓解d s p s 的数据瓶颈,充分利用d s p s 强大的处理能力。c 6 0 0 0 系列d s p s 内部集成有1 - 8 m b 的程序r a m 和数据r a m , 对有些片种,这些存储器还可以配置为程序c a c h e 或数据c a c h e 来使用。 5 流水处理 除多功能外,流水技术是提高d s p s 程序执行效率的另一个主要手段。流水技术 可以使2 个或更多不同的操作重叠执行。在处理器内,每条指令的执行分为取指、解 码和执行等若干个阶段,每个阶段称为一级流水。流水处理使得若干条指令的不同执 行阶段可以并行执行,因而能够提高程序执行速度。理想情况下,一条k 段流水能在 k + ( n 一1 ) 个周期内处理n 条指令。其中前k 个周期用于完成第一条指令的执行,其余 n 一1 条指令的执行需要n - 1 个周期。而在非流水处理器上执行i 1 条指令则需要n k 个周 期。当指令条数n 较大时,流水线的填充和排空时间可以忽略不计,可以认为每个周 期内执行的最大指令个数为k ,即流水线在理想情况下效率为1 0 0 。但是由于程序 中存在数据相关、程序分支、中断以及一些其他因素,这种理想情况很难达到。 10 贵州大学硕士学位论文 图2 3 是t m s 3 2 0 c 5 0 的4 级流水示意图。c 5 0 在执行一条指令时,要经过取指、 解码、读取操作数和执行4 个阶段。 e 图2 3c 5 0 的指令流水线 对于流水操作还有一个特殊的延迟问陈( d e l a ys l o t ) 问题,即如果某条指令的 执行时间不是单个周期,则在指令结果可以使用前会有1 个或几个周期的等待时间, 称为延迟间隙。对于多数d s p s ,延迟间隙问题会给编程带来一些困难。但是对于 c 6 0 0 0 系列d s p s ,这个问题在线性汇编语言编程中完全不用考虑。而且采用线性汇 编语言编程,程序效率可以达到标准汇编效率的9 5 1 0 0 。 2 3t m s 3 2 0 c 6 4 1 x 体系架构 d a m 6 4 1 6 p 图像处理平台是基于t l 的d s pt m s 3 2 0 c 6 4 1 x 芯片设计的评估开 发板。板上d s p 的计算能力可达到4g i p s ,可以做实时的视频和音频的采集、压缩 和播放或其它高速的d s p 应用。 t m s 3 2 0 c 6 4 1 6 为t m s 3 2 0 c 6 0 0 0 系列的高性能定点d s p 处理器,工作频率可 为4 0 0 ,5 0 0 ,6 0 0 ,7 2 0 m h z 。在本系统中,d s p 的工作时钟为6 0 0 m l - i z ,由于视频 f i f o 的限制,外部寄存器接口的时钟是1 0 0 m h z 。 t i 鼬d 新型的c 6 4 xd s p 以其c 6 4 x 内核的先进超长指令字( v l t w ) 结构,获得 当前应用所需的最高性能。图2 4 显示了c 6 4 xd s p 的简要结构框图。它包括采用 v e l c o i t l 2 构架的d s p 内核单元,内部存储器的两级缓存结构,d m a 控制器,外部 总线接口,中断选择器,p l l 回路,低功耗逻辑,启动配置以及其它外设等。 贵州i 大学硕士学位论文 l e n i f a | l l pc a c h e 1 w i f b c 6 0 0 0d s pc o r e i n s t r u c t i o nf e c t h c o n t r o l p e r o i 。t h h e r1 s 9e n h a n c e i n s t r u c t i o nd i s p t c hr e 9 1 s t o r s 眦 l 2 i n s t r u c t i o nd e c o d e c o n t r o l c o n t r o l l e l o g i e d a t ap a t ha d a t ap a t hb m e m o r l t e s t 旧i n t e 。r r u 。p 。tl , ar e g i s t e rf i l e l br e g i s t e rf i l e i 000 缸一峙0 0 e m ua t i o n l l ,d n l l l 1l s 1 l m 1ld 1l l 0 2 lm 2 l s 2l l 2 l i n t e r r u p t c o n t r o l l i ,0 9 “ l 0i c o n f i g u r a t i o n 眦i l 1 dc a c h e 图2 4c 6 4 x d s p 结构框图 图2 5 显示了c 6 4 xd s p 核心的简要结构。c 6 4 x 内核的8 个功能单元能够在每 个周期内执行4 组1 6 位m a c 运算或8 组8 位m a c 运算,以便在处理通信和影 像算法中获得最大的并行性。单个c 6 4 xd s p 能够同时完成一个通道的m p e g 4 视频 编码、一个通道的m p e g 4 视频解码和一个m p e g 2 视频解码,并仍有5 0 的余量 留给多通道语音和数据编码。 c 6 2 x c 6 4 x c 6 7 xd e v l c e p r o g c a c h e p r o g r a mm e m o r y 3 2 一b i ta d d r e s s 2 5 6 一b i td a t a c 6 2 x c 6 4 x c 6 7 xc p u p o w e r d o w n p r o g r a mf e t c h i n s t r u c t i o nd i a p a t c h ( s e en o t e ) d m ae m l f i n s t r u c t i o nd e c o d e c o n t r o l r e g l s t e r s d a t ap a t ha 蠢五磊而 d a t ap a t hb 露面夏丽 l 1 1 s 11 m 1 l ,d l l1 d 2 l ,k 2 1 s 2 l ,l 2 c o n t r o l l o g i c t e s t e m u l a t i o n t e r r u p t s d a t ac a c h e d a t am e m o r y 3 2 一b i ta d d r e s s 8 一,1 6 ,3 2 一b i td a t a ( 6 4 一b i td a t a c 6 4 xo n l y ) a d d it i o n a l p e r i p h e r a ls t i m e r s , s e r i a lp o r t s 图2 5c 6 4 x d s p 核心结构 12 贵州大学硕士学位论文 图2 6 显示的是c 6 4 xd s p 核心的数据路径。与c 6 2 x c 6 7 x 不同,所有的8 个 功能单元均可以通过交叉路径访问另一组寄存器文件,进步提升了d s p 的性能。 r e g s t ”舫一a 3 z f f r e g i s t e rb 0 - b 3 1 【 l + j uljl j 2 x i 支 ,、r + 、 蚍 i 共 i 7i7 x哆 洲顺 r ,士 1 闱匿 上二, j 、, 、, 、, 7 9 琶“_ r 器”li “筒”lj 2 釜0 l d l l $ 25 茹“1 s l d l 镀“ 唑芝- ,弋芸塾 。o涮喇 急。n o l i y 2 b 。:厂、,_ t 墨2 3 2 - s r r洲r 。 图2 6c 6 4 xd s p 核心的数据路径 2 4d s p 与p c 间的通讯实现方法 2 4 1 d s p 与p c 通讯应用程序开发 d a m 6 4 1 6 板上提供了满足p c i2 2 规范的p c i 接口,d s p 和p c 机之间可以 通过p c i 接口实现通讯和数据交换,而不需要通过扩展异步通信芯片来实现串口通 信【1 0 】,这样即节省了设备,又可实现h o s t 与d s p 的高速大数据量数据交换。主机通 过p c i 接口可直接访问d s p 的所有存储空间,允许主机初始化d s p ,可以从主机加 找程序。d s p 与p c 之间的通讯可以采用消息的机制和d m a 的机制。 从j t a g 接口加载程序比较适合于程序的开发调试,对于实际的系统来说,大部 分都是系统自己从e e p r o m 或f l a s h 加载。现在我们可以从主机通过应用程序加载, 基于此,许多耗时的算法p c 机不能实时完成的可以由d s p 来完成。 这个过程可以这样来描述:p c 机执行应用程序,加载算法到d s p 端,并将需要 处理的数据传送到d s p ,d s p 计算完成后将数据传回p c 来控制启动、工作、完成, 使用起来比较方便。当然,d s p 算法还需要首先用仿真器通过j t a g 接口调试好才行。 1 d s p 程序的c m d 文件 为了实现d s p 与主机之间的通讯,我们必须首先在d s p 的内存空间保留以下的 段: s e c t i o n s 13 贵州大学硕士学位论文 c o m m d e s c :f i l l = 0 c o m m d e s c f i f o m s g t a b :f i l l = 0 l s r a m d m a d e s c :f i l l = 0 i s r a m 这些段的空间实际上是为d s p 与p c 之间的通讯内核程序保留的。在编写d s p 应用程序时需要特别注意将上面的段定义加入c m d 文件中。 2 d s p 与p c 之间的消息通讯 d s p 与p c 之间可以采用消息的方式进行通讯。 ( 1 ) 向p c 发送消息 对于d s p 而言,向p c 机发送消息可以通过下面的函数实现: p c i _ s e n d m e s s a g e ( u i n t 3 2d w f l a g , u i n t 3 2d w s i z e ,v o i d + p m e s s a g e ) 其中,p c i _ s e n d m e s s a g e 0 1 拘第一个参数表示向p c 机发送的消息类型,如果非 d m a 请求,则此参数为0 。第二个参数是消息队列的长度,第三个参数是指向消息 队列的指针。例如; s t a t u s = p c _ s e n d m e s s a g e ( o ,2 + s i z e o f ( u i n t 3 2 ) ,m e s s a g e b u f f e r ) ; 将向p c 机发送长度为2 的消息,消息的内容位于m e s s a g e b u f f e r 中。该函数执 行后,m e s s a g e b u f f e r 中的内容将被复制到f i f o m s g t a b 区,同时将触发p c 机的一个 p c i 消息事件。p c 可以采用下节介绍的方法响应这个消息。 ( 2 ) 处理来自p c 的消息 p c 机也可以向d s p 发送消息。此时会触发d s p 的主机中断。i e k l i b 提供的 库函数可以自动处理这个中断。可以使用下面的函数读取p c i 消息: i e k c 6 4 _ s t a t u sp c i _ g e t m e s s a g e ( u i n t 3 2 + p f l a g , u i n t 3 2 + p b y t e s r e a d - u i n t 3 2 d w s i z e ,v o i d + p m e s s a g e ) ; 对d s p 应用程序而言,可以选择以查询或回调函数两种方式来响应来自主机的 p c i 消息。使用查询方式时,程序如下; | 偿镣p c i 消息 w h i l e ( 1 ) s t a t u s = p c i _ g e t m e s s a g e ( & m s g f l a g ,& b y t e s r e a d ,s i z e o f ( m e s s a g e b u f f e r ) ,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025关于金融机构的贷款合同范本
- 2025承包工程不包含材料合同模板
- 2025年保险合同的订立与生效
- 2025合同样本参考范文
- 2021年北京重点校高一(下)期中物理试卷试题汇编:万有引力与宇宙航行章节综合
- 时间管理大师高端玩家
- 2025卓越的房地产销售合同范本
- 线上法律服务培训课件
- 肾内科慢性肾脏病饮食指导要点
- 校刊部未来工作规划
- 呼吸重症发展历程图解
- 生产用菌种管理制度
- 吉他教学视频课件
- T/CGMA 0303-2023螺杆空气压缩机电控系统
- 对外投资合作国别(地区)指南 2024-美国
- 中国铁塔考试试题及答案
- 大学生职业规划大赛《针灸推拿学专业》生涯发展
- 氧化碳气瓶搬运、存放及使用管理制度
- 设备采购方案投标文件(技术方案)
- DB37T 2401-2022 危险化学品岗位安全生产操作规程编写导则
- 六年级安全课
评论
0/150
提交评论