(通信与信息系统专业论文)基于tms320c5402的客流统计系统的设计与实现.pdf_第1页
(通信与信息系统专业论文)基于tms320c5402的客流统计系统的设计与实现.pdf_第2页
(通信与信息系统专业论文)基于tms320c5402的客流统计系统的设计与实现.pdf_第3页
(通信与信息系统专业论文)基于tms320c5402的客流统计系统的设计与实现.pdf_第4页
(通信与信息系统专业论文)基于tms320c5402的客流统计系统的设计与实现.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(通信与信息系统专业论文)基于tms320c5402的客流统计系统的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 城市公共交通是为城市 经济和建设服务, 是市民出行的主要交通工具。 但公 共交通存在着很大的问题, 例如:公交速度慢、 上下班拥挤、公交不准时等。 要 解决这些问题必须要实时地知道各条线路的乘客的人数。为此我们研发了基于 d s p 的公交客流统计系统。 在第一章中, 本文首先叙述了课题的相关背景以及当前国内外客流统计的发 展现状,同时还介绍了数字信号处理与d s p系统的相关知识。 第二章主要介绍了整个系统的硬件方案设计和实现。采用 t i公司的 t ms 3 2 0 v c 5 4 0 2 芯片作为系统核心并利用 c p l d实现主要的逻辑和时序控制, 重点介绍了各模块的软硬件连接 第三章对硬件设计中所应注意的 一 些问题展开了讨论, 重点介绍了电源的设 计。 在第四章中,介绍了整个系统的软件实现。主要介绍了算法思路。 最后一章中指出了 该系统在设计上的不足之处, 以 及 卜 一步工作中需重点解 决的问题 关键词:客流统计系统,数字信号处理器,图像采集,图像传感器 ab s t r a c t b u s e s a r e t h e m a i n t o o l s o f t h e p u b l i c w h i c h s e r v e s t h e e c o n o m y a n d c o n s t r u c t i o n o f ai n t h e b u s t r a n s p o rt a t i o n t r a n s p o rt a t i o n a r e a l o t o f s u c h a s t o o s l o w , t o o c i t y . b u t c r o wd e dd u r i n g r u s h h o u r s a n d n o t p u n c t u a l . t h e s e p r o b l e m s p r o b l e m s w i l l b e s o lv e d i f w e k n o w t h e n u m b e r o f t h e p a s s a n g e r s o f e v e r y l i n e i n r e a l t im e . s o w e d e v e l o p e d t h e p a s s e n g e r s fl o w s t a t i s t i c a l s y s t e m o n b u s e s b a s e d o n d s p . f i r s t l y , t h e d e v e lo p m e n t o f p a s s e n g e r s fl o w s t a t i s t i c a l s y s t e m , t h e o f o u r p r o j e c t a n d c h a p t e r o n e . s o m e k n o w l e a b o u t d i g i t a l s i g n a le s s i n g b a c k g r o u n d i n t r o d u c e di n t w o d e s c r i b e d t h e d e s i g n a n d i m p l e m e n t a t i o n t h e w h o l e s y s t e m. a t i tm s 3 2 0 vc5 4 0 2 wa s s e l e c t e d a s t h e h e a r to f t h a t s y s t e m a n d m o s t o f t h e i ma g e a c q u i s i t i o n l o g i c , c o n t r o l l o g i c a l a n d a n 1 2 c p r o t o c o li m p l e m e n t e d i n a c p l d c h i p . t h e c o n n e c t i o n o f c h i p s d e s c r i b e d i n d e t a i c h a p t e r t h r e e d i s c u s s e d s o m e t i p s a b o u t h a r d w a r e d e s i g n , e s p e c i a l l y a b o u t d e s i g n . i n t h e c h a p t e r f o u r , t h e a l g o r i t h m o f t h e s o ft w a r e w a s i n t r o d u c e d . l a s t c h a p t e r d r e w a c o n c l u s i o n t o t h i s d s p s y s t e m a n d t h e n m a d e s o m e s u g g e s t i o n t o t h e n e x t b o a r d k e y w o r d s : p a s s e n g e r s fl o w s t a t i s t i c a l s y s t e m , d s p , i m a g e c o l le c t i o n , i m a g e s ens or s 第一章 绪论 1 . 1 . 课题研究的背景和目的 视频监控系统是多媒体技术、计算机网络、工业控制和人工智能等技术的 综合应用。 近些年来数字视频监控系统凭借其高质量的图像和效率, 方便的配置, 快捷的操作, 专有的远程访问能力, 实时主动的监督能力等优越性正逐步取代模 拟监控系统。 作为应用在公交车辆的乘客流量统计监控系统, 正是在传统的模拟 监控摄像机无法进行实时监视, 无法自 动分析图像数据的情况下应运而生, 除了 能够准确、 及时、 方便地获得客流统计数据, 也可减少大量的人力、 物力和财力 的投入。 数字监控系统由图像输入、 压缩及处理模块; 切换控制模块; 网络连接 与远程传输模块构成。 图像处理系统, 作为数字监控系统的重要模块之一, 是本 次项目的研究对象。因此我们利用数字信号处理器 ( d s p )设计了一种基于 t ms 3 2 0 v c 5 4 0 2 的客流统计系统。 1 . 1 . 1研究开发的必要性及意义 城市公共交通是为城市经济和建设服务, 是市民出行的主要交通_ 具。 在城 市经济发展中,公共交通运营状况是科技应用水平和城市现代化程度的重要标 志, 并起着重要的支撑作用,同时也对城市公共交通提出了更高的要求。 作为人 口众多、 基础设施比较落后的中国, 公共交通还存在着很大的问题, 例如: 公交 速度慢、 上下班拥挤、公交不准时等, 如何提高公交运输效率, 将大批的乘客吸 弓 i 到公交车辆上来, 减少其它车辆的使用, 成为摆在当代交通管理者面前的 一个 重要课题。 在目 前的公交营运管理方面, 仍用着几十年来的传统方式: 人上 编制 行车时刻表和接落班表、 人工调度、 人工填路单、 人工统计乘客的数量、 人工输 数据并进行一系列的统计等繁重落后的操作过程, 这一操作过程又造成每天大量 的营运数据的不准确性。同时,由于受人工操作的限制, 大量动态的营运数据无 法为制定新的营运计划提供可靠的依据: 最终形成了工作效率低下、 运营成本过 高、企业面临亏损、不能满足市场客流需要。 浙江人 学硕 学位论文 采集有关的客流数据, 根据分析结果, 制汀营运作业计划, 将大大贴近该线 路的市 场客流的需要,也就是说既可投入相对较少营运成本( 人和车 ) 而获得相对 较多的经济效益,同时又能满足该线路乘客的乘车需求。 1 . 1 . 2自 动客流统计系统的发展和应用情况 通过对国际上现有的己 投入商 用的 a p c ( a u t o p a s s e n g e r c o u n t )系 统进行调查, 发现a p c 系统实现的主要方法主要有以下几种: 入口机械挡叉装置 主动/ 被动红外传感 可见光摄像监测 地板压力传感 光电监测 以卜 对现存的自 动客流统计方法作简要比较分析: ( 一)接触式方法: ( i )采用挡叉装置 挡叉装置严格控制了上下车秩序, 计数准确, 可是不适合于安装在城市公交车上。 ( 2 )踏板压力传感器 通过在 卜 下车门的两极踏板上安装压力传感器, 可以有效的记录并计算经过的人 数, 但是在 卜 下车拥挤的情况下 , 可能有不止 一 个人踩在同级台阶r , 这种方法 的精度就会大大降低。 ( 二)非接触式方法 ( 1 )红外线遮挡判断方法 红外遮挡计数是应用很广泛的计数力 一法, 特别是在工业流水线上得到了很好的应 用,可是在公交车客流拥挤的情况下同样无能为力。 ( 2 ) 基于可见光或者红外光的图像模式识别的方法 通过可见光或者红外线摄像, 并通过实时图像处理进行模式识别运算来判断并跟 踪运动人体的方法是自动监控系统中常见的。 基于红外光的监控系统对天气, 光 照的适应能力通常要比基于可见光的监控高不少,但这同时也提高了系统成本。 综上所述, 基于成本与性能的综合考虑, 我们采用基于可见光的摄像技术做图像 浙江大学硕上学位论文 采集,在光线比较暗的夜间情况 ij 一 能进一步使用红外辅助照明的手段 1 . 2 . 数字信号处理技术 n 从2 0 世纪8 0 年代初期第一片数字信号处理器芯片 ( d i g i t a l s i g n a l p r o c e s s o r s , 简称d s p s ) 问世以 来, d s p s 就以 数字器件特有的稳定性, 可 重复性, 可人规模集成,特别是可编程性和易于实现自 适应处理特点,给数字信号 处理 ( d i g i t a l s i g n a l p r o c e s s i n g , 简称 d s p ) 的 发 展带 来了巨 大机遇, 并 使得信号 处 理 手段更灵活, 功能更复杂, 应用领域也拓展到国民经济生活的各个方面。 近年来, 山于半导体制造 l : 艺的发展和计算机体系结构等方面的改进,d s p s 芯片的功能 越来越强大, 这使得信号处理研究的重点在很大程度 l 可以放在软件算法上, 而 不用像过去那样需要过多的考虑硬件实现。而且随着d s p s 运算速度的提高,能 够实时处理的信号带宽也大大增加, 数字信号处理的研究重点也有最初的非实时 应用转向了高速实时应用。 为了快速实时的完成数字信号处理运算,d s p 芯片一般具有这样一些特点: . 快速的运算速度 . 在一个指令周期内可完成一次乘法和一次加法运算 .独立的数据空间和程序空间,可以同时访问指令和数据 . 片内具有快速多总线结构的r a m .具有低开销或无开销循环及跳转的硬件支持 .快速的中断处理和硬件1 / o支持 .具有在单周期内操作的多个硬件地址产生器 .可以并行执行多个操作 .支持流水线操作, 使取码、译码和执行等操作可以重叠执行 目 前单片d s p s 的主频最高已达到1 . 1 g h z ,处理能力高达近9 0 0 0 mi p s( 每秒 百万条指令) 。这使得实时信号处理的应用空间越来越广阔,尤其是在实时图像 处理领域。以往,由于图像处理的数据量以及运算量过于庞大,利用单片d s p s 芯片或m c u ( m i c r o c o n tr o l l e r u n i t ) 是无法实时处理的,往往只能依赖于 多处 理器系统或者功能强大的p c 机。 现在, d s p s 的迅猛发展使得单片d s p s 实现实时 图像处理已成为可能。 浙江大学硕 学位论文 1 . 2 . 1 . d s p处理器与通用处理器 ( g p p )的比较 考虑一个数字信号处理的实例, 比如有限冲击响应滤波器 ( f i r ) 。 用数学语 言 来说,f i r 滤波器是做 一 系列的点积运算。取一个输入量和一个序数向量,在 系数和输入样木的滑动窗日间作乘法, 然后将所有的乘积加起来, 形成一个输出 样本。 类似的运算在数字信号处理过程中大量地重复发生, 使得为此设计的器件必 须提供专门的支持,这促成了d s p 器件与 通用处理器 ( g p p )的分流: 对密集的乘法运算的支持 g p p 不是设计来做密集乘法任务的,即使是一些现代的g p p ,也要求多个指 令周期来做一次乘法。而d s p 处理器使用专门的硬件来实现单周期乘法。d s p 处 理器还增加了累加寄存器来处理多个乘积的和。累加寄存器通常比其他寄存器 宽,增加的位宽用来避免运算溢出。同时,为了充分体现专门的乘法一 累加硬件 的好处,几乎所有的d s p 的指令集都包含有显式的m a c 指令。 存储器结构 传统上,g p p 使用冯 诺依曼结构。 这种结构中,只有一个存储器空间通过 组总线 ( 一个地址总线和一个数据总线) 连接到处理器核。 通常, 做一次乘法 会发生4 次存储器访问,用掉至少四个指令周期。 大多数d s p 采用了哈佛结构或者改进型的哈佛结构, 将存储器空间划分成程 序空间和数据空间。 存储器空间至少有两组独立的总线连接到处理器核, 允许同 时对它们进行访问。 这种安排将处理器存贮器的带宽加倍, 更重要的是处理器核 可同时获取数据与指令。在这种布局下,d s p 得以实现单周期的ma c 指令。 零开销循环 如果了 解到d s p 算法的一个共同的 特点, 即大多 数的处理时i fl 1 是花在执行较 小的循环上,也就容易理解,为什么大多数的d s p 都有专门的硬件,用于零开销 循环。 所谓零开销循环是指处理器在执行循环时, 不用花时间去检查循环计数器 的值、条件转移到循环的顶部、将循环计数器减t o 与此相反,g p p 的循环使用软件来实现。某些高性能的g p p 使用转移预报硬 件,几乎达到与 硬件支持的零开销循环同样的效果。 定点计算 浙江大学硕学位论文 很多d s p 使用定点计算,而不是使用浮点。虽然d s p 的应用必须十分注意数 字的精确, 用浮点运算容易实现得多, 但对d s p 来说, 价格廉价也是非常重要的。 定点处理器对比相应的浮点处理器在结构上要简单, 价格也要便宜一些。 为了不 使用浮点运算而又保证数字的准确, d s p 处理器在指令集和硬件方面都支持饱和 计算、舍入和移位。 专门的寻址方式 d s p 处理器往往都支持专门的寻址模式, 它们对通常的信号处理操作和算法 是很有用的。例如,模块 ( 循环)寻址 ( 对实现数字滤波器延时线很有用) 、位 倒序寻址 ( 对f f t 很有用) 。 这些非常专门的寻址模式在g p p 中是不常使用的, 只 有用软件来实现。 定点d s p 指令集 定点d s p 指令集是按两个目 标来设计的; 使处理器能够在每个指令周期内完 成多个操作, 从而提高每个指令周期的计算效率; 将存贮d s p 程序的存储器空间 减到最小 ( 由于存储器对整个系统的成木影响甚大, 该问题在对成本敏感的d s p 应用中尤为重要) 。 为了实现这些目 标, d s p 处理器的指令集通常都允许程序员在一个指令内实 现若干个并行操作。例如,在一条指令包含了m a c 操作,即同时的一个或两个 数据移动。在典型的例子里,一条指令就包含了计算f i r 滤波器一节所需要的所 有操作。 这种高效率付出的代价是, 其指令集功能既不良 观, 也不容易使用 ( 与 g p p 的指令集相比) ,完成的功能非常有针对性 1 . 2 . 2 . 实时d s p处理系统 1 . 2 . 2 . 1 . 实时d s p系统的构成 由于实时信号处理系统所要处理的信号多为自 然信号, 因此必须通过传感器 将自 然信号转换为电信号,另外要对自然界的信号进行数字处理,就必须通过 a / i 子系统将其转换为数字信号; d s p 子系统对数字信号处理完成后, 有时还需 要通过d / a子系统把处理后的数字信号转换为模拟信号。 图l - 1 是一个完整的实 时d s p系统框架图,在整个系统中,d s p 子系统是核心。下面主要介绍d s p 子 浙江人学硕 七 学位论文 系统的实现和构成。 模拟信号 a / 1) 转换d s p d / a 转换 模拟信 号 图 1 - 1实时d s p系统 1 . 2 . 2 . 2 . d s p子系统 在现有的技术条件下,上面的d s p子系统有六种实现方法: .在通用计算机上用软件实现 .在通用计 一 算机系统中加入专用的加速处理机 .通用单片机( 用于数字控制等不太复杂的数字信号 处理, 如i n t e l 的mc s 5 1 系列) .通用可编程d s p s 芯片 . 专用d s p s 芯片 .基于通用d s p s 核的a s i c :在用量较大的通信、硬盘控制等领域,些 d s p s ) 一 商提供一种基十d s p , 核心的a s i c设计和生产服务, 即用户可 以 在通用d s p s 的c p u基础上选用所需要的外设接日、 存储器等资源, 并在片内固化所需软件 卜 述方法中,第一种方法的缺点是速度慢,不适合于实时d s p ,一般只用于 d s p 算法的模拟: 第二种不是和于嵌入式应用, 而且和第五种方法一样具有专 用 较强的特点, 应用收到很大限制; 第三种不适合于以乘加运算为主的运算密集型 d s p 算法;第四种通用可编程d s p s 芯片,由于其可编程性和强大的处理能力, 在实时d s p领域居于主导地位。另外在批量应用中,基于通用d s p s 核的a s i c 由于较好的系统性价比也在近几年得到广泛应用。 1 . 3 . 论文的主要内 容 论文在第二章中, 着重叙述了我所设计的d s p实时视频图像处理系统的硬件 方案选择、 设计和实现, 在第三章介绍了在硬件设计中应注意的若千问题。 在第 四章中,则介绍了d s p系统的软件实现。在论文的最后,给出了总结和展望。 第二章 d s p 系统硬件实现 该客流统计系统的图像处理、数据交换和发送功能是由 d s p图像处理系统 完成。可以说 d s p是整个系统最核心的部分。系统的整体流程如图2 - 1 所示, 安装于公交车 r 的摄像头拍摄乘客在仁卜 车时的视频图像, 通过数据交换和d s p 的处理,最后得到乘客的上下车人数通过 d s p的串日传送出去。 c c d + 视 频 解码 / : m o s 数 据交换 镜头 图2 - 1 d s p 系统硬件结构原理框图 在图2 - 1 中, 数据交换通道是实现视频解码芯片与d s p 之间数据传输的缓冲 地带, 数据交换部分设计的好坏对整个d s p 系统的性能、 效率以及实现难易程度 有直接关系。 在本项目中 我们采用的是图2 - 2 这种方式。 即利用f i f o ( f i r s t i n f i r s t o u t ) 或者双h r a m 作为数据交换的缓存设备。 图2 - 2利用f i f o / 双口r a m 交换数据方案图 采用这种方式, 主要优点是 d s p 和解码芯片在各自 读取和存储原始视频图像 数据时,两者不会发生数据总线冲突;硬件设计比较简单;当f i f o 或双w r a m 容量不大, 速度不太高时, 价格成木也很低。 然而, 这种方式也有不足之处:由 于f i f o 和双口r a m 容量远小于 一场视频图像的数据大小,这使得d s p 不得不频 繁的中断正常处理程序来读取 f i f o 或双口r a m 中的数据,从而打断了程序的流 水工作, 降低了d s p 运行性能。 但在本项目中山于对成本要求比较严格, 我们选 用t i 公司的5 4 系列来做处理器, 为了能够增加处理速度, 在该项日中降低了图 浙江大学顿 上 学位论义 像的分辨率。这样采取一帧图像只需一次中断即可。我们使用f i f o 作为数据交 换。 2 . 1 硬件系统器件的选用 2 . 1 . 1 图像传感器技术的发展现状: 如今的图像传感器一般分为采用 c c d技术和采用 c mo s技术这两类。 以下先对这两类技术做简要的分析比较。 般认为 , . 高分辨率 ,ccd 传感器有以下优点: ( h ig h r e s o l u t io n ) : 像点的 大小为u m级, 可感测及识别精 细物体,提高影像品质。 2 .低噪声 ( l o w n o is e ) 和高敏感度;ccd 具有很低的读出噪声和暗电 流噪声,因此提高了信噪比 ( s n r ) ,同时又具有高敏感度,很低照度的入 射光也能侦测到,其讯号不会被覆盖,使ccd的应用较不受天候拘束。 3 .动态范围 广( h ig h d y n a m ic r a n g e ) : 同 时 侦测及 分辨强光 和弱光, 提 高系统环境的使用范围。 4 . 良 好的线性特性曲 线( l in e a r it y ) : 入射光源强度和输出 讯号大小成良 好 的正比关系,降低信号 补偿处理成本。 5 .高光子转换效率 ( h ig h q u a n t u m e f f ic ie n c y) :很微弱的入射光照射 都能被记录 卜 来, 若配合影像增强管及投光器,即使在暗夜远处的景物仍然 还可以侦测得到。 6 .光谱响 应 广 ( 日 r o a d s p e c t r a l r e s p o n s e ) : 能 检 测很宽 波长 范围 的 光, 扩大系统应用领域。 7 .低图 像失 真 ( l o w i m a g e d is t o rt io n ) 8 . 体积小、重量轻 9 .低耗电,不受强电磁场影响 1 0 . 电荷传输效率佳:该效率系数影响信噪比、分辨率,若电荷传输效率 不佳,影像将变得较模糊; 1 1 .可大批量生产,品质稳定,坚固,不易老化,使用方便及保养容易。 浙江大学硕士学位论文 cm0s图像传感器于8。 年代发明以来,由于当时cmos 工艺制造 的技术不高,以致于传感器在应用中的噪声较大,商品化进程一直较慢。时 至今日,cmos 传感器的应用范围也开始非常的广泛,在低档产品方面, 其丽质质量己接近低档ccd的解析度, 相关业者希望用cmos 器件取代 ccd 的努力正在逐渐明朗。c mos 传感器有可细分为: 被动式像素传感 器c m o s ( p a s s iv e p ix e l s e n s o r c m o s )与主动式像素传感器cmo s ( a c t iv e p ix e l s e n s o r c m o s ) 。与ccd 相t 匕 ,cmos具有体积小, 耗电量不到ccd的1 1 1 0 ,售价也比ccd 便宜 1 1 3 的优点。 cmos 传感器的最大优势,是它具有高度系统整合的条件。理论上, 所有图像传感器所需的功能,例如垂直位移、水平位移暂存器、时序控制、 c d s , a d c . . . 等, 都可集成在一颗晶片上, 甚至于所有的晶片包括后端晶片 ( b a c k - e n d c h ip ) 、快闪记忆体 ( f la s h r a m)等也可整合成单晶片 ( s 丫 s 下 e m - o n - c h ! 尸 ) ,以达到降低整机生产成本的日的。 2 . 1 . 2 图像传感器的选用: 经过再三比较, 我们决定采用c m o s图像传感器系列, o m n iv is i o n 作为 全球领先的 c m o s传感器厂商,其土要的产品包括:c i f ( 3 5 2 x 2 8 8 ) , v g a ( 6 4 0 x 4 8 0 ) , s v g a ( 8 0 0 x 6 0 0 )和 s x g a ( 1 2 8 0 x 1 0 2 4 ) 。我 们选择了v g a系列的o v 7 6 2 0芯片,主要是基于以下几点考虑: , .又 寸 于我们的客流统计系统来说,图像的分辨率要求并不高,过高的分辨 率反而造成很大的运算负担, o v 7 6 2 0 的3 0 万像素图 像( 6 4 0 x 4 8 0 ) 已 经 完全能够满足要求。 2 . c m o s芯片高度整合的特点有效的缩短了开发和调试的周期,如果采用 c c d传感器, 势必需要加入a i d等外围配套芯片, 而o v 7 6 2 0内部整合 模数转换 ( a i d ) , 0 动增益控制( a g c ) , 使系统前段图像采集部分的设 计和调试方便了许多。 o v 7 6 2 0芯片自身的一些特点也使他很适合于我们的系统性能要求,我 浙江大学硕 i - 位论文 们i 以将 o v 7 6 2 0设置在q v g a方式下 1 _ 作,输出分辨率为 3 2 0 x 2 4 0 ;甚 至还可以自由设定输出的图像窗口大小及位置,相当于可以任意调节视场, 这就带来了很大的方便。 2 . 1 . 3处理模块的选择 对于我们所面临的实时图像数据处理任务, t i 公司的d s p 芯片是最常用 的选择。 t i 公司的d s p 主要有浮点和定点两大类, 其体系结构专为实时信号处理 而设计。通常 t i 公司的 d s p被归纳为二大系列,即主要用于控制系统的 t ms 3 2 0 c 2 0 0 0 系列, 用于低功效处理系统的t ms 3 2 0 c 5 0 0 0 系列和高性能的 t ms 3 2 0 c 6 0 0 0 系列。 t ms 3 2 0 c 5 0 0 0 系列又分5 4 x 和 5 5 x . t ms 3 2 0 c 6 0 0 0 系 列分 6 2 x 6 4 x和 6 7 x 。出于成本和性能的综合考虑,我们选了t i 公司的 t ms 3 2 0 c 5 0 0 0 系列的5 4 0 2 芯片作为图像数据的处理单元。 2 . 1 . 3 . 1 t ms 3 2 0 c 5 4 x的主要特点 t ms 3 2 0 c 5 4 x的体系结构采用修正的哈佛结构, 程序与数据分开存放, 内部只有 8 条高度并行性的总线。 片上集成有在片的存储器和在片的外设以 及专门用途的硬件逻辑, 并配备有功能强大的指令系统, 使得该芯片具有很 高的处理速度和广泛的应用适应性。 再加上模块化设计以及先进的集成电路 技术,芯片的功耗小,成本低,它的典型结构框图如图2 - 3 所示。 硬件结构基本上可以分为 3 大块: ( i ) c p u :包括算术逻辑单元、乘法器、累加器、移位寄存器、 各种专门用途的寄存器、 地址生成器以及内部总线; ( 2 )存储器系统:包括2 4 位外界存储器接日、 在片的程序r o m, 在片的单访问数据r a m和双访问的r a m ; ( 3 )在片的外设与专用硬件电路:包括在片的定时器、各种类型 的串g 7 、 主机接g 1 , 在片的锁相环 ( p l l ) 时钟发生器以及各 种控制电路。 浙江大学硕士学位论文 图2 - 3 t ms 3 2 0 c 5 4 x的典型结构框图 其主要特点为: ( i ) c p u 一先进的多总线结构,具有 1 条程序存储器总线、3 条数据存储器总线 和 4 条地址总线; - - - 4 0 位算术逻辑单元( a l u) , 包括4 0 位桶形移位寄存器和2 个独立的 4 0 位累加器; - - - 1 7 位乘1 7 位的并行乘法器与一个4 0 位的专用加法器结合在一起, 用 i 5 浙江人学硕 卜 学位论文 于非流水线的单周期乘/ 累加操作; 一比较、选择和存储单兀 ( c s s u) ,用于 v i t e r b e操作 ( 一种通信的编 码方式)中的加/ 比较选择; 一指数编码器用于在单周期内计算4 0 位累加器的指数值; - - - 2 个地址生成器,包括8 个辅助寄存器和2 个辅助寄存器算术单元; ( 2 )存储器系统 一具有1 6 位 1 9 2 k字的可寻址空间: 6 4 k字程序空间, 6 4 k字数据和6 4 k 字的v 0空p j 在t m s 3 2 0 c 5 4 1 ,c 5 4 8 , c 5 4 9 , c 5 4 0 2 , c 5 4 1 0 ,c 5 4 2 0 等芯片上 还具有最多达2 5 6 k - 8 m字的扩展地址空间; 一在片的存储器结构及容量根据芯片的型号有所不同。 ( 3 )在片外设和专用电路 一软件可编程等待状态产生器; 一可编程的存储器体转换逻辑: 一在片的锁相环( p l l ) 时钟发生器,可采用内部振荡器或外部的时钟源; 一外部总线关断控制电路可用来断开外部数据总线、地址总线和控制信 一号; 一数据总线具有数据保持特性; 一可编程的定时器; 一直接存储器访问 ( d ma)控制器: 一直接存储器访问连接的8 位并行主机接口 ( u p i ) 一在片的串日。 ( 4 )在片的引导功能 除t ms 3 2 0 c 5 4 2 0 外, 所有的芯片都具有在片的引 导功能, 能 从片外的存 储器或在片的串口将程序引导转入指定的存储器位置。 ( 5 )指令系统 一单指令重复和块重复操作指令; 一用于程序和数据管理的存储器块传送指令: - - - 3 2 位长 操作数指令; 一同时读入2 个或3 个操作数的指令: 浙江 人学硕 卜 学位论 丈 一并行存储和装入的算术指令; 一条件存储指令; 一快速从中断返回的指令; 一具有延迟转移和调用指令; 一指令的执行采用指令预提取、 指令提取、 指令译码、 访问操作数、 读取 操作数、执行等6 级流水线并行结构,大大提高了指令的执行速度。 2 . 1 . 3 . 2 t ms 3 2 0 c 5 4 0 2芯片介绍 在木系统中,我们选用了t m s 3 2 0 c 5 4 0 2 这款芯片作为d s p 处理器。 t m s 3 2 0 c 5 4 0 2 是t i 公司t m s 3 2 0 c 5 4 x 定点d s p 系列中的一员。它的主要特点有: i . 算速度快,指令周期为i o n s ,运算能力为l 0 0 mi p s ; 2 . 4 k 的片内r o m i 6 k 的片内双口r a m; 3 .具有低功耗方式。t ms 3 2 0 v c 5 4 0 2内核电压 1 . 8 从i o电源 3 .3 v 。三个低 功耗方式( i d l e i , i d l e 2 , i d l e 3 ) 可以 减少功耗, 特别是对十电 池供电 系 统; 4 .具有符合i e e e 1 1 4 9 . 1 标准的片上仿真接门,方便调试。 虽然c 5 4 0 2 具有以上的种种优点, 但通常而言,这类芯片不太适宜于用 在有较高实时性要求的复杂图像处理中,原因主要有如下两点: i . c 5 4 0 2 最大允许访问的数据空间为6 4 k ( 1 6 位数据) , 这样的寻址能力对 于分辨率较高的图像处理来说是远远不够的。例如,一幅 6 4 0 x 4 8 0像素的 彩色图 像就需要大约9 0 0 k b y t e 的 存储空间。 如果采用分页的 方式扩展c 5 4 0 2 的外部寻址能力, 则在进行页与页之间大规模数据搬移时, d s p 运行效率会 非常低。不幸的是, 这种搬移工作是图像处理运算中很重要的一部分,所以 利用分页扩展寻址能力的方法不实用。 2 .虽然c 5 4 0 2 的运算能力可以达到 1 0 0 m i p s , 然而这对于运算量巨大,而 巨 实时性要求很高的图像处理来说,还是显得很不够。 荃于以上两点, 通常设计人员都会采用寻址能力更强, 性能更高的c 6 0 0 0 系列d s p 来对图像数据做实时处理。 浙江大学硕十学位论文 然而,我们还是采用了c 5 4 0 2 来实现,主要是基于以下几点考虑: 1 .我们的客流统计系统所要求的图像分辨率并不高。如果处理的图像为灰 度图像,分辨率控制在较小范围内,那么c 5 4 0 2 利用6 4 k数据空间中可 以实现较简单的处理算法。同时,还能通过适当的丢帧来弥补运算能力 的不足。 2 系统设计相对c 6 0 0 0 简单,设计周期较短。同时成本方面也有大幅度的 降低,由于我们的产品最终将大规模应用在公交车上,系统成木低廉是 一项核心的要求。 3 . t ms c 5 4 0 2价格很低,系统的性价l l 很高, 在低端的图象处理市场中能 有较强的竞争力。 综 卜 所述,我们的系统采用 t ms 3 2 0 c 5 4 0 2 作为处理器。 2 . 1 . 4 数据缓冲器及其接口 o v 7 6 2 0 芯片只要完成配置, 由于 c m o s f i f o ( f i r s t 输出数据和 d s p 就会不断按照固定的帧率输出图像数据,但 读取数据的速度并不一致,我们需要采用 i n - f i r s t o u t ) 器件作为图像数据的缓冲。根据 o v 7 6 2 0 周期为 了 4 n s ,也就是说每 7 4 门 s ,就会有 i个像素输出。我们采用 的时钟 了具有 4 0 9 6 x 9个存贮单元的 i d t 7 2 v o 4芯片作为缓冲器。同时我们选用廉价的 a l t e r a c p l 。 芯片e p m 3 0 6 4 a 来完成d s p , f i f o , c m o s 等芯片之间的逻辑接f l 2 . 1 . 5电源芯片的选择 电 源系统需要提供5 v , 3 .3 v , 1 . 8 v等输出电 压来满足d s p , o v 7 6 2 0 等 器件的要求。 5 v 主要用于o v 7 6 2 0 提供模拟器件电 压。 3 . 3 v 提供大多数的数 字器件的电压。1 . 8 v 仅用用于 c p u内核电源。 设计电源系统选用 t i t p s 7 6 7 d 3 0 1 5 r ti出低压差稳压芯片( l d o ) ,将 浙江人学硕 上 学位论文 5 v 转化成3 . 3 v , 1 . 8 v o t p s 7 6 7 d 3 0 i 是块双输出电源芯片, 可同时产生3 . 3 v 和 15 v 一 5 . 5 v 的可调电压。 2 . 1 .6系统的硬件设计框图 综上所述, 整个硬件系统的框架结构如下图所示, 采用o m n i v i s i o n 公司 的图像传感器芯片 o v 7 6 2 0获得视频图像,并且数字化输出,由于数据产生 的速度和d s p读取处理的速度不匹配,所以要通过 f 工 f o缓冲,再由c 5 4 0 2 读入图像数据。 c 5 4 0 2 对图像进行实时处理, 同时将处理结果通过串口输出。 图2 - 4 描述了 系统的结构框图,包括以卜 几个部分: d a t a f l a s h j t a g 调 试接口 图2 - 4硬件原理框图 1 ) c m o s 传感器为o v 7 6 2 。 芯片,配l 相应的镜头。 优点:单片集成模拟视 频头,a / d变换以及标准化数据输出等多种功能,同时芯片面积小,价 格便宜。 2 ) f i f o 为i d t 7 2 v o 4 , 容量9 b i t * 4 0 9 6 , 作为图 像数据的缓冲。 3 ) d s p选用t i 的t m s 3 2 0 v c 5 4 0 2 ,时钟可达到 1 0 0 m h z ,采用先进的哈佛结 构,其有专用硬件逻辑的 c p u 、片内存储器、在片外围电路,以及一个 高度专业化的指令集。可以胜任本设计中的算法要求。 4 ) c p l d 主要完成d s p 对 f l a s h , s r a m , f i f o 等的读取逻辑控制,以及s c c b 总线的连接。 浙江人学硕十学位论文 串口可以将数据传到总控制模块。 数据存储器选用 6 4 k 字的s r a m ,主要存放图像数据。 程序存储器选用 1 4 1 字的f l a s h ,存放程序并作为d s p自举 1 t a g调试接 ,可以对 d s p 进行仿真和 c p l d 程序的下载。 、.了、.2又.j、广 5吕厅闷 2 . 2 硬件系统模块介绍 2 . 2 . 1 o v 7 6 2 0 简介 a ) 芯片功能简介 o v 7 6 2 0是一块高度集成的 c m o s彩色/ 黑白 摄像芯片,其分辨率为 6 4 0 x 4 8 0 ,可以隔行或者逐行输出图 像数据。其支持多种视频输出格式,包 括: y c r c b 4 :2 : 2 1 6 b i t/ 8 b i t , z v ( z o o m e d v i d e o ) 端日 输出, r g b原始数据 1 6 b i u 8 b i t 输出, 以及c c i r 6 0 1 / 6 5 6 格式。 其采用内建的s c c b ( s e r i a l c a m e r a c o n t r o l b u s )总线结构来对内部功能进行配置。视频 y t 了 v格式和y c r c b 格 式与r g b格式的转换算式如下: y = 0 . 5 9 g+0 3 1 r+0 . 1 1 b ; u=r - y; v二日 一 丫; y=0 . 5 9 g +0 . 3 1 r+0 . 1 1 b c r = 0 . 7 1 3 x ( r一 y ) c b = 0 . 5 6 4 x( b一 y ) o v 7 6 2 0绝大部分的信号处理功能都由内 部的 模拟信号处理模块完成, 包括色彩分离,a g c( 自动增益控制) ,伽马校正,颜色校正,光圈校正, 白平衡,黑电平标定,亮度调节控制和抗混叠滤波等等。芯片有内建的自动 电 子曝光控制机制( a u t o e l e c t r o n i c e x p o s u r e c o n t r o l ) , 自 动曝光控制算法是基 浙江人学倾士学位论文 于整幅图像的亮度, 假定在相对丁 背景有充足光照的情形做了优化,当光照 条件不同导致不同的背景亮度时,可以山 a e c黑白比率调节寄存器来对曝 光进行自 动控制。a e c所允许的调 竹 范围是 1 : 2 6 0 ,外加内建的最高可以 将信号放大 2 4 d b的自 动增益控制器 ( a g o , 在绝大部分的光照条件下芯片 都可以较好的完成自 动曝光控制。 经过处理的模拟信号通过芯片内部集成的 o b i t a / d转换器转换为数字信号,灰度信号的输出范围为1 6 到2 4 0 , 0 和 2 5 6 保留用作同步信号。 o v 7 6 2 0 一个很重要的特性就是窗口功能,用户可以在 6 6 4 x 4 9 2图像阵 列数据范围内选择输出一个特定大小的窗日的数据,窗口大小从 4 x 2到 6 6 4 x 4 9 2 可选。 而且这样做并不改变图 像输出 帧率和数据率, 而只是改变了 h r e f ( 水平窗u位置参考信号) 的长度和位置。默认的输出窗q大小为 6 4 o x 4 8 0 。在不需要高分辨率输出图像的场合中, o v 7 6 2 0 提供了q v g a模 式输出,在此模式下像素输出速率减半,每一行只输出一半数据。 在隔行方 式下,输出所有3 2 0 行数据/ 帧,在逐行方式下,只输出一半的图像行数据。 不论何种图像输出 格式, 所有的图像数据都从o v 7 6 2 0 的y / u v口 输出, 在我们的系统中,o v 7 6 2 0只需要输出图像灰度数据,将其配置为黑白摄像 模式( b w= 1 ) , 亮度数据从y口 输出, 而u v口 保持三态。 o v 7 6 2 0 支持帧曝光模式( f r a m e e x p o s u r e m o d e ) , 在此模式f 通过外 部的机械快门 保证传感器所有感光阵列曝光时间相同, 此模式在某些高级应 用中被采用。 默认情况下o v 7 6 2 0 使用线曝光 模式( l in e e x p o s u r e m o d e ) , 不需要外部快门, 但在一 行一行读出图像数据的同时曝光同时进行。 我们的 设计采用默认的线曝光模式。 o v 7 6 2 0 由 两种功能配置方式, 其一是由 芯片在上电 ( p o w e r u p ) 或者重启 ( r e s e t ) 时通过 一 次性读入控制脚的电平来对相应的功能进行配置。 其互是通 过s c c b总线配置,两者只能选其一,通过s b b脚来选择。 第一种配置方 式 不能 提 供 对 所有 的 芯 片 功能 特性的 控制, 要 完 全 控 制 芯片 的 所 有 特 性, 必 须通过 s c c b总线方式访问并更改 s c c b寄存器组来进行。 综上 所述, 在我们的系统中o v 7 6 2 0 工作在q v g a逐行方式下, 输出帧 率为3 0 帧/ 秒,仅由y ( 0 : 7 )门输出图像灰度数据,通过s c c b总线来进 浙江人学硕 十 学位论文 行功能配置。 由于d s p的处理速度和存储空间有限, 我们采取丢帧的方式处 理o v 7 6 2 0 输出的数据, 每秒3 0 帧原始数据中只取等间隔的5 - 6 帧来处理。 1 6 b i t 方式输出时序图如一 卜可以看到h r e f 在用户定义的窗f 数据输出 时为高电平: t e l k pcl k href 丫 u v 自 举方式有以下 儿类: . 从8 位或是 16 位的e p r o m中并行加载。 并行的从 串行的从 位或是 位或是 6 位的 i / 0 加载。 6 位的串行日加载。 . h p i c _1 加载。 2 ) 片内r a m 5 4 0 2 内有1 6 k 双字长 的双寻址访问 d a r a m ,其由两块8k

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论