下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
【Word版本下载可任意编辑】网络的嵌入式IP可视电话设计方案(3)使用软件流水。
在编译时,使用-o2选项和-o3选项,编译器可对循环代码实现软件流水。为填满软件流水线,软件流水构造需要执行的循环迭代次数称为循环次数。循环总数小于循环次数时,执行不流水形式循环;循环总数大于循环次数时,执行软件流水形式循环。可以使用-ms选项,使编译器根据循环次数仅产生一种循环形式;可使用-o3和-pm选项,使优化器访问整个程序,了解循环次数信息;使用-nassert内联函数,防止冗余循环产生;使用-mh选项,消除软件流水循环的排空,从而减小代码尺寸。
由于在嵌套循环中编译器仅对里面的循环执行软件流水,因此对于执行周期很少的内循环开展循环展开,对外循环开展软件流水。
使用软件流水应当注意的问题:尽管软件流水循环可以包含内联函数,但不能包含函数调用;在循环中不使用break语句;循环控制变量不能与循环体内的语句有关;如果循环体内复杂的条件代码需要超过5个条件存放器或者32个以上存放器,则这个循环不可开展软件流水。
(4)片内存储器的分配及DMA技术的运用。
DM643内部有16KB的程序缓存、16KB的数据缓存和256KB的程序数据共享二级缓存,远小于执行程序和待处理图像数据,不可能将程序和图像数据都在片内RAM中缓存,因此合理地配置和使用存储空间,对系统整体效率影响很大。
提高算法程序执行速度的关键是使循环代码和要访问的数据在第1次访问之后全部发生L1P和L1D命中。循环代码占的空间很小,执行过之后,完全可以全部在L1P中缓存,因此,不用考虑代码如何在存储器中存放,主要问题是图像数据的存放。
由于L1D采取LRU(LeastRecentlyUsed)分配机制,因此对于小于等于16KB的连续存放的数据块可完全在L1D中命中。以解码过程为例,IDCT和运动补偿模块都是以宏块为单位开展运算的,IDCT数据类型为short型,运动补偿中的预测帧和当前帧的数据类型为unsignedchar型。计算一个宏块(420格式)的IDCT和运动补偿要访问的数据大小共需1536字节,运动补偿的数据包括预测宏块和当前宏块的数据,实际解码中以6个宏块(10KB)作为1次处理对象。待处理的数据要从外部存储器搬到L2中连续的存储空间,可利用EDMA与CPU并行工作的特点,采取Ping??Pong技术,使CPU在处理Ping空间数据的同时,由EDMA将下次要处理的数据搬到Pong空间中;当CPU处理Pong空间数据时,再由EDMA将Ping空间已处理好的数据搬回外部存储器,并将下次要处理的数据搬到Ping空间,这样就可到达CPU的计算能力。Ping、Pong空间各占用的大小为20KB,两个总共约40KB.L2中的剩余空间分出64KB留给数据空间,用于解码中常用的解码表、量化步长、输入压缩码流缓冲区和输出码流缓冲区等。64KB的程序空间用于存储H.264算法中的运动预测、运动补偿和中断服务程序等关键代码。L2其余部分配置为Cache,操作与L1D类似。
2.2编写线性汇编代码
为了提高代码性能,对影响处理速度的关键C代码段可以用线性汇编重新编写。线性汇编代码类似于汇编代码,不同的是线性汇编代码中不需要给出汇编代码必须指出的所有信息(如所使用的存放器、指令的并行与否、指令的延迟周期和指令使用的功能单元等),汇编优化器会根据代码的情况确定这些信息。当然,如果能够事先确定一些信息(如循环的执行次数、存储区的地址等),则编写的线性汇编代码的效率更高。具体的优化措施如下:
①使用伪指令向汇编优化器提供较为详细的信息。
②画出指令的相关图,根据相关图合理分配逻辑单元,限度地保证指令的并行执行。
③充分使用C64xDSP提供的强大包处理指令处理数据(包处理指令可同时处理2个l6位数据和4个8位数据)。本系统中使用了AVGU4、MIN2、MAX2、SPACKU4、PACK2、D0TP2、D0TPN2和UNPKLU4等指令。C64xDSP还提供了STDW(STNDW)、LDDW(LDNDW)指令,可存取连续的64位数据。可利用LDDW指令,将作1次行变换所需数据1次取来,并将处理后的结果利用STDW指令存好。这样大大缩短了代码长度,提高了代码效率。
④利用ScheduleTable确定循环的重复间隔,合理安排功能单元,开展软件的流水。
⑤对于两重循环嵌套,可将内层循环展开为外层循环内部的条件指令。这样可减小由内层循环所带来的循环前后的prolog和epilog的开销。
3性能分析
设计、调试好硬件系统,并在DM643上对整个系统软件开展设计和优化后,视/音频编/解码的处理速度及系统功能得到了很大提高。IP可视电话基本做到话音清晰并实时传输,在网络速度为30kbps以上时能实现CIF图像25~30帧/s,并可以音唇同步。
结语
该系统能在一颗DM643芯片上实现网络可视电话的几
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年直播带货运营直播间成交率提升调研
- 直播电商直播间精细化运营调研
- 乡镇古筝培训学员考级曲目选择调研
- 仿生3D支架模拟皮肤细胞外基质结构研究
- 代谢清除纳米载体用于肿瘤转移抑制研究
- 从“评什么”到“怎么评”:第三方评估机制升级
- 人工智能辅助诊疗知情同意的老年友好设计
- 人工智能辅助腹腔镜手术模拟的技能评估与转化
- 互联网健康教育用户行为数据分析
- 互联网+儿童生长发育监测与教育
- 2025甘肃庆阳正宁县公安局招聘警务辅助人员40人考试参考试题及答案解析
- 2024山东交通学院辅导员招聘笔试真题及答案
- 小型手持式采茶机
- 太空交通管理规则-洞察及研究
- 化学反应原理大题集训(含解析)-2026届高中化学一轮复习讲义
- 腹腔镜手术应用推广方案与技术指南
- 北京市西城区中学课余训练:现状洞察与发展探究
- 规划展馆改造项目方案(3篇)
- 玉米dh育种技术
- 头孢曲松钠过敏的观察与急救
- 幼儿园后勤人员培训会议记录2025
评论
0/150
提交评论