已阅读5页,还剩53页未读, 继续免费阅读
(计算机应用技术专业论文)基于龙芯simd技术的realvideo解码优化.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 在龙芯2 号处理器的众多应用中,r e a l d e 0 视频播放是最重要的应用之一。 r e a l d e 0 作为目前主流的网络视频格式,在提高性能的同时也带来了更加复杂的编、 解码算法。这给龙芯2 号处理器播放r e a l d e o 视频文件提出了更高的要求。 在龙芯2 号平台上,未进行多媒体优化时r e a l v i d e o 视频解码时间占总播放时间的 9 0 以上,其中去块效应滤波、运动补偿插值运算、重构、反量化等部分的核心应用函 数消耗时间又占总解码时间的6 0 左右。龙芯2 号c p u 为加强多媒体处理能力,设计 实现了一个6 4 位的s i m d 定点多媒体指令集。该指令集为在龙芯平台下优化r e a l d e 0 解码器提供了可能。 本文基于龙芯2 号平台的s i m d 技术对r e a l d e o 解码器进行了多媒体优化。首先, 从静态程序分析的角度入手,对r e a l d e 0 的核心压缩算法进行了深入研究,并初步确 定优化方向;接着从执行时间和动态指令两个方面分析了解码器在龙芯2 号上的动态运 行情况,并取得与静态分析相吻合的结果,从而确定了该解码器的核心解码函数;最后 通过分析这些核心函数的数据并行性,结合龙芯2 号体系结构的特点,使用多媒体指令 对r e a l d e 0 解码器进行了优化。 优化后的r e a l d e o 解码器在龙芯2 号平台上的解码效率提高了约3 0 ,播放 r e 椭d e o 文件的整体效率提高了约2 0 。这种基于龙芯s m i d 技术对r e a l v i d e o 解码 器的优化方法取得了比较理想的效果。 关键词:r c 础d e o ,解码,龙芯,s m m ,多媒体指令 o p 棘弧i z 纛t 主。珏斌r e a l v 耋d e od e 鹅d i 嘴1 2 i 鄹e do 鼓s i m d 骶e h 珏o l o g y 如1 薹国o 珏g 鳓建 ( c o 隧赋嚣a 弹l i e 蕊潍风妇o l o 影) d i 溉t i 硪b ya s s o c i a 绝p 姻w hs h g 雒g a b s 耄1 襞e l c 涮莲脚锻趣强e 西龇臻嘁纽带隰觚鑫帮l i 酬。潞奴如g s 鳃_ 2 即c 髂蹴翘 t h ec u 玎e 嫩m a i 】! l s :i 黔鼬n 咖o r kv i d e of o 咖媳r e a l d e o 诬嫩a s e s 辨触雒c ew b i l ena l s o m n 势as 嘶e so fm o r ec o m p l i c a t e dc o d i n g d e d i n ga l g o r i m m s ,w 嫩c hp u tp r e s s u r eo n r e a l d e o 矗l e sp l a y i n go nt h el o o n g s o n 一2p l a t f o 溉诵t l ll 佣黼舭q u e n c y o n 龇l o o n g s o n 2p l a t f o 咖,mn om u l t i 锄e d i a0 p t i i i l i z a t i o nm et i l r 屺o f 鼬a l v i d e 0 d e c o d i n ga c c ( 眦f o rm o 粥t 董l a n9 0 o f 龇t o t a 重p l a y i n g 缸l e ,i 芏1w k c ht h ec o r e 雒p l i c a l i o n 内稳瞻强s ,s 琢滚懿乏k b l o e 毯| 塔嚣l t l 纛。蛀。魏黼p 鼹僦。髓钿奄髅筘l a 耄i o 建o p 娌a 宝i o 岛 羚燃| 拄毗l i o 氇黻通l e q 氆嵫i 妨璐姗e 鑫的瀵6 0 o fm e 豢o l 醴如c o d 妇gt i l ¥跨ko 珥嚣幻 e 幽嫩e 骶a b i l 诹o fm l l l t i m c 斌a 踟i c c s s 蛾o fl 0 0 n g s - 2c p u ,as c to f “- b i t 散1 p o i n t s i m di n u l 洲i ai i l s 饥l c t i o nh 嬲b e e nd e s i 龃e da n d 诚p l e m e n t e d ,w h i c hm a k ei tp o s s i b l et 0 0 p t i m i z er e a l v i d e od c c o d i n g0 nl 0 0 n g s o np l a 渤m b a s e do nt 量l et c c h n o l o 盱o fs i m do n 也eb o n g s o n - 2p l a d b m ,t 1 1 i sp a p e rm a d e 疆l e 瑚聪珏澍i ao p 融主z a :娃o n 细r e a l d 鼬如c s f 主r 瓯雠渊铡呻豫s s i o na l g o 矗髓腿o f 氇e 至k 越v i 矗的w 瑟l l 自陇概d 速侥番群弱誊喇v eo f 懿蓬哇c 辫蛩g 撼m 越x 醵y s 主s 瑟d 谯ep 辩l 磁鼓鑫翠 o p t i 搬i 臻l i o nd 按e c 毫i o 程c 擞l 蟪。啦。s e e o n d ,也e 由嚏燎戚cp e 确f l n a n a n a l y s i s 鳃t h e l 0 0 n g s o 小2p l a t f o n nw 弱m a 如丘0 me x c c u t i t i o l lt i m e 柚dd y n a 戚ci l l s t r i 删o l l s a n dt l l e r e s l l l t so ft i l et 、i 旧嬲p 。c t s 越擒l y s i sc o i 舶l c i d ew i t hm a t o ft i l es t a t i ca l l a j y s i s ,s u _ t l lt l l a tt l l ec o 舱 o f 也cc o d e cd e c o d i n gf h i l c t i o nw a si d e n t i f i e d f i 蹦l y ,b y 删归n gd a 协p a r a l l e l i s mo fm c c o r e 氛】芏l c 缸o l 塔搬垴t :h cc 量潮t e ro fm el o o n g s o n - 2s y s t e l n ,m e 酬v i d c 0 d e c sb a s e do n 翅馥i 氆菘主ai 瓒黯蠡。教掰鹬q 如i z e d 确棼掇e i 钱c y 靠r e a l d e oc o 如c s 斓 c f 印耄i l 】也:a 耋i 隧傀t l 捡k 燃秘醴一2p l 鑫渤斑ll l 曩s b e 馓l l a n c e db y3 0 ,a n d 妇o f 她黜斌v i d c op l a y 堍h 徽b e 雠妇p v e db y2 0 。b a s e d 傩廿璩l o o n g s l o ns i m dt e c h l o g y ,t h i sm e n h ) do fo p t i l i l j z a 廿o no fr c a l v i d c oc o d e ch a s m 勰e 黼f l ys 磷s 氛建。秽愆s 试锯 k e yw o r d s :r e a l d e o ,d e c o d i i l g ,l o o n g s o i l s i m d ,m 试t i m e d i ai n g 蚋l c t j o n s 关于学位论文的独创性声明 本人郑重声明:所星交的论文是本人在指导教师指导下独立进行研究工作所取得的 成果,论文中有关资料和数据是实事求是的。尽我所知,除文中已经加以标注和致谢外, 本论文不包含其他人已经发表或撰写的研究成果,也不包含本人或他人为获得中匡石油 大学( 华东) 或其它教育机构的学位或学历证书丽使用过的材料。与我一同工作的同志 对研究所做的任何贡献均已在论文中作出了暖确的说明。 若有不实之处,本人愿意承担相关法律责任。 学位论文作者签名:垄ji 虫日期:沙。爹年堂胄巧尽 学位论文使用授权书 本人完全同意中国石油大学( 华东) 有权使用本学位论文( 氲括但不限于其印刷舨 和电子版) ,使用方式包括但不限于:保留学位论文,按规定向国家有关部门( 机构) 送交学位论文,以学术交流为鬻的赠送和交换学位论文,允许学位论文被查阅、借阅和 复印,将学位论文的全部或部分内容编入有关数据库进行检索,采用影印、缩印或其他 复制手段保存学位论文。 保密学位论文在解密后的使用授权同上。 学位论文作者签名:室辽整 指导教师签名: 篡,之遮兰 日期:凇够年堂月诟日 日期:矽塞年岁月巧日 中国石油大学( 华东) 硕士学位论文 第一章绪论 1 1 课题来源、背景及意义 本课题来源于8 6 3 计划项因低成本先进计算机( 项目号:2 0 0 6 a a o l 0 2 0 1 ) ,同 时受江苏省科技成果转化项目龙芯c p u 产业化应用( 项目号:b a 2 0 0 4 0 2 9 ) 资助。 龙芯系列处理器是我国拥有完全自主知识产权的高性能通用处理器。与恁芯l 号处 理器相比,龙芯2 号处理器1 1 l 性能大大提高,应用范围也更加广泛。在龙芯2 号处理器 的众多应用中,视频播放是其中最重要的应用之一。目前,龙芯2 号平台已实现对 m p e ( j l 、m p e g ,2 、m p e ( 弭及嗍7 、w m v 8 、w m v 9 等格式视频文件的支持,并且 通过软解码实现了各类m p e g 文件的流畅播放,但尚不支持r e a l v i d e o 格式的视频文件。 然而,随着网络技术的迅猛发展,r e a l d c o 视频格式在i n t e m e t 上得到广泛的应用和传 播,业已发展成为目前最流行的网络视频格式之一。因此,在龙芯平台下实现对 r e a l d e 0 视频文件的支持,有着重要的现实意义和应用价值。 与其它视频格式相比,斌v i 文件在获得更高压缩比的同时,也带来了更加复杂 的编、解码算法,这给低端处理器播放r e a l d e o 视频文件提出了更高的要求。本文工 作开展之初,将纯c 语言下的融斌v i d 解码器移植到龙芯2 号平台上,只能正常播放 平均码率在3 5 0 k b p s 、分辨率在3 5 2 ) 【2 8 8 像素以下的r e a l d e 视频流文件,而这远不能 满足龙芯2 号处理器的应用需求。 视频文件的播放总时间由视频解码、视频输出、音频解码与输出、系统开销四部分 组成,其中视频解码部分占比重最大,视频输出部分也占相当大的比重。匿前,龙芯2 号处理器通过为播放软件m p l a y e r 移植高速视频输出库v i d i x 【2 】和增加加速显卡显存访 闯的u 粒a c 魏穗a c c e l e 蹴i 驾技术嘲,有效的减少了视频输擞的时闻,僵r e 鑫l v i 曲。视频 文件的播放效果仍然不能令人满意。 龙芯2 号处理器采用s l m d 技术溺,通过扩展多媒体撵令集实现对多媒体应焉的指 令级支持。s i m d 即单指令多数据流,是一种典型的并行数据处理技术。处理器把输入 的数据分解为多个较短的数据,然后由单指令并行操作,从而提高处理海量、可分解数 据的能力。“龙芯”的s i m d 技术比较适合在对相邻数据做同样处理的场合,即对密集型 的数据处理来说,s 蹦d 对程序加速效采非常明显。在融越硪& o 视频解码过程中,存 在大量的低精度数据的重复操作,因此龙芯2 号多媒体指令集的实现,为减少视频解码 第一章绪论 时阆,从而提高播放黜a l v i d 视频文件的效率提供了条件。本谍题就是在这种背景下 提出并展开相关研究工作的。 l 。2 研究现状 1 2 1r e a l d c o 视频解码器在不同平台下的移植与优化 r e 畦辘如。视频文件格式是繇减n 鳓阳呔s 公司针对视频流应用进行开发的,它的设 计初衷是牺牲部分画面质量来换取可连续观看性。r e a l v i d e o 出色的压缩效率和支持流 式撩放的特点,使得它在霹络和娱乐场合等领域占有裾当大的市场份额。磊前, r e a l d e o 作为最流行的流媒体格式之一,广泛应用于远程教育、网络电台、视频点播 等领域,其解码器也被移植到不同的平台下。但可以肯定的是针对每一种平台,都要对 该解码器进行一定程度的软件优化,以达到该平台下的最佳播放效果。 英特尔公司将融斌v i d e o 解码器移植到x 8 6 平台,并采用m m x 瑟】技术对其进行了 软件优化。m m x 技术是英特尔公司针对x 8 6 体系结构的一次重大扩充,使计算机同多 媒体相关任务的综合处理能力提高了1 5 2 倍,该技术是英特尔自i 3 8 6 面世以来对 x 8 6 体系结构的一次显著改进。英特尔为m m x 技术设计了一组基本的、通用的整型指 令集,以满足各种多媒体和通讯应用的需要。其中最基本的就是单指令多数据( 即s i m d ) 技术。表1 1 为r e a l r l ( s 公司提供的一组r 嚣a l v i d 解码器在x 8 6 平台下的优化 数据,详见参考文献【6 】。 表1 1 酗m d 解码器在p i l l 胡o 期暾上的优化 飘b 孙l - lo p 锻m i z a 髓o no fr e a l d d e c o d e rf o rp m6 0 0 解码解码时间 视频文件分辨率码率帧率帧数模式 ( r - v 9 ) ( 辩s ) 未优化 l 3 3 a k i y oq c i f 3 0 k1 53 0 0妒1 2 优纯 l 。0 8 a l c i y oq c 零 3 0 k1 53 铲1 2 未优化 2 7 9c o m m e r c i a l q c i f 4 8 k1 56 2 6 q = 2 5 优纯 l 。9 8c o l 鞋掇e l 鑫l q c l f 毒8 k1 56 2 6 q 5 随着数码产品的普及,各类嵌入式平台也加入了移植和优化黜妣d e o 解码器的行 列。霸前,在高端嵌入式领域,对r 瘫v i 籼视频格式的支持己成为衡量产品性能的一 个重要指标。表l - 2 为r c a ln e 咖妇公司提供的一组r e a l v i d e o 解码器在康柏掌上电脑 i e 旧3 6 5 0 的工作数据,其采用的处理器为s 哟n g 删网2 0 6m h z 。 2 巾国石油大学( 华东) 硕士学位论文 表1 2r e a i 、,黼e o 解码器在& m n g a r m2 0 6m h z 上的优化 解码勰码时间 视频文件分辨率码率帧率帧数模式 ( r v 9 )( m s ) 来优化 2 4 6 3f e 黻瑟 q c l f 3 0 k1 5 q 一2 6 优化1 8 5 2f 0 r e m 柚 q c i f 3 0 k1 5 q 芦2 6 来优化 7 9 。3 7脚口黝 4 8 k1 5 铲2 l 优化 5 2 3 6 f a 噶oq v g a 4 8 k1 5 q = = 2 l 不难看出,r e a l v i d e o 视频解码器在x 8 6 及删平台下的多媒体优化,都取得了 较好的效果。 1 2 2 基于龙芯2 号s i m d 技术的m p e g 2 视频解码优化 m p e g 2 视频播放是龙芯处理器重要的应用之一。在龙芯2 号早期的版本中( 如2 b , 2 c ) ,m p e g 2 视频播放速度不甚理想,在龙芯2 号随后版本中( 如2 e 和2 f ) 加入的 s i m d 定点多媒体指令集,为优化m p e 0 2 视频在龙芯平台的播放提供了条件。关于龙 芯2 号s 狲囝定点多媒体指令集的情况,将在后续章节中详细介绍。 龙芯平台下m p e g 2 的优化工作主要是针对占解码时闻8 5 的l d c t 和运动章 偿进 行的。s 巩囝技术的采用大大提高了该部分数据的并行处理,并最终将m p e q 2 在龙芯 平台播放的整体加速比提高了1 4 l 。6 倍。m p 舳2 解码的复杂度虽然远低于r e a l v i d e 0 解码,但其优化思路为本文提供了借鉴,同时其优化结果,也可作为本文制定工作目标 的参考。关于龙芯2 号优化m p e g 2 解码的详细资料,见参考文献【8 】。 1 3 主要工作及目标 1 研究与课题相关技术,主要包括3 个方面的内容: 首先是对龙芯视频播放软件m p l a y e 的分析和研究。m 1 p l a y e r 是龙芯平台的主流播 放软件,本身不包含凡斌v i 粕视频的解码程序。因此,为了实现m p l a 蹦对弛a l 渤 解码器的调用,前期对脚l a y e r 的分析工作是必不可少懿。本文篱要分析了脚l a y 烈的 播放过程,并给出了龙芯平台下m p l a y e r 的主要目录及文件的结构和功能。 其次是龙芯体系结构及其多媒体指令集的学习和研究。龙芯2 号微处理器是一个兼 容m i p s i i i 指令集的6 4 位s c 结构f l o 】微处理器。它的多媒体指令集是龙芯系列的第一 个s m 指令集,支持对8 个字节、4 个1 6 位数、2 个3 2 位数或1 个6 4 位数的并行定 点操作。本文大量王作是在龙芯2 号平台下健用多媒体指令编写汇编程序,因此该部 分蠹容的学习和研究是本课题开展的登要前提。 第一章绪论 最后是多媒体性能评测方法研究。对多媒体性能进行评测时,多采用核心型基准程 序或者应用型基准程序。当前绝大部分的多媒体性能评测基准都是基于w i n d o w s 平台 的,丽龙芯平食使用的是l i l 嗽系统,因此寻找一种准确、赢效的多媒体评测手段,也 是本文前期的研究内容之一。 2 。分析黜斌d e o 视频解码器 采用多种方法对r e a l d e o 解码器进行分析,找出其在龙芯2 号平台上的热点函数 及解码瓶颈,进而给出提高解码效率的优化构想,为本文的优化工作提供理论依据。 3 优化r e a l v i d e o 视频解码器 在分析r 溺v i d e o 视频解码原理及其数据结构的基础上,将龙芯2 号的s 狲国技术 应用于该解码器,最终通过提高数据并行处理的方法优化r c a l d e o 解码器。 4 性能评测和比较 选用多个测试文件,从不同角度对解码器优化效果进行评测和比较,确保优化结果 的准确性。 5 本文的目标 鉴于越v l d e o 解码器在x 8 6 和羽支m 架构下的优化结果戬及龙芯平台下m p 粥2 解码的优化结果,本文希望通过s m i d 优化,能达到在龙芯2 号平台下无声、无视频输 出、全速解码融畦d 视频流时闻减少3 0 ,播放总时间减少2 0 的墨标,并希望给 今后的进一步优化工作提供参考和借鉴。 l 。4 论文的组织结构 第一章绪论。主要介绍了本课题的背景及意义、国内外的研究现状、课题的研究内 容、髓标以及本文的组织结构。 第二章r c 越d e o 视频解码优化技术。分析龙芯2 号的体系结构及其多媒体指令集, 研究视频播放软件m p l a y e r ,并介绍多媒体性能评测方法。 第三章r e a l v i d e o 视频解码器在龙芯2 号上的运行分析。通过静态及动态分析,找 出解码瓶颈,提出优化构想。 第四章r 湖v i d e o 解码器在龙芯2 号上的s 州d 优化。使用龙芯2 号多媒体指令集 对r 溺d 解码器进行优化。 第五章r e a l d e o 解码器优化性能评测。对优化前后结果进行了评测、比较。 第六章总结与展望。总结全文,归纳创新点,并给出以后的研究方向。 4 中国石淮大学( 华东) 硕士学位论文 第二章r e 甜v i 曲。视频解码优化技术 翻耐约视频格式由觥的张威s 公司开发,一开始定位在视频流应用方瑟,它 可以在用5 6 km o d e m 拨号上网的条件实现不间断的视频播放。r e a l d e o 的设计初衷 是牺牲部分溺面质量来换取可连续观看性,但实际上a l v i d e o 弱样可以实现不错鑫勺萄 面质量。r e a l v i d e o 出色的压缩效率和支持流式播放的特征,使得r e a l d e o 在网络和娱 乐场合占有相当大的市场份额。露前,融癌v i d 鼬解码技术被广泛移植到不同的平台下, 本文将完成该解码技术在龙芯平台的实现,并对其解码性能进行优化。 本章主要对优纯滋籼解码器的穗关技术进行7 研究,其中包括龙芯2 号体系 结构研究、s i m d 技术研究及l i n u x 系统下的视频播放技术研究等。 2 1 龙芯2 号处理器及其s i 加技术 龙芯2 号是一个兼容m l p s m 【l l 】指令集的、通用甜位s c 结构微处理器,是一个 四发射的超标量和超流水线结构,采用了很多先进的技术来提高流水线的效率,主要包 括乱序执行和先进的c k 设计等技术。据佶算,在龙芯2 b 中实现龙芯2 号多媒体指 令集占用了不到2 的芯片面积。 2 。l 。l 龙芯2 鼍处理器 龙芯2 号微处理器的基本流水级为取指、译码、寄存器重命名、发射、执行、写回 和提交,有5 个功能部件,包括2 个定点功能部件、2 个浮点功能部件和一个访存部件, 每个时钟周期可以取指并译码四条指令,并通过指令调度,动态地将其发射到五个功能 部件中。尽管指令是蘸序执行的,但是最后的提交是有序的,并且实现了精确例外处理。 龙芯2 号主要利用乱序执行技术和先进的c a c h e 设计来提高流水线的效率。乱序执 行技术包括寄存器重命名、动态调度和转移指令预测等。龙芯2 号各有6 4 个定点和浮 点物理寄存器堆,寄存器重命名将定点或浮点的3 2 个名义寄存器映射到各自对应的6 4 个物理寄存器,不仅可以解决读后写和写后写这两种数据相关,而且记录了重要的信息, 这些信息对予精确例外处理和跳转指令预测失败回退处理必不可少。动态调度通过调整 指令执行的次序来降低r a w ( 写后读) 数据相关造成的暂停。龙芯2 号有1 6 项定点指令 保留站和1 6 项浮点指令保留站来实现指令乱序发射,还有一个3 2 项的r - c o r d e r 队列用 来保证乱序执行的指令最终可以按程序中原有顺序有序提交。转移指令预测在跳转指令 执行结果完成以前,预测转移的方向,可以解决控制相关。为了提高转移预测的准确度, 第二章r c a l 、喱d 视频解码优纯技术 龙芯2 号设计了一个1 6 项的8 豫,一个4 k 项的b 骶,一个9 位的g 腿和一个4 项的 r a s 。 2 。l 。2 龙芯2 号多媒体指令集 龙芯2 号多媒体指令集是龙芯系列的第一个s i m d 指令集,它共6 7 条指令,表2 1 给出了龙芯2 号的多媒体指令集。它是一个6 4 位定点s 戮d 指令集,支持对3 个字节、 4 个1 6 位数、2 个3 2 位数或1 个6 4 位数的并行定点操作。 表2 - l 龙蕊2 号多媒体指令集 运算方式w 呻a u 耐有符号饱和 无符号饱羊眭 指令类型、 81 63 2 6 4 81 63 281 63 2 加 奎 奎 囊 减 乘( 保留低位结果) 乘( 保蜜高位结果) 算术乘( 低位操作数) 乘加 求最大僵 求最小值 求绝对值差 是否裰等 辜囊 比较 是否大于等于 成组( p a c k ) 数据转 分组( u n 鼬c k ) 高 位 换 分组( u 愀) 低 位 插入 数据调抽取 整p m o v m a s k b 调序 8 使1 6 位3 2 位雒使 与域 p a n d n 逻辑 或菲 异或 龙芯2 号支持的浮点指令是兼容m 撙s l 至l 薛,指令中包括一个5 位的触域,它只用 了1 6 和1 7 两个值,因此使用触域保留值可以复用已有的浮点指令,龙芯2 号多媒体 6 中黉石油大学臻弦醇鳃鹈库 l i b a 今 音频过滤器库 = 0 s d e p 与o s 相关的文件 却瞎, 辨设输入 音频输出库 视频输出库 m p l a y e r 图形界面 表2 - 3 龙芯2 号播放器主要文件及功能 t a m e 2 - 3 1 r i m a r y 翻舔a n d 加n c t i o n so fp i a y e ri nl o o n 铲o n _ 2 文锫名文件功能 m p - - m s g c 播放器出错信息处理功能 p l a 洳c 播放捌表功能实现 c p u t a b l e i h c p u 类型定义 c p u d e t e c t c 检测c p u 类型 雉p l a y e 芤e 主程序 s 仃l :甜虬c 定义各类数据流 d e m u x c 定义各类分流器 虢警翻矮o 。c 音频孵码器调震 d e 9 - v i d e o c 视频解码器调用 a f c 音频滤波 、瞪c视频滤波 a 0 c 音频输出 v o 簟c视频输粥 1 2 中嚣石油大学( 华衮) 硕士学位论文 播放器_ 开始运行瑟,主程序m p l 鑫y 既e 负责分流、解码、输崽3 个功能模块的文件 调度,如图2 9 所示。 图2 毋m p i a y e r 播放器目录文件组织结构 弱鹳1 9h 哇m a r yd 飙蜘她冀n d 搦髓o fm p h y 材 1 分流。对输入的媒体数据进行分流所要调用的文件都存放在媒体数据分析分流 库q i b m p d e 搬u x 当中。首先调用s 瞻a 擞e 文件,判断数据流类型,播放器定义了多种文 件流类型,分别是s t r e 锄f i l e c ,咖姗邱c ,妣蝴撇绷c ,s 讹撇眦1 1 c , s 咖獭v c d c ,s 堙e 锄v s 拄e 撇。e 等。从中挑选出正确的文件进行数据流的处理。下一步 调用d c m l l 】【眠c 文件,判断媒体类型,继而调用对应的分流器对媒体数据进行音、视频 的分流。播放器包含的分流器类型很多,常用到的文件有出魏u x 擞篷c ,妇越驭髓e , d e m u xa v i c ,d 锄l r c a l c 等。 2 。解码。解码分为视频解码和音频解码。以撬频解码为例,媒体编解码库 中的谑。e 文件,从中选择对应静解码器。最怎由 v d 妇 1 i l p e g c ( 以妇眈弹g c 解码器为例) 对视频数据进行解码。若要对视频进行控制,如 亮度设置、对比度设置、图像翻转、放大缩小等,还要从v e 文件孛相应滤波器对视频 进行滤波处理。需要指出的是,m p l a y e r 采用的解码库中,不包含对r e 甜d e 0 视频的 第二章r e a l v i d 视频解码优化技术 解码程序。本文首次以动态库的形式将燃汹解码器移植到龙芯平台,并实现了 m p l a y e r 对它的调用。 3 。输出。输出也分力视频输出和音频输出。以视频输出为例,视频输出疼i 辆驴 中的文件v i d - 0 u t c 首先判断输出设备类型( 如f r a m e b u 腩r 1 1 6 1 、v i d i ) ( ) ,继而调用相 应的设备驱动。通过瑚磁e v e 将解码屠的视频按照帧的方式从b 毽貔f 或v i 莲i x 等设备上播放。 2 3 多媒体性能评测基准 基准程序是对计算机系统某个方面的性能进行综合测试的程序,是计算机性能评价 的工具和方法。基准程序有不同的类型,最简单的如汉诺塔f 1 刁或八皇后【1 s 】之类的基准程 序和合成基准程序( 某些指令凑成的短程序,纯粹为了测试,并不进行有实际意义的计 算) 。但是,在进行多媒体性能评测的时候,人们通常不会用上述几类基准程序,丽会 采用核心型基准程序或者应用型基准程序。 核心型基准程序是从实际的应用中抽取出来的占该应用运行时间比重较大的代码 段,通常会用多媒体指令对其进行优化后组成库的形式,这样原应用就可以通过调用库 中的函数进行优化。应用型基准程序是一个在计算机系统上实际运行的完整应用,它所 选用的输入数据集对现实的数据集具有很好的代表性。因此,应用型基准程序的测试结 果,相比核心型基准程序测试结果而言,更具有权威性。 当前,绝大部分多媒体工作负载都是基于w 越o w s 平台的。为了研究多媒体工作负 载的特性,并对已有的s i m d 体系结构进行比较、评测,美国伯克利大学的研究人员在 上个世纪末设计了一组基于u 出系统的多媒体工作负载【嘲,其中包括了很多在现实中 具有代表意义的多媒体应用,并且所选应用都是开放源代码的。 2 3 。ll i 懿x 系统下的多媒体性缝评测 1 多媒体应用核心 多媒体应用中逶常会有一个或多个核心,它们常以函数的形式如现,占用了大量的 运行时间,多媒体指令集设计的初衷就是为了加速这些核心。多媒体应用核心例是多媒 体性能评测的手段之一,通常用来对单个厂商豹多媒体指令集进行性缝分析,方法是从 该厂商提供的多媒体核心优化函数库中抽取优化后的多媒体核心,用优化前后的多媒体 核心运行时闻计算出多媒体应用核心加速比,将其作为一个性能评测的重要指标。 2 多媒体工作负载 1 4 审嚣石油大学( 华东) 磺士学位论文 多媒体王作负载是一类重要的多媒体性能评测手段,遗德的是,迄今为止还没有一 个类似s p e cc p u 2 0 0 0 【2 1 l 样被普遍接受和广泛应用的多媒体工作负载。为了研究多媒 体工作负载的特性,并对已有的s i m d 体系结构进行比较、评测,美国伯克利大学的研 究人员在上个世纪末设计了一组多媒体工作负载,他们比较了当时的各种多媒体应用, 最终选取了一组u 曲系统下的开放源代码的多媒体应用,这些应用在当时具有很嵩的 代表性,采用的数据集也具有一定的代表性。表2 - 4 给出了伯克利多媒体工作负载所包 含应用名字及其数据集。 表2 0 伯克利多媒体工作负载 弧b 地4m 酣滚舶r 锻do fb e 掩姆 名称描述 数据集特征 节选歌剧片断,2 8 秒长,单声道,采样 a 粼轰莲燃鹾音频匿缝 频率4 4 骶z ,1 6 键群本 d j v u a 1 盯i w 4 4 小波图像编码器数字彩色照片,分辨率4 9 l x 7 2 6 游戏场最,长2 5 8 秒,共7 7 4 帧播放速 d 蝴 d o o m 商业3 d 的枪战多镜头游戏 度3 0 帧秒 i & h o s 蹴穗噼p o 瞅r i 辫音编瓣 节选论文牵鲶一炙,长2 4 8 k 字节 节选一段语音,2 4 秒长,单声道,采样 g s m g s m 语音编码 频率8 料_ l z ,1 6 位样本 j p e g 基于d c t 块变换的图像编码 同功v u 数据集 l ,a m e m p e g - l 层3 音频编码同a d p c m 数据集 三个动硒,各3 0 帧,每帧分辨率 m 蝴 o p e n g l a p i 内核( v 3 o ) l0 2 4 x 7 6 8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《电气控制系统中热继电器的精准选型与工程应用》-高职电气自动化技术专业二年级项目化教案
- 建筑使用年限方案范本
- 2025年临海市托幼机构卫生保健促规范培训试题及答案
- 安全生产管理宣传活动方案模板
- 体育环保教案
- 石块挡土墙施工细节与方案解析
- 屋面防水维修施工方案
- 四年级下册劳动教案
- 木材供货合同范本模板
- 建筑工程主体施工方案
- 雷斯丹一生健康
- 重庆市2025年高考真题化学试卷(含答案)
- 家长进课堂科学课件
- 江苏苏州2024~2025学年高二下册6月期末考试数学试题含解析
- DB1331∕T 054-2023 雄安新区建筑节能与绿色建筑工程施工质量验收标准
- 四川省江油市五校2025年七年级英语第二学期期末联考试题含答案
- 污水处理中菌藻共生系统的污染物去除机理及技术应用现状研究
- 湖北省武汉市2018年中考物理真题试卷(含答案)
- 教育学原理 课件 马工程 8-教学;9-教师与学生;10-教育科学研究
- PDCA循环降低低分子肝素注射皮下出血发生率医院护理质量改善案例
- 数据中心运维服务投标方案
评论
0/150
提交评论