下一代Centeral Process Unit的多媒体处理.doc_第1页
下一代Centeral Process Unit的多媒体处理.doc_第2页
下一代Centeral Process Unit的多媒体处理.doc_第3页
下一代Centeral Process Unit的多媒体处理.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

新一代Centeral Process Unit的多媒体处理回顾通用X86中央处理器的多媒体处理功能发展历史,介绍现在发展情况并展望发展未来新一代Centeral Process Unit的多媒体处理 要点:在日常的多媒体应用中,我们最主要的工具就是计算机,通过计算机的硬件和软件的支持,我们可以实现各种各样的多媒体应用。现在已经有很多厂商开始研发和生产专门的媒体处理芯片,比如Phlips公司开发的Trimedia,这种专用芯片具有成本低、实时性好、处理能力强、升级容易等特点,但它们的应用范围还是远不及PC的。PC将在比较长的一段时间里作为多媒体处理的主要角色,而CPU作为计算机的核心,它的发展也直接关系到多媒体技术进一步发展。在今后的几个月,Intel和AMD作为两家最大的通用CPU生产厂商陆续推出了他们的下一代产品,CPU的多媒体处理能力将作为本文探讨的重点。CPU多媒体处理的历史 追根溯源的话最早的CPU产生于1971年,当时还处在发展阶段的INTEL公司推出了世界上第一台微处理器4004。这不但是第一个用于计算器的4位微处理器,也是第一款个人有能力买得起的电脑处理器!4004含有2300个晶体管,功能相当有限,我们可以认为它并不具有多媒体处理的能力。又过了十几年,随着个人电脑 在世界范围内的流行,功能更强大的CPU也被生产出来,它们的多媒体处理能力也越来越强,但其本身并没有进行专门的对多媒体处理的优化改进。 直到Pentium MMX的出现。也许是INTEL认为Pentium 系列还是有很大的潜力可挖,1996年底推出了Pentium 系列的改进版本,厂家代号P55C,也就是我们平常所说的Pentium MMX(多能奔腾)。MMX技术是INTEL新发明的一项多媒体增强指令集技术,它的英文全称可以翻译多媒体扩展指令集 ,它是Intel公司在1996年为增强Pentium CPU在音像、图形和通信应用方面而采取的新技术,为CPU增加了57条专门指令。除了指令集中增加MMX指令外,还将CPU芯片内的L1缓存由原来的16KB增加到32KB(16K指命+16K数据)MMX CPU比普通CPU在运行含有MMX指令的程序时,处理多媒体的能力上提高了60左右。MMX技术不但是一个创新,而且还开创了CPU开发的新纪元,目前的KNI,3D NOW!也是从MMX发展演变过来的。我们可以说MMX是第一个专门为多媒体处理而对CPU增加的改进。 Pentium III(Katmai) 作为20世纪X86产品的最后一 作,它在多媒体处理方面做了重大的改进:为MMX 添加了70条新指令,以增强三维和浮点应用,并让原来支持MMX的软件和WEB开发程序运行得更快,这个技术被命名为MMX2,它可兼容以前的所有MMX程序,此规格是英特尔公司在1998年1月宣布的。新指令包括浮点数据类型的SIMD,CPU会并行处理指令,因而在软件重复做某项工作时可以发挥很大的优势。与MMX相比较的,MMX新增57条指令所提供的SIMD仅对整数类型有效。我们知道三维应用与浮点的关系很密切,强化了浮点运算即是加快了三维处理。以下几种多媒体处理都能从中受益。 首先是三维几何学,进行变换3D坐标(特别是同时变换几个)工作时,SIMD会在一秒中做出更多的操作,所以利用SIMD浮点指令将得到更高的性能,它能进一步对场景做渲染、实时影子效果、倒映之类的工作。对于最终用户来说,这意味着物体更生动,表面更光滑。在图中可以看出各种新增的变换指令,其中光线的控制是3D环境的关键,一种类似于浮点矩阵操作决定从物体表面反射光线的颜色和数量。游戏开发商们为了减低CPU的计算量常常去掉那些额外或复杂的光线,但一个场景的复杂光线能比普通着色起到更好的视觉效果。MMX2中的SIMD浮点指令就能对之进行平行编码,可以大大减轻处理器的负担,以获取更高水准的现实。其次是三维物体,MMX2不仅对3D场景有作用,而且能对游戏中活动的物体和人物加以改善。Katmai提供的额外计算能力能够支持现有技术,如:在复杂目标和移动物体上的碰撞侦察和对象物理化。它也可以使用未来的技术,如:前置运动和后置运动(它们能改善应用程序中的刚性和固态物体,让之接近真实)。最终用户将感受到交互性和真实性都有巨大的变化。再次是图像处理(特别是一些不常用的操作)亦受益于Katmai的平行编码和数据结构,图像变形的操作使用浮点计算比整数运算减少了一些CPU时钟周期。它可增加图像尺寸和图像混合操作,这对商业和个人绘图软件,高分辨率数字相机,高端图形工作站都有极大的帮助。 第四,视频加速。视频编辑软件比成像计算的要求更苛刻,高配置的机器是必不可少的。因为它需要大量的实时运算,不论是个人视频创造软件,还是专业视频生产软件,都要保证视频流数据运行于2430帧/秒。除了图像操作之外,作为视频计算核心的压缩/解压运算法则也很重要,加入MMX2可以使应用程序得到更高分辨率的图像和更快的帧数,它们是:MPEG,DVD/MPEG2、。 第五,语音识别,Katmai可对前置语音处理作加速,把新的代码增加到软件中能增强它搜索所需匹配单词的能力,它能减少出错的比率和缩短响应时间。 第六,音频输出。大多数音频输入和输出采样率是16位,许多中介音频处理都需要强大的浮点处理,包括FFT,FIR,IIR,平行信号处理滤波技术。SIMD浮点处理能让开发者容易利用杜比数字音频之类软件技术,作用包括:以多音源产生3D音效,修改声音样品取得不同效果,实时生成相应音乐,用物理建模造出高品质的乐曲和音轨,动态和交互式语音。 随后CPU的多媒体指令集进一步发展,Intel又在SSE的基础上推出了更先进的SSE2指令集。SSE2包含了144条指令,由两个部分组:SSE部分和MMX部分。SSE部分主要负责处理浮点数,而MMX部分则专门计算整数。SSE2的寄存器容量是MMX寄存器的两倍,寄存器存储数据也增加了两倍。在指令处理速度保持不变的情况下,通过SSE2优化后的程序和软件运行速度也能够提高两倍。由于SSE2指令集与MMX指令集相兼容,因此被MMX优化过的程序很容易被SSE2再进行更深层次的优化,达到更好的运行效果。SSE2对于处理器的性能的提升是十分明显的。 现在最新的多媒体指令集是SSE3指令,它是目前规模最小的指令集,它只有13条指令。它 共划分为五个应运层,分别为数据传输命令、数据处理命令、特殊处理命令、优化命令、超线程性能增强五个部分,其中超线程性能增强是一种全新的指令集,它可以提升处理器的超线程的处理能力,大大简化了超线程的数据处理过程,使处理器能够更加快速的进行并行数据处理。这些指令对3D图形处理非常有帮助,因为它们有效地简化了标量向量乘积的计算,对波形过程和声音处理的计算很有帮助,也就是对所有使用快速离散傅立叶变换的任务有益。另一方面,AMD也推出了自己的多媒体指令集3DNow!,该指令集应该是在SSE指令之前推出的,被广泛运用于AMD的K6、K6-2和K7系列处理器上,拥有21条扩展指令集。在整体上3DNow!的SSE非常相相似,它们都拥有8个新的寄存器,但是3DNow!是64位的,而SSE是128位。所以3DNow!它只能存储两个浮点数据,而不是四个。但是它和SSE的侧重点有所不同,3DNow!指令集主要针对三维建模、坐标变换和效果渲染等3D数据的处理,在相应的软件配合下,可以大幅度提高处理器的3D处理性能。AMD公司后来又在Athlon系列处理器上开发了新的Enhanced 3DNow!指令集,新的增强指令数达了52个,目前最为流行的Athlon 64系列处理器还是支持3DNow!指令的。 新一代CPU的多媒体处理及发展前景 现在处理器市场上,64位技术已经开始普及起来,随着制造工艺的发展另一方面双核心甚至多核心的产品也已经展现在我们面前。随着CPU处理性能的提高,它们自身在多媒体处理方面无疑也得到了极大的提高,Intel和AMD各自的新一代产品上也开始了各自不同的技术路线。 就在2006年度春季IDF大会(Intel Developer Forum,英特尔开发者论坛)上,Intel宣布了下一代处理器将统一采用全新的微架构,并将其正式命名为Core(酷睿)。Core微架构拥有双核心、64bit指令集、4发射的超标量体系结构和乱序执行机制等技术,使用65nm制造工艺生产,支持36bit的物理寻址和48bit的虚拟内存寻址,支持包括SSE4在内的Intel所有扩展指令集。Core微架构的每个内核拥有32KB的一级指令缓存、32KB的双端口一级数据缓存,2个内核共同拥有4MB或2MB的共享式二级缓存。从历史上来看,每一次新的多媒体扩展指令集的出现都将极大的提高CPU的多媒体处理能力,由于资料有限,在网上只能查到:英特尔公司公布了向其x86 芯片中增添约50条新指令的计划。英特尔此举是为了加速包括搜索、数学运算、多媒体处理在内的任务的执行速度。新的扩展指令集可以分为二大类。第一类是SSE4第四代流式SIMD(单指令流多数据流)扩展。英特尔表示,SIMD使得芯片能够对1 个以上的数据单元执行相同的操作,而无需每个数据单元都带有1 条指令,在处理图像、视频、音频时能够节约许多操作。SSE4还能够提高高性能计算的性能。第二类指令能够加速二种特定的应用。一种是搜索和模式匹配,这对手写体识别和基因研究特别有用;另一种是CRC 技术,能够监视计算机系统中数据传输的完整性。 另一方面根据AMD最近公布的路线图来看,AMD在明年中旬将推出代号为K8L的处理器,而届时Intel的Core 2处理器已经推出一年多时间。K8L原计划将采用四核心设计,在单一晶元上整合4个独立的执行处理核心,并同时采用共享L3缓存设计,四核心共享一个控制闩门及一个内存控制器,指令从16bit增加到32bit、引入更为完善的分支预测算法、类似于Conroe的乱序指令读取机制等等,这些改进都将可以消除处理器在整数运算方面的瓶颈,提升整体运算的性能。 除此之外AMD还有另一个野心勃勃的计划,在完成并购ATI之后,它同时宣布将于明(2007)年推出的整合式平台,以及预定于2008年问世的整合了CPU和GPU功能的全新x86处理器。AMD预计开发新类型的x86处理器,内部嵌入有中央处理器(CPU,Central Processing Unit)与绘图处理器(GPU,Graphics Processing Unit),并在硅组件层级中结合许多创新的设计;而此计划代号为Fusion。AMD计划研发具备功耗微调(step-function)功能的Fusion处理器,带来胜过现今单纯CPU架构的每瓦性能,并针对3D绘图、数字媒体、以及高性能运算等领域,提供最佳的客户经验。结论 从上面的发展我们可预见到,随着通用CPU的不断发展,除了物理运算速度的提高,功耗的控制外,它们最主要的性能发展将集中在多媒体处理上。从各种多媒体处理指令集的应用以满足各种媒体处理需求,又从硬件实现CPU和GPU的一体化融合,这一发展无论结果如何,无疑是会令人们为技术的革新而兴奋。甚至可以大胆的猜测,以后的主板上将只剩下一颗处理器,它包括了CPU、GPU、音频处理、网络等全面的处理能力,而它的多媒体处理能力也将较之于现在产生质的飞跃。引用资料来源: 1、 关于CPU等相关词条 2、 / 关于Intel和AMD的最新产品消息 3、 AMD下一代CPU架构预览 4、 http:/www.it.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论