




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于曙光集群的动画渲染集群方案摘要:电脑动画是计算机图形学和艺术相结合的产物,它给人们提供了一个充分展示个人想像力和艺术才能的新天地。目前, 电脑动画已经广泛应用于影视特技、商业广告、游戏、计算机辅助教育等领域。而在各种影视和动画领域令人难以置信的视觉效果背后是众多的三维动画制作软件和视频特技制作软件。三维动画不仅需要非常强大的设计软件,更需要能提供强大运算能力的硬件平台。曙光公司作为国内服务器技术领先的企业,拥有丰富行业经验。服务器产品包括从2路、4路到8路的AMD Opteron全线单、双核产品,可为动画设计行业的用户提供全面的产品解决方案。1.动画设计的背景和发展动画作为一种独特的视觉艺术形式一直受到广泛欢迎。从早期的二维动画设计到目前的三维动画设计,经历了将近10年的发展,已经步入全盛时期。这里提到的二维动画是指以 “分层”技术为基础的动画设计方法。动画师将运动的物体和静止的背景分别绘制在不同的透明胶片上,然后叠加在一起拍摄。发达的电脑技术与优秀动画师的联姻进一步推动了二维动画的发展,各个层开始在电脑上直接合成,电脑还能绘制出大自然、科幻式奇效等手绘无法完成的画面。而目前最为流行的三维动画设计则是依赖的CG技术通过电脑强大的运算能力来模拟现实,建模、运动、渲染是制造三维动画的基本步骤。总体说来二维动画更接近于绘画,而三维动画则更接近于摄影。目前,三维动画设计强大的优势越来越被人们所认可。同二维动画相比三维动画有着更为优美的动画画面和更加逼真的视觉效果。另外三维动画还具有许多突出优势:它不受帧数的限制,在模拟动作灯光都设置妥当的前提下,渲染程序可以自动产生足量的画面,使影片看起来如同现实一般流畅自然;在着色方面,三维动画的渲染步骤是一次性的过程,不必再像二维动画那样逐帧着色,大大减少了重复劳动。就拿我们熟知的海底总动员为例,制作人员先依据原画,以点、线、面逐步完善的方式,创建出小鱼与周围的海洋环境的几何信息,这种搭“骨架”的方式就是“建模”;之后是“运动”,在有了模型的基础上,通过运动捕捉、力场模拟等方法来让小鱼们按照设计运动起来;接下来的“渲染”,则是在三维世界中添加虚拟的灯光、通过摄像机来模拟摄影,此时小鱼的肤色和纹理都变得十分清晰和逼真,海水也被赋予了流动的波纹;当然,建模、运动、渲染只是三个“基本”步骤,在经过“光照计算”,并按照虚拟摄影机的设置来逐帧成像之后,那些各式各样、色彩斑斓的鱼才能真正游动了起来。2.计算机动画制作的流程2.1.动画前期制作项目简介:电视3d系列宣传片,集广告宣传与趣味故事为一体的全三维动画制作概念设计业内通用的专业动画流程前期制作,内容包括根据剧本绘制的动画场景、角色、道具等的二维设计以及整体动画风格定位工作,给后面三维制作提供参考分镜故事板根据文字创意剧本进行的实际制作的分镜头工作,手绘图画构筑出画面,解释镜头运动,讲述情节给后面三维制作提供参考2.2动画中期制作3D粗模在三维软件中由建模人员制作出故事的场景、角色、道具的粗略模型,为Layout做准备。建模工作从简单的基本形体开始逐步修改、变形得到复杂的模型是建模的一项重要技术。基本形体的建立参数可以在创建之前设置,也可在创建之后编辑。其中复合物体主要是布尔运算(Boolean,19世纪英国数学家),主要是体块间的相并(Union)、相交(Intersection)和相减(Substraction)操作,可用于诸如在墙面上挖门洞、窗洞。3D故事板(Layout)用3D粗模根据剧本和分镜故事板制作出Layout(3D故事板)。其中包括软件中摄像机机位摆放安排、基本动画、镜头时间定制等知识。3D角色模型3D场景道具模型根据概念设计以及客户、监制、导演等的综合意见,在三维软件中进行模型的精确制作,是最终动画成片中的全部“演员”。贴图材质根据概念设计以及客户、监制、导演等的综合意见,对3D模型 “化妆”,进行色彩、纹理、质感等的设定工作,是动画制作流程中的必不可少的重要环节。贴图,顾名思义,就是使用一幅或多幅图像“贴”到模型上,制作物体表面的纹理(Texture)或绘图特征很显然,对具体的图像就要贴到特定的位置,三维软件使用了一种贴图坐标(Map Coordinate)的概念,一般有平面(Plannar)、柱体(Cylindrical)和球体(Spherefy)贴图,分别对应于不同的需求(注:Maya的贴图概念略有差别)。材质,即材料的质地,体现于物体的颜色、透明度、反光度和反光强度、自发光特性以及粗糙程度等特性上面。对于模型“毛坯”,如果不作贴图处理,就要对它设置相应的材质属性。毫不夸张地说,材质和贴图是一件作品的灵魂,好的材质和贴图可以弥补建模的不足。对于精细的物体,一般都需要多重贴图,如对一片叶子,可能要用到颜色贴图,凹凸贴图等。骨骼蒙皮根据故事情节分析,对3D中需要动画的模型(主要为角色)进行动画前的一些变形、动作驱动等相关设置,为动画师做好预备工作,提供动画解决方案。分镜动画参考剧本、分镜故事板,动画师会根据Layout的镜头和时间,给角色或其它需要活动的对象制作出每个镜头的表演动画。灯光根据前期概念设计的风格定位,由灯光师对动画场景进行照亮、细致的描绘、材质的精细调节,把握每个镜头的渲染气氛。计算机中的灯光一般都有泛光灯(如太阳、蜡烛等四面发射光线的光源)和方向灯(如探照灯、电筒等有照明方向的光源)。灯光起着照明场景,投射阴影以及增添氛围的作用。同真实的灯一样,你可以 选择光色、强度,设置衰减等,也包括一些真实灯光所没有的特性,如对场景中的物体选择性的影响以及是否投射阴影的控制。由于计算机中的物体没有反射性(除非使用辐射度(Radiosity)渲染器),因此设置一个恰当的照明环境是个比较麻烦的过程。3D特效根据具体故事,由特效师制作。若干种水、烟、雾、火、光效在三维软件中的实际制作表现方法。分层渲染/合成动画、灯光制作完成后,由渲染人员根据后期合成师的意见把各镜头文件分层渲染,提供合成用的图层和通道。2.3.动画后期制作配音配乐由剧本设计需要,由专业配音师根据镜头配音,根据剧情配上合适背景音乐和各种音效。剪辑用渲染的各图层影像,由后期人员合成完整成片,并根据客户及监制、导演意见剪辑成不同版本,以供不同需要用。动画合成传统的赛璐珞(cel)动画已经过时,计算机逐渐取代了他的位置。计算机动画一般使用关键帧(keyframe)的概念,即由设定动画主要画面(一般是动画中动作或场景变化较大的那一瞬间)并设置关键帧,而关键帧之间的过渡由计算机来完成,这个过程称为插值(Interplet)。为了形象化动画信息,更好地不编辑动画情态,三维软件大都将动画信息以动画曲线(Animation Curve)表示。动画曲线的横轴是时间(帧),竖轴是动画值,可以从动画曲线上看出动画设置的快慢急缓、上下跳跃。3.动画渲染的需求3.1什么是动画渲染渲染,英文为Render,也有的把它称为着色,但习惯把Shade称为着色,把Render称为渲染。Shade是一种显示方案,一般出现在三维软件的主要窗口中,和三维模型的线框图一样起到辅助观察模型的作用。Shade可以显示出简单的灯光效果、阴影效果和表面纹理效果,但是Shade采用的是一种实时显示技术,硬件的速度限制它无法实时地反馈出场景中的反射、折射等光线追踪效果。而现实工作中我们往往要把模型或者场景输出成图像文件、视频信号或者电影胶片,这就必须经过渲染程序。渲染是基于一套完整的程序计算出来的,硬件对它的影响只是一个速度问题,而不会改变渲染的结果,影响结果的是看它是基于什么程序渲染的。因此渲染可以细致的显示出纹理贴图、光源影响甚至阴影效果,比如是光影追踪还是光能传递等技术细节。3.2.动画制作软件简介当今影视、电视媒体和游戏工业中几种主流的三维动画与渲染软件,它们是:Alias公司的Maya、Avid公司的Softimage|XSI、Side Effects Software公司的Houdini、Discreet公司的3D Studio Max、Newtek公司的 Lightwave 3D、Pixar公司的Photorealistic Renderman和Mental Images公司的Mental Ray。目前主流的,被广泛应用的主要是Maya、Softimage|XSI和3D Studio Max。详细内容请参考4.6 动画制作和渲染的软件介绍。3.3.动画渲染的瓶颈三维图像处理过程由创建三维模型及执行几何运算开始。一个完整的三维图像处理过程可分为物理运算、几何转换、剪切及光效、三角形设定和像素渲染四个阶段,其中需要进行大量的浮点运算(包括物理实体、几何转换、剪切、光效,以及三角形设定)和整数运算(包括三角形设定和像素渲染)。因此在这种背景下,势必存在繁重低效的过程,也就“渲染瓶颈”。在进行三维创作过程,动画设计者大都使用图形工作站来完成渲染的任务。单机渲染视图和动画时所需时间往往让人难以忍受,30帧动画就可能耗费数小时,显然渲染时间显得十分困窘,使用单机工作站渲染视频动画的方式速度实在很低,往往是以数天计算,甚至上月的;这样的渲染占到很大的制作时间比例。另外,必须考虑解决渲染过程中的I/O瓶颈。当动画越来越逼真、模型越来越细腻、渲染要求越来越高的情况下,伴随着文件变大、素材库变大,庞大的数据处理将使得32位计算本身在架构上就成为一个瓶颈。因为32位的工作模式已经决定了I/O的带宽不能满足数据处理的要求。4.基于曙光集群的集群渲染在动画节目制作过程中渲染所需要的时间越来越多,而利用PC工作站来进行渲染的方式必定无法满足如此庞大的计算量。因此,我们需要使用集群渲染系统来解决渲染的瓶颈问题。并行集群渲染系统由一台或几台服务器、多台PC和网络连接设备构成,每台PC拥有中央处理器、主板、内存以及存储设备。渲染服务器通过一系列分布式工作命令借助强大的渲染能力来帮助设计师高效率地完成三维作品的最后成形。借助于分布式渲染器,动画设计者不仅可以在设计完成3维模型以后,导入集群渲染系统,通过集群渲染强大的数据处理能力,迅速的按需求进行动画或静帧进行渲染。通过分布式计算,将一个大型的模型快速渲染,时间往往缩短到原来的1/2,1/3,甚至几十分之一。原来可能要几天运算的数据,可能几个小时就能搞定,大大提高工作效率。 集群渲染系统是有很多渲染节点组成,采用领先的分布式渲染技术,系统将自动确定网络中可用的渲染节点和资源,同时将将任务分解到相应渲染节点,自动负载平衡功能可以优化工作流程中每个渲染节点的使用效率。如果某一个渲染节点与网络断开,内置式故障保护功能管理端将自动将作业重新路由到渲染集群中的其他渲染节点,确保渲染工作如期完成。 集群渲染系统目前可以很好的支持3dsmax,maya中或softimages、lightwave等软件设计模型的网络渲染工作。在实际应用的过程中,集群渲染系统将可以根据具体设计软件调整参数结合使用,较好地解决了复杂情况下的模型渲染问题。对于已经构造好的三维模型,也可以利用集群渲染,可以通过简单的设置对来对渲染模型属性参数进行交互式的编辑与修改,以达到迅速设定渲染模型的目的。 使用集群渲染能够大大节省了渲染时间、减轻了渲染劳动强度,同时能够为高效率地完成后续合成工作打下了坚实的基础。这一点在中、大型建筑模型应用和计算机动画等多媒体制作领域作用尤为明显。4.1.集群渲染介绍4.1.1.集群渲染的的流程每个工作站制作好的三维场景文件提交给管理节点服务器,由管理节点服务器将任务分发给系统中任意个计算节点,渲染完成后每个节点再将结果返回管理节点服务器,最后由管理服务器把视频信号输出到视频设备(如Beta Cam、DVD制作设备和打印机)或者三维/视频工作站。1)管理节点 管理节点主要承担两种任务,为计算节点提供基本的网络服务,以及调度计算节点上的工作,通常集群的工作调度程序应该运行在这个节点上。2)计算节点 计算节点是整个集群系统的计算核心,它的功能就是执行计算。这需要根据你的需要和预算来决定采用什么样的配置,对于集群系统来说,多CPU节点作为渲染系统的计算节点具有广泛的用户群,以及更高的性价比。3)存储节点 如果集群系统的应用运行需要大量的数据存储,比如HD素材,就需要一个存储节点。顾名思义,存储节点就是集群系统的数据存储器和数据服务器。 4)交换机 集群计算的进程迁移需要高速硬件连接设备,进行计算机之间的数据传输,可选的设备包括千兆网卡、交换机或者光纤卡以及相应的光纤交换机。对于中小型的集群系统来说,千兆的传输速率完全能够满足了。4.1.2.集群渲染完成的工作首先,渲染程序通过三维场景中的摄像机获取了需要渲染的范围,一般来说,三维软件已经提供了四个默认的摄像机,那就是软件中四个主要的窗口,分为顶视图、正视图、侧视图和透视图。渲染的是透视图,而透视图的摄像机基本遵循真实摄像机的原理,所以结果才会和真实的三维世界一样,具备立体感。接下来,体现空间感,渲染程序决定哪些物体在前面、哪些物体在后面和那些物体被遮挡等。之后,就要计算光源对物体的影响,这和真实世界的情况又是一样的。许多三维软件都有默认的光源,否则,我们是看不到透视图中的着色效果的,更不要说渲染了。因此,渲染程序就是要计算我们在场景中添加的每一个光源对物体的影响。渲染程序往往要计算大量的辅助光源。渲染程序还要计算一种特殊的阴影软阴影,场景中的光源如果使用了光源特效,渲染程序还将花费更多的系统资源来计算特效的结果,特别是体积光,也称为灯光雾,它会占用大量的系统资源。最后,渲染程序还要根据物体的材质来计算物体表面的颜色,材质的类型不同,属性不同,纹理不同都会产生各种不同的效果。而且,这个结果不是独立存在的,它必须和前面所说的光源结合起来。如果场景中有粒子系统,比如火焰、烟雾等,渲染程序都要加以“考虑”。4.2.集群渲染的特点具有强大渲染能力渲染集群中的渲染节点采用目前浮点运算性能强劲的的多处理器,配置大容量内存,合理科学的分布式的结构,充分发挥系统的整体浮点运算能力,使得整体渲染效能大幅提升。提高产品输出效率;节省设计师的时间,让他们去做创造性的工作而不是让他们的能力浪费在冗长的等待中。 独有功能 动态服务: 你可以联机或切断机器不需要停止你的程序.将会认别每一个修改和自动地恢复任何动态渲染。容错功能: 将渲染封包指派给机器, 及时检查遗失的帧与帧大小的差异.也可以查觉机器和重新改变封包路径。单帧处理: 可以使用一些工具的渲染功能部分去分割单一帧图片, 透过几个有用的工具可以产生测试渲染结果或大的打印图片。响应快、渲染快集群渲染服务器采用了分布式网络渲染技术,对于所建的模型文件小、用面省;同样的模型,分布式渲染器较传统单机工作站渲染速度提高约数倍,甚至数十倍,上百倍,渲染时间缩短到原先的1/3、1/5、甚至几十分之一 支持三维设计软件广泛支持市面上常见三维设计软件 Alias|Wavefront Maya 4.0,4.5,5.0和6.0, Softimage|3D, Softimage|XSI,Newtek Lightwave,3D Studio Max 6.0,Apple Shake,Adobe After Effects 6.0, Mental Ray for Maya 或 mental ray standalone 分布式渲染等软件,集群渲染系统在后期将支持更多的设计软件。 集群渲染服务器中采用积木式的灵活构造方法,使得动画设计者能够根据自身需要制定渲染集群的组合方式或处理时间,给使用者提供了很大的选择空间。 支持多平台客户端渲染,包括Windows NT/2000/XP, Linux(Redhat 8.0以上版本), Irix 6.5 和 Mac OS X (Apple OS X version 10.3 )机器上使用。完美的和多平台工作环境融合,充分利用已有设备,降低成本,提高工作效能。 渲染输出结果方便集群渲染服务器采用面向对象的三维渲染技术,渲染方式简单、方便、直观,符合后期合成设计人员工作习惯和思维方式。集群渲染服务器的输出手段灵活多样,可以直观地修改渲染的各类参数,也可以通过对输出属性的调整,及时改变输出结果特性与类型。 智能化渲染系统集群渲染服务器是智能化的工具型渲染系统,它不仅能够合理分配用户输入模型,而且能够对各个渲染节点处理能力进行自动匹配适应,使所渲染结果自然、合理。并采用了有效的渲染管理技术,分布式渲染器可以根据用户的需求继续渲染功能管理,如指定队列,任务渲染。 使用方式灵活,费用低集群渲染服务器对于自由设计者和小型动画工作室用户来说,可以采用临时租用的方式,这样相对成本低,效率高, 对于长期有大量渲染需求的用户来说,购买系统开始是一笔不算高的的开展,实施网络渲染器可以有效提高公司的业务处理能力,在单位时间内处理客户业务更多,创造价值更多,从长远上增加公司竞争力,相比之下长期成本成本更低。 4.3.渲染过程对CPU的选择对于动画渲染的处理以往主要由Alpha处理器、SGI工作站、Apple等所统治,而随着X86处理器性能的飞速提升,越来越多的厂商推出了基于X86处理器的工作站产品。在完成了模型构造后,在最终输出图形前还需要对模型进行渲染。如果处理算法复杂,要求的画面质量高,渲染生成的时间就会很长。对于3D设计类软件,其主要运算是浮点运算,而选择一款浮点性能出色的处理器无疑是提高工作效率的前提。AMD 处理器浮点运算能力非常强大,从而会大大提高3D渲染的工作效率。由于3D动画设计中对处理器的依赖较大,大多数图形工作站都采用了多处理器结构。通过将3D设计软件生成的进程分配到每个处理器上,系统可以比较大幅度的提升软件的运行速度。一般的多处理器系统都使用一条总线连接处理器与北桥芯片,在进行大量运算时势必会出现争夺数据带宽的情况,而AMD Opteron处理器构成的多处理器系统,则是使用HT总线互连。在高负载运算下,AMD Opteron这种结构更能充分发挥处理器的性能。4.3.1.AMD Opteron处理器的介绍一款64位处理器,同时兼容X86-32位应用在近二十年里,X86-32位平台广泛应用在各种计算环境,但随着各行业信息化的逐步深入,使得以往的32位计算平台在越来越多的高端应用中显得力不从心。32位计算的局限性不仅体现在处理器的计算能力上,还体现在系统对内存的控制上。传统的32位计算系统被限制在4GB的内存寻址能力上,这使得很多需要大容量内存的大规模的数据处理程序在这时都会显得捉襟见肘,形成了运行效率的瓶颈。而64位计算则可以突破这两大限制。同时,目前面临一个不争的事实,就是决大多数的应用软件都是32位。其中虽然64位应用需求正在不断加深,但是显然从32位完全过渡到64为系统需要一个过程。Opteron处理器就很好解决了这一点。它可以运行64位应用的同时,还可以兼容32位的应用,普通的32位应用软件可以不经过重新编译直接运行在这样的系统之下,如图所示。这样,用户就可以由32位平滑的过渡到64位。内置内存控制器技术AMD Opteron处理器将内存控制器集成到了CPU的内部,一方面使得内存控制器以CPU的频率运行(以往都是以总线频率运行),一方面又极大地减少了CPU内核和内存那控制器之间的距离,使得系统的内存访问延迟得到了极大的改善(减半),应用这样的内存控制技术,Opteron一改以往Xeon处理器内存访问的瓶颈问题,实现了超强的内存存取能力。内置内存控制器技术大大得提高了CPU访存的带宽,更重要的是,大幅度降低了CPU访存的延迟。这一点对于内存密集型应用程序,特别是不规则访存的应用程序来说,如MM5,在性能提升和可扩展性上有很大的帮助。Xeon和Itanium系统Opteron系统利用HT总线的直连架构AMD Opteron处理器利用HT(Hyper Thansport)总线实现了CPU和CPU,CPU和内存之间的直连架构,实现了CPU之间的通讯性能的提高。其双向的传输能力使得系统FSB(前端系统总线)概念在这款处理器上完全消失,或者我们可以认为基于Opteron处理器的系统的前端总线非常高(是至强系统的几倍)。4.4.渲染过程对单核双核的选择4.4.1.AMD Opteron双核处理器介绍CPU的性能每年以惊人的速度在提升。目前提高CPU性能的一个方法是通过减小晶体管的体积来提高CPU的主频,但这带来了CPU功耗的不断提升和CPU散热问题日趋困难。由于量子力学的不确定原理和CPU散热工艺的影响,通过提高CPU主频来提升CPU性能的方法日趋困难。目前各个CPU厂商都在一个硅片中放置多个处理器或者多个处理器的核,推出了双核CPU,并且向多核方向发展。AMD Opteron(皓龙)处理器从一开始设计时就考虑到了添加第二个内核,两个 CPU 内核使用相同的系统请求接口 SRI 、 HyperTransport 技术和内存控制器,兼容 90 纳米单内核处理器所使用的 940 引脚接口,而不是仅仅将两个完整的 CPU 封装在一起连接到同一个前端总线上的做法。AMD的技术架构为实现双核和多核奠定了坚实的基础。AMD直连架构(也就是通过超传输技术让 CPU 内核直接跟外部 I/O 相连,不通过前端总线)和集成内存控制器技术,使得每个内核都自己的高速缓存可资遣用,都有自己的专用车道直通 I/O ,没有资源争抢的问题,实现双核和多核更容易。在双核计算方面,借助直连架构和集成内存控制器技术,两个处理器核心直接连接到同一个内核上,核心之间以芯片速度通信,进一步降低了处理器之间的延迟,而且每个内核都有自己的高速缓存可资遣用,以及自己专用车道直通I/O,没有资源争抢问题。而不同CPU之间的直接相连,可以实现更加线性的对称多处理,能够以更低的频率处理更高的工作负担,因而避免了通常由多处理器设计导致的功率需求(和散热问题),提升计算密度,每瓦功耗产生的性能更高,使用户以低成本实现计算性能的飞跃式升级。双核AMD Opteron结构AMD Opteron双核处理器不仅仅带来性能上的优势,在电源功耗上也有着巨大的优势。AMD Opteron CPU的单核功耗为85W,双核处理器95W。Intel Xeon DP CPU或者Intel Xeon MP CPU的功耗都超过了100W,对于Intel Xeon双核处理器,其功耗就更高,在130W左右。我们以AMD双核处理器举例,采用AMD Opteron双核处理器,在提升了计算密度的同时,避免了通常由多处理器设计导致的功率需求和散热问题,每瓦功耗产生的性能更高,使用户以低成本实现计算性能的飞跃式升级。通过比较我们可以发现同主频下,一颗双核Opteron CPU仅比单核Opteron CPU功耗高10W,但同时性能确提高了两倍。若将一颗双核CPU和两颗单核CPU功耗相比较,1颗 AMD Opteron 265(双核)的功耗为:95 W2颗 AMD Opteron 244(单核)的功耗为:285.3 W170.6 W同主频下,一颗双核CPU的功耗是两颗单核CPU功耗的一半。由于采用双核CPU以后,机器的其它部件包括硬盘、主板等等都减少了一半,功耗也相应的减少。经测试发现,1台两路的双核节点机的正常运行功耗略大于2台双路单核节点机功耗的二分之一。系统功耗减少的同时会带来机房散热设备功率的减少和机房UPS容量的减少,采用双核处理器以后,包括机器、空调等整个机房的功耗比采用单核处理器减少了一半。在节约能源、降低日常运行费用的同时,又促进了环保。4.4.2.AMD Opteron双核和单核性能对比.性能测试单双核Opteron规格对照表在性能测试中,采用曙光的R4380A四路双核服务器,这是一台3U高度的机架式服务器,全长尺寸,安装了4颗Opteron-875双核处理器,具有8个计算核心。安装了4GB的DDR 333内存,最大支持20GB内存,支持4块热插拔SCSI硬盘,并且提供了CDROM 和FDD,同时在面板上提供了两个USB接口,这使得无论是安装系统还是维护服务器都变得十分方便。服务器的所有操作都集中在面板的右上角,电源开关、RESET、ID按键和网卡指示灯等一应俱全。测试环境配置测试环境选择的是Windows Server 2003 SP1 32位企业版和Windows Server 2003 64位测试版(正式版尚未发布,但在64位环境下进行测试非常有必要)。它们都安装了ASP .NET 2.0、V F 6.5、V STUDIO、SPEC CPU2000 V 1.2等测试环境和测试工具。测试结果分析SPEC CPU2000SPEC CPU2000是一个针对密集型整数、浮点计算的测试集合,它通过一个基准的测试包,对服务器的计算能力进行全面的分析,因为测试负荷大,不但考察了实际的整数、浮点计算能力,而且对内存系统的消耗也非常惊人,同时还对服务器的整体稳定性进行了考量。从图中可以清楚地看到,Opteron双核的性能已经远远超过其他的处理器,4路双核带来的8路计算能力可谓高不可攀了。虽然每一个计算核心的计算能力并没有太大的变化,但是在双核的良好配合和在HyperTransport的支持下,总体性能几乎是单颗处理器性能的8倍,这也说明了曙光R4380A服务器的良好架构给双核Opteron处理器提供了宽广的计算空间。SiSoftware性能对比虽然SiSoftware不是一个面向服务器的测试工具,但是它对各个子系统的测试还是能够从中觅到双核的威力。处理器性能突破了8万MIPS。多媒体整数性能13万,浮点性能20万,虽然和SPEC CPU2000略有不同,但是性能已经远远超过了用于对比的产品。内存性能过万,得益于Opteron内置的内存控制器,4颗处理器给内存带宽的提升做出了贡献。.应用测试这次测试采用了两颗AMD皓龙875双内核处理器,与同样平台的两颗单核皓龙246进行应用对比。测试软件为专业3D制作软件Softimage/XSI,渲染软件为XSI默认的Mental Ray渲染器,测试场景为一条30秒广告中使用3D制作的一个摩托车场景。该场景数据如下:Poly Model(多边形模型数):272Triangles(三角形数目):1027976Light(灯光):5Materials(材质):249Maps(帖图):27 材质和环境设置:Ray Trace真实光线追踪反射;从图中可以看出双核心系统的渲染速度明显要快于单核心系统,从渲染测试的最终结果来看,双核心系统的渲染性能比单核心要快了一倍。4.5.渲染对节点机的选择首先动画渲染是一个计算密集型的计算,对CPU的浮点运算能力要求较高,而胖节点架构将使用更多的CPU,这就增加了线程数,有利于快速完成大规模的计算量。其次,胖节点架构有利于性能的提高,因为它采用一种进程/线程间通讯,即胖节点采用CPU间通讯方式,系统将任务队列对称地分布于多个CPU之上,从而极大地提高了整个系统的数据处理能力。 而其他架构则采用节点间网络通讯的方式,众所周知并行程序运算的瓶颈在于通讯,过大的通讯延迟将影响运算速度,而胖节点很好的屏蔽了这一点,极大的提高了性能。另外胖节点架构提过对大内存支持,节点中任何一个CPU都可以使用节点内全部的内存,在运行串行程序时,这个程序可以申请很大的内存。同时提供多线程的支持, 一个节点中采用多个CPU,这些CPU之间可以进行多线程的并行。根据以上我们对动画渲染软件对于硬件的需求,推荐用户使用采用4路Opteron处理器的曙光R4280A服务器或具有更高性能的采用8路Opteron处理器的曙光A950服务器。我们的理由是:性能的极大提升由于采用了支持4路的Opteron CPU带来的性能提高。4P或8P SMP节点机系统会比2个2路的节点机用目前的任何网络连接要快。在4路SMP中,CPU与CPU的数据传递的带宽在6.4GB,延迟为60ns左右。而现在的高性能网络是远远达不到这一点的,特别是对计算性能影响最大的延迟方面差2个数量级。所以同是4个CPU,2个2路节点机之间的通讯和其他性能不能与4路节点相比。减少了节点规模带来了通讯性能的提高。众所周知,节点规模越小,效率越高,通讯性能越好。4路节点机使整个机群系统的节点规模比2路减少了一半,而8路节点机更是减少了四分之三,这样带来了机群通讯性能的极大提高。成本的极大降低网络设备的大量减少:通常,按照一个节点机配置2块网卡的通用模式,那么对于拥有128个处理器的系统,如果采用1U2P的架构得话,则需要64个节点机,那么至少需要128块网卡设备,而如果采用2U4P的架构得话,则只需要32个节点机,即64个网卡设备。而相对于网卡的简单减少,网络交换机的成本则可能得到非常大的降低,例如,对于64个2P节点,如果希望得到全线速的以太网交换能力,则通常采用模块化的大型交换机设备(普通的全线速交换机设备端口最多48个)或者可堆叠式的交换机,而这样的设备通常比正常的48口交换机设备昂贵很多,也就是需要更高的成本才能够提供全线速的交换能力。这样的特点更加突出体现在高速专用网络上,一方面高速专用网络的网卡设备数会明显降低,而这些网卡通常都非常昂贵,另一方面由于高速专用网络通常都采用全交换的拓扑结构,交换机数将会随节点数的提高而快速上升,这些交换机的成本也非常昂贵。主板个数的减半:很显然,作为服务器系统一个很大成本因素之一的主板个数将从4P和8P节点中获益。机柜的节省:节点数的减少可能会导致机柜数量的减少。曙光监控系统部件的节省:曙光监控板卡和曙光的SKVM系统都是随着节点数的增多而正比例提高的,因此采用4P或8P主板的节点会极大地减少这些部件的开销,从而降低整个节点的成本。功耗的降低采用4P或8P节点机使故障点减少,由于系统部件的大量减少,从而导致系统的故障点而因此减少。也因此降低了系统的维护成本。同时节点数目的减少,使电源得功耗也相应减少。如果采用1U2P单电源节点,则电源数随着节点数的增多而增加,而结点数减少,相应的电源个数也减少,这样就降低了功耗节约开支,同时减少了由于节点过多需要大功率制冷设备的开销。4.6.动画制作和渲染软件的选择4.6.1.三维动画软件.Alias公司Maya市场使用情况Maya可以说是当今三维动画领域之王,在过去的6年之中,它已逐步发展成故事电影、动画片制作行业的创立者和领先者。尤其在最近,由于Alias公司调整了价格策略,Maya也成为了视频游戏工业的强有力的参与者,但在游戏工业领域,其普及程度还稍微落后于Discreet公司的3D Studio Max。主要特色Maya具有非常著名的全能建模工具,强大的角色动画与特效制作能力,它是一款及其深奥和可扩展的软件系统,具有极强的协作开发能力。对于动画制作,Maya相对来说比较稳定,它对计算机的硬件利用率也比较高。对于实用性,它具有最先进、完全可配置的软件用户界面;独具特色的雕刻笔刷绘画工具,可以对场景中的物体进行实时的,自由绘画式的编辑、雕刻;它的绘画效果(Paint Effccts)工具可以直接将树木、玻璃、和其它三维视觉元素描绘到的三维空间之中并渲染出来;它的动力学模拟系统,包括刚体、柔体、流体力学、皮毛和毛发,再结合使用强大脚本编辑语言,使Maya成为了当今最伟大的特殊效果制作工具。 Maya自身的标准渲染器功能并不是十分强大,需要借助其他第三方的渲染软件进行动画设计。发展历史在Maya之前,Alias Research公司开发了两款当时非常有名的软件,它们是Alias Studio和Alias Power Animator,到目前为止Alias Studio仍然是一款在设计领域非常流行的工业、汽车设计软件。而早期的Alias Power Animator在加入了一些动画功能后,至今仍有一些娱乐行业的制作公司在使用。由于早期的Alias Research公司与另外一个公司Wavefront|TDI(这家公司拥有一系列的软件产品,如:Advanced Visualizer, TDI Explore, Kinemation, and Dynamation)合并,并取名AliasWavefront,才有了今天的Maya,后来AliasWavefront被美国以生产高端计算机,工作站,军事用计算机系统而著名的SGI公司并购,2004年,美国和加拿大的两家投资机构又从SGI公司手中购回AliasWavefront公司,现在改名为Alias公司。Maya目前的最新版本是Maya6.0。.Discreet公司3D Studio Max市场使用情况3D Studio Max 软件目前统治着视频游戏工业领域。它是在三维爱好者中最流行的三维软件,同时也有一些公司将它用于电影和电视产品的制作。主要特色3D Studio Max 提供了建模、动画及渲染解决方案,比如有支持其带有阴影能力的体积烟雾渲染输出的插件,或者模拟复杂流体动力学的插件等,3D Studio Max是第一款可以直接通过插件程序渲染出Flash动画格式的三维软件,另外还有几种插件渲染程序,可以支持3D Studio Max进行更强有力的光线追踪算法和全局照明渲染。如果加上这些高端的插件程序,3D Studio Max要比其他的软件程序贵很多。新版本的3ds max将满足游戏开发、 角色动画、电影电视视觉效果和设计行业方面日新月异的制作需求,专为流畅的角色动画和新一代的三维工作流程而设计。新版本包括业界首创游戏开发行业的工作流加速器“法线贴图”(Normal Mapping)和多边形编辑修改器(Edit Poly Modifier)。多边形编辑器(Edit Poly Modifier)使动画制作更为方便和快速。类似法线贴图这种开创先河的功能发扬了Discreet在不同的市场广泛收集创新性技术的传统,一种原本为某个市场领域(如游戏)开发的功能可能对其它的市场领域(如电影或设计视觉化)产生重大的影响。发展历史Discreet Logic公司以其后期合成、编辑产品Flint, Flame和Inferno等而著名。这些产品是一系列运行在SGI平台上的软硬件组合系统。后来Autodesk收购了Discreet Logic,生产出了3D Studio Max。很快,Autodesk又收购了Lightscape,所有的这些产品组成了一个两维、三维产品序列,公司也以一个更短的名字Discreet出现在市场之上。.Avid公司Softimage|XSI市场使用情况XSI在最近的高端三维动画软件市场中扮演着非常重要的角色,这个软件的开发公司Avid公司曾经以其早期的Softimage 3D软件统治过三维软件市场。但是由于若干年来集中精力XSI软件,使得它在与Maya的竞争中失去了相当的市场份额。最近,它又收回了一部分市场份额,所以在高端市场,XSI是Maya的最有力的竞争对手。主要特色Softimage|XSI是AVID公司面向高端三维影视市场的旗舰产品,是一个基于节点的体系结构,这就意味着所有的操作都是可以编辑的。它的动画合成器功能更是可以将任何动作进行混合,以达到自然过渡的效果。Softimage|XSI的灯光、材质和渲染已经达到了一个较高的境界,系统提供的几十种光斑特效可以延伸为千万种变化。XSI中的多边形建模方式是非常强大的,它同时还有不同类型的几种细分表面建模方式。XSI中的非线性动画系统非常强大,既可以编辑许多片断的动画序列,又能够同时对模型上的各种极端姿势,骨骼装配设定、约束,表情等进行变换、变形。XSI软件中完全无缝地集成了业界流行的著名渲染器Mental Ray,而且还有支持一个非常方便的渲染功能称为区域渲染(render regions),使用这个功能,动画师们只需在模型窗口上画出一个方形区域,就可以看到由Mental Ray渲染出来的具有光线追踪计算的局部渲染图像,并且可以随着参数的调节自动地更新,例如改变灯光的阴影设置以后,或者改变了摄像机的位置和动画以后等等。而且它的渲染系统还对其它软件中的多通道渲染具有最完全的支持。XSI中甚至还集成了后期合成系统。发展历史在XSI软件发布以前,其早期的产品名为Softimage|3D,是许多动画影片制作公司中非常流行的一款软件。Softimage|3D软件的早期名称The Softimage Creative Environment是业界第一款支持反向运动学(IK)系统和其它动画特点的的商业动画软件。Softimage曾经是一个位于加拿大蒙特利尔的独立软件开发商,但是在1994年被微软Microsoft收购,成为了当时第一个支持Windows平台的高端三维软件,当时所有的高端三维软件都是运行在SGI公司的IRIX平台上。后来微软Microsof通过交换股权的方式将Softimage卖给了现在的Avid公司,直到现在微软仍持有Avid公司的股权。4.6.2.渲染软件.Pixar公司Photorealistic RendermanRenderMan是好莱坞著名的动画公司PIXAR的所开发的用于电影及视频领域的最强渲染器。RenderMan具有功能强大的shader编译器和抗动画模糊功能,能够让设计者创造出非常棒复杂效果的动作片。同时RenderMan的还有一个功能是它的真实性,RenderMan能够渲染出照片级真实的图片,因此在工业界里的运用很受欢迎。市场使用情况Pixar公司的Photorealistic Renderman(简写PRMan)是电影制作公司最广泛使用的一个渲染解决方案。著名的Pixar公司、工业光魔公司(Industrial Light and Magic)和其他一些顶级电影制作公司都使用它来渲染电影中的三维场景。主要特色新版本中的Photorealistic Renderman 11中加入了光线追踪和全局照明功能,这些功能以前只能使用一些其他的渲染器来虚拟、计算。之所以在电影制作中大量使用Photorealistic Renderman是因为它渲染的图像非常鲜亮、置换贴图的细节和运动模糊效果非常逼真,可以非常快速地渲染出极高分辨率的图像。Renderman在渲染计算时,并不是在渲染之前就将所有的Nurbs表面模型或者细分表面模型镶嵌细分成多边形表面,而是分区域进行这个工作。Renderman的材质模型(Shader)是使用脚本语言编写出来的,这个脚本语言非常强大、灵活,且用容易使用。RenderMan渲染图片.Mental Images公司Mental Ray市场使用情况Mental Ray是Avid公司的Softimage|XSI中的标准渲染器,现在它也被包括在了Alias公司的Maya之中,而且在其他的动画系统中也越来越普及。主要特色Mental Ray是一个非常复杂的可编制程序的光线追踪渲染器,支持全局照明、光线的发散反射及光学特效。Mental Ray的材质模型就是一些标准的程序代码,通常是使用C+语言编写的。所以在速度上要优于用其他脚本语言编写的的材质模型。,但是这同时也给材质模型的开发工作带来了一定的困难。Mental Ray中的各个渲染进程都是用可编写程序式的材质模型进行控制的,比如几何体材质模型用来控制细分表面物体或者几何体的镶嵌细分,材质和贴图模型用来控制表面外观,光子材质模型用来控制全局照明效果,摄像机材质模型用来控制各种镜头的应用和抗锯齿效果。输出材质模型用来控制各种后期特效,等等。Mental Ray现在也是3ds Max中的一个可选渲染器,但是功能有限,不支持可编成的材质模型。5.曙光集群渲染的经典案例上海市多媒体公共服务平台由上海市科委、长宁区人民政府共同出资,由上海市科技信息中心、上海市多媒体行业协会共同建设完成。 该平台是上海研发公共服务平台多媒体领域的专业服务机构。平台旨在实现政府的服务功能,降低多媒体中、小企业的投入成本和运营成本,形成企业聚集效应,推动多媒体产业的发展。上海市多媒体公共服务平台服务对象是国内动画、影视制作及工业设计等需要高性能渲染计算和影视后期制作的企业和个人。平台的功能是为多媒体企业提供优质的特色服务。曙光双核产品R4380A在曙光的战略合作伙伴上海多媒体服务公共平台得到实践的全面检验,在双核服务器的帮助下,上海多媒体服务平台场景渲染速度较之过去翻了一倍,真正成为了生产创意的“梦工场”。在渲染过程中,由制作者发出的指令已多达上亿条。接下来的工作要靠超级计算机,它能以最快速度将图画渲染出来。以往一个场景的渲染往往让制作者们等的不可耐烦,可是自从引进3台曙光双核R4380A以来,制作者们不再有这种困惑,指令输入,场景渲染转瞬间轻松完成,速度提升一倍。速度提升如此之大有赖于曙光R4380A两颗CPU内核在提升系统性能、提高计算密度、提高性能功耗比等方面的独特优势。此外,曙光独特的3U机架高密度设计,使R4380A在大规模科学计算和数据处理领域性能尤为突出,既可作为Tflops级超级服务器的专用高性能计算节点,又可作为后台数据库服务器承担海量处理。所以,“梦工场”中场景渲染即使一时指令多达上亿条,R4380A也可以应对从容。应用到上海多媒体平台的R4380A服务器配置如下:3U机架式服务器机箱4颗AMD Opteron 875(2.2GHz)64位CPU8GB ECC Registered DDR内存(可扩展到20GB)1块73GB 10K RPM Ultra320 SCSI热插拔硬盘2块RJ45千兆以太网网卡四个64bit 100/133MHz PCI-X插槽850W 21热插拔冗余电源集成硬件监控芯片6.国外集群渲染的应用长期以来,好莱坞的电影大师都是采用采用专用图形工作站进行电脑特技制作的。但是,最近在全球同步公映的好莱坞巨片星球大战:西斯的反击却使用了基于AMD皓龙处理器和Windows 64位操作系统的通用图形工作站。与此同时,最近上演的史瑞克、罪恶之城、从尘埃到荣耀、鲨鱼黑帮,以及由罗伯.科恩导演、近期上演的绝密飞行等热门电影的特技制作,都采用AMD皓龙处理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 衢江区游乐设施管理办法
- 襄阳市道路管理办法规定
- 西秀区人才津贴管理办法
- 论坛管理研讨会暂行办法
- 评标委员会管理暂行办法
- 财务负责人委派管理办法
- 购物卡会计凭证管理办法
- 贵州省防洪预案管理办法
- 资产证券化业务管理办法
- 足球俱乐部运营管理办法
- DB43∕T 876.2-2014 高标准农田建设 第2部分:土地平整
- 针灸科重点病种诊疗方案
- 从管控到赋能:我国文艺演出市场发展进程中政府职能转变探究
- 光伏电站安全规程培训
- 贵州省贵阳市2025年八年级英语第二学期期末考试试题含答案
- 高水平专业群建设与产业适配性研究
- 中医养生保健知识讲座讲课件
- 2025至2030中国防爆设备行业发展分析及发展前景与投资报告
- 科研团队经费管理制度
- 药品企业研发管理制度
- 商协会公章管理制度
评论
0/150
提交评论