网游开发之如何建造3D世界.doc_第1页
网游开发之如何建造3D世界.doc_第2页
网游开发之如何建造3D世界.doc_第3页
网游开发之如何建造3D世界.doc_第4页
网游开发之如何建造3D世界.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网游开发之如何建造3D世界下面我们将从游戏设计者的角度讨论创造3D世界的一些细节,你也应该看一看DaveSalvator所写的“3D管线导论“,以便对3D图象生成的主要过程有一个整体的了解。3D物体(对象)被储存成3D世界中的一系列点(被称为顶点),彼此之间有相互关系,所以计算机知道如何在世界中的这些点之间画线或者是填充表面。一个立方体由8个点组成,每个角一个点。立方体有6个表面,分别代表它的每一个面。这就是3D对象储存的基础。对于一些比较复杂的3D物体,比如说一个Quake的关卡,将有数以千计(有时数以十万计)的顶点,和数以千计的多边形表面。参见上图的线框表示(注:原文在这里有一幅图)。本质上与上面的立方体例子类似,它仅仅是由许许多多的小多边形组成的一些复杂场景。模型和世界如何储存是渲染器的一部份功能,而不属于应用程序/游戏部份。游戏逻辑不需要知道对象在內存中如何表示,也不需要知道渲染器将怎样把他们显示出来。游戏只是需要知道渲染器将使用正确的视野去表示对象,并将在正确的动画幀中把正确的模型显示出来。在一个好的引擎中,渲染器应该是可以完全被一个新的渲染器替换掉,并且不需要去改动游戏的一行代码。许多跨平台引擎,而且许多自行开发的游戏机引擎就是这样的,如Unreal引擎,-举例来说,这个游戏GameCube版本的渲染器就可以被你任意的替换掉。让我们再看看内部的表示方法除了使用坐标系统,还有其他方法可以在计算机內存里表示空间的点。在数学上,你可以使用一个方程式来描述直线或曲线,并得到多边形,而几乎所有的3D显示卡都使用多边形来作为它们的最终渲染图元。一个图元就是你在任何显示卡上面所能使用的最低级的绘制(渲染)单位,几乎所有的硬件都是使用三个顶点的多边形(三角形)。新一代的nVidia和ATI显卡可以允许你以数学方式渲染(被称为高次表面),但因为这不是所有图形卡的标准,你还不能靠它作为渲染策略。从计算的角度来看,这通常有些昂贵,但它时常是新的实验技术的基础,例如,地表的渲染,或者对物件锐利的边缘进行柔化。我们将会在下面的曲面片小节中更进一步介绍这些高次表面。剔除概观问题来了。我现在有一个由几十万个顶点/多边形描述的世界。我以第一人称视角位于我们这个3D世界的一边。在视野中可以看见世界的一些多边形,而另外一些则不可见,因为一些物体,比如一面看得见的墙壁,遮挡住了它们。即使是最好的游戏编码人员,在目前的3D显卡上,在一个视野中也不能处理300,000个三角形且仍然维持60fps(一个主要目标)。显卡不能处理它,因此我们必须写一些代码,在把它们交给显卡处理之前除去那些看不见的多边形。这个过程被称为剔除。 如果你没有看到物体,那么物体就不在那里。通过剔除3D世界钟不可见的部分,游戏引擎可以减少可观的工作负载。来看上面的场景和图像,在建筑下面在一个屋子后面有另外一个屋子,但是如果从有优势的点看过去它并不可见,那么另外一个屋子的几何和其他三维数据就可以被忽略。有许多不同的剔除方法。在深入了解这些之前,让我们探讨一下为什么图形显示卡不能处理超高数量的多边形。我是说,最新的图形卡每秒钟不能处理几百万个多边形吗?它不应该能够处理吗?首先,你必须理解市场销售宣称的多边形生成率和真实世界的多边形生成率。行销上宣称的多边形生成率是图形显示卡理论上能够达到的多边形生成率。如果全部多边形都在屏幕上,相同的纹理,相同的尺寸大小,正在往显示卡上传送多边形的应用程序除了传送多边形以外什么也不做,这时显卡能处理多少多边形数量,就是图形芯片厂商呈现给你的数字。然而,在真实的游戏情形中,应用程序时常在后台做着许多其他的事情-多边形的3D变换,光照计算,拷贝较多的纹理到显卡內存,等等。不仅纹理要送到显示卡,而且还有每个多边形的细节。一些比较新的显卡允许你实际上在显卡內存本身里面储存模型/世界几何细节,但这可能是昂贵的,将会耗光纹理正常可以使用的空间,所以你最好能确定每一幀都在使用这些模型的顶点,否则你只是在浪费显示卡上的存储空间。我们就说到这里了。重要的是,在实际使用显卡时,并不必然就能达到你在显卡包装盒上所看到的那些指标,如果你有一个比较慢速的CPU,或没有足够的內存时,这种差异就尤为真实。基本的剔除方法最简单的剔除方式就是把世界分成区域,每个区域有一个其他可见区域的列表。那样,你只需要显示针对任何给定点的可见部分。如何生成可见视野区域的列表是技巧所在。再者,有许多方法可以用来生成可见区域列表,如BSP树,窥孔等等。可以肯定,当谈论DOOM或QUAKE时,你已经听到过使用BSP这个术语了。它表示二叉空间分割。BSP是一种将世界分成小区域的的方法,通过组织世界的多边形,容易确定哪些区域是可见的而哪些是不可见的从而方便了那些不想做太多绘制工作的基于软件的渲染器。它同时也以一种非常有效的方式让你知道你位于世界中的什么地方。在基于窥孔(Portal)的引擎(最早由3DRealms已经取消的Prey项目引入游戏世界)里,每个区域(或房间)都建造有自己的模型,通过每个区域的门(或窥孔)能够看见另外的区段。渲染器把每个区域作为独立的场景单独绘制。这就是它的大致原理。足以说这是任何一个渲染器的必需部份,而且非常重要。尽管一些这样的技术归类在"遮挡剔除"之下,但是他们全部都有同样的目的:尽早消除不必要的工作。对於一个FPS游戏(第一人称射击游戏)来说,视野中时常有许多三角形,而且游戏玩家承担视野的控制,丢弃或者剔除不可见的三角形就是绝对必要的了。对空间模拟来说也是这样的,你可以看见很远很远的地方剔除超过视觉范围外面的东西就非常重要。对于视野受到限制的游戏来说比如RTS(即时战略类游戏)-通常比较容易实现。通常渲染器的这个部份还是由软件来完成,而不是由显卡完成,由显卡来做这部分工作只是一个时间问题。基本的图形管线流程一个简单的例子,从游戏到多边形绘制的图形管线过程大致是这样:&-183;游戏决定在游戏中有哪些对象,它们的模型,使用的纹理,他们可能在什么动画幀,以及它们在游戏世界里的位置。游戏也决定照相机的位置和方向。&-183;游戏把这些信息传递给渲染器。以模型为例,渲染器首先要查看模型的大小,照相机的位置,然後决定模型在屏幕上是否全部可见,或者在观察者(照相机视野)的左边,在观察者的后面,或距离很远而不可见。它甚至会使用一些世界测定方式来计算出模型是否是可见的。(参见下面这条)&-183;世界可视化系统决定照相机在世界中的位置,并根据照相机视野决定世界的哪些区域/多边形是可见的。有许多方法可以完成这个任务,包括把世界分割成许多多重纹理与凹凸映射单一纹理映射给整个3D真实感图形带来很大的不同,但使用多重纹理甚至可以达到一些更加令人难忘的效果。过去这一直需要多遍渲染(绘制),严重影响了像素填充率。但许多具有多流水线的3D加速卡,如ATI#sRadeon和nVidia#sGeForce2及更高级的显卡,多重纹理可以在一遍渲染(绘制)过程中完成。产生多重纹理效果时,你先用一个纹理绘制多边形,然后再用另外一个纹理透明地绘制在多边形上面。这让你可以使纹理看上去在移动,或脉动,甚至产生阴影效果(我们在照明一节中描述过)。绘制第一个纹理映射,然后在上面绘制带透明的全黑纹理,引起一种是所有的织法黑色的但是有一个透明分层堆积过它的顶端,这就是-即时阴影。该技术被称为照明映射(有时也称为暗映射),直至新的Doom,一直是Id引擎里关卡照明的传统方法。凹凸贴图是最近涌现出来的一种古老技术。几年以前Matrox第一个在流行的3D游戏中发起使用各种不同形式的凹凸贴图。就是生成纹理来表现灯光在表面的投射,表现表面的凹凸或表面的裂缝。凹凸贴图并不随着灯光一起移动-它被设计用来表现一个表面上的细小瑕疵,而不是大的凹凸。比如说,在飞行模拟器中,你可以使用凹凸贴图来产生像是随机的地表细节,而不是重复地使用相同的纹理,看上去一点趣味也没有。凹凸贴图产生相当明显的表面细节,尽管是很高明的戏法,但严格意义上讲,凹凸贴图并不随着你的观察角度而变化。比较新的ATI和nVidia显卡片能执行每像素运算,这种缺省观察角度的不足就真的不再是有力而快速的法则了。无论是哪一种方法,到目前为止,没有游戏开发者太多的使用;更多的游戏能够且应该使用凹凸贴图。高速缓存抖动=糟糕的事物纹理高速缓存的管理对游戏引擎的速度至关重要。和任何高速缓存一样,缓存命中很好,而不命中将很糟糕。如果遇到纹理在图形显示卡内存被频繁地换入换出的情况,这就是纹理高速缓存抖动。发生这种情况时,通常API将会废弃每个纹理,结果是所有的纹理在下一幀将被重新加载,这非常耗时和浪费。对游戏玩家来说,当API重新加载纹理高速缓存时,会导致幀速率迟钝。在纹理高速缓存管理中,有各种不同的技术将纹理高速缓存抖动减到最少这是确保任何3D游戏引擎速度的一个决定性因素。纹理管理是件好事情这意味着只要求显卡使用纹理一次,而不是重复使用。这听起来有点自相矛盾,但效果是它意谓着对显卡说,"看,所有这些多边形全部使用这一个纹理,我们能够仅仅加载这个纹理一次而不是许多次吗?"这阻止API(或图形驱动软件)上传多次向显卡加载纹理。象OpenGL这样的API实际上通常处理纹理高速缓存管理,意谓着,根据一些规则,比如纹理存取的频率,API决定哪些纹理储存在显卡上,哪些纹理存储在主存。真正的问题来了:a)你时常无法知道API正在使用的准确规则。b)你时常要求在一幀中绘制更多的纹理,以致超出了显卡内存空间所能容纳的纹理。外一种纹理高速缓存管理技术是我们早先讨论的纹理压缩。很象声音波形文件被压缩成MP3文件,尽管无法达到那样的压缩比率,但纹理可以被压缩。从声音波形文件到MP3的压缩可以达到11:1的压缩比率,而绝大多数硬件支持的纹理压缩运算法则只有4:1的压缩比率,尽管如此,这样能产生很大的差别。除此之外,在渲染(绘制)过程中,只有在需要时,硬件才动态地对纹理进行解压缩。这一点非常棒,我们仅仅擦除即将可能用到的表面。如上所述,另外一种技术确保渲染器要求显卡对每个纹理只绘制一次。确定你想要渲染(绘制)的使用相同纹理的所有多边形同时送到显卡,而不是一个模型在这里,另一个模型在那里,然后又回到最初的纹理论。仅仅绘制一次,你也就通过AGP接口传送一次。QuakeIII在其阴影系统就是这么做的。处理多边形时,把它们加入到一个内部的阴影列表,一旦所有的多边形处理完毕,渲染器遍历纹理列表,就将纹理及所有使用这些纹理的多边形同时传送出去。上述过程在使用显卡的硬件T&L(如果支持的话)时,并不怎么有效。你面临的结局是,满屏幕都是使用相同纹理的大量的多边形小群组,所有多边形都使用不同的变换矩阵。这意谓着更多的时间花在建立显卡的硬件T&L引擎,更多的时间被浪费了。无论如何,因为他们有助于对整个模型使用统一的纹理,所以它对实际屏幕上的模型可以有效地工作。但是因为许多多边形倾向使用相同的墙壁纹理,所以对于世界场景的渲染,它常常就是地狱。通常它没有这么严重,因为大体而言,世界的纹理不会有那么大,这样一来API的纹理缓存系统将会替你处理这些,并把纹理保留在显卡以备再次使用。在游戏机上,通常没有纹理高速缓存系统(除非你写一个)。在PS2上面,你最好是远离"一次纹理"的方法。在Xbox上面,这是不重要的,因为它本身没有图形内存(它是UMA体系结构),且所有的纹理无论如何始终保留在主存之中。事实上,在今天的现代PCFPS游戏中,试图通过AGP接口传送大量纹理是第二个最通常的瓶颈。最大的瓶颈是实际几何处理,它要使东西出现在它应该出现的地方。在如今的3DFPS游戏中,最耗费时间的工作,显然是那些计算模型中每个顶点正确的世界位置的数学运算。如果你不把场景的纹理保持在预算之内,仅居其次的就是通过AGP接口传送大量的纹理了。然而,你确实有能力影响这些。通过降低顶层的MIP级别(还记得系统在哪里不断地为你细分纹理吗?),你就能够把系统正在尝试送到显卡的纹理大小减少一半。你的视觉质量会有所下降&-45;-尤其是在引人注目的电影片断中-但是你的幀速率上升了。这种方式对网络游戏尤其有帮助。实际上,SoldierofFortuneII和JediKnightII:Outcast这两款游戏在设计时针对的显卡还不是市场上的大众主流显卡。为了以最大大小观看他们的纹理,你的3D显卡至少需要有128MB的内存。这两种产品在思想上都是给未来设计的。关于内存使用的思考让我们想一想,在今天实际上是如何使用3D显卡内存的以及在将来又会如何使用。如今绝大多数3D显卡处理32位像素颜色,8位红色,8位蓝色,8位绿色,和8位透明度。这些组合的红,蓝和绿256个色度,可以组成16。7百万种颜色-那是你我可以在一个监视器上看见的所有颜色。那么,游戏设计大师JohnCarmack为什么要求64位颜色分辨率呢?如果我们看不出区别,又有什么意义呢?意义是:比如说,有十几个灯光照射模型上的点,颜色颜色各不相同。我们取模型的最初颜色,然后计算一个灯光的照射,模型颜色值将改变。然后我们计算另外的一个灯光,模型颜色值进一步改变。这里的问题是,因为颜色值只有8位,在计算了4个灯光之后,8位的颜色值将不足以给我们最后的颜色较好的分辨率和表现。分辨率的不足是由量化误差导致的,本质原因是由于位数不足引起的舍入误差。你能很快地用尽位数,而且同样地,所有的颜色被清掉。每颜色16或32位,你有一个更高分辨率,因此你能够反复着色以适当地表现最后的颜色。这样的颜色深度很快就能消耗大量的存储空间。我们也应提到整个显卡内存与纹理内存。这里所要说的是,每个3D显卡实际只有有限的内存,而这些内存要存储前端和后端缓冲区,Z缓冲区,还有所有的令人惊奇的纹理。最初的Voodoo1显卡只有2MB显存,后来RivaTNT提高到16MB显存。然后GeForce和ATIRage有32MB显存,现在一些GeForce2到4的显卡和Radeons带有64MB到128MB的显存。这为什么重要?好吧,让我们看一些数字比如你想让你的游戏看起来最好,所以你想要让它以32位屏幕,1280x1024分辨率和32位Z-缓冲跑起来。好,屏幕上每个像素4个字节,外加每个像素4字节的Z-缓冲,因为都是每像素32位。我们有1280x1024个像素也就是1,310,720个像素。基于前端缓冲区和Z-缓冲区的字节数,这个数字乘以8,是10,485,760字节。包括一个后端缓冲区,这样是1280x1024x12,也就是15,728,640字节,或15MB。在一个16MB显存的显卡上,就只给我们剩下1MB来存储所有的纹理。现在如果最初的纹理是真32位或4字节宽,那么我们每幀能在显卡上存储1MB/4字节每像素=262,144个像素。这大约是4个256x256的纹理页面。很清楚,上述例子表明,旧的16MB显卡没有现代游戏表现其绚丽画面所需要的足够内存。很明显,在它绘制画面的时候,我们每幀都必须重新把纹理装载到显卡。深度测试现在我们开始讨论深度测试,深度测试丢弃隐藏的像素,过度绘制开始起作用。过度绘制非常简单在一幀中,你数次绘制一个像素位置。它以3D场景中Z(深度)方向上存在的元素数量为基础,也被称为深度复杂度。如果你常常太多的过度绘制,-举例来说,符咒的眩目视觉特效,就象HereticII,能让你的幀速率变得很糟糕。当屏幕上的一些人们彼此施放符咒时,HereticII设计的一些最初效果造成的情形是,他们在一幀中对屏幕上每个相同的像素画了40次!不用说,这必须调整,尤其是软件渲染器,除了将游戏降低到象是滑雪表演外,它根本不能处理这样的负荷。深度测试是一种用来决定在相同的像素位置上哪些对象在其它对象前面的技术,这样我们就能够避免绘制那些隐藏的对象。看看这个场景并想一想哪些东西看不到,哪些东西在前边,或者遮挡了其他的场景对象。深度测试就是来做这个决定的。看着场景并想想你所看不见的。换句话说,是什么在其他场景对象前面,或者隐藏了其他场景对象?是深度测试作出的这个决定。我将进一步解释深度深度如何帮助提高幀速率。想像一个很琐细的场景,大量的多边形(或像素)位于彼此的后面,在渲染器获得他们之间没有一个快速的方法丢弃他们。对非Alpha混合的多边形分类排序(在Z-方向上),首先渲染离你最近的那些多边形,优先使用距离最近的像素填充屏幕。所以当你要渲染它们后面的像素(由Z或者深度测试决定)时,这些像素很快被丢弃,从而避免了混合步骤并节省了时间。如果你从后到前绘制,所有隐藏的对象将被完全绘制,然后又被其他对象完全重写覆盖。场景越复杂,这种情况就越糟糕,所以深度测试是个好东西。抗锯齿让我们快速的看一下抗锯齿。当渲染单个多边形时,3D显卡仔细检查已经渲染的,并对新的多边形的边缘进行柔化,这样你就不会得到明显可见的锯齿形的像素边缘。两种技术方法之一通常被用来处理。第一种方法是单个多边形层次,需要你从视野后面到前面渲染多边形,这样每个多边形都能和它后面的进行适当的混合。如果不按序进行渲染,最后你会看见各种奇怪的效果。在第二种方法中,使用比实际显示更大的分辩率来渲染整幅幀画面,然后在你缩小图像时,尖锐的锯齿形边缘就混合消失了。这第二种方法的结果不错,但因为显卡需要渲染比实际结果幀更多的像素,所以需要大量的内存资源和很高的内存带宽。多数新的显卡能很好地处理这些,但仍然有多种抗锯齿模式可以供你选择,因此你可以在性能和质量之间作出折衷。对於当今流行的各种不同抗锯齿技术的更详细讨论请参见DaveSalvator的3D流水线一文。顶点与像素着色在结束讨论渲染技术之前,我们快速的说一下顶点和像素着色,最近它们正引起很多关注。顶点着色是一种直接使用显卡硬件特征的方式,不使用API。举例来说,如果显卡支持硬件T&L,你可以用DirectX或OpenGL编程,并希望你的顶点通过T&L单元(因为这完全由驱动程序处理,所以没有办法确信),或者你直接利用显卡硬件使用顶点着色。它们允许你根据显卡自身特征进行特别编码,你自己特殊的编码使用T&L引擎,以及为了发挥你的最大优势,显卡必须提供的其他别的特征。事实上,现在nVidia和ATI在他们大量的显卡上都提供了这个特征。不幸的是,显卡之间表示顶点着色的方法并不一致。你不能象使用DirectX或者OpenGL那样,为顶点着色编写一次代码就可以在任何显卡上运行,这可是个坏消息。然而,因为你直接和显卡硬件交流,它为快速渲染顶点着色可能生成的效果提供最大的承诺。(如同创造很不错的特效&-45;-你能够使用顶点着色以API没有提供的方式影响事物)。事实上,顶点着色正在真的将3D图形显示卡带回到游戏机的编码方式,直接存取硬件,最大限度利用系统的必须知识,而不是依靠API来为你做一切。对一些程序员来说,会对这种编码方式感到吃惊,但这是进步代价。进一步阐述,顶点着色是一些在顶点被送到显卡渲染之前计算和运行顶点效果程序或者例程。你可以在主CPU上面用软件来做这些事情,或者使用显卡上的顶点着色。为动画模型变换网格是顶点程序的主选。像素着色是那些你写的例程,当绘制纹理时,这些例程就逐个像素被执行。你有效地用这些新的例程推翻了显卡硬件正常情况做的混合模式运算。这允许你做一些很不错的像素效果,比如,使远处的纹理模糊,添加炮火烟雾,产生水中的反射效果等。一旦ATI和nVidia能实际上就像素着色版本达成一致(DX9#s新的高级shader语言将会帮助促进这一目标),我一点不惊讶DirectX和OpenGL采用Glide的方式-有帮助开始,但最终不是把任何显卡发挥到极限的最好方法。那么什么是API?它是应用程序编程接口,将不一致的后端用一致的前端呈现出来。举例来说,很大程度上每种3D显示卡的3D实现方式都有所差别。然而,他们全部都呈现一个一致的前端给最终使用者或者程序员,所以他们知道他们为X3D显示卡写的代码将会在Y3D显示卡上面有相同的结果。好吧,不管怎样理论上是那样。大约在三年以前这可能是相当真实的陈述,但自那以后,在nVidia公司的引领下,3D显卡行业的事情发生了变化。如今在PC领域,除非你正计划建造自己的软件光栅引擎,使用CPU来绘制你所有的精灵,多边形和粒子-而且人们仍然在这样做。跟Unreal一样,AgeofEmpiresII:AgeofKings有一个优秀的软件渲染器否则你将使用两种可能的图形API,OpenGL或者DirectX之一。OpenGL是一种真正的跨平台API(使用这种API写的软件可以在Linux,Windows和MacOS上运行。),而且有多年的历史了,为人所熟知,但也开始慢慢地显示出它的古老。大约在四年以前,定义OpenGL驱动特征集一直是所有显示卡厂商工作的方向。然而,一旦在目标达成以后,没有预先制定特征工作方向的路线图,这时候,所有的显卡开发商开始在特征集上分道扬镳,使用OpenGL扩展。3dfx创造了T-缓冲。nVidia努力寻求硬件变换和光照计算。Matrox努力获取凹凸贴图。等等。我以前说过的一句话,"过去几年以来,3D显示卡领域的事情发生了变化。"

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论