毕业设计 显卡的技术与评测.doc_第1页
毕业设计 显卡的技术与评测.doc_第2页
毕业设计 显卡的技术与评测.doc_第3页
毕业设计 显卡的技术与评测.doc_第4页
毕业设计 显卡的技术与评测.doc_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目目 录录 第一章第一章 绪论绪论1 1.1 pc 图形卡的简介.1 1.2 论文概述 2 第二章第二章 任务与论证任务与论证3 2.1 设计任务 3 2.2 基本思想 4 2.3 方案论证及设计 4 第三章第三章 电路设计与原理电路设计与原理6 3.1 pc 图形卡的基本原理及设计.6 3.2 主机接口部分(pci express,agp) .8 3.3 内存控制部分(ddr ddr2 gddr3).11 3.4 显示输出部分(vga,dvi-i,hdmi,displayport).13 3.5 gpio 通用输入输出端口15 3.6 散热设计及控制 16 第四章第四章 显卡的测试显卡的测试19 4.1 显卡的特性和稳定性测试 19 4.2 测试结果与分析spec viewpref 8.0120 4.3 显卡部分功能模块附图 22 结结 论论23 参考文献参考文献24 致谢致谢25 第一章第一章 绪论绪论 1.11.1 pcpc 图形卡的简介图形卡的简介 显卡主要分为专业图形卡和娱乐图形卡,近年来图形卡产品有了 爆炸式的增长,专业图形卡产品和娱乐图形卡产品的界限越来越模糊。 许多 diyer 通过 rivatuner 等工具轻易的修改 geforce 为 quadro、修 改 radeon 为 firegl。但是这样的修改并没有使得专业图形卡的价格 有所下降,专业图形卡的价格依然几倍于娱乐图形卡。专业显示卡主 要针对的是需要 opengl 的三维动画软件(如 3ds max、maya、softimage|3d 等) 、渲染软件(如 lightscape、3ds viz 等) 、cad 软件(如 autocad、pro/engineer、unigraphics、solidworks 等) 、模型设计 (如 rhino)以及部分科学应用等专业应用市场。专业图形处理器针 对这些专业图形图像软件进行必要的优化,都有着极佳的兼容性。可 获得无与伦比的性能和品质,从而满足最苛刻专业人员的需要。适合 从电影界的数字内容制作人到工厂的工程师、偏远石油钻探平台的地 质学家这样的专业人士。笔记本上常见的专业移动图形处理器包括 amd 旗下的 firegl 系列图形处理器和 nvidia 公司的 quadro fx 系列 图形处理器。 1.21.2 论文概述论文概述 本人在公司实习的两个月中,完成了显卡技术评测,理论与实践 相结合,让我更深入的了解显卡的技术与应用。通过公司网站,本着 提出问题,分析问题,解决问题的原则,对该课题的理论与实物进行 了详尽的阐述。在文章的第二章,就课题的目的,要求加以说明。并 分析各论证方案,取长补短,确定出本文所使用的方法,思想明确。 第三章中,对所涉及的显卡各部分以图文结合的方式呈现出来,直观 具体。并进一步分析各元件所使用环境,确定本文的设计思路与方向。 第四章主要是显卡的测试说明,对显卡的特性和稳定性测试做出详尽 的分析。论文的电路图依靠orcad完成,正是使用了简单易懂的画图 工具,才使论文图文结合,更加清晰具体。 第二章第二章 任务与论证任务与论证 2.12.1 设计任务设计任务 该设计的目的是制作一个 pc 显卡,该系统由图形芯片(gpu) 、 显存、电源,ramdac 等主要模块组成方框图,如图 2.1 所示: 图 2.1 所示系统方框图 2.1.12.1.1 显卡的功能特性测试显卡的功能特性测试 (1)对 opengl 完善的支持 (2)绝对的稳定性 (3)足够高的渲染精度 2.22.2 基本思想基本思想 (1) 以 gpu 图形处理器为核心,来完成 pc 图形显卡的系统控制; gpu 中的 3d 显示芯片是将三维图像和特效处理功能集中在显示芯片 内。 (2) 利用 pci express(金手指) 完成与主机的接口部分。 (3) 开关电源部分提供给 gpu 电源,ddr sdram power supply。 (4) ddr 显存作为双倍速率同步动态随机存储器存储大量待处理信 息。 (5) (vga,dvi-i, displayport)做为显示输出部分,向显示器输 出相应的声音视频图像信号。 (6) pc 显卡使用主动式散热设计,电源采用 switch 开关电源设计, 并对比 ldo 线形电源进行论证分析。 (7) 对显卡的特性和稳定性进行严格测试,并分析测试结果。 2.32.3 方案论证及设计方案论证及设计 2.3.12.3.1 电源的方案论证电源的方案论证 方案 1:电源主要采用 switch 降压型开关稳压电路(dc-dc 变 换器) ,降压开关稳压电路的工作原理:当开关管断开时,电感的感 应电动势使二极管导通,电感电流 il通过二极管和负载构成回路, 由输入电源向负载提供能量。 方案 2:电源采用低压差线性稳压器(ldo),基本工作原理:系 统加电后,如果使能脚处于高电平时,电路开始启动,恒流源电路 给整个电路提供偏置,基准源电压快速建立,输出随着输入不断上 升,当输出即将达到规定值时,由反馈网络得到的输出反馈电压也 接近于基准电压值,此时误差放大器将输出反馈电压和基准电压之 间的误差小信号进行放大,再经调整管放大到输出,从而形成负反 馈,保证了输出电压稳定在规定值上;同理如果输入电压变化或输 出电流变化,这个闭环回路将使输出电压保持不变 2.3.22.3.2 论证分析论证分析 (1)对于显卡供电部分,要认真的分析它的电源需求。不仅仅 是 关心输入电压,输出电压和电流,还要仔细考虑总的功耗,电源实 现的效率,电源部分对负载变化的瞬态响应能力,关键器件对电源 波动的容忍范围以及相应的允许的电源纹波,还有散热问题等等。 功耗和效率是密切相关的,效率高了,在负载功耗相同的情况下总 功耗就少,对于整个系统的功率预算就非常有利了,对比 ldo 和开 关电源,如果一个驱动图像处理器的 ldo 输入电源是从单节锂电池 标称的 3.6v,在电流为 200ma 时输出 1.8v 电压,那么转换效率仅为 50%,开关电源的效率要高一些。 (2)评估效率不仅仅是看在满负载的时候电源电路的效率,还要 关注 gpu 负载的时候效率水平。至于负载瞬态响应能力,对于一些高 性能的应用就会有严格的要求,因为当 gpu 突然开始运行繁重的任务 时,需要的启动电流是很大的,如果电源电路响应速度不够,造成瞬 间电压下降过多过低,造成 gpu 运行出错。一般来说,要求的电源实 际值多为标称值的5%,所以可以据此计算出允许的电源纹波,当 然要预留余量的。 结合以上两个事实,并为了满足设计要求,我们可以采用方案一, 一般对于弱电部分,包括了 ldo(线性电源转换器) ,开关电源电容降 压转换器和开关电源电感电容转换器。相比之下,开关电源最易实现, 电路设计灵活,效率高,发热量小,而 ldo 设计输出纹波小,但缺点 是效率有可能不高,发热量大,可提供的电流相较开关电源不大等等。 第三章第三章 电路设计与原理电路设计与原理 3.13.1 pcpc 图形卡的基本原理及设计图形卡的基本原理及设计 显卡主要由图形芯片(gpu) 、显存、电源、ramdac 等构成,发展 基本上经历了三个阶段:isa 总线、pci 总线、agp 总线, isa:pc 上最早期的显卡都是 isa 总线或 eisa 总线的,另外还 有一种 vesa 总线的显示卡,这三种显卡可以统称为 isa 类 显卡。在很多超期服务的 386、486 机器上,我们仍可以看 见它们的影子。 pci:在一些工控机和特殊的场合 pci 卡还在应用,pci 显卡比 agp 还贵。 agp:agp1xagp2xagp4xagp8xpci express 264mb/s532mb/s1gb/s2gb/s48gb/s 3.1.13.1.1 gpugpu 简介简介 gpu 英文全称(graphic processing unit)中文翻译为“图形处 理器” 。gpu 是相对于 cpu 的一个概念,由于在现代的计算机中(特别 是家用系统,游戏的发烧友)图形的处理变得越来越重要,需要一个 专门的图形的核心处理器。 gpu 是显示卡的“心脏” ,也就相当于 cpu 在电脑中的作用,它 决定了该显卡的档次和大部分性能,同时也是 2d 显示卡和 3d 显示卡 的区别依据。2d 显示芯片在处理 3d 图像和特效时主要依赖 cpu 的处 理能力,称为“软加速” 。3d 显示芯片是将三维图像和特效处理功能 集中在显示芯片内,也即所谓的“硬件加速”功能。显示芯片通常是 显示卡上最大的芯片(也是引脚最多的) 。 于是 nvidia 公司在 1999 年发布 geforce 256 图形处理芯片时首 先提出 gpu 的概念。gpu 使显卡减少了对 cpu 的依赖,并进行部分原 本 cpu 的工作,尤其是在 3d 图形处理时。gpu 所采用的核心技术有硬 体 t&l、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、 双重纹理四像素 256 位渲染引擎等,而硬体 t&l 技术可以说是 gpu 的 标志。 单说 gpu 就是能够从硬件上支持 t&l(transform and lighting,多边形转换与光源处理)的显示芯片,因为 t&l 是 3d 渲染 中的一个重要部分,其作用是计算多边形的 3d 位置和处理动态光线效 果,也可以称为“几何处理” 。一个好的 t&l 单元,可以提供细致的 3d 物体和高级的光线特效;只大多数 pc 中,t&l 的大部分运算是交由 cpu 处理的(这也就是所谓的软件 t&l),由于 cpu 的任务繁多,除了 t&l 之外,还要做内存管理、输入响应等非 3d 图形处理工作,因此在 实际运算的时候性能会大打折扣,常常出现显卡等待 cpu 数据的情况, 其运算速度远跟不上今天复杂三维游戏的要求。即使 cpu 的工作频率 超过 1ghz 或更高,对它的帮助也不大,由于这是 pc 本身设计造成的 问题,与 cpu 的速度无太大关系. 3.1.23.1.2 ramdacramdac 简介简介 ramdac 决定了刷新频率的高低(与显示器的“带宽”意义近似) 。 其工作速度越高,频带越宽,高分辨率时的画面质量越好.该数值决定 了在足够的显存下,显卡最高支持的分辨率和刷新率。如果要在 1024768 的分辨率下达到 85hz 的分辨率,ramdac 的速率至少是 1024768851.3441.0690mhz,我们通常在显卡上见不到 ramdac 模块,那是因为厂商将 ramdac 整合到显示芯片中以降低成本, 不过仍有部分高档显卡采用了独立的 ramdac 芯片。 3.1.33.1.3 显存简介显存简介 gpu 在处理显示的信息的过程中,它会产生大量的临时数据(未 处的、正在处理的、已经处理完成的) ,这就需要一个专门的地方来存 放这些临时数据,那就是显存了,它也可能是一个芯片,也可能只是 芯片的一部分。 数据位数是显存也是显卡的一个很重要的参数。在显卡工作过程 中,z 缓冲器、帧缓冲器和纹理缓冲器都会大幅占用显存带宽资源。 带宽是 3d 芯片与本地存储器传输的数据量标准,这时候显存的容量并 不重要,也不会影响到带宽,相同显存带宽的显卡采用 64mb 和 32mb 显存在性能上区别不大。因为这时候系统的瓶颈在显存带宽上,当碰 到大量像素渲染工作时,显存带宽不足会造成数据传输堵塞,导致显 示芯片等待而影响到速度 显存与系统内存一样,也是多多益善。显存越大,可以储存的图 像数据就越多,支持的分辨率与颜色数也就越高。显存均以标准的大 小提供:16mb、32mb、64mb , 128mb,256mb,512mb,以下计算显存 容量与分辨率关系的公式: 所需显存所需显存= =图形分辨率图形分辨率色彩精度色彩精度/8/8。 例如要上 16bit 真彩的 1024768,则需要 102476816/8=1.5m,即 2m 显存。 对于三维图形,由于需要同时对 front buffer、back buffer 和 z buffer 进行处理,因此公式为:所需显存(帧存)所需显存(帧存)= =图形分辨率图形分辨率 33色彩精度色彩精度/8/8。 例如一帧 16bit、1024768 的三维场景,所需的帧缓存为 1024768316bit/8=4.71m,即需要 8m 显存。 power:power: 提供给 gpu 电源,显存供电。 3.23.2 主机接口部分(主机接口部分(pcipci expressexpress,agpagp) 3.2.13.2.1 pcipci expressexpress 简介及应用简介及应用 pcipci expressexpress(以下简称 pci-e)采用了目前业内流行的点对点 串行连接,比起 pci 以及更早期的计算机总线的共享并行架构,每个 设备都有自己的专用连接,不需要向整个总线请求带宽,而且可以把 数据传输率提高到一个很高的频率,达到 pci 所不能提供的高带宽。 相对于传统 pci 总线在单一时间周期内只能实现单向传输,pci-e 的 双单工连接能提供更高的传输速率和质量,它们之间的差异跟半双工 和全双工类似。 pci-e 的接口根据总线位宽不同而有所差异,包括 x1、x4、x8 以及 x16,而 x2 模式将用于内部接口而非插槽模式。pci-e 规格从 1 条通道连接到 32 条通道连接,有非常强的伸缩性,以满足不同系统设 备对数据传输带宽不同的需求。此外,较短的 pci-e 卡可以插入较长 的 pci-e 插槽中使用,pci-e 接口还能够支持热拔插,这也是个不小 的飞跃。pci-e x1 的 250mb/秒传输速度已经可以满足主流声效芯片、 网芯和存储设备对数据传输带宽的需求,但是远远无法满足图形芯片 对数据传输带宽的需求。 因此,用于取代 agp 接口的 pci-e 接口位宽 为 x16,能够提供 5gb/s 的带宽,即便有编码上的损耗但仍能够提供 约为 4gb/s 左右的实际带宽,远远超过 agp 8x 的 2.1gb/s 的带宽。 尽管 pci-e 技术规格允许实现 x1(250mb/秒), x2,x4,x8,x12,x16 和 x32 通道规格,但是依目前形式来看,pci- e x1 和 pci-e x16 已成为 pci-e 主流规格,同时很多芯片组厂商在南 桥芯片当中添加对 pci-e x1 的支持,在北桥芯片当中添加对 pci-e x16 的支持。除去提供极高数据传输带宽之外,pci-e 因为采用串行数 据包方式传递数据,所以 pci-e 接口每个针脚可以获得比传统 i/o 标 准更多的带宽,这样就可以降低 pci-e 设备生产成本和体积。另外, pci-e 也支持高阶电源管理,支持热插拔,支持数据同步传输,为优 先传输数据进行带宽优化。 在兼容性方面,pci-e 在软件层面上兼容目前的 pci 技术和设 备,支持 pci 设备和内存模组的初始化,也就是说过去的驱动程序、 操作系统无需推倒重来,就可以支持 pci-e 设备。目前 pci-e 已经成 为显卡的接口的主流,不过早期有些芯片组虽然提供了 pci-e 作为显 卡接口,但是其速度是 4x 的,而不是 16x 的,例如 via pt880 pro 和 via pt880 ultra,当然这种情况极为罕见。 3.2.23.2.2 agpagp 简介及应用简介及应用 agp(accelerate graphical port),加速图形接口。随着显 示芯片的发展,pci 总线日益无法满足其需求。英特尔于 1996 年 7 月 正式推出了 agp 接口,它是一种显示卡专用的局部总线。严格的说, agp 不能称为总线,它与 pci 总线不同,因为它是点对点连接,即连 接控制芯片和 agp 显示卡,但在习惯上我们依然称其为 agp 总线。agp 接口是基于 pci 2.1 版规范并进行扩充修改而成,工作频率为 66mhz。 agp 总线直接与主板的北桥芯片相连,且通过该接口让显示芯片 与系统主内存直接相连,避免了窄带宽的 pci 总线形成的系统瓶颈, 增加 3d 图形数据传输速度,同时在显存不足的情况下还可以调用系统 主内存。所以它拥有很高的传输速率,这是 pci 等总线无法与其相比 拟的。 由于采用了数据读写的流水线操作减少了内存等待时间,数据传 输速度有了很大提高;具有 133mhz 及更高的数据传输频率;地址信号 与数据信号分离可提高随机内存访问的速度;采用并行操作允许在 cpu 访问系统 ram 的同时 agp 显示卡访问 agp 内存;显示带宽也不与 其它设备共享,从而进一步提高了系统性能。 agp 标准在使用 32 位总线时,有 66mhz 和 133mhz 两种工作频率, 最高数据传输率为 266mbps 和 533mbps,而 pci 总线理论上的最大传 输率仅为 133mbps。目前最高规格的 agp 8x 模式下,数据传输速度达 到了 2.1gb/s。 agp 接口的发展经历了 agp1.0(agp1x、agp2x)、agp2.0(agp pro、agp4x)、agp3.0(agp8x)等阶段,其传输速度也从最早的 agp1x 的 266mb/s 的带宽发展到了 agp8x 的 2.1gb/s。 3.33.3 内存控制部分(内存控制部分(ddrddr ddr2ddr2 gddr3gddr3) 3.3.13.3.1 ddrddr 显存显存 ddr 是 double data rate sdram 的缩写,是双倍速率同步动态 随机存储器的意思。ddr sdram 是在 sdram 基础上发展而来的。sdram 在一个时钟周期内只传输一次数据,它是在时钟的上升期进行数据传 输;而 ddr 内存则是一个时钟周期内传输两次数据,它能够在时钟的 上升期和下降期各传输一次数据,因此称为双倍速率同步动态随机存 储器。ddr 内存可以在与 sdram 相同的总线频率下达到更高的数据传 输 。 与 sdram 相比:ddr 运用了更先进的同步电路,使指定地址、数 据的输送和输出主要步骤既独立执行,又保持与 cpu 完全同步;ddr 使用了 dll(delay locked loop,延时锁定回路提供一个数据滤波信 号)技术,当数据有效时,存储控制器可使用这个数据滤波信号来精确 定位数据,每 16 次输出一次,并重新同步来自不同存储器模块的数据。 ddl 本质上不需要提高时钟频率就能加倍提高 sdram 的速度,它允 许在时钟脉冲的上升沿和下降沿读出数据,因而其速度是标准 sdra 的 两倍。ddr sdram 是目前应用最为广泛的显存类型,90%以上的显卡都 采用此类显存。 3.3.23.3.2 ddr2ddr2 显存显存 ddr2 显存可以看作是 ddr 显存的一种升级和扩展,ddr2 显存把 ddr 显存的“2bit prefetch(2 位预取)”技术升级为“4 bit prefetch(4 位预取)”机制,在相同的核心频率下其有效频率比 ddr 显存整整提高了一倍,在相同显存位宽的情况下,把显存带宽也整整 提高了一倍,这对显卡的性能提升是非常有益的。从技术上讲,ddr2 显存的 dram 核心可并行存取,在每次存取中处理 4 个数据而非 ddr 显 存的 2 个数据,这样 ddr2 显存便实现了在每个时钟周期处理 4bit 数 据,比传统 ddr 显存处理的 2bit 数据提高了一倍。相比 ddr 显存, ddr2 显存的另一个改进之处在于它采用 144pin 球形针脚的 fbga 封装 方式替代了传统的 tsop 方式,工作电压也由 2.5v 降为 1.8v。 由于 ddr2 显存提供了更高频率,性能相应得以提升,但也带来 了高发热量的弊端。加之结构限制无法采用廉价的 tsop 封装,不得不 采用成本更高的 bga 封装(ddr2 的初期产能不足,成本问题更甚)。发 热量高、价格昂贵成为采用 ddr2 显存显卡的通病,如率先采用 ddr2 显存的的 geforce fx 5800/5800ultra 系列显卡就是比较失败的产品。 基于以上原因,ddr2 并未在主流显卡上广泛应用。 3.3.33.3.3 ddr3ddr3 显存显存 ddr3 显存可以看作是 ddr2 的改进版,二者有很多相同之处,例如 采用 1.8v 标准电压、主要采用 144pin 球形针脚的 fbga 封装方式。不 过 ddr3 核心有所改进:ddr3 显存采用 0.11 微米生产工艺,耗电量较 ddr2 明显降低。此外,ddr3 显存采用了“pseudo open drain”接口 技术,只要电压合适,显示芯片可直接支持 ddr3 显存。当然,显存颗 粒较长的延迟时间(cas latency)一直是高频率显存的一大通病,ddr3 也不例外,ddr3 的 cas latency 为 5/6/7/8,相比之下 ddr2 为 3/4/5。客观地说,ddr3 相对于 ddr2 在技术上并无突飞猛进的进步, 但 ddr3 的性能优势仍比较明显: (1)功耗和发热量较小:吸取了 ddr2 的教训,在控制成本的基础 上减小了能耗和发热量,使得 ddr3 更易于被用户和厂家接受。 (2)工作频率更高:由于能耗降低,ddr3 可实现更高的工作频率, 在一定程度弥补了延迟时间较长的缺点,同时还可作为显卡的卖点之 一,这在搭配 ddr3 显存的显卡上已有所表现。 (3)降低显卡整体成本:ddr2 显存颗粒规格多为 4m x 32bit,搭 配中高端显卡常用的 128mb 显存便需 8 颗。而 ddr3 显存规格多为 8m x 32bit,单颗颗粒容量较大,4 颗即可构成 128mb 显存。如此一来, 显卡 pcb 面积可减小,成本得以有效控制,此外,颗粒数减少后,显 存功耗也能进一步降低。 (4)通用性好:相对于 ddr 变更到 ddr2,ddr3 对 ddr2 的兼容性更 好。由于针脚、封装等关键特性不变,搭配 ddr2 的显示核心和公版设 计的显卡稍加修改便能采用 ddr3 显存,这对厂商降低成本大有好处。 目前,ddr3 显存在新出的大多数中高端显卡上得到了广泛的应用。 3.43.4 显示输出部分(显示输出部分(vgavga,dvi-idvi-i,hdmihdmi,displayportdisplayport) 3.4.13.4.1 vgavga 接口接口 显卡所处理的信息最终都要输出到显示器上,显卡的输出接口就 是电脑与显示器之间的桥梁,它负责向显示器输出相应的图像信号。 crt 显示器因为设计制造上的原因,只能接受模拟信号输入,这就需 要显卡能输入模拟信号。vga 接口就是显卡上输出模拟信号的接口, vga(video graphics array)接口,也叫 d-sub 接口。虽然液晶显 示器可以直接接收数字信号,但很多低端产品为了与 vga 接口显卡相 匹配,因而采用 vga 接口。 vga 接口是一种 d 型接口,上面共有 15 针空,分成三排,每排五 个。vga 接口是显卡上应用最为广泛的接口类型,多数的显卡都带有 此种接口。有些不带 vga 接口而带有 dvi 接口的显卡,也可以通过 一个简单的转接头将 dvi 接口转成 vga 接口,通常没有 vga 接口的 显卡会附赠这样的转接头。 3.4.23.4.2 dvi-idvi-i 接口接口 dvi 接口是 1999 年由数字显示工作组 ddwg(digital display working group)推出的接口标准,是 digital visual interface 的缩写, 其造型是一个 24 针的接插件。是专为 lcd 显示器这样的数字显示设 备设计的。dvi 接口有多种规格,分为 dvi-a、dvi-d 和 dvi-i。 dvi-a 其实就是 vga 接口标准,所以带有 dvi 接口的液晶显示器也并 不一定就是真正的数字液晶显示器;dvi-d 则实现了真正的数字信号 传输。而 dvi-i 通吃上述两个接口,当 dvi-i 接 vga 设备时,就是起 到了 dvi-a 的作用;当 dvi-i 接 dvi-d 设备时,便起了 dvi-d 的作用。 为了兼容传统的模拟显示设备,现在的大部分显卡都采用了 24 只数字 信号针脚和 5 只模拟信号针脚的 dvi-i 接口。 3.4.33.4.3 hdmihdmi 接口接口 hdmi 的英文全称是“high definition multimedia”,中文的意思是 高清晰度多媒体接口。hdmi 接口可以提供高达 5gbps 的数据传输带 宽,可以传送无压缩的音频信号及高分辨率视频信号。同时无需在信 号传送前进行数/模或者模/数转换,可以保证最高质量的影音信号传送。 应用 hdmi 的好处是:只需要一条 hdmi 线,便可以同时传送影音信 号,而不像现在需要多条线材来连接;同时,由于无线进行数/模或者 模/数转换,能取得更高的音频和视频传输质量。对消费者而言, hdmi 技术不仅能提供清晰的画质,而且由于音频/视频采用同一电缆 ,大大简化了家庭影院系统的安装。 hdmi 接口支持 hdcp 协议,为看有版权的高清电影电视打下 基础。不过,为了让显卡带有 hdmi 接口,除了需要专用芯片外,显 卡厂商还要支付一笔不斐的 hdmi 认证费,因此目前带有 hdmi 接口 的显卡还不多。但是 hdcp 已成定局,因此未来支持 hdcp 协议的显 卡也会多起来。 3.4.43.4.4 displayportdisplayport 视频电子标准协会(vesa)公布了 displayport 显示接口标准的最 终版本:displayport 1.0。作为 dvi 的继任者,displayport 将在传输 视频信号的同时加入对高清音频信号传输的支持,同时支持更高的分 辨率和刷新率。 displayport 1.0 最大支持 10.8gb/s 的传输带宽,而最新的 hdmi 1.3 标准也仅能支持 10.2g/s 的带宽;另外, displayportisplayport 可支持 wqxga+(25601600)、 qxga(20481536)等分辨率及 30/36bit(每原色 10/12bit)的色深, 19201200 分辨率的色彩支持到了 120/24bit,超高的带宽和分辨率 完全足以适应显示设备的发展。另外,displayport 还有一条可实现双 向通信的外部通道,传输速度超过了 1mbps,可以直接作为语音、视 频等低带宽数据的传输通道,另外也可用于无延迟的游戏设备。 displayport 接口将会是未来显示设备的主要接口标准,将完全 取代现今的 dvi 与 vga,甚至 hdmi。相对于目前最先进的 hdmi 接 口来说,displayport 有着更多的优势和更大的传输带宽,并且从可扩 展性和外围设备兼容方面要远远强于 hdmi 接口;成本方面, displayport 不仅可以直接驱动面板,节省大量的电路费用和空间,并 且该标准完全开放,并不需要支付如 hdmi 接口所涉及到的版权费用。 我们预计,到 2008 年底或者 2009 年,displayport 将走向最巅峰的 阶段。 3.53.5 gpiogpio 通用输入输出端口通用输入输出端口 gpio (通用输入/输出) 或 spi接口简化了 i/o 口的扩展, 当微 控制器或芯片组没有足够的 i/o 端口,或当系统需要采用远端串行通 信或控制时,gpio 产品能够提供额外的控制和监视功能。每个 gpio 端口可通过软件分别配置成输入或输出, 提供推挽式输出或漏极开路 输出。 gpio 的优点(端口扩展器) 低功耗:gpio 具有更低的功率损耗 (大约 1a,c 的工作电流则为 100a)。 集成 iic 从机接口:gpio 内置 iic 从机接口,即使在待机模式下也能够全速工作。 小封装: gpio 器件提供最小的封装尺寸 3mm x 3mm qfn! 低成本:不用 为没有使用的功能买单!灵活的灯光控制:内置多路高分辨率的 pwm 输出。 可预先确定响应时间:缩短或确定外部事件与中断之间的响应 时间。 更好的灯光效果:匹配的电流输出确保均匀的显示亮度。 布 线简单:仅需使用 2 条 iic 总线或 3 条 spi 总线。 3.63.6 散热设计及控制散热设计及控制 由于显卡核心工作频率与显存工作频率的不断攀升,显卡芯片 的发热量也在迅速提升。显示芯片的晶体管数量已经达到,甚至超过 了 cpu 内的数量,如此高的集成度必然带来了发热量的增加,为了解 决这些问题,显卡都会采用必要的散热方式。目前常见的散热方式有 被动式和主动式,此外还有一种比较特殊的热管散热方式。 被动式散热被动式散热: 显卡的散热方式分为散热片和散热片配合风扇的形 式,也叫作被动式散热和主动式散热方式。一般一些工作频率较低的 显卡采用的都是被动式散热,这种散热方式就是在显示芯片上安装一 个散热片即可,并不需要散热风扇。因为较低工作频率的显卡散热量 并不是很大,没有必要使用散热风扇,这样在保障显卡稳定工作的同 时,不仅可以降低成本,而且还能减少使用中的噪音。 主动式散热主动式散热: 主动式散热除了在显示芯片上安装散热片之外,还 安装了散热风扇,工作频率较高的显卡都需要这种主动式散热。因为 较高的工作频率就会带来更高的热量,仅安装一个散热片的话很难满 足散热的需要,所以就需要风扇的帮助,而且对于那些超频使用的用 户和需要长时间使用的用户来说就更重要了。 按照热功学原理我们可以把目前显卡的散热方式分为轴流式散热 和风道导流式散热。其中轴流式散热是最常见的散热方式,这种散热 方式类似于 cpu 散热器的散热方式,主要靠采用高导热系数的大面积 金属材质散热器来实现散热。此外,厂商还会为散热器配置散热风扇, 散热风扇会按电机轴向吸收空气并吹到散热片上,从而达到高效率散 热的目的。不过,这种方式散发出的热量最终还是要排放到机箱内, 对机箱自身的散热系统提出了较高的要求,当机箱散热效果不佳的时 候,显卡散热效率也将会大打折扣。 导流式散热则是一种非常好的设计,很多高档游戏显卡都采用了 这种散热方式,虽然该散热系统的外形与轴流式有些相似,但其散热 效果却是轴流式散热系统不可比拟的。散热片收集的热量可以通过显 卡自身的专用导流风道直接排到机箱的外部,既保证了显卡的散热效 果,又不为机箱增加额外的热负荷。 热管式散热热管式散热: 热管就是利用蒸发制冷,使得热管两端温度差很大, 使热量快速传导。常见的热管均是由管壳、吸液芯和端盖组成。制作 方法是将热管内部抽成负压状态,然后充入适当的液体,这种液体沸 点很低,容易挥发。管壁有吸液芯,由毛细多孔材料构成。热管一端 为蒸发端,另外一端为冷凝端。当热管一段受热时,毛细管中的液体 迅速蒸发,蒸气在微小的压力差下流向另外一端,并且释放出热量, 重新凝结成液体。液体再沿多孔材料靠毛细力的作用流回蒸发段,如 此循环不止。热量由热管一端传至另外一端,这种循环是快速进行的, 热量可以被源源不断地传导开来。简而言之,就是在蒸发端吸收热量, 然后再在冷凝端释放热量。 热管传热具有如下优点:重量轻且构造简单;温度分布平均,可 作均温或等温动作;热传输量大,热传输距离长;没有主动元件,本 身并不耗电;可以在无重力力场的环境下使用;没有热传方向的限制, 蒸发端以及冷凝端可以互换;容易加工以改变热传输方向;耐用、寿 命长、可靠,易存放保管等等。 热管的导热过程具有很高的热传导性能,与金属相比,单位质量 的热管可多传递几个数量级的热量,并且具有优良的等温性和热开关 性能,特别适用于高精密散热环境。值得注意的是,热管只是一种高 效率的热传导技术,本身并不能散热,还必须要在冷凝端配合散热装 置例如散热片或风扇等才能把热量最终散发出去。目前采用热管散热 的显卡也越来越多了。 第四章第四章 显卡的测试显卡的测试 4.14.1 显卡的特性和稳定性测试显卡的特性和稳定性测试 (1)对)对 opengl 完善的支持完善的支持 directx 是娱乐显卡所必须遵循的规范,而专业图形卡所必须遵 循的规范显然就是 opengl 了。opengl 1.0 尽管已经发表了近十年, 但灵活的扩展性和开放性使得 opengl 依然成为最强悍的图形 api。 事实上,所有关于图形学的研究都涉及 opengl,所有的专业 2d、3d 程序都构建在 opengl 之上。专业图形卡只有提供对 opengl 完善的 支持,才能正确的运行所有应用。 随着 opengl 2.0 的发布,各专业图形卡制造商也纷纷推出了支 持 opengl 2.0 的驱动程序。3dlabs 作为 opengl 的缔造者之一,表现 当然是惊人的迅速。而 nvidia 的 opengl 2.0 驱动也紧随其后。至于 ati 则步伐相对慢了一点。 (2)绝对的稳定性)绝对的稳定性 在几百个小时的工作即将完成时,系统的突然崩溃!这样一次 崩溃往往会对用户造成极大的损失。专业工作站基本都是 7x24 不间断 工作的,这样的工作环境对于硬件来说绝对是个挑战。因此所有的专 业图形卡都不惜工本的采用最为顶级的元件和较为保守的设计。所以 即便是做工远超同系列游戏卡的专业图形卡,其核心/显存频率也可能 较之有所降低。 在驱动方面,专业图形卡为了保证渲染结果和精度往往也会牺 牲一定的速度。与此同时,为了获得对相应软件的完美支持,各大图 形卡制造商还与软件生产商进行相互的合作,甚至有专门对应某软件 的驱动版本以便获得速度和稳定性的提升。在厂商认证方面,无论是 nvidia 还是 3dlabs 抑或 ati 都做的相当好,几乎所有找得到的 dcc、cad 等软件都有相应的通过厂商认证的驱动。 (3) 足够高的渲染精度足够高的渲染精度 几乎所有的 3d 工作者都会遇到这样的情况:在 3d 软件中建模完 成之后,发现有些圆弧部分、人体的关节部分有明显闪烁的黑点,或 者是直接破裂。这样的情况就是专业图形卡的精度不足导致的。早期 ati 的专业图形卡如 firegl x1 只有 4bit 的子象素精度,同时 z-buffer 的精度也较为底下,在渲染大部分圆弧过渡的对象时都会产生破裂和 黑点。而 3dlabs 和 nvidia 则很早就将子象素精度提高到了 12bit 甚 至是 16bit,彻底杜绝了该问题的产生。在我们本次的测试中,所有显 卡都没有发生因为子象素精度不足导致的画面错误。 4.24.2 测试结果与分析测试结果与分析specspec viewprefviewpref 8.018.01 在整个测试中,我们采用了 spec 组织提供的 viewperf 8 和 specapc 测试套件。spec(standard performance evaluation corporation)是由 ibm、intel、sgi、ati、nvidia 等几十个业界领 导企业于 1988 年共同组成的计算机性能评估小组。时至今日,spec 已经有上百个会员,他们几乎囊括了我们所熟知的所有硬件制造商。 与此同时,spec 的组织结构也有了较大的发展,spec 旗下分为 3 个 小组,分别是着重于系统图形运算性能评估的 the graphics performance characterization group (gpc)、着重于对超级计算机和高性 能计算机进行性能评估的 the high-performance group (hpg)和着重于 对普通工作站、服务器性能进行评估的 the open systems group (osg)。 spec 在高端性能评估方面有着绝对的领导力所有的测试都基 于真实脚本、所有的测试都对会员提供源代码。几乎所有的研究机构 都用 spec 套件来衡量系统的运行速度,世界超级计算机 500 强 (top500)也采用了 spec 测试套件来进行性能模拟。 在本次测试中,我们首先使用了合成类的 spec viewpref 8.01 进 行测试。spec viewpref 8.01 包含 7 个真实测试脚本,分别基于入门 3d 软件 3ds max 3.1、工程设计软件 catia v5r12、科学可视化模拟 软件 cei ensight、室内建模软件 lightscape visualization system、中 端 3d 设计软件 maya 5.0、工程虚拟设计装配软件 ptc pro/engineer 2001、solidworks 2004、unigraphics v17。 在 viewpref 8.01 的测试中,拥有 2 个 vpu 和 1 个 vsu 加上 512mb 显存的 3dlabs wildcat realizm 800 以压倒性的优势超过了 ati firegl v7100 和 nvidia quadrofx 1400 及 quadrofx 1400 sli。在 opengl 应用中 3dlabs 彻底可编程的流水线、额外存放指令的 128mb 存储器、单独的几何(vertex shader)及负载平衡 vsu 体现出了应有 的价值。这样的性能优势,即便是面对同级别的 quadro fx 4400 也能 毫无惧色。 经过几年的耕耘,ati firegl 也迎来了他们的收获。与之前的产 品相比,ati firegl v7100 表现的性能已经有了长足的进步。但 ati r300/r420 gpu 的体系结构在运行 opengl 应用时的效率较为底下的 问题似乎依然困扰着 firegl。在绝大部分应用中,拥有 16 条流水线的 firegl v7100 性能甚至不敌档次更低的 quadrofx 1400。也许 ati 是 时候重写 opengl 引擎代码了。 quadrofx 1400 是我们所测试最具性价比的专业图形卡产品、 quadrofx 1400 的价格仅有上面 2 款产品的一半,甚至更低。但是 quadrofx 1400 所能提供的性能却不仅仅是 50。得益于 nv4x 体系 结构,nvidia quadrofx 1400 在较小晶体管规模上实现较高的专业性 能。需要指出的是,nvidia 在专业图形卡方面的软件开发力度相当 大,不仅提供了完善的 forceware 驱动,还额外提供了为加速 autocad 预览的 powerdraf、加速 3ds max viewport 预览的 maxtreme7 等软件。近期 nvidia 推出的 nvidia gelato 离限渲染器 更是实现了完整硬件加速的最终渲染。 随后我们采用了 specapc for maya 6 和 specapc for 3ds max 7 两 个套件对图形卡的实际性能进行考察。specapc 和上面的 viewpref 8.01 不同,specapc 需要完整版本的 maya 6 和 3ds max 7,同时 spec 仅仅提供相应的脚本设置和最终加权得分计算方法。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论