FSB总线与HT总线与QPI总线的区别.docx_第1页
FSB总线与HT总线与QPI总线的区别.docx_第2页
FSB总线与HT总线与QPI总线的区别.docx_第3页
FSB总线与HT总线与QPI总线的区别.docx_第4页
FSB总线与HT总线与QPI总线的区别.docx_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

FSB生命进入倒计时,学会生活在QPI时代 习惯了谈论FSB前端总线(Front Side Bus,简称FSB)的我们,面对QPI时代的到来,以后再谈论CPU连接到北桥芯片的总线时,QPI将是一个崭新的朋友,作为渠道FSB,成为新一代CPU和CPU、CPU与芯片组(CPU与内存)之间的连接总线,QuickPath Interconnect(简称QPI)的总线技术,Nehalem成为了推动FSB生命终结的死亡使者。让FSB去死的唯一理由,就是没足够宽的前端总线带宽,即使配备再强的CPU,用户也不会明显感觉到计算机整体速度的提升。接替它的QPI可以满足这一需求。小提示:目前Intel处理器主流的前端总线频率有800MHz、1066MHz、1333MHz几种,进入2007年后,Intel在11月又将处理器前端总线提升至1600MHz(默认外频400MHz),这比2003年最高端的800MHz FSB总线频率整整提升了一倍。这样高的前端总线频率,其带宽有多大呢?前端总线为1333MHz时,处理器与北桥之间的带宽是10.67GB/s,而提升到1600MHz能达到12.80GB/s,增加了20%。FSB最大杀手前端总线瓶颈 也许很多人会认为,Intel处理器的前端总线频率已很高了,还有必要换吗?作为Intel来说也许很高,但是对比内存带宽、显卡带宽相比,CPU与芯片组的前端总线瓶颈依旧没有根本的改变,例如:1333MHz的FSB所提供的内存带宽是1333MHz64bit/8=10667MB/s=10.67GB/s,其与双通道的DDR2 667正好匹配,但如果使用双通道的DDR2 800、DDR2 1066的内存,这时候FSB的带宽就小于内存的带宽。面对承担普及DDR3、以绝对领先竞争对手的Intel来说,这是无法容忍的,更何况X58带来的三通道高频率DDR3内存搭配了(Nehalem平台DDR3 1333内存的带宽可达32GB/s)FSB无法提供支持,面对这些问题,FSB必须被抛弃。Intel不能忍了FSB以全面落后Hyper Transport当全世界都对Intel Inside拥有最佳印象的时候,作为Intel的CPU领域竞争对手,AMD推出的HyperTransport(HT)总线技术相比,FSB的带宽瓶颈也很明显。小帖士:HT作为AMD主板CPU上广为应用的一种端到端总线技术,它可在内存控制器、磁盘控制器以及PCI-E总线控制器之间提供更高的数据传输带宽。HT 1.0在双向32bit模式的总线带宽为12.8GB/s,其带宽便可匹敌目前最新的FSB带宽。2004年AMD推出的HT 2.0规格,最大带宽又由1.0规格的12.8GB/s提升到了22.4GB/s。而最新的HT 3.0又将工作频率从HT 2.0最高的1.4GHz增到2.6GHz,提升幅度几乎又达一倍。这样,HT 3.0在2.6GHz高频率32bit高位宽的运行模式下,它即可提供高达41.6GB/s的总线带宽(即使在16bit位宽下它也能提供20.8GB/s带宽)值得注意的是,HT 3.0技术应付近两年内内存、显卡和处理器的未来需要也没有问题。作为Intel来说,虽然CPU的市占率上它可以全面领先,崇尚技术的英特尔,面对这种带宽上劣势,虽然采取多种方法,但是并没有能够带带来根本的转变,换句话来说,Intel假如可以将FSB提升到2133MHz,面对DDR3以及交火、SLI等多显卡系统带来的带宽需求时,FSB依然没有办法满足它们的带宽需求,QPI必须被推到前台。(一)QPI究竟能给我们带来什么呢?面对上述困难,Intel也清醒地认识到,再单纯提高处理器的外频和FSB,已难以带来更好的性能提升,保守的使用FSB将会成为AMD乃至其它竞争对手诟病之处,因此全新的Nehalem架构让我们看见了英特尔变革的决心。采用全新的Socket 1366接口,45nm制程,集成三通道DDR3内存控制器(支持DDR3 800/1066/1333/1600内存规格),使用新总线QPI与处理器进行连接,支持SMT(Simultaneous Multi-hreading,单颗处理器就可以支持8个线程并行运作)多线程技术,支持SSE4.2指令集(增加了7条新的SSE4指令),是Intel第一款原生四核处理器CPU接口的改变引发了人们探寻变革的理由,FSB被抛弃了新的QPI能给我们带来什么? 【架构上】(二)QPI互联架构本身具有升级性QPI采用串联方式作为讯号的传送,采用了LVDS(低电压差分信号技术,主要用于高速数字信号互联,使信号能在差分PCB线对或平衡电缆上以几百Mbps以上的速率传输)讯号技术,可保证在高频率下仍能保持稳定性。QPI拥有更低的延迟及更良好的架构,将包括集成的存储器控制器技术以及改善的系统组件间通信链路。Nehalem平台将具备很好的扩展弹性,因为QPI互联架构的数量可以根据用户将来对中央处理器的需要进行增加或者减少。QPI具备的这种可让Nehalem中央处理器体系架构可扩展性的特点,不受核心的限制,这对于构建服务器高性能集群非常有利。(三)QPI总线架构具备高可靠性和性能可靠性,实用性和适用性特点为QPI的高可用性提供了保证。比如链接级循环冗余码验证(CRC),自愈型连接能避开错误区域重新进行自我配置来启用连接中好的部分。出现时钟密码故障时,时钟能自动改路发送到数据信道。QPI还具备热插拔能力来支持诸如处理器卡这种节点的热插拔。深度改良的微架构、集成内存控制器设计以及QPI直连技术,令Nehalem拥有更为出色的执行效率,在单线程同频率条件下,Nehalem的运算性能在相同功耗下比现行Penryn架构的效能同比提高30%。【技术上的改进】 (四)QPI使CPU中集成内存控制器QPI抛弃了以往“前端总线北桥内存总线”的模式,使用了4+1的互联方式(4针对处理器,1针对I/O设计)。这样做的好处是,多处理器的每个处理器都能直接与物理内存相连,每个处理器之间也能彼此互联来充分利用不同的内存,可让多处理器的等待时间变短(访问延迟可以降低50%以上)。(五) 峰值带宽可达96GB/s满足未来的数据传输需求据Intel相关数据显示,QPI高速互连方式使得CPU与CPU之间的峰值带宽可达96GB/s,峰值内存带宽可达34GB/s。这主要在于QPI采用了与PCI-E类似的点对点(Point-to-Point)设计,包括4条通路,每个通路(Lanes)包括一对线路,分别负责数据发送和接收,每一条通路可传送20bit数据。这就意味着即便是最早的QPI标准,其传输速度也能达到6.4GB/s相当于每个连接能传输的单向带宽总计带宽可达到25.6GB/s(为FSB 1600MHz的12.8GB/s的两倍)。这样的带宽能满足未来CPU与CPU、CPU与芯片组间的数据传输需求。(六)数据传输直通车不需在绕道芯片组QPI总线可实现多核处理器内部的直接互联,而无须如以前那样还要再经过FSB进行连接。例如,针对服务器的Nehalem处理器将拥有至少4组QPI传输,可至少组成包括4枚处理器的4路高端服务器系统(也就是16枚运算内核至少32线程并行运作)。而且在多处理器作业下,每颗处理器可以互相传送资料,并不需经过芯片组,从而大幅提升整体系统性能。随着未来Nehalem架构的处理器集成内存控制器、PCI-E 2.0图形接口乃至图形核心,QPI架构的优势将进一步发挥出来。(七)QPI给未来单芯片时代铺路目前限于工艺要求,Nehalem的首款产品并未集成内存和PCI-E控制器,但是(QPI的高带宽,让Intel进一步集成了PCI-E控制器)新模式会存在,这样的设计会颠覆传统的北桥芯片+南桥芯片的设计,让英特尔快速进入单芯片时代铺平了道路,入门级产品将会更廉价。(八)摩尔定律下的又一“完美设计” 虽然目前对Intel的新平台(特别是移动平台)能否在未来通过新的制造工艺获得完美的低功耗怀疑不少,但英特尔QPI仍可称得上目前最完美的总线架构,它具备了酷睿处理器高指令解码能力、出色的每瓦性能的优点,又兼具了以前一直欠缺的集成内存控制器高速直连的特性,将大大改善未来Intel CPU与CPU、CPU与内存间的带宽瓶颈,将让它们间能更好的实现更短延时的快捷通讯,所以一经推出便赢得了行业的广泛支持与赞同。在QPI新总线技术的支持下,可以预见的是,以后的系统性能将进一步增强,更符合摩尔定律发展的规律。也正是在QPI总线的强力支持下,Intel的新平台有望告别已略显过时的南北桥芯片组架构,进入更符合时代潮流的单芯片组(只保留南桥芯片)架构。并且,在QPI总线的强力支持下,CPU集成较高性能的GPU将不再是一句空话预计在2009年第二季度末推出的第三款Nehalem架构的“Havendale”处理器便将直接集成GPU(将图形核心做成一枚单独的芯片,然后将它与CPU封装在一起)。(九)QPI其实不是串行QPI是(DifferentialSignaling)点对点(point-to-point)方式的高速连接。信号可以实现双向传输。这个与PCIExpress传输方式相似,而这也是目前高速数据传输的主要方法。QPI可以被认为是“串行总线”,不过这个并不严谨。因为QPI并不进入串行总线。因此QPI不能算是嵌入式时钟。而PCIExpress等的串行接口使用的是数据信号拥挤时的嵌入式时钟方式,而QPI则使用的另外一条信号链接进行传送。如图所示那样,可以看到这个就是典型性串行内连接与PCIExpress差异。(十)QPI对AMD和NVIDIA的影响做为行业领导性厂商,每次Intel平台的进步都是有人欢喜有人愁。比如,AMD面临着该如何追赶Intel处理器革新速度的问题,如果未来AMD无法跟上英特尔的步伐,其市场份额肯定将变得越来越小。当然,AMD有其过硬的显卡技术支撑,这正是目前Intel所欠缺的。AMD CPU如真能将其GPU整合,带来的市场影响力也是巨大的。NVIDIA的处境,Intel的目标是CPU整合GPU,而NVIDIA的目标则是GPU整合CPU,虽然NVIDIA自身对其信心满满,从目前的竞争形势来看,一项是靠显卡技术、芯片组维系的NVIDIA,面对Intel的打压,必须在Intel平台推广SLI,面对Intel和AMD的CPU整合GPU方案,对NVIDIA的低端、中低端显卡市场又非常大的影响。习惯了LGA775接口、习惯了CPU会变得越来越小、功耗越来越低、工艺越来越先进。然而LGA1366接口的CPU一到,让我们大吃一惊,工艺从65nm变成了45nm,CPU体积居然又变大了。面对主板CPU接口日渐臃肿,它的改变带来的是行业的变革。 Hyper Transport总线规范术最早是由AMD提出,并得到众多芯片组和板卡厂商支持的一种总线技术。它最大的特点是在集成电路间点采用对点的高速互连,并在连接两个芯片时采用两个单向连接(发送与接受),在连接多个器件时采用菊花链(daisy chain)连接,这样就可以几乎无限制的增加功能模块。Hyper Transport并不是仅仅局限于CPU和北桥之间的传输方式,而是适用于PC系统中的任何模块间实现菊状链连接信号传输。它主要是针对内存控制器、硬盘控制器以及PCI总线控制器这些高带宽设备需要而研发的技术,进入Athlon 64时代后,Hyper Transport的高传输率和高带宽的优势才真正有了用武之处。Hyper Transport不只是一个死板、固定的概念,它可以根据传输设备需求的不同,对工作频率与位宽进行调节。Hyper-Transport的最突出的地方就在于双向传输,由两条点对点传输的单向数据链组成,这两条数据链分别负责数据传输过程中的输入和输出。每一条数据链都可以是2到32位宽,标准总线宽度是2、4、8、16和32位。和DDR的Dual Pump技术类似,Hyper Transport可以实现双倍的数据传输速率。它的总带宽计算公式如下: (HT总线工作频率)(2数据/时钟)(各方向上的位宽度)(2总的方向数) 。 下图是AMD64系列处理器的架构示意图,我们可以很清楚的看见其中增加HT传输控制器。在K8体系里,CPU的外频已经不再是等同于传统意义上的前端总线的频率。Athlon 64的外频是200MHz,而通过主板芯片组支持的Hyper Transport总线(就是乘上一个倍频ratio),来达到实际和北桥传输带宽,也就是前端总线的标准。也就是说,不同芯片组实现的HT总线带宽是完全不一样的。比如,NVIDIA的NF3 150仅仅支持600MHz的Hyper Transport传输频率(上行8位,下行16位),而威盛同期发布的K8T800芯片组就能够支持800MHz的更高频率(上行16位,下行16位),当NF3 250将HT频率提升到800MHz的时候,K8T800 Pro甚至之后的K8T890系列都已经支持到1000MHz,提供16位上行下行,总线带宽也由原来的6.4GB/s提高到8GB/s,充分发挥了K8的强大能力。相对于过去的PCI总线设计而言,Hyper Transport技术有了根本上的提高,它的数据传输率达到了惊人的12.8GB/s,这个数值相比Intel最新3GIO技术的最初理论传输率高出了很多(3GIO早期产品的带宽设计为2.5GB/s,远景规划为10GB/s)。同目前的PCI总线而言,Hyper Transport的数据传输率更是高出了整整96倍以上。尤其值得推崇的是,这种大幅的性能提升并没有使成本增加多少,K8T800和K8T890系列芯片组很快就将这种新技术应用在K8的新产品上,使它得以迅速得普及,为AMD 的64位的高速飞机装上了轻快、可靠的双翼。CPU : 什么是QPI总线QPI intel的全新架构,Bloomfield将采用全新的LGA 1366 Socket,Package Size为42.5 x 45mm,散热器设计虽然和LGA 775类似,但Mounting Holes为80mm,相较LGA775的72mm2更大,因此散热器不能另相兼容,VRM采用全新的11.1版本,最高TDP为130W 。 利用双向串联点对点传输,它可提供与FSB相近的Latency,可让软件及操作系统管理,并且针对部份Streams(Threading、ISOC、LT/VT)及out of order requests作出了优化,单向最高速度暂 定为6.4GT/s,双向最高速合共10.8GT/s,相比AMD采用的Hyper-Transport 3.0的速度更高。Intel的QuickPath Interconnect技术缩写为QPI,译为快速通道互联。事实上它的官方名字叫做CSI,Common System Interface公共系统界面,用来实现芯片之间的直接互联,而不是在通过FSB连接到北桥,矛头直指AMD的HT总线。无论是速度、带宽、每个针脚的带宽、功耗等一切规格都要超越HT总线。QPI最大的改进是采用单条点对点模式下,QPI的输出传输能力非常惊人,在4.8至6.4GT/s之间。一个连接的每个方向的位宽可以是5、10、20bit。因此每一个方向的QPI全宽度链接可以提供12至16BG/s的带宽,那么每一个QPI链接的带宽为24至32GB/s。(不过,这仍是逊色于AMD的Hypertransport3-单条连接最大传输带宽可以达到45GB/s,但我们相信未来英特尔仍会对QPI进行进一步提速改进。)在早期的Nehalem处理器中,Intel预计使用20bit的链接位宽,大约能提供25.6GB/s的数据传输能力。这个数字是Intel在上一季IDF中公布的。举例来说,在X48芯片组中,FSB的速度为1600MHz,这是目前为止规格最高的FSB总线了。不过最初的QPI总线具备25.6GB/s的吞吐量,这个值相当于1600MHz FSB带宽的2倍。QPI技术特点效率更高此外,QPI另一个亮点就是支持多条系统总线连接,Intel称之为multi-FSB。系统总线将会被分成多条连接,并且频率不再是单一固定的,也无须如以前那样还要再经过FSB进行连接。根据系统各个子系统对数据吞吐量的需求,每条系统总线连接的速度也可不同,这种特性无疑要比AMD目前的Hypertransport总线更具弹性。例如,针对服务器的Nehalem处理器将拥有至少4组QPI传输,可至少组成包括4枚处理器的4路高端服务器系统(也就是16枚运算内核至少32线程并行运作)。而且在多处理器作业下,每颗处理器可以互相传送资料,并不需经过芯片组,从而大幅提升整体系统性能。随着未来Nehalem架构的处理器集成内存控制器、PCI-E 2.0图形接口乃至图形核心,QPI架构的优势将进一步发挥出来。为了降低QP

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论