微处理器设计流水线技术引论_第1页
微处理器设计流水线技术引论_第2页
微处理器设计流水线技术引论_第3页
微处理器设计流水线技术引论_第4页
微处理器设计流水线技术引论_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

微处理器设计流水线技术引论第1页/共82页第2页/共82页第3页/共82页第4页/共82页第5页/共82页第6页/共82页第7页/共82页第8页/共82页第9页/共82页第10页/共82页第11页/共82页第12页/共82页第13页/共82页第14页/共82页第15页/共82页第16页/共82页第17页/共82页第18页/共82页第19页/共82页第20页/共82页第21页/共82页流水线的基本性能流水线增大了CPU的指令吞吐量---即单位时间完成指令的条数流水线技术经常对流水线附加一些控制,因而增加了开销,随之单条指令执行时间略有加长第22页/共82页流水线基本性能—例

考察非流水线机器。假设其时钟周期为10ns,ALU和分支操作需要4个时钟周期,存储器操作需要5个时钟周期,以上操作的比例相应为40%,20%,40%

假设由于存在时钟偏移和启动时间,时钟周期增加了1ns,并忽略其他的影响,求该流水线的加速比。第23页/共82页在非流水线的机器上,指令的平均执行时间:指令平均执行时间=时钟周期X平均CPI=10nsX[(40%+20%)X4+40%X5]=44ns在流水线方式下,时钟周期为11ns,即指令的平均时间。

speedup=44ns/11ns=4第24页/共82页流水线级数选择—优点在理想情况下,即流水线处理器中可连续执行的指令条数k->

时,流水线处理器的性能加速比为流水线的级数,因此流水线处理器的性能取决于流水线级数的选取。若流水线级数选取得越大,则对于给定的逻辑通路,流水级就分得越细,每一级的逻辑通路就越短,时钟周期就越快,处理器的性能也就越高。第25页/共82页流水线级数选择—缺点随着流水线级数的增加,由于指令流的断流所产生的延迟就增加了,这样将会逐渐掩去由于流水级的增加所带来的性能增益;在每一个流水级中,除了实现操作的逻辑通路具有一定的传输延迟外,还需要有固定的锁存开销时间,包括:锁存建立、锁存传输和时钟偏斜第26页/共82页流水线级数选择--流水线中时钟周期的组成

第27页/共82页流水线级数选择若逻辑通路过分地细化,虽然逻辑通路的传输时间可分摊到各流水级中,但由于锁存开销时间是固定的,锁存开销时间将会成为决定流水线时钟周期的主要因素。另外,随着流水线级数的增加,流水线中各级所需的锁存硬件开销也将逐渐增大;同时由于流水线级数的增加,处理器的时钟频率也将加快,处理器所需的功耗也将逐渐增高。因此存在一个根据所实现处理器的性能、价格目标,选取满足设计目标的最佳流水线级数的问题。

第28页/共82页流水线级数选择--最佳流水线长度Larson和Davidson[Larson73]提出了一个求解使所实现的处理器的性能达到最大的最佳流水线级数的模型,该模型的建立是基于处理器的逻辑通路长度L、锁存开销时间t、连续执行指令数k。则最佳流水线长度nmax:

式中的nmax

的意义为:当流水线级数增加时,处理器的性能将随着流水线级数的增加而逐渐增加;当流水线级数增加为nmax时,处理器的性能达到最大;此后尽管再继续增加流水线的级数,处理器性能开始下降。第29页/共82页流水线级数选择--最佳流水线长度可以得到一个结论:减少t值,可以获得更长的流水线,获取更高的性能。t值的减少可通过两种渠道:一方面在实现中采用快速的锁存器;另一方面在实现中采用合理的时钟分配方案来减少时钟偏斜。在设计处理器的流水线时,需考察分析各种影响流水线设计的有关因素,根据所实现处理器的性能、价格目标,选取满足设计目标的最佳流水线级数,使所实现的处理器达到设计要求。第30页/共82页流水级的分配为了保证各流水级中操作的平衡,一个最直接的想法是依照最佳流水线级数将逻辑通路中的逻辑门进行平均分配来进行流水线的划分。图示出了在两个寄存器之间具有L个逻辑级的一级流水线;若流水线分为两级,则每一级逻辑有L/2个逻辑门;以此类推。但是由于处理器中的逻辑结构非常复杂,存在众多的中间信号和反馈信号,这样划分会增加太多的流水级锁存,是极为不现实的。第31页/共82页流水级的分配通常在进行流水线的划分时,将所确定的最佳流水线级数作为参考,依据功能来进行划分的。依据功能来进行划分所带来的好处是:流水级之间彼此独立,中间信号可以减少,减少中间锁存的开销;其缺点是:很难完全平衡流水线中各流水级的操作第32页/共82页将一个功能划分为一个子功能流水线的条件

所划分的子功能流水线的功能等价于原功能;在子功能流水线中,前一个子功能流水级的输出是下一个子功能流水级的输入;在各子功能流水级之间仅存在输入与输出的联系,而无其它任何内部联系;各子功能流水级的功能实现可由硬件完成;各子功能流水级的执行时间通常相等。在对处理器的逻辑通路进行流水线划分时,应严格遵循上述5个条件,其中,要重点平衡流水线中各流水级的操作,使各流水级的执行时间基本相等,以减少流水线处理器中时钟周期的长度。第33页/共82页第34页/共82页第35页/共82页第36页/共82页第37页/共82页第38页/共82页第39页/共82页第40页/共82页第41页/共82页第42页/共82页第43页/共82页第44页/共82页第45页/共82页第46页/共82页第47页/共82页第48页/共82页第49页/共82页第50页/共82页第51页/共82页第52页/共82页第53页/共82页第54页/共82页第55页/共82页第56页/共82页第57页/共82页第58页/共82页第59页/共82页第60页/共82页第61页/共82页第62页/共82页第63页/共82页第64页/共82页第65页/共82页第66页/共82页第67页/共82页第68页/共82页第69页/共82页第70页/共82页第71页/共82页第72页/共82页第7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论