已阅读5页,还剩207页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020/6/7,上海交通大学,1,21世纪课程教材,国家普通高等教育“十一五”规划教材,孙德主编,微机技术维信-吉苏-恩吉姬叔(第4版),2020/6/7,上海交通大学,2,第3章,32位和64位微处理器的硬件特性,2020/6/7,上海交通大学,3,32位和64位微处理器的硬件特性,3.132的基本结构3.564位微处理器的基本结构,3.4,2020/6/7,上海交通大学,4,3.132位微处理器,3.1.1英特尔80386微处理器的基本结构3.1.2英特尔80486微处理器的基本结构3.1.3英特尔奔腾微处理器的基本结构3.1.4英特尔奔腾专业微处理器的主要特征3.1.5英特尔奔腾MX微处理器的主要特征3 . 1 . 3英特尔奔腾II微处理器的主要特征3.1.7 5 . 3 . 1 . 1英特尔80386微处理器的基本结构80386是英特尔公司于1985年10月推出的高性能32位微处理器。 它与8086和80286兼容。这是一款高度集成的芯片,专为高性能应用程序、多用户和多任务操作系统而设计。80386具有片内集成内存管理单元和保护机制。它的数据线是32位。32位微处理器的内部寄存器结构和引脚功能操作也是32位。它有32位地址线,可以直接寻址4GB(1GB等于230B)的物理地址空间。其虚拟存储空间为64TB(1TB为240B)。2020/6/7,上海交通大学,6,英特尔80386微处理器,80386微处理器内部结构如图3-1所示。从图中可以看出,80386由六个主要组件组成,即总线接口组件、指令预取组件、指令预解码组件、执行组件、分段组件和分页组件。2020/6/7,上海交通大学,780386微处理器的内部结构,2020/6/7,上海交通大学,8,1。总线接口单元(BIU)在中央处理器和系统之间提供高速接口。其功能是生成访问存储器和输入/输出端口(即完成总线周期)所需的地址、数据和命令信号。这些操作可以与任何当前操作同时进行。总线接口单元被设计成接收和优化来自多个内部总线的请求,以便在服务请求时能够最大限度地利用所提供的总线宽度。80386的总线周期只有2个时钟。2020/6/7,上海交通大学,9,2。指令预取单元,指令预取单元(IPU)包含16B指令预取队列寄存器,当总线空闲周期到来时,读取指令流4B并将其存储在指令预取队列寄存器中。80386的平均指令长度为3.5B。因此,预取队列寄存器通常可以保存5条指令。2020/6/7,上海交通大学,10,3。指令预解码单元,指令预解码单元(IDU)的作用是预解码指令操作码,完成从指令到微指令的转换,并存储在解码后的指令队列中供执行单元使用。可以节省取指令和解码时间。2020/6/7,上海交通大学,11,4。欧盟执行单元包括8个32位通用寄存器(寄存器文件)、一个64位桶形移位器和一个乘法器/除法器。通用寄存器可用于数据运算和地址计算。桶形移位寄存器用于有效实现指令移位、循环移位和位操作,也用于促进乘法和其他操作。它们可以在一个时钟周期内将任何类型的数据移位任意位。乘法器/除法器可以在1个时钟周期内完成1位乘法/除法,最早允许在40个时钟周期内完成32位乘法或除法。上述IPU、IDU和欧盟统称为中央处理器。,2020/6/7,上海交通大学,12,5。分段单元,分段单元(SU)根据指令要求计算有效地址,完成从逻辑地址到线性地址的转换,同时完成总线周期分段的非法检查,由图3-1中的保护测试单元完成。转换后的线性地址随后与总线周期事务信息一起被发送到寻呼单元。SU通过提供额外的寻址设备来管理逻辑地址空间。它可以实现任务之间的隔离以及指令和数据区的重定位。2020/6/7,上海交通大学,13,6。分页单元将由SU或IPU生成的线性地址转换成物理地址。这种转换是通过两级页面重定位机制实现的。公共单元提供物理地址空间的管理。每页4 KB,每个段落可以是一页或几页。聚氨酯是80386芯片的新组件,也是可选组件。如果不使用单位,80386的线性地址就是物理地址。SU和PU的上述两个部分统称为内存管理单元(MMU)。2020/6/7,上海交通大学,14,3.1.2英特尔80486微处理器的基本结构。英特尔公司于1989年4月推出了一款新的32位微处理器80486。与80386相比,在相同的工作频率下,其处理速度提高了2 4倍。80486采用精简结构计算机(RISC)技术,将执行每条指令所需的时钟数量减少到1 2条指令/时钟。2020/6/7,上海交通大学,15,英特尔80486微处理器的基本结构。在80486之前,处理器执行指令以获得地址,然后输入和输出数据。然而,80486采用了一种称为突发总线的技术,使得一组与地址相关的数据在获得地址后被输入和输出,有效地解决了微处理器和内存之间的数据交换问题。此外,80486内部集成了浮点单元(FPU)和高速缓存。CPU和FPU以及CPU和缓存使用高速总线进行数据传输,大大提高了80486CPU和80486系统的处理速度。2020/6/7,上海交通大学,16,英特尔80486微处理器的基本结构,80486基本遵循80386架构,以保持与86系列微处理器在目标代码级的兼容性。它由八个基本组件组成:总线接口组件、指令预取组件、指令解码组件、执行组件、控制组件、内存管理组件、高速缓存和高性能浮点组件。后两部分旨在80386的基础上提高80486的性能。2020/6/7,上海交通大学,17,英特尔80486DX=高性能,高性能8kb 1高速缓存8038680387*多处理器架构*主频从33MHz提高到50/60MHz*采用1.2片精简RISC技术/时钟8087是NDP数字数据处理器80287和80387是数学处理器,2020/6/7,上海交通大学,18,12.1英特尔奔腾微处理器的基本结构。奔腾是英特尔公司于1993年3月推出的第五代80X86系列微处理器。它的中文翻译是“奔腾”。奔腾的内部结构如图3-2所示。与80486相比,奔腾具有以下结构特征:奔腾的内部结构,2020/6/7,上海交通大学,20,2020/6/7,上海交通大学,21,结构特征。1.超标量流水线奔腾由两个指令流水线组成,U和V,形成超标量流水线结构。每个管道都有自己的ALU、地址生成逻辑和缓存接口。每个时钟周期可以执行两个整数指令,每个流水线分为五个步骤:指令预取、指令解码、地址生成、指令执行和写回。当一条指令完成预取步骤时,流水线可以开始对另一条指令进行操作,极大地提高了指令的执行速度。,2020/6/7,上海交通大学,22,2。重新设计的浮点单元,奔腾的浮点单元,已经基于80486重新设计。它的执行过程分为8个流水线阶段,使得每个时钟周期可以完成一个浮点操作(或两个浮点操作)。使用快速算法可以将诸如加法、MUL和LOAD等运算的速度提高至少3倍。在许多应用中,使用指令调度和重叠(流水线)执行可以将性能提高5倍以上。同时,电路用于固化,硬件用于实现。2020/6/7,上海交通大学,23,3。独立指令高速缓存和数据高速缓存,奔腾芯片有两个8KB高速缓存双向高速缓存结构,一个是指令高速缓存,另一个是数据高速缓存。翻译后备缓冲器(TLB)用于将线性地址翻译成物理地址。这两种高速缓存采用32X8线宽,这是对奔腾64位总线的有力支持。指令和数据分别使用不同的缓存,这减少了冲突并提高了在奔腾中访问数据和指令的性能。2020/6/7,上海交通大学,24,独立指令缓存和数据缓存,奔腾的数据缓存有两个接口,分别与U和V管道连接,以便同时与两个独立的管道交换数据。当将数据写入被占用的数据缓存时,当前使用频率最低的数据将被删除,并同时写回内存。这项技术称为缓存回写技术。由于中央处理器将数据写入缓存,同时将缓存释放的数据写回内存,缓存写回技术将节省处理时间。分支预测,奔腾提供了一个名为BranchTargetBuffer (BTB)的小型高速缓存来动态预测程序分支操作。当指令导致程序分支时,BTB记住指令的地址和分支目标,并使用该信息预测指令再次分支时的路径,预先从那里进行预取,以确保流水线的指令预取步骤不会为空。这种机制的设置可以减少在循环操作期间用于判断循环条件的中央处理器时间。2020/6/7,上海交通大学,26,5。采用64位外部数据总线。奔腾芯片中的ALU和通用寄存器仍然是32位,所以它们仍然是32位微处理器。但外部数据总线采用64位总线,与内存进行数据交换,两者之间的数据传输速率可达528兆位/秒。2020/6/7,上海交通大学,27,3.1.4英特尔集成微处理器的主要特性,PentiumPro是英特尔公司于1995年11月推出的80X86系列中的另一个新品种,其中文名称为“高能奔腾”。与奔腾芯片相比,奔腾处理器采用了新的架构。2020/6/7,上海交通大学,28,1。两个芯片安装在一个封装中,奔腾处理器在一个封装中包含两个芯片,一个是中央处理器核心,包括两个8KB的L1Cache(一级Cache),集成550万个晶体管;另一个是L2高速缓存(L2高速缓存),容量为256千字节,集成了1550万个晶体管。这个L2Cache通过全速总线连接到中央处理器核心,从而提高程序的运行速度。2020/6/7,上海交通大学,29,2。指令被分解成微操作。PentiumPro将CISC结构化指令分解成若干个微操作,如RISC指令,这些微操作可以在流水线上并行执行,以提高性能。它不仅保持了与以前的80X86微处理器的兼容性,使80X86早期产品的巨大软件资源能够在PentiumPro上运行,而且使用RISC技术来提高指令的运行速度。2020/6/7,上海交通大学,30,3。无序执行和推测执行。推测性执行指的是当遇到分支指令时,在结果出来之前转移该分支指令并提前执行。由于投机并不总是正确的,它带有一定的风险,也称为风险执行。无序执行是指不完全按照程序指定的顺序执行指令。无序执行是PentiumPro的一个重要特性。它结合了推测性执行,并允许CPU最有效地利用指令流中的内部资源。,2020/6/7,上海交通大学,31,4。超级流水线和超标量技术,PentiumPro有一个3路超标量结构,其并行执行指令的能力优于奔腾芯片;同时,PentiumPro具有14级超级流水线结构,将任何指令的整个执行分成一系列指令步骤(这里分为14个指令步骤),从而从另一个角度提高处理器的并行处理能力。这两种“超级”技术的结合极大地提高了PentiumPro的性能。2020/6/7,上海交通大学,32,3 . 1 . 5英特尔集成微处理器的主要特性。1997年1月9日,英特尔55C微处理器芯片正式推出。它在英语中被完全称为奔腾和奔腾,在汉语中被称为“多能量奔腾”。MMX是多媒体扩展的缩写,意思是“多媒体扩展”。这是新一代处理器技术,旨在提高电脑处理多媒体和通信的能力。它是32位集成体系结构32 (IA32)指令系统的扩展。它是通过向奔腾处理器添加4种新数据类型、8个64位寄存器和57条新指令来实现的。多能源奔腾MMX技术是英特尔80X86微处理器架构的重大创新,增加了许多新技术,主要如下:2020/6/7,上海交通大学,33,1。多能奔腾引入了新的数据类型,定义了四种新的64位数据类型及其压缩(也称为压缩)表示,它们是压缩字节(在64位
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个性化医疗与药物设计
- 传染病防控与应急管理
- 神经外科引流管的安全护理与管理
- 传染病护理岗位防控措施解析
- 数据基础结构 3
- 体育微课程设计和制作
- 中医药现代化进程与挑战
- 毕业课程设计大赛
- 麻醉护理研究进展
- 钉道护理中的感染预防与控制
- 《高等数学E》课程教学大纲及课程介绍
- 公司出纳明年个人工作计划标准模板(3篇)
- 第十章 问题解决与创造性
- 团体心理咨询的基础
- 比较文学概论马工程课件 第6章
- GB/T 11352-2009一般工程用铸造碳钢件
- 主板规格书-薄板itx-m19ver1.1说明书
- 授信报告范本 中信
- 同方易教操作指南
- (完整)污水处理厂施工组织设计
- T-CABEE 003-2019 近零能耗建筑测评标准
评论
0/150
提交评论