高级计算机系统结构概述.ppt_第1页
高级计算机系统结构概述.ppt_第2页
高级计算机系统结构概述.ppt_第3页
高级计算机系统结构概述.ppt_第4页
高级计算机系统结构概述.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高级计算机系统结构,雷航 ,前 言,课程历史:,现代微机系统,现代微机结构,高级计算机体系结构,1、本课程的前续课程 (1) 微型计算机原理及应用 主要内容: 微型计算机的基本组成 寻址方式、指令系统以及汇编语言程序设计 信息存储原理、存储器组织、存储空间分配以及 如何与CPU接口 微机接口: 查询、中断、DMA三种主要接口方式 典型接口芯片: Intel8255/8253/8259/8237/8251等 微机应用: 如串行/并行通信、A/D和D/A转换等,(2) 计算机组成原理 主要内容: 运算器的构成(从全加器、进位链到加法器、乘法器等, 以及原码、补码的各种运算方法) 控制器的构成: 组合逻辑设计方法、微程序设计方法 存储器: 存储信息的原理、存储器的组织、存储空间的分配等 计算机接口: 查询、中断、DMA等 外部设备: 如CRT、磁盘、磁带机、打印机等,学习以上两门课程的目的: 掌握计算机和微型计算机的基本工作原理以及一些基本的应用。 计算机原理偏重于内部特性和原理 微机原理则偏重于外部特性和原理,(3) 操作系统 掌握一些基本概念, 如多任务机制、分段、分页等存储管理。,2、本课程的主要内容和目的 主要内容 (1) 现代计算机硬件体系结构, 着重介绍:, 引入的关键技术, 如流水线、虚存机制、保护模式、超标量结构、指令重调度、超线程、多核技术、向量计算等, 并以Intel系列微处理器为典型代表进行介绍。,(2) RISC处理器设计方法以及与CISC的比较 (3) 64位处理器 (4) 总线技术 (5) 计算机的一般性能评价方法等, 处理器体系结构,学习目的 掌握现代计算机硬件技术的特征、发展状况、不断引入的新技术和发展方向,了解新技术如何提高处理器以及计算机系统的性能,为进行计算机系统分析和研究、以及为其它专业课程的学习进行打下基础。同时, 也从一个更高的层面上学习计算机硬件技术。,课程特点 (1) 内容丰富, 概念多, 但难度不大; (2) 系统结构与微处理器相结合,第一章 概述 一、计算机的发展过程 (一) 计算机的发展时期归纳,(二) 计算机性能指标,网络系统,70年代前 70年代 80年代 90年以后,大中型机,小型机,微型机,(1) 字长,第1台64位微处理器:,DEC的Alpha21064, 64位计算机系统, 内部总线和寄存器为64位 外部总线64位 配置64位操作系统 64位数据一次性处理,(2) 速度,从每秒几万条指令到每秒达到上数千亿条指令。,速度是衡量计算机处理能力的一个综合指标。,主频、处理器的结构、指令运行模式、Cache的容量、内存的大小和速度等诸多因素, 最终都将表现在计算机的速度上。, 64位处理器: 64位内外部总线、64位寄存器,(3) 容量 内存容量:, 外存容量, 高速缓存(Cache)容量:,不计入存储容量, 主频, 决定主频的因素?, MIPS: 百万条指令/每秒, 基准测试程序, 比如SPEC,(比如Intel80386系统的理论内存空间可达 232=4000M ) 。, 用什么来衡量速度,(三) 微处理器发展过程中引入的一些重要技术 1、虚存管理机制 提供分段管理和分页管理等的硬件支持, 为操作系统实现虚存管理、多任务机制提供了便利,2、流水线技术 地址流水线和指令流水线,3、分支预测技术 提高程序分支时的执行效率,4、超级标量结构 实现了单核多条指令流水线的并行执行,5、大容量高速缓存 极大缓解了CPU速度与内存速度不匹配的矛盾,为实现指令流水线起到了重要的作用,6、RISC技术 处理器的一种设计方法, 提高了处理器的速度, 使处理器的设计方法向前迈进了一大步,7、SIMD技术(Single Instruction Multi-Data) 单指令多数据流技术,8、指令乱序执行技术 指令的重调度(指令重新排序、指令动态调度)能力, 使指令流水线具有更高的执行效率,9、显示并行计算(EPIC) 使处理器具有更高的指令并行能力,11、多核技术 使处理器具有多处理器的处理能力,10、向量处理 一种面向运算的并行处理器技术,二、处理器(硬件)的热点(近十几年) 1、PC处理器典型代表:,Intel8086系列处理器, 指令执行方式:, 总线:,内外部总线均为64位, 体系结构:,指令流水线,超级标量结构, Pentium基本型:,称为“多能Pentium”, 在Pentium基本型基础上增加以下功能:, 新增加57条多媒体信息处理指令 片内Cache容量从16K增加到32K SIMD技术: 一条指令同时处理多个数据,传统标量处理,SIMD,X,Y, 积和运算功能,如单指令可完成计算:,Pentium基本型和Pentium MMX称为第一代奔腾处理器(P5架构), 饱和计算功能,将溢出后的结果作为最大值或最小值处理。,X=a0b0a1b1a2b2a3b3a6b6a7b7,目的:,避免做溢出处理导致流媒体信息处理实时性能下降和颜色出现倒置, 14级流水线, 双穴封装技术:, 指令乱序执行:, 寄存器重命名(Register renaming):,分析并重排指令, 优化指令的顺序执行。也称为指令流分析技术,数据重新定位到一个内部寄存器(速度与流水线的考虑), Pentium Pro: 高能Pentium,将L2Cache(256K)封装在一个模块中, L1Cache和L2Cache之间采用64位的独立总线连接,在Pentium基本型的基础上的主要改进: 将CISC指令集转换为类RISC指令集来执行;,(Pentium II只支持2个处理器), Pentium II: 在Pentium Pro体系结构中引入奔腾MMX功能 Pentium Pro与Pentium MMX技术的结合 二级Cache从256K增加到512K Pentium II Xeon(至强): 在Pentium II基础上的主要改进: 二级Cache从512K增加到1M 可支持4个或更多个处理器,从PentiumPro到PentiumIII称为第二代奔腾处理器(P6架构),原有Pentium处理器的SIMD只能处理整数, 而Pentium III的SIMD, 既能处理整数, 也能处理浮点数。, Pentium III: 在PentiumII基础上的主要改进: 新增加了70条指令, 增强对多媒体信息、3维图形图象信息、互连网操作的处理能力 增强的SIMD技术, Pentium 4: Pentium 4采用了新的内部设计, 主要表现为: 增加了144条指令, 进一步增强了对多媒体信 息/3维信息/互连网操作的处理能力; 主频达2G以上, 提高了指令执行的吞吐率; 系统总线的速度从PentiumIII的133M提高到了400M; 流水线的级数(流水线深度)从PentiumIII的14级提高到20级; 超线程技术 (Hyper-Threading),Pentium4、Prescott、Pentium D的体系结构均称为NetBurst,主要特征: 流水线的级数从Pentium 4的20级提高到30级 提高了分支预测机构的预测效率, Pentium D,主要特征: 沿用Prescott架构, 采用双核结构(2个独立的Prescott核心) 不支持超线程, CORE2 (酷睿2),CORE2的体系结构称为Core微架构 通用于台式机、服务器和笔记本电脑, 双核结构 更长位数SIMD (128位整数及128位浮点, 传统的处理器为64位) 降低了功耗 整体性能比Pentium D提高44。,(2) 从集成技术的角度, CMOS(互补金属氧化物半导体电路)工艺,直接在半导体基片上制作各种晶体管电路, SOI制作工艺,(Silicon On Insulator), 减少了充电电流, 降低了功耗, 减少了晶体管的静电电容, 缩短了充放电时间, 提高了晶体管的切换速度,SOI制作工艺与同期CMOS工艺相比, 速度可提高35%40%, 功耗可减少50%60%,曾有资料认为: SOI技术将使摩尔定律继续起作用,有望使CPU主频提高到T级。,但是: 近年来以及可预见的将来, 处理器的发展方向不是提高主频, 而是多核处理器, 铜芯片 采用铜导线来代替铝用于集成电路中晶体管之间的互联线, 在相同条件下减少40的功耗; 还可以将铜导线与SOI技术相结合(IBM率先采用了该方式)。, Low K互连层技术 Low K材料解决了芯片中的信号干扰, 并降低处理器的功耗,提高处理器的高频稳定性。, 应变硅技术 基本原理: 加大硅原子的间距, 以减小电子通行所受到的阻力, 相当于减小了电阻。从而降低了功耗和热量, 使运行速度得以提升。,目前, 在处理器的工艺上, 芯片的功耗、封装等越来越难以处理, 使得摩尔定律本身的发展及其对处理器的影响发生了一些深刻的变化。,首先, 摩尔定律趋势已经变缓, 由原来的1.5年一代变为2-3年一代。除技术难度增加以外, 集成电路生产线更新换代的成本越来越昂贵。,其次, 处理器主频正在与摩尔定律分道扬镳。过去每代微处理器主频是上代产品的两倍中, 只有1.4倍来源于器件的按比例缩小, 另外1.4倍来源于结构优化。,为此, 芯片设计越来越强调结构的层次化、功能部件的模块化和分布化, 即每个功能部件都相对地简单, 部件内部尽可能保持通信的局部性。,(3) 从体系结构的角度, 处理器体系结构,从标量结构演变到超级标量结构 从单数据流演变到多数据流 处理器内单一总线结构演变为多总线结构 单指令发射到多指令发射,即把多条指令连在一起, 增加运算速度。,超长指令字VLIW(Very Long Instruction Word),比如: 编译器把“R1+R2R3”和“R4+R5R6”这两条指令组合到一个指令字中(两条指令无寄存器相关)。,如:比较Intel 80286与Pentium的内部结构, Intel 80286,Pentium基本型, 微机系统硬件结构的变化,从单一总线结构,主要表现为PCI总线出现后, 在一个系统中PCI总线、ISA总线、EISA总线并存。,多总线结构,(4) 从指令计算的角度 指令计算的执行顺序的演变:,串行计算方式:,指令流水线:,指令1, ,指令2,指令3,指令4,指令1,指令2,指令3,指令4, , EPIC模式,EPIC体系结构最基本的特点是从VLIW继承而来: 支持由编译器来决定指令执行方案。,在传统的体系结构中, 由于分支指令的存在, 执行时可能会造成很长的延迟, 所以条件分支往往是限制VLIW处理器性能发挥的瓶颈。 EPIC将分支指令拆分成三部分: 计算分支条件 形成分支地址 从分支处和分支失败处取指令译码 各个部件可以重叠执行。,理论上讲, 让一组指令完全并行执行, 比如:,对分支指令:,一组指令,一组指令,两个分之方向的指令并行执行!,EPIC的关键技术:, 大量的寄存器支持,支持多个分支同时执行时, 所需要的大量数据和寻址信息。采用EPIC技术的处理器, 一般其寄存器数量都在128个以上。, 高性能编译器 通过“指令断定” 技术(判定技术)使多个分支同时执行, 由 “指令管道”技术来实现(多个指令管道),EPIC(Explicity Parallel Instruction Computing) 显式并行指令计算: 核心思想是“并行处理”,实现方法: 编译器提前完成代码排序,以满足大流量指令和数据的要求。, 高速的指令和数据预装技术, 高带宽的数据通路:,以保证大数据高速流动。,三、微机领域当前的几大热点 1. 处理器及系统 (1) 64位处理器, 基于EPIC英特尔IA-64结构(Itanium处理器), AMD X86-64处理器, 双核2.5 GHz 处理器 存储空间扩展至8GB 测试表明: 运行速度远超出3.4 GHz奔腾4系统, 64位PowerPC G5 (Apple, 用于个人电脑 ), Power 4和Power 5(IBM, 用于服务器) Power 6: 主频达到5.4GHz,64位编程模式和64位API 64位的编译器,支持大于4GB的物理存储空间 支持大于4GB规模的文件 支持多个物理设备文件(如多个磁盘系统),64位宽度以上的总线 64位Cache、高速图形板等,应用层,操作系统层,机器层,CPU芯片层,64位整数寄存器 64位浮点寄存器 64位宽度以上的数据总线,以64位计算模式为基础, 加上相应系统软件支持,(2) 全64位计算平台,(3) 多核处理器,也可以说, 多核处理器是传统多处理器系统的进一步发展, 也是集成电路技术发展的结果。,多核处理器(CMP) 是将多个计算内核集成在一个处理器芯片中。,多核可以分为同构多核和异构多核两种:,同构多核 ,计算内核相同, 地位对等的称为“同构多核”。同构CMP大多数由通用的处理器组成, 多个处理器执行相同或者类似的任务。,异构多核,计算内核不同, 地位不对等的称为“异构多核”,异构多核多采用“主处理核协处理核”的设计,如: IBM公司的CELL处理器 AMD公司的Fusion方案 “CPU+GPU”,但是, 存在以下一些观点:,多核处理器面临的最大问题是可编程性。一旦核心超过八个, 就需要执行程序能够并行处理。尽管在并行计算上, 人类已经探索了超过40年, 但编写、调试、优化并行处理程序的能力还非常的弱。,出于技术的挑战,多核强加给了产业,而产业界并没准备好。或许十年后,多核就到头了。一味地增加并行处理核可能是行不通的。并行计算的发展历史表明,并行性超过一定程度后,程序就很难写。,即使能够不断增加同类型的CPU内核以加强并行处理能力, 但整个系统的处理性能仍然会受到软件中必须串行执行的那部分的制约。,虽然英特尔已研发并展示了80核处理器原型, 但尴尬的是,目前还没有能够利用这一处理器的操作系统。,2. 存储器, 问题: 挥发与非挥发存储器与速度和容量的矛盾, 发展的思路: 将非挥发性、存取速度快、低成本、大容量、低功耗和可无限擦写等目前所有挥发性与非挥发性两种存储器的特性(优点)集于一身。,挥发性存储器: 高速度、小容量、易挥发。,非挥发性存储器: 低速度、大容量、不挥发。, 几种典型解决方案 FeRAM存储器(铁电存储器) 利用铁电薄膜的极化反转来实现数据存/取。,MRAM存储器 通过控制铁磁体中的电子旋转方向来实现读/写电流的大小, 使其具备二进制数据存储能力。,OUM存储器 由Intel所提出。以Ge、Sb、Te等化合物为材质, 利用不同温度造成材料相位的变化来存储数据。,PCM(基于硫系合金的电热诱导相变转换) 简称相变化存储器, 是近年来研发的热点。 基本原理: 利用某些特殊材料电阻差异存取信息。,3. 64位的操作系统, 微软 Windows Server 2003。可兼容Intel和AMD的64位处理器, Windows .NET Server,64位操作系统描述:,“以64位CPU芯片为前提, 为充分发挥该64位CPU芯片的性能而实行64位扩展的操作系统”。, 1996年DEC公司: Digital UNIX 4.0 64位操作系统, 以及Open VMS 7.0 64 位操作系统。 SUN公司: 64位的Solaris操作系统, Windows7 64位 、Windows XP X64 、Vista,4、正研究中的未来计算机,一般认为, 目前在半导体基片上光刻电子元件的方式会遭遇极限(工艺和热量)。,从未来计算机的发展角度看, 科学界看好的未来计算机目前有以下三类:,(1) 生物计算机 通过控制DNA分子间的生化反应完成运算。,在DNA计算机中, 信息将以分子代码的形式排列于DNA上。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论