版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、高级计算机系统结构,雷航 Tel: 61831144,前 言,课程历史:,现代微机系统,现代微机结构,高级计算机体系结构,1、本课程的前续课程 (1) 微型计算机原理及应用 主要内容: CPU及微型计算机的组成 寻址方式、指令系统以及汇编语言程序设计 信息存储原理、存储器组织、存储空间分配以及 如何与CPU接口 微机接口: 查询、中断、DMA三种主要接口方式 典型接口芯片: Intel8255/8253/8259/8237/8251等 微机应用: 如串行/并行通信、A/D和D/A转换等,(2) 计算机组成原理 主要内容: 运算器的构成(从全加器、进位链到加法器、乘法器等, 以及原码、补码的各种
2、运算方法) 控制器的构成: 组合逻辑设计方法、微程序设计方法 存储器: 存储信息的原理、存储器的组织、存储空间的分配等 计算机接口: 查询、中断、DMA等 外部设备: 如CRT、磁盘、磁带机、打印机等,学习以上两门课程的目的: 掌握计算机和微型计算机的基本工作原理以及一些基本的应用。 计算机原理偏重于内部特性和原理 微机原理则偏重于外部特性和原理,(3) 操作系统 掌握一些基本概念, 如多任务机制、分段、分页等存储管理。,2、本课程的主要内容和目的 主要内容 (1) 现代计算机硬件体系结构, 着重介绍:, 引入的关键技术, 如流水线、虚存机制、保护模式、超标量结构、指令重调度、超线程、多核技术
3、、向量计算等, 并以Intel系列微处理器为典型代表进行介绍。,(2) RISC处理器设计方法以及与CISC的比较 (3) 64位处理器 (4) 总线技术 (5) 计算机的一般性能评价方法等, 处理器体系结构,学习目的 掌握现代计算机硬件技术的特征、发展状况、不断引入的新技术和发展方向,了解新技术如何提高处理器以及计算机系统的性能,为进行计算机系统分析和研究、以及为其它专业课程的学习进行打下基础。同时, 也从一个更高的层面上学习计算机硬件技术。,课程特点 将系统结构、技术发展、典型处理器相结合; 内容丰富, 概念多, 但难度不大。,第一章 概述 一、计算机的发展过程 (一) 计算机的发展时期归
4、纳,(二) 计算机性能指标,网络系统,70年代前 70年代 80年代 90年以后,大中型机,小型机,微型机,(1) 字长,第1台64位微处理器:,DEC的Alpha21064, 64位计算机系统, 内部总线和寄存器为64位 外部总线64位 配置64位操作系统 64位数据一次性处理,(2) 速度,速度是衡量计算机处理能力的一个综合指标。,主频、处理器的结构、指令运行模式、Cache的容量、内存的大小和速度等诸多因素, 最终都将表现在计算机的速度上。, 64位处理器: 64位内外部总线、64位寄存器,(3) 容量 内存容量:, 外存容量, 高速缓存(Cache) 容量:,不计入存储容量, 主频,
5、决定主频的因素?, MIPS: 百万条指令/每秒, 基准测试程序, 比如SPEC,(比如Intel 80386系统的理论内存空间可达 232=4000M ) 。, 用什么来衡量速度,(三) 微处理器主要生产厂商,Intel公司 AMD公司 IBM公司(如Power PC系列和Power系列) Apple公司(如Power PC系列) Motorola公司(如MC68系列) SUN公司(SPARC系列, 仅作设计) MIPS公司(如R系列RISC处理器) HP公司(如PA系列RISC处理器) DEC公司(Alpha系列)等,(四) 微处理器发展过程中引入的一些重要技术 1、虚存管理机制 提供分段
6、管理和分页管理等虚存管理机制, 为操作系统提供了支持: 为存储管理(虚存管理)提供了一种有效手段 为多任务机制提供了一种重要的技术保证,2、流水线技术 地址流水线和指令流水线,3、分支预测技术 提高程序分支时的执行效率,4、超级标量结构 实现了多条指令流水线的并行执行 5、大容量高速缓存 极大缓解了CPU速度与内存速度不匹配的矛盾,为实现指令流水线起到了重要的作用,6、RISC技术 处理器的一种设计方法, 提高了处理器的速度, 使处理器的设计方法向前迈进了一大步 7、SIMD技术(Single Instruction Multi-Data),单指令多数据流技术,9、显示并行计算(EPIC) 使
7、处理器具有更高的指令并行能力,8、指令乱序执行技术 指令的重调度(指令重新排序、指令动态调度)能力, 使指令流水线具有更高的执行效率,11、多核技术 使处理器具有多处理器的处理能力,10、向量处理 一种面向运算的并行处理器技术,更好的硬件平台,(五) 微机迅速发展的主要原因和关键技术,集成技术的发展,微机性能的提高,功能更强的软件,微机进入新的应用领域,对微机性能提出更高的要求,1、主要原因:,2、关键技术:,需求,集成电路技术的发展,二、处理器(硬件)的热点(近十几年) 1、PC处理器典型代表:,Intel8086系列处理器, 指令执行方式:, 总线:,内外部总线均为64位, 体系结构:,指
8、令流水线,超级标量结构, Pentium基本型:,称为“多能Pentium”, 在Pentium基本型基础上增加以下功能:, 新增加57条多媒体信息处理指令 片内Cache容量从16K增加到32K SIMD技术: 一条指令同时处理多个数据,传统标量处理,SIMD,X,Y, 积和运算功能,如单指令可完成计算:,Pentium基本型和Pentium MMX称为第一代奔腾处理器(P5架构), 饱和计算功能,将溢出后的结果作为最大值或最小值处理。,X=a0b0a1b1a2b2a3b3a6b6a7b7,当发生上溢出时: 溢出的结果转化为最大值,当发生下溢出时: 溢出的结果转化为最小值,目的:,避免做溢出
9、处理导致流媒体信息处理质量下降和颜色出现倒置, 14级流水线, 双穴封装技术:, 指令乱序执行:, 寄存器重命名(Register renaming):,分析并重排指令, 优化指令的顺序执行。也称为指令流分析技术,数据重新定位到一个内部寄存器(速度与流水线的考虑), Pentium Pro: 高能Pentium,将二级Cache(256K)封装在一个模块中, 一级Cache和二级Cache之间采用64位的独立总线连接,在Pentium基本型的基础上的主要改进: 将CISC指令集内部转换为类RISC指令集来执行, 以提高处理器速度,(Pentium II只支持2个处理器), Pentium II
10、: 在Pentium Pro体系结构中引入奔腾MMX功能 Pentium Pro与Pentium MMX技术的结合 二级Cache从256K增加到512K Pentium II Xeon(至强): 在Pentium II基础上的主要改进: 二级Cache从512K增加到1M 可支持4个或更多个处理器,从PentiumPro到PentiumIII称为第二代奔腾处理器(P6架构),原有Pentium处理器的SIMD只能处理整数, 而Pentium III的SIMD, 既能处理整数, 也能处理浮点数。, Pentium III: 在PentiumII基础上的主要改进: 新增加了70条指令, 增强对多
11、媒体信息、3维图形图象信息、互连网操作的处理能力 增强的SIMD技术, Pentium 4: Pentium 4采用了新的内部设计, 主要表现为: 增加了144条指令, 进一步增强了对多媒体信 息/3维信息/互连网操作的处理能力; 主频达2G以上, 提高了指令执行的吞吐率; 系统总线的速度从PentiumIII的133M提高到了400M; 流水线的级数(流水线深度)从PentiumIII的14级提高到20级; 超线程技术 (Hyper-Threading),Pentium4、Prescott、Pentium D的体系结构均称为NetBurst,主要特征: 流水线的级数从Pentium 4的20
12、级提高到30级 提高了分支预测机构的预测效率, Pentium D,主要特征: 沿用Prescott架构, 采用双核结构(2个独立的Prescott核心) 不支持超线程, CORE2 (酷睿2),CORE2的体系结构称为Core微架构 通用于台式机、服务器和笔记本电脑, 双核结构 提高了每周期的执行的指令数量 双核共享L2 Cache 更多的指令及数据预取器 更长位数SIMD (128位整数及128位浮点, 传统的处理器为64位) 降低了功耗 整体性能比Pentium D提高44。,(2) 从集成技术的角度, CMOS(互补金属氧化物半导体电路)工艺,直接在半导体基片上制作各种晶体管电路, S
13、OI制作工艺,(Silicon On Insulator 硅晶绝缘体), 减少了充电电流, 降低了功耗, 减少了晶体管的静电电容, 缩短了充放电时间, 提高了晶体管的切换速度,SOI制作工艺与同期CMOS工艺相比, 速度可提高35%40%, 功耗可减少50%60%,曾有资料认为: SOI技术将使摩尔定律继续起作用,有望使CPU主频提高到T级。,但是: 近年来以及可预见的将来, 处理器的发展方向不是提高主频, 而是多核处理器, 铜芯片 采用铜导线来代替铝用于集成电路中晶体管之间的互联线, 在相同条件下减少40的功耗; 还可以将铜导线与SOI技术相结合(IBM率先采用了该方式)。, Low K互连
14、层技术 随着电路板蚀刻精度越来越高, 芯片上集成的电路越来越多, 信号干扰也就越来越强。Low K材料解决了芯片中的信号干扰, 并降低处理器的功耗,提高处理器的高频稳定性。, 应变硅技术 基本原理:加大硅原子的间距, 以减小电子通行所受到的阻力, 相当于减小了电阻。从而降低了耗发和热量, 运行速度则得以提升。,在处理器的工艺上, 芯片的功耗、封装、等越来越难以处理, 使得摩尔定律本身的发展及其对处理器的影响发生了一些深刻的变化。,首先, 摩尔定律趋势已经变缓, 由原来的1.5年一代变为2-3年一代。除技术难度增加以外, 集成电路生产线更新换代的成本越来越昂贵。,其次, 处理器主频正在与摩尔定律
15、分道扬镳。过去每代微处理器主频是上代产品的两倍中, 只有1.4倍来源于器件的按比例缩小, 另外1.4倍来源于结构优化。,为此, 芯片设计越来越强调结构的层次化、功能部件的模块化和分布化, 即每个功能部件都相对地简单, 部件内部尽可能保持通信的局部性。,(3) 从体系结构的角度, 处理器体系结构,从标量结构演变到超级标量结构 数据流上从单数据流演变到多数据流 处理器内单一总线结构演变为多总线结构 单指令发射到多指令发射,VLIW(Very Long Instruction Word), 即把多条指令连在一起, 增加了运算的速度。,短指令到超长指令字VLIW,VLIW的基本思想:,VLIW的基本思
16、路: 处理器在一个长指令字中赋予编译程序控制所有功能单元的能力, 让编译程序精确调度在何处执行每个操作、各寄存器读写和每个转移操作。,比如: 编译器可以把“R1+R2R3”和“R4+R5R6”这两条指令组合到一个指令字中(两条指令无寄存器相关)。,指令并行性和数据移动完全由编译来安排, 处理器只需简单执行编译程序所产生的结果, 因而简化运行时资源的调度。,如:比较Intel 80286与Pentium的内部结构, Intel 80286,Pentium基本型, 微机系统硬件结构的变化,从单一总线结构,主要表现为PCI总线出现后, 在一个系统中PCI总线、ISA总线、EISA总线并存。,多总线结
17、构,(4) 从指令计算的角度 指令计算的执行顺序的演变:,串行计算方式:,指令流水线:,指令1, ,指令2,指令3,指令4,指令1,指令2,指令3,指令4, , EPIC模式,EPIC体系结构最基本的特点是从VLIW继承而来: 支持由编译器来决定指令执行方案。,在传统体系结构中, 分支指令可能会导致流水线的长延迟。所以条件分支往往成为指令流水线和VLIW处理器性能发挥的瓶颈。 EPIC将分支指令拆分成三部分: 计算分支条件、形成分支地址、从分支处和分支失败处取指令译码, 各个部件可以重叠执行。,理论上讲, 让一组指令完全并行执行, 比如:,对分支指令:,一组指令,一组指令,两个分之方向的指令并
18、行执行!,EPIC的关键技术:, 大量的寄存器支持,支持多个分支同时执行时, 所需要的大量数据和寻址信息。采用EPIC技术的处理器, 一般其寄存器数量都在128个以上。, 高性能编译器 通过“指令断定” 技术使多个分支同时执行。 “指令管道”技术来实现(多个指令管道),EPIC(Explicity Parallel Instruction Computing) 显式并行指令计算: 核心思想是“并行处理”,实现方法: 编译器提前完成代码排序,以满足大流量指令和数据的要求。, 高速的指令和数据预装技术, 高带宽的数据通路:,以保证大数据高速流动。,三、微机领域当前的几大热点 1. 处理器 (1)
19、64位处理器及全64位计算平台, 基于EPIC计算模式的英特尔IA-64结构,以Itanium处理器为代表,比如:提供长模式(Long-Mode-Active), 解决与32位处理器的兼容性问题。, AMD X86-64处理器,LMA=1:,LMA=0:,纯x86系统, 兼容32位和16位OS和应用,系统为64位系统。并具有两种子模式: 64-bit模式和兼容模式。这两种模式均需要使用64位操作系统。, 双核2.5 GHz 处理器 存储空间扩展至8GB 在进行64位计算的同时, 兼容32位应用软件 测试表明: 运行速度远超出3.4 GHz奔腾4系统, 64位PowerPC G5 (Apple,
20、 用于个人电脑 ), Power 4和Power 5(IBM, 用于服务器) 如: Power 4处理器的P690服务器 Power 5处理器的open power 710服务器。, Power 6 主频达到5.4GHz,64位编程模式和64位API 64位的编译器,支持大于4GB的物理存储空间 支持大于4GB规模的文件 支持多个物理设备文件(如多个磁盘系统),64位宽度以上的总线 64位Cache、高速图形板等,应用层,操作系统层,机器层,CPU芯片层,64位整数寄存器 64位浮点寄存器 64位宽度以上的数据总线,以64位计算模式为基础, 加上相应系统软件支持,(2) 全64位计算平台,(3
21、) 多核处理器,对高速处理器的需求和主频及功耗的限制, 多核技术和多核处理器的发展成为必然趋势。,也可以说, 多核处理器是传统多处理器系统的进一步发展, 也是集成电路技术发展的结果。,多核处理器(CMPChip Multi-Processors ) 是将多个计算内核集成在一个处理器芯片中。,从结构上, 多核可以分为同构多核和异构多核两种:,同构多核 ,异构多核,计算内核相同, 地位对等的多核称为“同构多核”。同构CMP大多数由通用的处理器组成,多个处理器执行相同或者类似的任务。,计算内核不同, 地位不对等的称为“异构多核”, 异构多核多采用“主处理核协处理核”的设计,如: IBM公司的CELL
22、处理器 AMD公司的Fusion方案 “CPU+GPU”,但是, 存在以下一些观点:,多核处理器面临的最大问题是可编程性。一旦核心多过八个, 就需要执行程序能够并行处理。尽管在并行计算上, 人类已经探索了超过40年, 但编写、调试、优化并行处理程序的能力还非常弱。,出于技术的挑战,多核处理器被强加给了产业,而产业并没有事先做好准备。或许十年以后,多核就到头了。一味增加并行的处理单元可能 是行不通的。并行计算机的发展历史表明,并行性超过一定程度以后,程序就很难写。,即使能够不断增加同类型的CPU内核以加强并行处理能力, 但整个系统的处理性能仍然会受到软件中必须串行执行的那部分的制约。,虽然英特尔
23、已展示了80核处理器原型, 但尴尬的是,目前还没有能够利用这一处理器的操作系统。,2. 存储器, 问题: 挥发与非挥发存储器与速度和容量的矛盾, 发展的思路: 将非挥发性、存取速度快、低成本、大容量、低功耗和可无限擦写等目前所有挥发性与非挥发性两种存储器的特性(优点)集于一身。,挥发性存储器: 高速度、小容量、易挥发。,非挥发性存储器: 低速度、大容量、不挥发。, 几种典型解决方案 FeRAM存储器(铁电存储器) 以铁电薄膜电容取代常规的存储电荷的电容, 利用铁电薄膜的极化反转来实现数据存/取。,MRAM存储器 通过控制铁磁体中的电子旋转方向来实现读/写电流的大小, 使其具备二进制数据存储能力
24、。 比如Infineon 的16Mbit MRAM芯片速度比应用于USB闪存、手持计算机和数码相机中的非易失性闪存的速度快约1000倍, 且可写入次数比闪存要高100万倍。,OUM存储器 由Intel所提出。原理是利用Ge、Sb、Te等化合物为材质的薄膜来存储信息, 数据存储利用不同温度造成的相位变化来存储数据。,Intel公司认为: OUM是最有前景的非易失性存储器替代者, 将超越了MRAM和FeRAM。,PCM(基于硫系合金的电热诱导相变转换) 简称相变化存储器,是近年来的热门研发主题。 基本原理: 利用物质(特殊材料)电阻差异存取信息。,据预测, PCM未来市场潜力较FeRAM和MRAM
25、为大。FeRAM和MRAM有容量扩展方面的限制, 而PCM由于良好可扩展性,被认为是未来十年内最好的主流NVM技术之一。,由于容量和价格上的原因, 上述存储器还不能代替如DRAM、SRAM等存储器。,3. 64位的操作系统, 微软 Windows Server 2003。可兼容Intel和AMD的64位处理器, Windows .NET Server,64位操作系统描述:,“以64位CPU芯片为前提, 为充分发挥该64位CPU芯片的性能而实行64位扩展的操作系统”。, 1996年DEC公司: Digital UNIX 4.0 64位操作系统, 以及Open VMS 7.0 64 位操作系统。 SUN公司: 64位的Solaris操作系统, Windows7 64位 、Windows XP X64,4、正研究中的未来计算机,一般认为, 目前在半导体基片上光刻电子元件的方式会遭遇极限(工艺和热量)。,从未来计算机的发展角度看, 科学界看好的未来计算机
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 插花摆摊活动方案策划(3篇)
- 施工方案项目部人员(3篇)
- 机房下送风施工方案(3篇)
- 楼道底部刷漆施工方案(3篇)
- 池塘清淤护坡施工方案(3篇)
- 活动食物策划方案范文(3篇)
- 滑板冲浪提供营销方案(3篇)
- 盖板勾缝施工方案(3篇)
- 移动入户活动方案策划(3篇)
- 纸包鱼店面营销方案(3篇)
- 2026年中考物理全真模拟试卷及答案(共五套)
- 68多彩立体卡通风格的六一儿童节游戏总动员模板
- 气象局数据安全制度规范
- 肝内胆管癌护理查房
- 肺结核诊疗指南(2025版)
- 消防官兵交友课件
- 工装保洁合同协议
- 2026上药控股有限公司校园招聘(公共基础知识)综合能力测试题附答案解析
- 司法三段论课件
- 零件读本(出书版)-1
- 教育局中小学考试命题管理方案
评论
0/150
提交评论