




已阅读5页,还剩98页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章中央处理器 2 介绍CPU的功能和组成 通过具体例子介绍指令周期的概念 深入了解指令的执行过程 简单介绍时序产生器和控制方式 详细介绍微程序控制器的原理和设计技术 简单介绍硬布线控制器的设计思想 了解传统CPU的结构的基础上 进一步了解流水CPU RISCCPU 多媒体CPU等先进的计算机科学技术 本章的重点 进一步理解CPU的组成 完成指令的过程 控制器的实现技术 微程序控制技术 3 5 1CPU的功能和组成 CPU的功能CPU的基本组成CPU中的主要寄存器 简单介绍 CPU操作控制器与时序产生器 4 CPU是利用大规模集成电路技术 把运算器和控制器集成在一片芯片上 是微型计算机中的运算控制部件 它本身不具备微型计算机硬件的全部功能 即其本身不构成独立工作系统 因此它不能独立地执行程序 CPU其主要任务是执行指令序列 对系统的各个部件进行统一的协调和控制 通常由算术逻辑部件 ALU 控制部件 寄存器组等几部分组成 5 1 CPU的功能 CPU是计算机的核心组成部分 装入内存的程序在CPU的控制下 完成取出指令和执行指令的任务 CPU的基本功能 指令控制 程序的顺序控制 保证机器按顺序执行程序 如何保证 CPU内部设置了程序计数器等部分 操作控制 管理并产生完成指令执行操作所需的控制信号 把这些信号送往相应的部件 控制这些部件按指令的要求进行动作 时间控制 对各种操作实施时间上的定时 保证计算机有条不紊地自动工作 数据加工 对数据进行算术运算和逻辑运算处理 6 2 CPU的基本组成 传统CPU 运算器 控制器 现代CPU 运算器 Cache和控制器 控制器的主要功能 从内存中取出一条指令 并指出下一条指令在内存中的位置 对指令进行译码或测试 并产生相应的操作控制信号 以便启动规定的动作 指挥并控制CPU 内存和输入 输出设备之间数据流动的方向 控制器的组成 程序计数器 指令寄存器 指令译码器 时序产生器和操作控制器 7 内部暂存器 IP ES SS DS CS 输入 输出控制电路 外部总线 执行部分控制电路 123456 ALU 标志寄存器 通用寄存器 地址加法器 指令队列缓冲器 16位 20位 16位 8位 8086内部结构图 8 3 CPU中的主要寄存器 CPU中最基本寄存器 指令寄存器 IR 保存正在执行的指令程序计数器 PC 存放要执行的指令的地址地址寄存器 AR 保存当前所要访问的内存单元的地址数据缓冲寄存器 DR 作为CPU和内存 外围设备之间信息传送的中转站 补偿CPU和内存 外围设备之间在操作速度上的差别 在单累加器结构的运算器中 数据缓冲寄存器还可兼作操作数寄存器 累加寄存器 AC 暂时存放ALU运算的结果信息状态条件寄存器 PSW 通过P128图5 1进一步理解CPU各部分功能 9 10 4 CPU操作控制器与时序产生器 操作控制器的功能 根据指令操作码和时序信号 产生各种操作控制信号 以正确建立数据通路 完成取指令和执行指令的控制 根据设计方法不同 操作控制器可分为 1 硬布线控制器 采用组合逻辑技术来实现 2 微程序控制器 采用存储逻辑来实现 3 门阵列控制器 吸收前两种的设计思想来实现的 本章重点介绍微程序控制器 时序产生器 产生对控制信号进行时间上控制的定时信号 11 5 2指令周期 指令周期的基本概念几种典型指令的指令周期分析CLA指令的指令周期ADD指令的指令周期STA指令的指令周期NOP指令和JMP指令的指令周期用方框图语言表示指令周期 12 各种周期的动态演示 13 1 指令周期的基本概念 指令周期 取出并执行一条指令的时间 程序的执行过程 图5 2 取指 执行指令 再取指令 执行指令 各种指令的操作功能不同 其指令周期不尽相同 机器周期 也称CPU周期 指令周期由若干个CPU周期组成 通常 用内存中读取一个指令字的最短时间来规定CPU周期 时钟周期 常称为节拍 一个CPU周期又包含若干个时钟周期 它是处理操作的最基本单位 14 15 2 几种典型指令周期分析 CLA CLA指令功能 清累加器 是一个非访内指令 取指令阶段 CPU完成三件事 1 从内存取出指令 2 对程序计数器PC加1 为取下一条指令做好准备 3 对指令操作码进行译码或测试 以确定进行什么操作 执行指令阶段 CPU根据对指令操作码的译码或测试 进行指令所要求的操作 小结 CLA指令的指令周期包括一个CPU周期的取指令和一个CPU周期的执行指令 共需两个CPU周期 16 取指令周期 17 执行周期 18 几种典型指令周期分析 ADD ADD30指令功能 取存储单元 30 中的操作数和累加器的内容相加 结果送累加器 这是一条访问内存取数并执行加法的指令 取指令执行指令 将操作数的地址送往地址寄存器把地址寄存器的内容 30 送到地址总线 经译码从内存取出操作数 06 送往数据缓冲器 执行相加的操作 小结 ADD指令功能由三个CPU周期组成 取指 送操作数地址 去操作数进行相加运算并将结果放回累加器 19 20 21 ADD指令的指令周期 22 几种典型指令周期分析 STA STA40指令的功能 把累加器内容送存储单元 40 这是一条访内存存数指令 取指令执行指令 将操作数的地址送往地址寄存器 累加器的内容送到数据缓冲寄存器DR 把地址寄存器的内容 40 送到地址总线 把数据缓冲寄存器的内容送到数据总线 数据总线上的数写入选中的存储单元 40 具体过程描述如图小结 它由三个CPU周期组成 23 24 STA指令的指令周期 25 几种典型指令周期分析 NOP和JMP NOP 空操作指令 在第二CPU周期中不发出任何控制信号 JMP指令是一个程序控制指令 在执行周期中只是改变了PC的内容 26 27 几种典型指令周期分析 小结 指令周期分取指令周期 执行指令周期两大部分 执行指令时间的长短不同 可能包括一 三个CPU周期 执行周期中CPU周期的划分原则 总线及控制不冲突 28 3 用方框图语言表示指令周期 规则 方框代表一个CPU周期 其内容表示数据通路的操作或某种控制操作 菱形表示某种判断或测试 时间上依附于它前面方框的CPU周期 不单独占用一个CPU周期 表示公操作 指一条指今执行完毕后 CPU所开始进行的一些操作 这些操作可能是CPU对外设请求的处理 如中断处理 通道处理等 若没有外设请求 CPU将转入下一个 取指令 因此取指令也可以认为是公操作 前面五条指令用方框图语言表示的指令周期见图 29 30 指令周期分析及方框图表示示例 例1 图5 15所示为双总线结构机器的数据通路 IR为指令寄存器 PC为程序计数器 具有自增功能 M为主存 受R W信号控制 AR为地址寄存器 DR为数据缓冲寄存器 ALU由加 减控制信号决定完成何种操作 控制信号G控制的是一个门电路 另外 线上标注有小圈表示有控制信号 例中yi表示y寄存器的输入控制信号 R1o为寄存器R1的输出控制信号 未标字符的线为直通线 不受控制 1 ADDR2 R0 指令完成 R0 R2 R0的功能操作 画出其指令周期流程图 假设该指令的地址已放入PC中 并列出相应的微操作控制信号序列 2 SUBR1 R3 指令完成 R3 R1 R3的操作 画出其指令期流程图 并列出相应的微操作控制信号序列 31 32 5 3时序产生器和控制方式 一 时序信号的作用和体制二 时序信号产生器三 控制方式 33 一 时序信号的作用和体制 1 对时序信号的理解 CPU的 作息时间 表 机器一旦启动 CPU开始取指令并执行指令 操作控制器就利用定时脉冲的顺序和不同的脉冲间隔 有步骤地指挥各部件工作 规定在这一脉冲到来之前做什么 在另一脉冲到来之前又做什么 一般来说 操作控制器发出的各种控制信号都是时间因素 时序信号 和空间因素 部件位置 的函数 思考 用二进制码表示的指令和数据都放在内存里 那么CPU是怎样识别出它们是数据还是指令呢 时间 空间 34 一 时序信号的作用和体制 2 时序信号的体制 一个CPU周期中要划分为若干个小段 每一个小段中应该做什么有严格规定 根据组成计算机硬件的器件的特性 微程序控制器中的时序信号最基本的体制是节拍电位 节拍脉冲制 一个节拍电位表示一个CPU周期 节拍脉冲把一个CPU周期划分成几个较小的时间间隔 35 二 时序信号产生器 微程序控制器的时序信号产生器 P142图5 17 由时钟源 环形脉冲发生器 节拍脉冲和读写时序译码逻辑 启停控制逻辑等部分组成 36 37 38 节拍电位与节拍脉冲时序关系图 39 40 三 控制方式 1 控制器的控制方式指形成不同操作序列的时序信号的控制方法 有同步控制 异步控制 联合控制三种方式 同步控制方式 在任何情况下 已定的指令在执行时所需的机器周期数和时钟周期数都固定不变 异步控制方式 每条指令 每个操作控制信号需要多少时间就占用多少时间 采用应答方式 41 三 控制方式 2 联合控制方式 上述两种情况的结合 大部分操作序列安排在固定的机器周期中 对某些时间难以确定的操作则以执行部件的 回答 信号作为本次操作的结束 机器周期的节拍脉冲数固定 但是各条指令周期的机器周期数不固定 42 5 4微程序控制器 引言基本思想 利用软件方法设计硬件 即仿照通常的解题程序的方法 把操作控制信号编成所谓的 微指令 存放到一个只读存储器里 当机器运行时 一条又一条地读出这些微指令 从而产生全机所需要的各种操作控制信号 使相应部件执行所规定的操作 微程序控制器特点 具有规整性 灵活性 可维护性等一系列优点 43 主要内容 一 基本概念 微命令和微操作微指令和微程序二 微程序控制器原理三 微程序设计举例四 两种关系 CPU周期与微指令周期的关系机器指令与微指令的关系 44 一 微命令和微操作 1 计算机的两大组成部件 控制部件 控制器 执行部件 运算器 存储器 外设相对来说是执行部件 微命令 控制部件通过控制线向执行部件发出各种控制命令 微操作 执行部件接受微命令后所进行的操作 45 一 微命令和微操作 2 根据数据通路的结构关系 微操作的相容性和相斥性 相容性的微操作 在同时或同一个CPU周期内可以并行执行的微操作 相斥性的微操作 不能同时或同一个CPU周期内并行执行的微操作 示例 P145图5 20 三个寄存器的访问可以同时 而ALU的加 减运算只能依次进行 不能并行 如微操作1 2 3是相容的 而4 6 8是相斥的 46 47 二 微指令和微程序 微指令 在机器的一个CPU周期中 一组实现一定操作功能的微命令的组合 一般由操作控制和顺序控制两大部分组成 P146图5 21示意一条微指令的基本格式 微指令周期 读出一条微指令并执行微指令的时间总和 串行方式的微程序控制器中 微指令周期就是只读存储器的工作周期 微程序 许多条微指令按照一定的顺序组成微程序 事实上 一条机器指令的功能是有一定的微程序来实现的 48 49 三 微程序控制器原理 微程序控制器原理框图如P147图5 23所示 它主要由控制存储器 微指令寄存器 地址转移逻辑三大部分组成 其中微指令寄存器分为微地址寄存器和微命令寄存器两部分 50 51 四 微程序设计举例 设计思想 一条机器指令是由若干条微指令组成的序列实现的 一条机器指令对应一个微程序 而微程序的总和可实现整个指令系统 微指令又是 一个CPU周期中一组实现一定操作功能的微命令的组合 分析指令系统的每条指令的微命令及如何组合为微指令是很重要的 52 举例 设计 十进制加法 运算指令的微程序 仍以运算器为例 并假设参加运算的两个十进制数已经分别存入寄存器R1 R2中 要调整的数据6放到R3寄存器中 53 首先确定实现 十进制加法 运算的算法 根据算法画出指令流程 算法 1 R1 R2存入R2 2 R2 R3存入R2 3 测试进位标志CY 若CY 0 表示不该加6 需要将R2 6后存入R2 若CY 1 表示该加6 R2中就是十进制运算结果 指令流程也是微程序的一种表示形式 54 第二步确定微指令的格式 按前面已经给出一种微指令的格式 实际上微指令的格式及如何编码都有很多种方法 这里给出的是一种比较直观的方法 直接表示法 5 5节将详细介绍多种设计方法 根据每一条微指令所需要控制信号和微指令的格式分别写出四条微指令的编码 将上述四条微指令按顺序排列构成 十进制加法 的微程序 编码形式 55 五 CPU周期与微指令周期的关系 在串行方式的微程序控制器中 微指令周期 读出微指令的时间 执行该条微指令的时间为了保证整个机器控制信号的同步 一般将一个微指令周期时间设计得恰好和CPU周期时间相等 56 六 机器指令与微指令的关系 P151图5 26很好地说明了机器指令和微指令之间的关系 也方便深层次地解释程序的执行过程 取指令入IR后通过微程序执行指令 小结 一条机器指令的功能是由若干条微指令组成的序列来实现的 从指令与微指令 程序与微程序 地址与微地址的一一对应关系来看 前者与内存储器有关 后者与控制存储器有关 每一个CPU周期就对应一条微指令 57 58 5 5微程序设计技术 微程序设计的关键是如何确定微指令的结构 目标是 有利于缩短微指令字长度 有利于减小控制存储器的容量 有利于提高微程序的执行速度 有利于对微指令的修改 有利于提高微程序设计的灵活性 本节内容微命令编码方法微地址形成的方法微指令格式动态微程序设计 59 一 微命令编码 微命令编码 对微指令中的操作控制字段采用的表示方法 直接表示法 操作控制字段中的每一位代表一个微命令 优点 简单直观 其输出直接用于控制 缺点 微指令字较长 使控制存储器容量较大 编码表示法 把一组相斥性的微命令信号组成一个小组 即一个字段 然后通过小组 字段 译码器对每一个微命令信号进行译码 译码输出作为操作控制信号 优点 表示微命令信号的二进制信息位少 缩短微指令字 缺点 微程序的执行速度稍稍减慢 混合表示法 把直接表示法与字段编码法混合使用 以便能综合考虑微指令字长 灵活性和执行微程序速度等方面的要求 60 二 微地址形成的方法 1 微指令执行顺序控制是通过产生后继微指令的地址实现的 其方法有两种 计数器法方式 顺序执行微指令时 由现行微地址加上一个增量来产生 非顺序执行微指令 须通过转移方式 与程序计数器来产生机器指令地址的方法相似 特点 顺序控制字段较短 微地址产生机构简单 但是多路并行转移功能较弱 速度较慢 灵活性较差 61 二 微地址形成的方法 2 多路转移方式 多路转移 一条微指令具有多个转移分支的能力 如 取指 微指令要根据操作码产生多个微程序分支 当微程序不产生分支时 后继微地址由微指令的顺序控制字段给出 当微程序出现分支时 按顺序控制字段的 判别测试 标志和 状态条件 信息选择某一分支所对应的微地址 状态条件 有n位标志 可以实现微程序2n路转移 取指后的分支由IR的OP字段确定 特点 能以较短的顺序控制字段配合 实现多路并行转移 灵活性好 速度较快 但转移地址逻辑需要用组合逻辑方法设计 62 三 微指令格式 1 微指令的编译方法是决定微指令格式的主要因素 考虑到速度 成本等原因 微指令的格式大体分为两类 水平型微指令一次能定义并执行多个并行操作微命令的微指令 前面5 4节中所讲的微指令为水平型微指令 水平型微指令的一般格式 按照控制字段的编码方法 又分为三种 全水平型 不译码 字段译码法直接和译码相混合 63 三 微指令格式 2 垂直型微指令微指令中设置微操作码字段 采用微操作码编译法 由微操作码规定微指令的功能 垂直型微指令的结构类似于机器指令的结构 特点 每条微指令的功能单一 一条垂直型微指令只能产生1 2个微操作命令 它是采用较长的微程序结构换来较短的微指令结构 64 三 微指令格式 3 水平型微指令和垂直型微指令的比较水平型微指令并行操作能力强 效率高 灵活性强 水平型微指令执行一条指令的时间短 垂直型微指令执行时间长 水平用较少的微指令数实现一条指令的功能 因而缩短了指令的执行时间 而且水平型不需要译码 水平型微指令解释指令的微程序 微指令字比较长 但微程序短 垂直型微指令则相反 微指令字较短而微程序长 水平型微指令用户难以掌握 用户对机器结构 数据通路 时序系统以及微命令很精通才能设计 而垂直型微指令相对来说易掌握 65 四 动态微程序 静态微程序对应于一台计算机的机器指令只有一组微程序 而且这一组微程序设计好之后 一般无需改变而且也不好改变 动态微程序通过改变微指令和微程序来改变机器的指令系统 这样可以在一台机器上实现不同类型的指令系统 这种技术又称为仿真其他机器指令系统 以便扩大机器的功能 66 5 6硬布线控制器 硬布线控制器 把控制部件看做产生专门固定时序控制信号的逻辑电路 由门电路和触发器构成复杂树形网络 设计目标 使用最少元件和取得最高操作速度 特点 与微程序控制相比 硬布线控制的速度较快 其原因是微程序控制中每条微指令都要从控存中读取一次 影响了速度 而硬布线控制主要取决于电路延迟 发展 由于硬布线控制器的电路结构很复杂 设计和调试都非常困难 后来就被微程序控制器所替代 但是随着新一代机器及VLSI技术的发展 硬布线逻辑设计思想又得到了重视 因此 近年来在某些超高速新型计算机结构中 又选用了硬布线控制 或与微程序控制器混合使用 67 硬布线控制器设计 1 微操作控制信号的产生 硬布线控制器中 某一微操作控制信号由布尔代数表达式描述的输出函数产生 逻辑函数的设计方法 根据所有机器指令流程图 寻找出产生同一个微操作信号的所有条件 并与适当的节拍电位和节拍脉冲组合 从而写出其布尔代数表达式并进行简化 然后用门电路或可编程器件来实现 注意 为了防止遗漏 设计时可按信号出现在指令流程图中的先后次序书写 然后进行归纳和简化 要特别注意控制信号是电位有效还是脉冲有效 如果是脉冲有效 必须加入节拍脉冲信号进行相 与 68 硬布线控制器设计 2 例4 图5 32中五条指令的微操作控制信号的产生 注意T脉冲的顺序 回顾指令流程写出逻辑函数LDAR M1 T2 M2 ADD STA T2LDDR M1 T3 M3 ADD STA T3LDIR M1 T4RD M1 M3 ADDWE M3 STA其中 M1 M2 M3是三个节拍电位信号 T3 T4为时钟周期信号 ADD STA JMP是指令OP字段译码器的输出信号 69 5 7传统CPU简介 M6800CPU P186 典型的单总线结构的微处理器 其主存和外设采用统一编址 有加 减运算功能 Intel8088CPU产生于8086之后 准16位结构 和早期的8085兼容 CPU功能上分BIU EU 内设指令流队列 有乘 除运算功能 IBM370系列CPU P189 使用了定点运算和浮点运算两种部件 Intel80486CPU 64位DB 32位AB 使用了流水线技术 片内8Kcache包含增强性80387协处理器 浮点运算器FPU 70 5 7流水CPU简介 一 并行处理技术二 流水CPU的结构三 流水线中的主要问题四 奔腾CPU 71 一 并行处理技术 标准的冯 诺依曼体系结构是串行处理 即一个时刻只能进行一个操作 并行性的两种含义同时性 两个以上事件在同一时刻发生 如多机系统中 同一时刻多个进程在运行 并发性 两个以上事件在同一间隔内发生 如并发程序 某一时刻CPU中只有一个进程在运行 而在一个时间段内 多个进程同时运行 并行性的三种形式时间并行 即使用流水处理部件 时间重叠 空间并行 设置重复资源 同时工作 主要体现在多处理器系统和多计算机系统 时间并行 空间并行 时间重叠和资源重复的综合应用 如奔腾CPU采用超标量流水技术 在一个机器周期中同时执行两条指令 72 二 流水CPU的结构 流水CPU的组成 按流水方式组织 其组成由指令部件 指令队列 执行部件三大部分 且组成3级流水线 执行段的速度匹配问题的解决执行部件分为定点和浮点执行部件 分别处理定点和浮点运算指令 在浮点执行部件中 又有浮点加法部件和浮点乘 除部件 它们也可以同时执行不同的指令 标量流水计算机 只有一条指令流水线 超标量流水计算机 具有两条以上的指令流水线 常见流水形式 指令流水线 算术流水线 处理机流水线 73 流水CPU的时空图 74 三 流水线中的主要问题 资源相关 指多条指令进入流水线后在同一机器时钟周期内争用同一个功能部件所发生的冲突 解决方法 指令推迟执行 或是设置重复资源 数据相关 在一个程序中 如果必须等前一条指令执行完毕后 才能执行后一条指令 这两条指令就是数据相关 解决方法 定向传送技术 控制相关 当执行转移指令时 根据转移条件是否发生来控制指令的执行顺序 解决方法 延迟转移法 转移预测法 75 四 奔腾CPU 主要掌握其超标量流水线 指令Cache和数据Cache 浮点单元 转移预测四个方面的特性 P196 198 76 5 9RISCCPU RISC的三个基本要素 有限 简单的指令集 CPU配备大量的通用寄存器 强调对指令流水线的优化RISC机器的特征 使用等长指令 寻址方式少 绝不出现存储器间接寻址 只有取数 存数指令访问存储器 指令数一般少于100条 指令格式少于4种 指令功能简单 控制器多采用硬布线方式 大部分指令在一个机器周期内完成 CPU中通用寄存器数量相当多 强调通用寄存器和流水线的优化使用 一般用高级语言编程 特别重视编译优化工作 CISC与RISC的主要特征对比见表5 6 77 5 10多媒体CPU 多媒体技术的主要问题MMX技术动态执行技术 78 一 多媒体技术的主要问题 媒体 信息传递领域中传递信息的媒介 包括存储信息的实体与传递信息的载体两部分 如磁盘 光盘等属于存储信息的实体 而载体指表示信息的形体 如数值 文字 声音 图形与动静图象等 多媒体技术 指计算机把各种不同的电子媒质集成起来 统一进行存储 处理和传输的技术 如把计算机屏幕显示 视频光盘 CD ROM以及语言和声音综合 并在他们之间建立逻辑连接 使整个系统具有交互性 多媒体技术解决的主要问题 图像与声音的压缩技术适应多媒体技术的软件技术计算机系统结构方面的技术 79 二 MMX技术 一种多媒体扩展结构技术 MMX指令是一种SIMD并行处理指令 其先进性主要体现在 P206 SIMD结构饱和运算方式积和运算方式比较指令转换指令 80 三 动态执行技术 动态执行技术通过预测程序流来调整指令的执行 并且分析程序的数据流来选择指令执行的最佳顺序 实现的关键使用一个指令缓冲池以开辟一个较长的指令窗口 以便允许执行单元能在一个较大的范围内调遣和执行已译码过的程序指令流 81 实验 实验计算机的设计 设计指令系统 确定指令系统的指令 包括几种类型 操作数有哪几种寻址方式 以及指令的编码等 要兼顾必要性 编程方便 和可行性 硬件条件 设计指令执行流程对于微程序控制的计算机设计指令流程时 要保证每条微指令所包含的微操作的必要性和合理性 防止微操作之间有时序冲突 为此要分析 哪些微操作信息可以安排在同一条微指令中 哪些微操作信息必须安排在同一条微指令中 哪些微操作信息不能安排在同一条微指令中 82 实验 实验计算机的设计 设计微操作控制信号及其实现方法 综合指令系统各指令执行流程中涉及到的微操作控制信号 统计总共需要多少个微操作控制信号 设计时应考虑以下几点 微指令编码格式微操作信号的有效性器件的操作条件设计微指令格式确定微程序控制方式包括设计各微程序入口地址的形成方法和控存的顺序控制 即下地址形成 方法 编写各指令的微程序设计实验接线表 83 Pentium4的逻辑结构 寄存器组与CPU字长超标量结构ALU流水线处理技术SIMD技术EM 64T超线程技术双核与多核技术 84 Pentium4处理器的逻辑结构 指令译码器 整数寄存器组 L1数据cache 8KB 浮点寄存器组 慢ALU 复杂指令 2xALU 简单指令 2xALU 简单指令 2xAGU 存地址 浮点存浮点取 2xAGU 取地址 MMX SSE SSE2 浮点加浮点乘浮点除 执行跟踪cache 12000微操作 微码ROM 微操作队列 微操作队列 指令预取部件 动态分支预测器 前端总线 256位 时钟频率 64位 时钟频率 总线接口部件 总线接口 运算器 寄存器组 控制器 85 Pentium4处理器的芯片布局 86 Pentium4的寄存器组 整数寄存器组 指令计数器标志寄存器 87 Pentium4的超标量结构运算器 88 采用超标量 superscalar 结构 一共包含9个ALU 均可同时工作 2个高速整数ALU 每个时钟周期进行2次操作 用于完成简单的整数运算 如加 减法 1个慢速整数ALU 需要多个时钟周期才能完成1次操作 用于完成整数乘 除法运算2个地址生成部件 AGU 用于计算操作数的有效地址 所生成的地址分别用于从内存取操作数或向内存保存操作结果1个ALU用于完成浮点操作数地址的计算1个ALU用于完成浮点加法 乘法和除法运算1个ALU用于执行流式的SIMD处理 SSE SSE2 SSE3指令 1个ALU用于完成多媒体信号处理 MMX指令 89 I6 I5 I4 I3 指令的流水线执行 I2 指令的顺序执行 I1 指令的流水线执行 Pentium4的流水线分成20级 每一级的操作都很简单 执行速度极快 因而允许时钟频率高达1GHz以上 90 超流水线 Hyper pipeline 技术 Pentium4有多条超流水线 每条流水线的级数均很长 定点运算达20级 浮点运算达到29级 处于执行状态的指令数最多可达到126条 超级流水线中每步操作都非常简单 因此主频可以显著提高 91 指令流水线的效果 Add Add Add Add Add Div Sub Mul Add Sub Add CPU 流水线会阻塞吗 如何确保指令流水线通畅 运算结果 92 指令预取和分支预测 为了使流水线不中断 指令预取部件用于完成指令地址的计算 并从指令cache中读取指令 一次64位 它还通过动态分支预测器对即将执行的指令提前进行预取 如果预测发生错误 那么流水线就会中断 CPU的速度将会受到影响 A A 2 If A 10 B A 93 Pentium的64位扩展技术 EM 64T 整数寄存器组 指令计数器标志寄存器 共16个64位寄存器 另外还增加8个128位的SSE寄存器增加了处理64位整数的指令支持c语言中的 longint 数据类型 对应的是64位整数 Pentium4的64位寄存器组 94 超线程 Hyper Threading HT 技术 背景 实际应用中CPU的执行单元没有被充分使用 性能未得到充分发挥超线程 HT 技术 把硬件模拟成两个处理器芯片 从OS来看就像有两个CPU一样 可同时执行2个线程P4处理器增加了一个逻辑CPU指针 而整数运算单元 浮点运算单元 L2Cache等均由2个线程共享处理器有两种运行模式 SingleTaskMode 单任务模式 系统只有1个逻辑处理器MultiTaskMode 多任务模式 系统有2个逻辑处理器分析 由于不是2个真正的CPU 它们需要共享ALU cache等资源 当两个线程同时需要使用某个资源时 一个线程必须暂停运行 直到该资源空闲后才能继续执行 因此超线程的性能达不到2个物理CPU的性能超线程技术需要芯片组 OS和应用软件支持 才能发挥该项技术的优势 Windows2000就不支持双线程当运行单线程应用软件时 超线程技术甚至会降低系统性能 95 双核处理器出现的背景 提高主频来提升处理器性能的瓶颈是散热问题 3 2GHz的Pentium4处理器功率超过100W 内核温度达摄氏70度提升到4 0GHz时功率会达到150W 散热问题更难处理超线程技术虽然可以提高执行部件的使用效率 但有一定开销 对于单线程的软件反而降低了效率集成电路制造及封装技术的进步 有能力把2个甚至更多个处理器做在1个芯片内 96 双核处理器 1个芯片中有两个功能相同的处理器 内核 在操作系统看来 系统中有2个CPU2个内核可以各有自己的L2cache 但必须保正其中的信息完全一致 否则就会出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030全球及中国音乐制作服务行业发展趋势分析与未来投资战略咨询研究报告
- 第十三章内能 单元测试卷(含答案) 2025-2026学年人教版九年级物理全一册
- 中石化中原油田招聘考试真题2024
- 2024年北京信息职业技术学院招聘真题
- 2025年智能制造的能源效率优化方案
- 2025年海洋能源利用技术创新:海水淡化反渗透膜材料高效转化研究
- 2025年海洋能发电技术国际合作与市场拓展研究报告
- 2025广西仙城投资发展集团有限公司第一次招聘人员考前自测高频考点模拟试题及参考答案详解一套
- 2025年4月北京门头沟区龙泉镇城市协管员招聘1人模拟试卷及答案详解(考点梳理)
- 2025广东韶关市南雄市司法局招聘1人模拟试卷及答案详解(典优)
- 隧道施工应急预案方案
- 植物鉴赏课件
- 安徽省华师联盟2026届高三上学期9月开学质量检测物理试卷(含答案)
- 航海船舶航线选择指南
- 2025年中小学校长岗位竞聘面试题库及答案
- 2025年中国心血管病报告
- 肿瘤热疗中国专家共识
- 2025年甘肃省药品检查员资格考试(药械化流通)历年参考题库含答案详解(5套)
- 2025年泸州职业技术学院招聘考试笔试试卷【附答案】
- 自来水企业内部管理规范
- 2025新热处理工程师考试试卷及答案
评论
0/150
提交评论