




已阅读5页,还剩35页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章 中央处理器cpu 介绍cpu的: 发展和现状性能指标 新技术应用接口封装 计 算 机 硬 件 技 术 基 础 第 2 页 第四章 微型机的中央处理器cpu 4.1 cpu概述 4.2 cpu的主要技术参数 4.3 微处理器中所采用的新技术 4.4 单指令多数据流技术 4.5 cpu的封装与接口类型 4.6 典型cpu介绍 第 3 页 4.1 cpu概述 分代intel cpu其他cpu开始年代 第一代 第二代 第三代 第四代 第五代 第六代 第七代 8086/8088 80286 80386 dx/sx 80486 sx/dx/dx2/dx4 pentium pentium mmx pentium pro pentium ii celeron pentium iii pentium 4 pentium d/ee 1978 1984 1987 1990 1993 1996 2000 amd k5 cyrix 6x86/6x86mx idt winchip c6 winchip2 3d amd k6 amd k6-2 amd k6-3 amd k7 (athlon) / (64) amd thunderbird pentium在拉丁文里面就是“五”的意思 第 4 页 4.2 cpu的主要技术参数 4.2.1 位、字节和字长 位:cpu的最小存储单位,有“0”和“1”两种取值。 字节:cpu的最小访问单位,8位组成的。 字长:cpu一次能处理的二进制数,cpu中alu的处理 位数。 cpu按照其处理信息的字长可以分为:八位、十六位、 三十二位及六十四位微处理器等。 intel x86系列cpu 8位 8080、8085 16位8086、80186、80286 32位386、486、pentium、pii、piii、p4 64位 itanium(安腾)、p4 f、pentium d/ee 第 5 页 4.2.2 时钟频率 主频:驱动cpu工作的周期性循环脉冲信号的频率,是 cpu内核(整数和浮点运算器)电路的实际运行频率。其周期 为时钟周期。多个时钟周期组成一个机器周期,多个机器 周期组成一个指令周期。 外频: cpu外频也叫前端总线频率或系统总线时钟频率 ,是由主板为cpu提供的基准时钟频率。 倍频:cpu主频、倍频、外频三者的关系: 主频=外频倍频。 超频:超频就是在实际使用中让cpu工作在高于额定的 工作频率上。 pentium 6066 75200 p ii 66100 233450 p iii 100133 450733 p 4 100266 13.8g cpu 外频 主频 第 6 页 4.2.3 l1和l2 cache的容量和速率 l1和l2 cache的容量和工作速率对提高微机速度 起关键作用。 l1 cache:一般在cpu内部,容量为几十kb。 l2 cache:可在cpu内部或外部,一般为几百kb几 mb。 l2 cache对提高整数运算速度有显著作用。 第 7 页 4.2.4 工作电压 cpu 的工作电压:5v 3.3v 12v 早期cpu(8086486时代)的工作电压一般为5v。标 准的ttl (transistor- transistor logic)数字电路工作电 压为5v。 早期pentium cpu工作电压一般为3v左右。这是由于 : cpu的制造工艺提高,低电压工作可靠性有保 障。 减小cpu功耗,减小发热量。cpu功耗与电源 电压的平方成正比。 节能。 笔记本专用的cpu和pentium4的工作电压一般为1.2 1.8v。 第 8 页 4.2.5 地址总线宽度、数据总线宽度 地址总线宽度 地址总线宽度决定了cpu可以访问的物理地址空 间,简单地说就是cpu到底能够使用多大容量的内存。 808620位,最大存储器空间1mb。 8028624位,最大存储器空间16mb。 8038632位,最大存储器空间4gb。 pentium pro36位,最大存储器空间64gb 。 数据总线宽度 数据总线负责整个系统的数据流量的大小,而数 据总线宽度则决定了cpu与二级高速缓存、内存以及输入 /输出设备之间一次数据传输的信息量。 数据总线宽度与cpu位宽可能不一致。 数据总线宽度与总线位宽可能不一致。 第 9 页 4.2.6 制造工艺 半导体材料工艺目前均为cmos工艺。 ttl(transistor- transistor logic) 晶体管逻辑 nmos(n-channel mos) n沟道金属氧化物半导 体 pmos(p-channel mos) p沟道金属氧化物半导 体 cmos(complementary metal oxide simeconductor) 互补金属氧化物半导体,cmos工 艺ic功耗与频率成正比,与电压的平方成正比。 线宽指芯片上的最基本功能单元的宽度,缩小线宽 可以提高集成度,pentium cpu一般使用0.60.13微米线 宽,最新技术是0.09微米 铜配线技术以往芯片内部使用铝连线,现在普遍采 用导电特性更好的铜配线技术,可以提高cpu的集成度和 工作频率。 第 10 页 4.3 微处理器中所采用的新技术 4.3.1 流水线与超标量结构 非流水线指令的执行过程: 取指令:从内存读取这条指令; 译码:将指令翻译成操作命令; 取操作数:从内存中读取执行该条指令所需的操作数; 执行指令:cpu指定部件实际执行这条指令; 回写:将执行的结果送回内存或寄存器中。 一条指令必须在前一条指令的五个步骤执行完后才能执 行下一条指令。 不一定所有指令都有五步。 取指令fi译码d取操作数fo执行指令e回写w 第 11 页 4.3.1 流水线与超标量结构 流水线 (pipeline):是intel首次在486芯片中开始使 用的。流水线工作方式将不同指令的各个步骤并行化。 执行一条指令的步骤越多(细化),流水线长度越长,流 水线效率越高。 影响流水线效率的另2个因素: 数据相关性指令的执行需要前一条指令的 结果。 分支控制转移。 指令1 指令2 指令3 指令4 指令5 fi 1 2 3 4 5 6 7 8 9 d fi fo d fi e fo d fi w e fo d fi w e fo d fi w e fo d fi w e fo d fi w e fo d fi 时钟 第 12 页 4.3.1 流水线与超标量结构 超标量(superscalar): 在cpu中存在多个相同的功能 部件,可以根据指令的需要动态分配功能部件,组成多条 流水线。这种设计就叫超标量技术。 采用超标量技术的cpu集成了多个alu、多个 fpu 、多个译码器,以并行处理的方式来提高性能。 pentium是intel系列cpu中最早采用超标量结构的处 理器。带有2条独立的处理管线,理想情况下每周期执行2 条指令。 超标量处理器每个周期所使用到的执行单元(用蓝色 表示),可见每个周期都有执行单元空闲。 部件n 部件1 部件2 第 13 页 超线程(hyper threading)技术 超线程(hyper threading): 在单个处理器基础上提供两 个逻辑处理器,这两个逻辑处理器共享相同的物理执行单 元,而从软件的角度来看,操作系统可以象拥有两个物理 处理器那样为这两个逻辑处理器分配不同的线程。 pentium 4共有7个执行单元,平均只有23个单元在使 用状态,在超标量结构中空闲的功能部件得到利用。 图中红色和蓝色分别为两个线程占用的 功能部件。 pentium 4 northwood b率先支持ht。 windows xp 的后期版本支持超线程。 部件n 部件1 部件2 第 14 页 双核技术 双核cpu: 在cpu内部 封装两个处理器内核。双核 和多核cpu是今后cpu的发 展方向。 intel最新的(2005年)双核 cpu: pentium d 和pentium extreme edition。其中 pentium d不支持超线程但 pentium extreme edition支 持超线程。 第 15 页 4.3.2 高速缓存技术 cache存储器:容量较小、速度较快的静态存储器 (sram) 主存储器:容量较大、速度较慢的动态存储器(dram) cpu 主存储器 (dram) cache (sram) cache的工作原理是基于程序访问的局部性: 1. 时间局部性:如果一个存储项被访问,则可能该项会 很快被再次访问。 2. 空间局部性:如果一个存储项被访问,则该项及其邻 近的项也可能很快被访问。 第 16 页 命中:cpu访问存储器数据时,数据已在于cache 中 则称为命中。命中的概率为命中率。 cache控制:命中时,只需直接访问cache即可。如果 未命中,需要将主存储器数据拷贝到cache中,再访问 cache。 cache比主存的容量小得多。 cache的存储容量 越大,命中率也越高。太小会使命中率太低;过大不仅 会增加成本。 4.3.2 高速缓存技术 第 17 页 影响cache命中率的因素: cache容量/主存储器容量 一般考虑性能价格比的折中。采用2级或3级cache,可 以以较低的成本获得较高的命中率。 cache块和主存储器块的相联关系 按效率由低到高(同时实现由简单到复杂)排列: 直接组相联全相联 替换策略:确定替换出的cache块的方法 先进先出策略(fifo: first in first out):是把最先调入的 cache字块替换出去。 最近最少使用策略(lru: least recently used):把当前近 期cache中使用次数最少的那块信息块替换出去。 lru策略优于fifo策略,但lru实现复杂。 4.3.2 高速缓存技术 第 18 页 4.3.3 cache技术的实现 cache技术: 多级cache:不前大多数cpu为两级cache,高端cpu 可能为3级cache。分级cache可以以较小的成本获得较高 的命中率。如: pentium iii采用32kb l1cache+256kb全速l2 cache; itanium采用32kb l1 + 256kb全速l2 + 2mb l3 cache 数据与指令cache:由于数据访问和指令访问之间不存在 局部性规律,所以l1 cache 将数据和指令cache分开,有 利于提高效率。 cache速度:l1 cache一般和cpu内核同步,l2 cache 运行速度有半速和全速两种。 第 19 页 cpu l1 cache (内部) l2 cachel3 cache 80486dx8kb混合型无无 pentium8kb+8kb无无 pentium mmx16kb+16kb512kb pentium 16kb+16kb512kb半速 celeron 16kb+16kb无 / 128kb半速 无 无 无 celeron 16kb+16kb128kb 全速无 pentium 16kb+16kb256kb全速无 pentium 48kb+12kb trace cache 256kb无 xeon mp16kb+16kb256kb全速1mb itanium16kb+16kb256kb全速2-4mb 4.3.3 cache技术的实现 第 20 页 4.4 单指令多数据流技术 处理器虽然只能执行单个指令序列,但能将那些指令同 时应用于多个独立的数据。我们称之为“单指令多数据 ”(simdsingle instruction multiple data)处理器。它 允许cpu 同时对2、4、8 个数据进行并行处理。有效地提 高了cpu 对 视 频 、音频等多媒体方面的处理速度。 simd的具体体现是指令集的扩充,主要包括: mmxintel pentium mmx 侧重提高多媒体数据处理速度,定点运算。 3d now !amd k6-2 侧重提高3维变换,浮点运算。 sseintel pentium 增强浮点运算能力。 sse2 、sse3intel pentium 4 第 21 页 4.4.1 mmx技术 mmx(multimedia extensions)技术是单指令流、 多数据流技术在奔腾cpu的具体实现,在pentium mmx 开始使用,mmx技术核心体现在如下三点: 4种新的数据类 紧缩字节类型:8个字节打包成一个64位 长的数据; 紧缩字类型:4个字打包成一个64位长的 数据; 紧缩双字类型:2个32位的双字打包成一 个64位长的数据; 四字类型:一个64位数据。 8个64位宽的mmx寄存器 57条新指令 第 22 页 饱和运算:保证当 运算结果超出最大 值时按最大值运算 ,低于最小值时按 最小值运算。 饱和运算常用于 音频和视频数据处 理,可以省去常规 运算的溢出检测。 4.4.1 mmx技术 原信号波形(无符号数) 经过非饱和运算放大 经过饱和运算放大 第 23 页 4.4.2 “3d now!”技术 3d now ! 是第一种3d加速指令集,共有21条指令,由 amd公司开发并于amd k6-2 cpu首次使用。 3d now ! 和 mmx 指令集比较: 两者都使用基于simd的处理技术 mmx主要侧重于整数指令的加速,加速的处理对象主要 是音频、视频数据。 3d now ! 主要浮点指令的加速,加速的处理对象主要是 三维图形。 使用3d now !指令的三种途径: 编程时直接使用3d now ! 指令; 编程时使用api接口程序; 使用支持3d now ! 的图形加速卡。 第 24 页 4.4.3 sse技术 sse(streaming simd extension)是pentium 扩 展的第二套多媒体专用指令集。和mmx 指令集不同, sse的主要作用是加速cpu的3d运算能力 。 它总计包括70 条指令 : 50条simd浮点指令,主要用于3d 处理 一条指令可以同时处理4对单精度(32位)浮点数。 12 条新mmx指令,扩充mmx指令集 8 条系统内存数据流传输优化指令 采用新的数据预存取技术,减少了cpu处理连续数据 流的中间环节。 从软件实际运行效果来看sse比3d now!效果更 好,从direct x 6.1 开始支持sse。 第 25 页 intel cpu复杂数据类型处理指令的发展 fpu mmx sse sse2 sse2 mmx:pentium mmx 8个64位mmx寄存器,可为各sse扩展所使用 数据为整数,支持2个32位、4个16位、8个8位运算 sse:pentium iii 8个128位xmm寄存器 支持单精度浮点 支持64位simd整数 sse2:pentium 4 willamette 双精度浮点 128位整数 双精度单精度转换 sse3:pentium 4 prescott 主要增强了视频解码、3d图形优化和超线程性能 第 26 页 4.5 cpu的封装与接口类型 4.5.1 cpu 的封装 第 27 页 4.5 cpu的封装与接口类型 socket系列:目前intel cpu常见的有socket 370(p iii 二 代)、socket 423(p 4)、socket 478(p 4)。 socket 423 插座 slot 系列:有slot 1(p ii / p iii 一代)、slot 2 (p4 xeon)。 又称sec(single-edgecontactcartridge)卡盒 slot 1 插座 第 28 页 lga775:lga(land grid array)封装下的cpu,其特征是 没有了以往的针脚,取而代之的是整齐排列的金属圆点, cpu不再靠针脚接触来固定,而是使用一个金属扣架将 cpu压在露出来的具弹性的触须上 pentium 4的最新型号 采用lga775封装。 4.5 cpu的封装与接口类型 第 29 页 4.6 典型cpu介绍 intel系列pentium 1. pentium (奔腾)处理器 1993年推出的第五代处理器 早期75120mhz使用0.6微米制造工艺 后期120200mhz频率以上改用0.35微米工艺 供电电压为3.3v 内部含有的晶体管数310万个 内置了8k+8k的一级缓存 时钟频率60/66mhz 第 30 页 4.6 典型cpu介绍 intel系列pentium ii 1997年推出,采用了与pentium pro相同的32位核心结 构。增强了mmx指令集,主频233450mhz,采用了slot1 封装标准, 512k同步突发式半速l2缓存,集成度750万。 pentium ii的发展经历了三个阶段: 第一阶段: 0.35微米工艺,核心电压 2.8v,66mhz外频 ,主频有233、266、300三种 第二阶段:0.25微米工艺,核心电压2.0v,66mhz外频, 主频有300、333等几种; 第三阶段:0.25微米工艺 , 核心电压2.0v,100mhz 外频下,主频有350、 400和450三种。 第 31 页 型号核心 总线 主频l2封装线宽 (mhz) (mhz)(kb)(微米) = 1 celeronconvington66 2663000slot 10.25 2 mendocino66 300400128slot 10.25 3 mendocino66 3333661283700.25 4 celeron iicoppermine 66 5337661283700.18 5 celeron800coppermine 100 8001100128全速3700.18 6tualatin100 9001.4g256全速3700.13 7 celeron 4willamette400 1.71.8g128全速4780.18 8 northwood400 1.42.8g128全速4780.13 9 prescott 533 2.43.2g256全速4780.09 10 celerond prescott533 2.43.2g256全速7750.09 4.6 典型cpu介绍 intel系列celeron 赛扬 第 32 页 4.6 典型cpu介绍 intel系列pentium iii 第一代pentium iii处理器 0.25微米工艺; 拥有32kb l1 cache 和512k半速l2 cache; 包含mmx指令和intel自己的“3d”指令sse; 主频有450和500mhz两种规格; 100 mhz外频; 除了sse指令外, piii与pii很相象,事实 上也正是如此,在运 行没有为sse指令优化 过的应用软件时,piii 与pii的速度几乎一样。 第 33 页 第二代pentium iiicoppermine 采用0.18微米工艺 前端总线为133mhz; cpu主频最高733mhz; 内置256kb 全速cache 工作电压1.65v socket 370封装标准 4.6 典型cpu介绍 intel系列pentium iii 第 34 页 型号 核心封装 主频 l2 线宽系统总线 (ghz)(kb)(微米)(mhz) = p 4 willamette4231.31.7 2560.18400 p 4willamette4781.52.0 2560.18400 p 4 “a”northwood 4781.82.6 5120.13400 p 4 “b”northwood4782.32.8 5120.13533 ht p 4 “c”northwood4782.43.4 5120.13800 p 4 “e”prescott 4782.83.4 1m0.09533/800 p 4 “e”prescott 7752.82m0.09800/1066 p 4 “f”prescott7753.23.6 12m0.09800/1066 pentiumd prescott7753.23.6 12m0.09800/1066 pentiumeeprescott7753.23.732m l30.09800/1066 4.6 典型cpu介绍 intel系列pentium 4 第 35 页 4.6 典型cpu介绍 intel系列pentium 4 pentium 4 处理器是intel公司全新推出的ia-32结构 处理器。采用了和以往(p6)不同的全新的netburst体 系结构。 netburst微型结构采用了多种新技术。性能涉 及各种应用领域性能的提高。 socket478封装的pentium 4 lga775封装的pentium 4 第 36 页 4.6 典型cpu介绍 intel netburst cpu结构特点 超长流水线 intel的piii处理器是12层计算管线的超标量设计, 而初级p4处理器是20级计算管线的超标量设计,之后又 增加到31级。 将译码后的指令放入命令缓存 pentium 4采用了微操作指令(micro-operation)方 式,但与p6体系结构不同的是,它不是在内部将可变长 x86指令变换成固定长的risc指令,而是在其相当于一 级缓存的trace cache(跟踪高速缓存)中存储译码后 的微码,一旦命中,无需译码操作,加快了处理速度。 整数运算器(alu)的工作速度是内核的2倍 当处理器的工作频率为1.4ghz时,alu实际工作 频率是2.8ghz,1个时钟周期可以执行2条命令。 第 37 页 一级数据缓存容量少、速度高 一级数据缓存容量为8kb(pentium iii的一半)。访 问只需2个时钟周期(pentium iii是3个)。 sse2强化多媒体指令 mmx和sse的再一次升级,称做sse2。 将原simd的 64位整数运算扩充为128位;支持16 个8位、8个16位、4个32位、2个64位的simd整数 运算; 将原simd的 32位浮点运算扩充为64位双精度浮点 运算。 400mhz前端总线 400mhz(100mhz外频) 的系统总线在奔腾4处理 器和内存控制器之间提供了3.2 gb/s的传输速度。 4.6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤矿支护考试题及答案
- 数学旋转考试题及答案
- 康复治疗面试题及答案
- 储能系统运维安全手册
- java自增自减面试题及答案
- 家电公司采购合同管理办法
- 西藏环卫工人考试试题及答案
- 海曙社工面试题及答案
- 咸宁叉车考试题及答案
- 物理磁学考试题及答案
- 2025汽车智能驾驶技术及产业发展白皮书
- 苯职业病防护课件
- 2025年铸牢中华民族共同体意识基本知识测试题及答案
- 2025年湖北省中考道德与法治真题(解析版)
- 2025-2030年中国胃食管反流病行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030中国苯丙酮尿症(PKU)行业市场发展趋势与前景展望战略研究报告
- 2025至2030年中国PA10T行业市场竞争态势及未来前景分析报告
- 催收新人培训管理制度
- DZ/T 0089-1993地质钻探用钻塔技术条件
- 2025-2030中国铁路道岔行业市场现状供需分析及投资评估规划分析研究报告
- 特种设备安全法培训课件
评论
0/150
提交评论