第4章+存储系统.ppt

上传人：g*** IP属地：河南上传时间：2020-03-14 格式：PPT 页数：179 大小：1.79MB 积分：15 举报 版权申诉

已阅读5页，还剩174页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2007 7 2 计算机组成原理 1 第4章存储系统计算机组成原理 2007 7 2 计算机组成原理 2 第4章存储系统本章介绍了计算机中各种常见存储器芯片的结构和工作原理以及当存储器芯片不满足系统需求时如何对存储器进行扩展采用何种方式对存储器进行管理以提高存储空间的利用率 2007 7 2 计算机组成原理 3 本章要点存储器分类及其工作原理芯片扩展方法存储空间管理方法 2007 7 2 计算机组成原理 4 4 1计算机存储系统组织方式随着计算机和网络技术的发展人们对计算机的要求逐渐提高从最开始只需要计算机代替人进行计算逐渐过渡到要求计算机系统能长时间保存大量信息并且方便用户进行异地查询为了满足人们对各类信息的查询要求现在的计算机必须要配备容量较大的存储系统但是计算机存储系统特别是磁盘存储系统自身存在很难克服的缺陷如读取速度慢寻道时间长等然而尽管存储器速度提升缓慢处理器的处理能力却在快速提高这就造成了新的矛盾存储器的数据传输速度远远小于处理器处理数据的速度使得存储器的性能成为计算机系统性能的瓶颈 2007 7 2 计算机组成原理 5 基于以上原因计算机中配置存储器时需要考虑两方面的问题 1 如何利用有限的存储空间尽可能多地存储数据方便快捷地读出数据 2 如何将慢速的磁盘存储器和快速的处理器匹配起来第1个问题的解决方法我们将在4 5节中详细介绍下面简单介绍第2个问题的解决方法为了同时满足用户对容量和速度的要求计算机系统往往会采用以下的存储器配置方法如图4 1所示 2007 7 2 计算机组成原理 6 2007 7 2 计算机组成原理 7 大容量磁盘存储器处于存储系统的最底层其主要作用是给计算机系统提供一个较大的存储容量因此对它的要求主要是存储容量要尽可能大在计算机中配置了磁盘存储器后已经解决了容量问题为什么还要加内存呢原因在于匹配CPU和磁盘的速度从前面的分析我们可以知道计算机中 CPU的处理速度比磁盘的读写速度快得多如果不进行速度匹配则会出现CPU长时间等待磁盘输入数据的情况从而降低CPU利用率影响系统性能内存的读写速度比CPU的速度慢但是比磁盘快刚好可以起到速度匹配的作用同时因为内存解决的主要问题不是容量问题所以对其容量的要求不是特别高 2007 7 2 计算机组成原理 8 寄存器和Cache都是CPU中的存储器但是二者作用却不完全相同寄存器的读写速度最快主要用于直接提供CPU计算所需要的数据 Cache 又叫高速缓存作用与内存相似主要用于匹配相对低速的内存和高速的寄存器由此可见二者对速度的要求都很高而对容量的要求则较小基于以上的原因目前市场上的主流磁盘容量都在160G以上内存的容量大都是512M或1G 而Cache的容量则在1M左右思考联系实际一台微型计算机存储系统包含那些部件它们分别存在于计算机那些地方作用是什么 2007 7 2 计算机组成原理 9 4 2半导体存储器芯片介绍目前几乎所有的存储器都是用半导体材料做成的但是根据存储器的使用特性可以将存储器分为两类随机存取存储器 RandomAccessMemory RAM 和只读存储器 Read OnlyMemory ROM 只读存储器跟随机存储器不同用户在使用时只能读取其中的数据如果要对ROM中的数据进行修改则必须采用特殊的方法进行因此ROM可以用于保存不需要经常改变的程序和数据如设备驱动程序等同时 ROM有掉电保护功能可用于制造磁盘等能长时间保存信息且不受断电影响的存储器常用ROM有以下五类 2007 7 2 计算机组成原理 10 掩模式 Masked ROM 该种ROM不允许用户对其修改可编程ROM ProgrammableROM PROM 该种ROM允许用户对其进行一次修改一旦程序或数据写入则不允许用户再次修改可擦除PROM ErasablePROM EPROM 该种ROM允许用户在第一次写入数据后再次进行修改但是修改时必须先用紫外光擦除原来的数据电可擦除PROM ElectricallyErasableROM EEPROM又叫E2PROM 该种存储器与PROM一样可以对数据进行多次修改但是不同的是E2PROM不需要紫外光擦除而是采用加电的方式进行擦除闪存 Flashmemory 闪存是电可擦除只读存储器 EEPROM 的变种所不同的是闪存的删除写入是以字节为单位而EEPROM是以整块芯片为单位现在的U盘 MP3和MP4等都使用的是闪存 2007 7 2 计算机组成原理 11 4 2 1SRAM芯片的结构和工作原理1 内部存储单元SRAM的一个存储单元可以用来保存一位数据即可保存一个 0 或一个 1 电路如图4 2所示图4 2SRAM内部存储单元电路中使用的T1 T2 T3 T4均是NMOS管 X是单元行地址选择线 Y是单元列地址选择线作为存储单元电路该电路至少应该有保持写入和读出三种状态 2007 7 2 计算机组成原理 12 1 保持图中T1 T2 T3 T4能构成一个双稳态电路 T1和T2在某一时刻只能有一个处于导通状态当T1截止 T2导通时节点A处于高电平状态节点B处于低电平状态 A的高电平可以保证T2持续导通 B的低电平可以保证T1持续截止反之亦然如果没有外界因素的影响该电路的状态将长时间保持所以 SRAM不需要经常刷新约定 T1截止 T2导通时表示该单元电路状态为 1 T1导通 T2截止时表示该单元电路状态为 0 从以上分析可以看出 A点的状态即为单元电路保存的信息状态 A为高电平时单元信息为 1 A为低电平时单元信息为 0 因此读出时只需要读出A点的状态即可 2007 7 2 计算机组成原理 13 2 写入要对此单元进行写入操作要选中该单元并且要将数据放在数据线上选中时该单元的行选择线X和列选择线Y都处于高电平状态 X Y的高电平使得T5 T8全部导通如果待写入的数据是 0 则I 0数据线被置为低电平数据线被置为高电平不管A B之前的状态如何此时A点将被强制置为低电平 B点将被强制置为高电平进而使得T1导通而T2截止反之如果待写入数据为 1 使得T1截止而T2导通 2007 7 2 计算机组成原理 14 3 读出跟写入一样读出单元数据时也要先选中该电源不同的是此时往数据线上放数据选中时该单元的行选择线X和列选择线Y都处于高电平状态 X Y的高电平使得T5 T8全部导通 I O数据线直接与A点相连 A两点的状态将通过数据线输出 2007 7 2 计算机组成原理 15 4 2 2DRAM芯片的结构和工作原理相对于SRAM来说 DRAM具有容易集成位价格低容量大和功耗低等优点但是由于受到器件的限制 DRAM的存取速度比SRAM慢而且需要定时刷新 1 内部存储单元跟SRAM一样 DRAM的一个存储单元也可以用来保存一位数据即可保存一个 0 或一个 1 常见的DRAM的基本存储电路可以分为多管型和单管型下面以单管型为例介绍电路原理单管型存储单元如图4 4所示 2007 7 2 计算机组成原理 16 电路中的电容C和NMOS管T是电路的核心器件单元存储的信息是通过电容的高低电压来表示的电容充电后的高电位表示 1 放电后的低电位表示 0 读出时只要能读出C的电位即可 T管的栅极接行选择信号源极通过T2接数据线其作用是控制对C的充电当T管导通时源极电位与电容电位相同对单元电路的写入读出和保持这三个基本操作的基本原理如下 2007 7 2 计算机组成原理 17 1 写入要对单元进行写入行列选择信号必须有效且待写入数据需要放在数据线上此时T1 T2导通数据线与源极相连而源极电位与电容电位相同因此数据线上的电位将强制修改电容的电位从而完成写入操作 2 读出该单元的行列选择地址有效时 T1 T2导通所以电容电位的高低能通过数据线输出 3 保持单元电路是通过C的高低电位表示信息然而电容的电压不能长时间保持如果不定期对C的数据进行刷新则其保存的信息 1 经过一段时间后将会变为 0 导致数据丢失通常每1 2ms就需要对其状态进行一次刷新 2007 7 2 计算机组成原理 18 2 典型芯片的工作原理下面我们以Intel2164A芯片为例介绍DRAM芯片的工作过程 1 芯片简介Intel2164A芯片存储容量为64K 1位最大存取时间为200ns 刷新时间间隔为2ms 采用双列直插式封装有16个引脚其引脚图如图4 5所示各引脚功能行地址选通信号用于锁存行地址低电平有效兼作芯片选择信号为低电平时表明芯片当前接收的是行地址列地址选通信号地址总线上先送上行地址后送上列地址它们分别在RAS和CAS有效期间被锁存芯片中 A0 A7 地址线用来分时接收CPU送来的8位行列地址 DIN 数据输入 DOUT 数据输出 NC 未用引脚 VCC 5V电源引脚 GND 接地引脚读写允许控制信号输入引脚当其为低电平时执行写操作否则执行读操作 2007 7 2 计算机组成原理 19 2 工作原理2164A有64K 1位的存储空间需要16位地址线才能寻址由于其存储单元采用矩阵的方式设置我们只要知道某个存储单元的行列地址就可以对该单元进行读写所以芯片16位地址线又可以分成8位行地址线和8为列地址线为了节约成本和减少芯片引脚数量芯片只用了8位地址线采用分时的方式分别传送行地址和列地址传送地址时先传送8位行地址后传送8位列地址为了区别行列地址芯片设置了两个低电平有效的引脚 RowAddressStrobe 和 ColumnAddressStrobe 分别作为行地址选通信号和列地址选通信号当信号为低电平时把此时地址线上的8位地址信号送至内部的行地址锁存器同理当信号为低电平时把此时地址线上的8位地址信号送至内部的列地址锁存器 2007 7 2 计算机组成原理 20 与6116不同 2164A的输入输出数据线使用了不同的引脚在实际使用时常将这两位数据线与数据总线的同一位相连为了保证正确的接收数据和输出数据芯片设置了读写允许控制信号输入引脚当 0时芯片接收数据并根据行列地址信号将此数据写入到相应的存储单元当 1时芯片根据行列地址信号读出相应的存储单元的数据并且输出到数据总线上 2007 7 2 计算机组成原理 21 4 2 3ROM的结构和原理下面我们以EPROM的典型芯片Intel2716为例介绍ROM芯片的工作原理 1 内部存储单元EPROM的基本电路如图4 6所示其核心器件是浮置栅雪崩注入型场效管 FloatinggridAvalancheinjection FAMOS 图4 6EPROM内部存储单元在没有被写入数据前 FAMOS管的栅极没有电子源漏极间没有形成导电沟道不导通此时保存的信息为 1 对其进行写入操作后其栅极上被注入电子源漏极间形成导电沟道管子导通此时保存的信息为 0 2007 7 2 计算机组成原理 22 2 典型芯片的工作原理 1 芯片简介Intel2716是容量为2K 8位读出时间在350ns 450ns 有24个引脚采用双列直插式封装的芯片芯片引脚图如图4 7所示各引脚功能如下 Al0 A0 地址信号输入引脚可寻址芯片的2K个存储单元 O7 O0 双向数据信号输入输出引脚片选信号输入引脚低电平有效只有当该引脚转入低电平时才能对相应的芯片进行操作数据输出允许控制信号引脚低电平时允许数据输出 Vcc 5V电源 VPP 25V 5V电源用于在专用装置上进行写操作 GND 接地引脚 2007 7 2 计算机组成原理 23 2 工作原理芯片有两个电源输入引脚VCC和VPP 引脚VCC作为芯片电源引脚一直接高电平即VCC 1 引脚VPP用以控制是否对芯片进行写操作当VPP 5V时不允许对写芯片但是当VPP 25V时能对芯片读操作也能进行写操作其工作原理如下当VPP 5V 且时允许对读芯片芯片将地址信号所指定的单元的信息放到输出数据线O7 O0上当VPP 5V 时无论状态如何芯片都将进入保持状态此时不能对芯片进行读写输出数据线呈高阻状态当VPP 25V 为持续50ms的高电平时数据线上的信息将被写入到地址信息确定的单元里此时芯片处于编程写入状态数据线处于输入状态编程完成后需要验证写入芯片的数据是否正确因此 Intel2176芯片还能提供程序校验功能即当VPP 25V 时能对芯片内的存储单元进行读操作根据读出的数据判断写入的程序是否正确当VPP 25V 时不允许写芯片此时数据线又将呈高阻状态 2007 7 2 计算机组成原理 24 4 2 4相联存储器相联存储器 associativememory 是一种根据存储内容来进行存取的存储器也称为按内容访问存储器 contentaddressedmemory 它跟一般的存储器不同一般存储器进行读写时需要控制芯片提供读写的单元地址而相联存储器则是按顺序写入根据需要读取的内容读出严格地说相联存储器是一种存取方法而不是一种存储器 2007 7 2 计算机组成原理 25 任何一个记录都有很多的数据项如学生的姓名学号联系方式等每个数据项都是不完全相同的特别是同一所学校的学生的学号是不可能重复的因此在对这类数据进行读出时选定一个数据项作为相联关键字来代表要查找的对象如学生的学号读出时根据中央处理单元给出的这个相联关键字用它和存储器中所有单元中的一部分信息进行比较如果相等则将此单元中余下的信息读出这是实现存储器并行操作的一种有效途径特别适合于信息的检索和更新现在的大部分数据库都是采用这种方法实现的为了进行正确比较存储器必须设置一定的机构来实现比较的过程这些机构包括比较寄存器屏蔽寄存器字选择寄存器查找结果寄存器等各寄存器作用如下 2007 7 2 计算机组成原理 26 1 比较寄存器用来存放检索字其位数和相联存储器的存储单元位数相等 2 屏蔽寄存器用来存放屏蔽码其位数和检索寄存位数相同当按内容进行检索时相应地把MR中要比较的位设置成 1 不要比较的设置成 0 置 1 的字段为关键字段 3 查找结果寄存器位数等于相联存储器的存储单元位数每一位对应一个存储单元位的序数即为相联存储器的单元地址若比较结果第i个字满足要求则将第i位置为 1 其余的均为 0 2007 7 2 计算机组成原理 27 4 字选择寄存器位数与记录的数据项的数量相同用以确定哪些字参与检索参与检索的则相应位为 1 其余的为 0 思考目前我们使用的那些存储产品采用的是半导体存储技术 2007 7 2 计算机组成原理 28 4 3主存储系统主存储器主要有以下几个性能指标存储容量所谓存储容量即存储器能够保存的数据的数量常用的单位有GB MB KB等 1GB 1024MB 1MB 1024KB 1KB 1024B 也可以用乘积的方式表示公式为容量字数字长如1KB可以表示为1K 8位 1MB可以表示为1M 8位等存取速度所谓存取速度即是单位时间内存储器能读写的位数或字节数该参数跟存储器的时钟频率有关一般情况下时钟频率越高存取速度越快如果用位数衡量常用单位有Kb s Mb s等如果用字节数衡量常用单位有KB s MB s等 2007 7 2 计算机组成原理 29 读写周期所谓读写周期是指读写一位或一个字节所需要的时间该参数与存取速度成反比存取速度越快周期越短反之亦然前面我们介绍了几种常用的存储器芯片的结构电路和工作原理但是不同的应用场合会对芯片提出不同的要求现有的芯片往往不能完全满足系统的需要因此如何用现有的芯片来实现系统的性能要求就成为了存储系统必须解决的重要问题之一芯片不满足使用的需要主要有以下几个方面 2007 7 2 计算机组成原理 30 1 位数不够如系统需要的存储容量为128K 8位可选的芯片却只有128K 1位或者128K 4位的芯片这种情况下芯片能够满足128K的要求而位数却不能满足8位的要求此时需要对位数进行扩展即位扩展 2007 7 2 计算机组成原理 31 2 字数不够如系统需要的存储容量为256K 8位可选的芯片却只有64K 8位或者128K 8位的芯片这种情况下芯片能满足8位的要求但却不能满足容量256K的要求此时需要对字进行扩展即字扩展 2007 7 2 计算机组成原理 32 3 字数位数均不够如系统需要的存储容量为256K 8位可选的芯片却只有64K 4位或者128K 4位等芯片这种情况下芯片既不能满足8位的要求又不能满足容量256K的要求此时需要对位数和字同时进行扩展即字位扩展当芯片不能直接满足系统需求时设计者就需要对存储器进行扩展上述三种情况是对存储器进行扩展时的三种主要情况因此对存储器的扩展又主要有位扩展字扩展和字位扩展 2007 7 2 计算机组成原理 33 值得一提的是如果发生下述情况系统需要的存储容量为128K 8位可选的芯片只有256K 8位的芯片这时不需要进行芯片扩展只需要在编程时仅使用低地址空间即可系统需要的存储容量为128K 8位可选的芯片只有128K 16位的芯片这时也不需要进行芯片扩展只需要在编程时只使用输出数据的低8位高8位悬空或者置零即可所以只有当可选芯片的字或位不够用时才需要进行芯片扩展 2007 7 2 计算机组成原理 34 4 3 1位扩展所谓位扩展就是当单个芯片的容量能满足要求但是输出位数不满足系统对存储器输出位数的要求时通过几个芯片同时输出的方式对存储器的输出位数进行扩展根据前面的介绍我们知道了何时需要进行位扩展那么如何用位数较少的芯片来扩展位数较多的存储器呢比如系统需要的存储容量为128K 8位可选的芯片却只有128K 4位的芯片其扩展过程如下 2007 7 2 计算机组成原理 35 1 确定扩展类型仔细分析系统要求可知系统需要的容量跟芯片容量刚好相等但是位数不同因此我们需要进行位扩展 2 需要确定所需芯片的数量系统要求存储器每次输出8位数据而一片芯片每次只能输出4位则为了满足系统需求每次要两片芯片同时输出因此在对芯片进行选择时这两片芯片的片选信号和地址线必须相同实际连接电路时只需要将片选信号和地址线连在一起即可 3 因为扩展时需要由两个4位组成一个8位进行输出所以要确定哪4位为高4位哪4位为低4位根据以上步骤可以得出如图4 8所示的扩展电路图 2007 7 2 计算机组成原理 36 2007 7 2 计算机组成原理 37 图中两芯片的片选信号读写控制信号和地址信号连在一起当系统需要进行读写时两块芯片将同时工作现以读地址为1024的单元为例介绍扩展后的存储器工作过程控制芯片将其与片选信号相连的引脚置为低电平将与读写控制线相连的引脚置为低电平将待读取地址 00100H 通过地址总线传送给存储器因为两块芯片的以上三个信号相同它们将同时把其1024单元中的地址放到数据线上输出两组输出数据线分别连接控制芯片的数据线的高4位和低4位所以控制器在发出一个读信号后将收到一组8位的数据从而实现了用两片4位输出芯片扩展为一个8位输出的存储器 2007 7 2 计算机组成原理 38 4 3 2字扩展所谓字扩展就是当单个芯片输出位数满足系统要求而容量不满足要求时用多个芯片采用地址分段的方式对存储容量进行扩展参与扩展的每个芯片的地址范围不同注意在学习本节内容的过程中大家一定要注意字扩展和位扩展方法的不同 2007 7 2 计算机组成原理 39 下面用一个例子解释字扩展的方法系统需要的存储容量为256K 8位可选的芯片只有64K 8位其扩展的步骤如下 1 确定扩展类型分析系统要求可知芯片输出数据的位数与系统需求一致所以不需要进行位扩展芯片容量只有系统需求的四分之一所以本例中为了满足系统需求需要用多个小容量芯片组成一个较大容量的存储器即字扩展 2007 7 2 计算机组成原理 40 2 确定芯片数量系统需要256K的容量如果用64K的芯片则需要4片才能满足系统需求所以本例中参加扩展的芯片数量为4 注意如果实际需要的容量不是芯片容量的整数倍则扩展后的容量不能比系统需要的容量小 3 选择合适的扩展方法字扩展时常采用的方法有线选法数字逻辑法和译码法 2007 7 2 计算机组成原理 41 下面分别对以上三种方法进行介绍线选法所谓线选法就是在产生片选信号低电平有效时不是由几位地址线的组合状态经过运算后得出而是用直接将控制器的一根地址线与芯片使能端相连线选法是字扩展中最简单的方法其优点是片选信号的产生过程简单不容易出现错误但是由于每个芯片都占用一根地址线当芯片数量增多时要求控制器地址线数量很多而且此方法会严重浪费控制器的逻辑地址空间限制了程序的规模 2007 7 2 计算机组成原理 42 采用线选法对上述例子进行字扩展的电路图如图4 9所示图中芯片的地址信号都是使用的A15 A0这16位低地址线但是芯片的片选信号都分别占用了A16 A19中的一根地址线则每个芯片的地址见表4 3所示假设控制器的地址线共有20根即A19 A0 寻址空间大小为1M 从上表中我们可以看出被浪费的地址空间是00000H 6FFFFH 80000H AFFFFH C0000H CFFFFH和F0000 FFFFFH四个范围地址空间大小占768K 占控制器寻址空间的75 对地址空间造成了严重的浪费且当系统需求增大时被浪费的地址也无法再被利用 2007 7 2 计算机组成原理 43 2007 7 2 计算机组成原理 44 2007 7 2 计算机组成原理 45 为了克服线选法对地址空间的浪费我们常采用数字逻辑法和译码法进行字扩展数字逻辑法所谓数字逻辑法即用数字逻辑电路对两位高地址进行逻辑运算产生片选信号各个芯片的存储单元的地址情况 256K的容量需要18根地址线 A17 A0 而64K的容量需要16根地址线因此只需要从系统的18根地址线中取出低16位 A15 A0 即可对芯片内的每个存储单元进行寻址剩余的两位高地址 A17 A16 有4种组合每一种组合刚好可以用作产生片选信号每个芯片的地址范围见表4 4所示 2007 7 2 计算机组成原理 46 2007 7 2 计算机组成原理 47 2007 7 2 计算机组成原理 48 从上述例子中我们可以看出逻辑运算法克服了线选法的缺点地址空间的利用率达到了100 同时也节省了两根地址线所以存储器的容量还可以进一步扩展但是片选信号的产生复杂容易出现错误随着扩展时所需芯片数量的增加电路的复杂性将会成级数方式增加为了达到地址空间100 的利用率和使用的地址线尽可能少的要求克服逻辑运算法产生片选信号过程复杂的缺点实际进行字扩展时常常采用第三种方法即译码法 2007 7 2 计算机组成原理 49 译码法所谓译码法就是对几根地址线的组合状态用译码器译码后产生片选信号其原理与逻辑运算法类似不同之处在于片选信号的产生方法逻辑运算法是对地址状态经过组合逻辑电路运算后得出片选信号而译码法则是用译码器译码产生根据参与译码的地址线的数量可以将译码法分为完全译码法和部分译码法完全译码法是指所有地址线状态都作为译码器输入的方法部分译码法是指部分地址线状态作为译码器输入的方法 2007 7 2 计算机组成原理 50 译码法进行字扩展时各芯片的地址空间跟逻辑运算法的芯片地址空间一样如表4 5所示因此只需要对两位地址通过2 4译码器译码即可产生4块芯片需要的片选信号所以采用的译码方法是部分译码法芯片扩展后的电路图如图4 11所示 2007 7 2 计算机组成原理 51 2007 7 2 计算机组成原理 52 与逻辑运算法相比译码法产生片选信号时用译码器替代了复杂的数字组合逻辑电路片选信号的产生简单明了不容易出现错误更降低了成本译码法不仅继承了逻辑运算法的优点克服了逻辑运算法的缺点还方便存储容量再次扩展比如现在需要将系统容量从256K提高到512K 译码法只需要将2 4译码器更改为3 8译码器然后将译码器输出与各芯片片选引脚相连即可而采用逻辑运算时需要重新计算每个片选信号与地址输入信号的关系然后根据此关系式选择正确的门电路画出组合逻辑电路图最后将每个组合逻辑电路的输出与各芯片片选信号相连因此译码法是较方便且不容易出错的字扩展方法 2007 7 2 计算机组成原理 53 4 3 3字位扩展所谓字位扩展就是当单个芯片的输出位数和容量同时不满足系统要求时用多个芯片结合位扩展和字扩展的方法对存储器进行扩展在实际芯片扩展时常常会需要用到这种扩展 2007 7 2 计算机组成原理 54 例子如系统需要的存储容量为256K 8位可选的芯片容量只有128K 4位在这种情况下存储器需要一次输出8位而芯片却只能一次输出4位需要进行位扩展存储器要求容量为256K 而芯片容量却只有128K 需要进行字扩展扩展过程中需要用到位扩展的方法也会用到字扩展的方法扩展步骤如下 2007 7 2 计算机组成原理 55 1 位扩展根据位扩展的原理此处需要两个芯片同时输出才能满足系统对位数的要求因此连接电路时这两块芯片的片选引脚必须接同一个片选信号保证两块芯片同时被选中 2007 7 2 计算机组成原理 56 2 字扩展位扩展时虽然是两块128K的芯片同时工作但是存储器容量仍然是128K 只是输出变成了8位构成了128K 8位的芯片因此要构成256K 8位的存储器必须先将两块芯片构成一组此时这一组芯片可以当成一个128K 8位的芯片使用然后由两组芯片组成系统需要的存储器此处只需要两组就可以达到要求所以片选信号产生时没有用到译码器而选择了一个非门如果需要多组则需要通过译码芯片产生片选信号 3 连接数据输出线字位扩展后的电路图如图4 12所示 2007 7 2 计算机组成原理 57 2007 7 2 计算机组成原理 58 电路中的4块芯片从左向右编号分别为1 2 3 4 其中1 2号芯片构成一组 3 4号芯片构成一组从图中我们可以看见每组芯片输出都是8位地址线A16 A0能对组内128K的地址范围进行寻址 A17作为片选信号当A17为低电平时芯片1 2被选中当A17为高电平时芯片3 4被选中因此芯片1 2构成的芯片组地址范围是00000H 1FFFFH 2 3构成的芯片组地址范围是20000H 3FFFFH 2007 7 2 计算机组成原理 59 综上所述可以得到以下结论假定系统需要的存储容量为M N位可选的存储芯片容量只有x y位 x M y N 此时需要在字向和位向同时进行扩展共需 M x N y 块存储芯片思考假如计算机存储系统中单片ROM容量为4K 8 单片RAM容量为8K 8 请设计计算机存储系统电路图要求ROM为16KB RAM容量为64KB 2007 7 2 计算机组成原理 60 4 4高速缓冲存储器Cache 4 4 1Cache基本原理1 设置Cache的必要性计算机有两个核心器件一个内存另外一个则是CPU 二者是否能较好配合将直接影响计算机性能早期的CPU跟内存的速度相差不多但是随着计算机硬件技术的发展 CPU的速度提高的比内存快现在内存和CPU的读写速度相差2 3个数量级如果仅仅依靠内存给CPU传输数据那么CPU可能会长时间等待降低资源利用率所以必须对二者速度进行匹配 2007 7 2 计算机组成原理 61 匹配内存和CPU的速度有以下三个方法 1 降低CPU速度 2 采用高速的SRAM作为内存的存储器 3 根据程序执行的局部性原理在二者之间设置一定的缓冲器显然第一个方法降低了计算机性能不可能采用第二个方法需要用价格昂贵的SRAM来制作容量高达几百兆的内存成本过高因此第三个方法则呈了现代计算机的首选方法 2007 7 2 计算机组成原理 62 实际的计算机系统中常常在CPU和内存间设置一个容量不大常常为几十至几百K 但是速度跟CPU速度相同的Cache作为缓冲器把正在执行的指令代码单元附近的一部分指令代码或数据存入Cache中 CPU需要数据时直接从Cache中读取这种方法解决了速度不匹配的问题又不会大幅度增加成本 2007 7 2 计算机组成原理 63 2 基本原理Cache又叫高速缓存是高速缓冲存储器 CacheMemory 的简称作为一种存储器 Cache有一定的存储空间但Cache的主要作用不是进行数据存储所以其存储空间较小根据Cache所处位置的不同可以将Cache分为一级Cache和二级Cache 与CPU集成在同一块芯片中的是一级Cache 简称L1Cache 其容量常常为几十KB 几百KB 不与CPU集成在同一块芯片中的是二级Cache 简称L2Cache 其容量常常为几百KB 2MB 目前市场上比较高档的CPU常常配有512KB 1MB或者2MB的Cache 配置了Cache的CPU和内存之间的存储结构如图4 13所示 2007 7 2 计算机组成原理 64 2007 7 2 计算机组成原理 65 在Cache控制器的作用下 CPU首先访问Cache 如其需要的数据在Cache中则直接访问Cache即可否则再访问内存如果设置了L2Cache 则系统将按照L1Cache L2Cache 内存的顺序访问值得注意的是 Cache不能被用户直接访问用户不能使用Cache地址进行编程 2007 7 2 计算机组成原理 66 Cache一般由SRAM TRAM和控制器组成其中 SRAM提供存储空间它的容量即为Cache的容量 TRAM保存Cache中的数据在主存中的地址控制器则是实现比较和控制Cache的读写操作等功能当CPU需要内存中某一地址的数据时控制器首先将该地址信号与TRAM中的地址进行比较如果找到相同的地址说明内存中的数据在Cache中则CPU直接访问Cache 否则CPU将访问内存当CPU所需要的数据没有在Cache中时控制器还要完成对Cache的修改将内存中的数据读取到Cache中以保证Cache命中率尽可能高提高数据访问速度 2007 7 2 计算机组成原理 67 4 4 2地址映像Cache作为CPU和内存间的缓冲存储器理想情况下应该保证CPU每次需要访问的数据都在Cache中但是用户程序却是按照内存地址编写的 Cache所做的工作是在CPU访问内存前根据程序执行的局部性原理先将内存中的数据读出当CPU需要时再提供给它所以 Cache所保存的数据到底是内存中的哪些数据地址是什么就成了关键性问题这一问题实际上也是Cache的存储空间与内存之间的地址映像问题 2007 7 2 计算机组成原理 68 常用的地址映像方式有三种全相联映像直接映像和组相联映像 1 全相联映像所谓全相联映像是指将内存和Cache按找固定的相同的大小进行分块内存的块和Cache的块可以任意对应即内存的任何一块都可以映像到Cache的任何一块在Cache的存储空间被占满的情况下也允许确实已被占满的Cache存储器中替换出任何一个旧块 2007 7 2 计算机组成原理 69 这种映像方式的优点是映像过程灵活块冲突率低只有在Cache中的块全部装满后才会出现冲突 Cache利用率高缺点是块表查找的速度慢由于Cache的速度要求高全部比较和替换策略都要用硬件实现控制复杂实现起来也比较困难成本高全相联映像方式下内存与Cache对应的对应关系如图4 14所示 2007 7 2 计算机组成原理 70 2007 7 2 计算机组成原理 71 2 直接映像跟全相联映像一样直接映像先将Cache分成若干块每个块的大小相同并对每个块进行编号同时根据Cache容量大小将内存分成若干页每个页的容量都跟Cache的容量相同然后对内存进行分块每块的大小跟Cache块的大小相同同样对页内的块进行编号映像时内存的某个页的块只能保存在与其块号相同的内存块中例如如图4 15所示内存各页中的第0块只能映像到Cache的第0块而不能映像到其他块 2007 7 2 计算机组成原理 72 2007 7 2 计算机组成原理 73 直接映像的优点是地址变换简单速度快缺点是映像不灵活块冲突率较高 Cache命中率低特别是程序需要在两个页的相同块号的块之间往返执行时 Cache命中率将降得非常低 2007 7 2 计算机组成原理 74 3 组相联映像为了解决直接映像的冲突问题组相联映像方式先将Cache分成大小相同的若干区一般分为2个或4个区对每个区按照直接映像的方式进行分块并且编号因此 Cache中有多个编号相同的块对内存按照Cache区的大小进行分页再对每页按照Cache块的大小进行分块每个内存块可以对应不同Cache区中的相同块号的块例如图4 16中内存第0页的第0块可以对应Cache的第0区的第0块也可以对应第j区的第0块 2007 7 2 计算机组成原理 75 组相联映像的减小了直接映像方式下的页冲突问题提高了Cache的命中率且Cache的容量越大分区的数量越多命中率越高但是这中映像方式控制电路复杂值得注意的是如果只对Cache分1个区时则组相联映像就是直接映像因此直接映像是组相联映像的一种特殊情况 2007 7 2 计算机组成原理 76 2007 7 2 计算机组成原理 77 4 4 3替换策略及更新策略1 替换策略不管采用何种映像方式内存的每个块都对应Cache的某一个块但是Cache容量远小于内存容量不能将内存的所有块全部保存因此如果需要往Cache中调入一个新块且Cache已经被占满时就需要将Cache中的某一个块调出而将新块调入Cache 这个过程就是替换 2007 7 2 计算机组成原理 78 采用不同的替换策略将很大程度上影响Cache的命中率常用的替换策略有随机替换法任意选择一个Cache块将其调出先进先出 FIFO 策略替换出最先进入Cache的块近期最少使用 LRU 策略这种替换策略需随时记录Cache存储器中各个字块的使用情况以便确定哪个字块是近期最少使用的字块这三种策略的算法将在4 5节中介绍这里不再赘述 2007 7 2 计算机组成原理 79 2 更新策略当内存数据被修改时与之对应的Cache的数据也需要相应修改这个过程就是更新但是进行修改时 Cache无法向CPU提供数据因此修改Cache的时机相当重要常用的更新策略有 2007 7 2 计算机组成原理 80 及时更新策略修改内存的同时对Cache进行修改周期更新策略对Cache的修改周期进行修改周期到的时候无论内存数据是否改变都将Cache数据更新为与内存相同的数据执行时更新策略当CPU需要某个Cache块的数据时将此块与内存中与之对应的块进行比较二者不相同时对Cache进行更新思考目前市场上主流微处理器 CPU 和最新技术的微处理器 CPU 的Cache的容量分别是多少 2007 7 2 计算机组成原理 81 4 5虚拟存储系统程序要运行需要CPU运算而在计算机存储中 CPU只能从内存中读取数据因此要运行的程序必须首先进入内存此时如果程序运行所需要的内存容量大于计算机配置的内存容量则程序无法运行而当前很多的计算机软件对内存的需求都大于实际的内存容量如果不采用一定的方法对内存进行扩充则计算机的应用范围将受到很大限制在4 3节中我们学习了如何依靠芯片数量的增加来增大存储器容量的方法能在一定程度上解决系统容量的问题但是芯片数量的增加必然导致成本的急剧提高因此如何在现有的存储容量基础上通过对程序进出内存的方法进行设计以提高存储器利用率让计算机能运行比自身内存大得多的程序便成了首要任务于是虚拟技术便应运而生 2007 7 2 计算机组成原理 82 所谓虚拟存储就是采用一定的方法将一定的外存容量模拟成内存同时对程序进出内存的方式进行管理从而得到一个比实际内存容量大得多的内存空间使得程序的运行不受内存大小的限制虚拟存储方法的实现依赖于程序的特性 2007 7 2 计算机组成原理 83 顺序性所谓程序的顺序性是指程序运行过程中如果要运行第N 1行语句则大多数情况下需要先运行第N行语句即程序是在顺序执行局部性为了减小程序的规模很多的程序设计语言都会设计循环结构如C语言中的for语句和while语句就是典型的循环语句程序在执行这类循环语句时程序的执行范围就限定在循环体中而不会执行循环体外的语句执行的语句限定在很小的范围内即在局部范围内执行这种情况经常会发生这就是程序的局部性 2007 7 2 计算机组成原理 84 根据程序的以上两个特性需要运行的程序不需要完全进入内存也可运行具体方法如下根据程序的顺序性和局部性原理如果将程序分成几块当前面一个块快运行结束时再将下一个块调入内存则程序的执行将不会受到影响而且程序所需要的内存容量也将变小本节的几种虚拟存储实现的方法都是基于这一原理 2007 7 2 计算机组成原理 85 4 5 1页式存储系统在学习页式存储方法之前我们先了解一下最简单的两种存储器分配方式 1 单一连续分配在单道环境下计算机只允许一个作业运行此时所有的计算机资源被该作业独占包括存储器所谓单一是指此方式下计算机只为一个作业分配存储空间所谓连续是指出了操作系统占用的存储空间外剩余的内存空间将全部分配给作业因此作业占用的存储空间不间断其内存分配情况图4 17所示 2007 7 2 计算机组成原理 86 2007 7 2 计算机组成原理 87 系统运行必须要操作系统统一管理因此尽管计算机只运行一个作业也要将操作系统运行的内存空间留出来但是不管操作系统是如图4 17 a 一样占据低地址空间还是如图4 17 b 一样占据高地址空间作业所占的地址都是连续的而且除操作系统占用的那一部分内存外剩余的所有内存空间均被作业独占这种分配方式很容易造成内存空间的浪费因为作业的大小跟剩余空间的大小往往不相等如图4 17的两个图所示内存容量为128KB 操作系统占用32KB 剩余空间内存96KB 如果作业大小为20KB 则剩余76KB的存储空间在该作业退出系统前将不会被利用 2007 7 2 计算机组成原理 88 为了解决单一分配时的空间浪费问题在给作业分配存储空间之前先将剩余空间分成若干区域各区域大小可以相同也可以不同然后再根据作业的需要进行分配即分区分配 2007 7 2 计算机组成原理 89 2 分区分配根据分区分配时区域的大小是否固定分区分配又可以分为固定分区分配和可变分区分配 1 固定分区分配所谓固定分区分配是指先将内存分成若干固定区域区域大小一经确定将永远不再改变每个作业占用一个区域 2007 7 2 计算机组成原理 90 分区过程中要给作业分配内存必须首先要知道哪些分区是空闲未分配的这些空闲区的容量是多大因此系统需要设置一种表格来纪录这些信息常常采用的方法是分区分配表为了满足正常分配的要求分区分配表应该包含每个分区的起始地址大小和分配情况等信息分配前系统先查找分区分配表如果能找到一个满足作业要求的的分区则将此分区分配给作业在固定分区中分区分配表直接决定了是否能正确给各作业分配存储空间所以为了保证分区的正确性需要随时更新分区分配表的信息 2007 7 2 计算机组成原理 91 常用的分区方法一般有两种最佳适应法和最先适应法所谓最佳适应法是指在给作业分配空间时首先遍查分区分配表找到一个能满足作业要求的最小分区分配给该作业而最先适应法则是指在分区时按地址从低到高查找分区分配表将找到的第一个能满足作业运行要求的分区分配给作业流程图分别如图4 20和图4 21所示 2007 7 2 计算机组成原理 92 2007 7 2 计算机组成原理 93 2007 7 2 计算机组成原理 94 假如在图4 19 a 所示的情况下又有一个需要23KB运行空间的作业3进入内存如果采用最佳适应法进行分配则通过查找分区分配表可知能满足该作业要求的分区的序号分别为2 3和5 三个分区的大小分别为30KB 25KB和35KB 很显然分区3是容量最小的分区则系统将此分区分配给作业3 同时将其分配状态和标志分别修改为已分配和作业3 如果采用最先适应算法进行分配在查找分区分配表时找到的第一个能满足作业要求的分区是分区2 则将该分区分配给作业3 同时跟最佳适应法一样修改分区2对应的分配情况和标志 2007 7 2 计算机组成原理 95 从上述分区过程中我们不难看出最佳适应法给作业分配的空间是最合适作业运行的空间这就是最佳的原因但是分配的速度较慢在分配前系统要查找分区分配表的所有表项然后才能找到最佳的分区随着内存容量的增大分区的增多此查找过程所需要的时间将会很长而最先适应算法分配空间的速度最快不需要查找所有的表项但是最先适应算法容易造成空间的浪费如前所述给作业3分配的分区为分区2 根据固定分区的思想该分区的剩余空间不能在分配给其他作业则作业2占用的空间为30KB 浪费的空间为7KB 如果再有一个28KB的作业进入系统则势必将作业5分配给该作业又再次造成7KB的空间浪费降低了存储空间的利用率因此无论采用那种分配方式固定分区都不能完全满足系统对速度和空间利用率的要求 2007 7 2 计算机组成原理 96 2 可变分区分配所谓可变分区分配是指先不给内存分区给作业分配时根据作业运行时对内存的需要再从剩余空间中分出一部分给该作业经过一段时间的分配后内存也将分为若干区域因此在可变分区中也需要设置分区分配表 2007 7 2 计算机组成原理 97 假设内存容量为256KB 有以下申请和释放内存的操作顺序作业1申请20KB 作业2申请30KB 作业3申请40KB 作业4申请30KB 作业1释放20KB 作业3释放40KB 则其内存的分布情况如下所述当4个作业申请完内存之后内存分布情况如图4 22 a 所示跟固定分区一样为了对内存进行有效地管理每次分区后也将对分区分配表进行修改从而得到图4 22 b 所示的分区分配表 2007 7 2 计算机组成原理 98 2007 7 2 计算机组成原理 99 2007 7 2 计算机组成原理 100 与固定分区时的分区情况相同给作业分配空间后内存都被分成

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第4章+存储系统.ppt

文档简介

温馨提示

最新文档

评论

第4章+存储系统.ppt

文档简介

温馨提示

最新文档

评论

相关文档