ARM存储器结构

上传人：t*** IP属地：河南上传时间：2020-04-20 格式：PPT 页数：71 大小：400KB 积分：15 举报 版权申诉

已阅读5页，还剩66页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2 6ARM存储器结构 ARM架构的处理器的存储器寻址空间有232 4G字节该存储空间可以分为可快存可缓冲 Cacheable Bufferable 区域和不可快存不可缓冲区域 ARM架构的处理器有的带有指令快存 I Cache 和数据快存 D Cache 但是片内都不带有片内RAM和片内ROM 系统所需的RAM和ROM 包括闪存FLASH 都通过总线处接故有的片内还带有存储器管理单元MMU MemoryManagementUnit ARM架构处理器还允许外接PCMCIA 2 6 1ARMCache结构 Cache是一种小容量高速度的存储器用于处理器与主存储器之间存放当前被使用的主存部分内容以减少访问主存的等待时间表2 4Cache性能 161电影网整理发布常用的Cache有两类指令和数据统一的Cache 以及指令和数据分离的I Cache与D Cache 新型的ARM架构处理器较多采用了I Cache与D Cache的独立块存结构如Intel公司的SA1110处理器内含16K字节I Cache和8K字节D Cache 1 Cache的分类和结构图2 19统一Cache的结构示意图图2 18分离Cache的结构示意图 2 Cache的放置安排快存Cache的放置是主存地址与快存Cache单元之间的映像机制常用的方法有直接映像 Direct mapped 组相联 set associative 和全相联 Fullyassociative 等 a 直接映射直接映像的方式是给定的内存块仅能放在一个特定的Cache块中可用若干低位地址直接访问Cache项其余的高位地址与Cache项中的地址标识 tag 进行比较若比较相等且有效位为 1 则为命中 hit 这是最简单的放置算法未命中则为失效 miss 直接映像图2 21直接映像的Cache机制优点实现简单访问Cache速度快缺点某些情况下命中率很低 b 组相联映像组相联映像也使用低位地址直接访问Cache项但它选中的是一个组组内包含有两块或多个块给定的内存块可以放在选中组中的任意一块内一组内的块数一般称为相联度或相连路数 way 选中一组后组内所有项的标识同时进行比较如果有一个匹配则命中与组相联映像实际上是靠比较器的个数据及增宽Cache位来降低Cache块的冲突组相联映像图2 22二路组相联的示意图 c 全相联全相联映像方式是给定的主存块可以放在Cache的任意一块中用内容寻址存储器CAM ContentAddressedMemory 或称为相联存储器来实现送来的地址与Cache所有项中的地址标识作比较以判断是否命中全相联映像图2 23全相联的示意图优点命中率高缺点 CAM访问速度慢结构复杂占用芯片资源多 3 Cache的替换算法当发生Cache不命中时必须选择被替换的项常用的算法有随机法近期最少使用LRU LeastRecentlyUsed 法循环 Round robin 法和锁操作法 a 随机法从Cache中的各行中随机选取一行进行淘汰可选择一随机事件作为替换的依据如可用系统实时时钟的低几位 b 近期最少使用LRU法 Cache控制器设置访问标识以记录数据在某一段时间内被访问的次数当需要淘汰时则淘汰近期最少使用的那一行 c 循环法此方法类似于先进先出FIFO法 Cache控制器设置特殊的时间标识以记录数据在Cache中存放时间当需要淘汰时则淘汰进入Cache时间最长的那一行循环法结构简单速度快 ARM架构的处理器大多采用该淘汰算法 c 锁操作循环法对Cache中代码或数据不分常用还是非常用的都一样地参与循环淘汰很明显该淘汰替代算法的效率不及LRU法为了弥补其不足 ARM架构中许多高性能处理器核采用了锁操作在一些常用的代码或数据加上锁放入指令Cache或数据Cache中可免于频繁地淘汰替代从而可提高系统的效率但是锁操作也会给Cache带来了一些缺陷无形之中缩小了相应Cache的容量故需及时对已上锁的目前不常用的代码或数据进行解锁 4 存储器写策略产生的结果数据要写到存储器中有多种方式进行处理一般分为写直达 Write through 通过缓存写和写回 Write back 三种方式 a 写直达当要写Cache时数据同时写回主存储器优点是简单易实现缺点是写存储器的速度较慢影响处理器的效率 b 通过缓存写可先高速把数据写至缓存在下一个操作时再把数据送至主存储器优点是在写操作不是很频繁的时候提高处理器效率但是如果有连续的写操作发生时处理器仍然要等待 c 写回写回有时也称Copy back 是当处理器更新Cache的某一行后相应间数据并不立即写回主存储器单元而当该行被从Cache淘汰时才把数据写回主存储器中 5 ARM的Cache设计图2 24Cache关联度的系统性能及带宽 Cache性能改进的途径降低失效率减少失效开销减少命中时间 a 降低失效率产生Cache失效原因有强制性失效需从主存储器调入Cache 容量失效所需的块行不能全部调至Cache 和冲突失效某块行被替换后又被重新访问改进方法增加Cache中行块的大小来减少强制性失效提高相联度来减少冲突失效硬件预取技术 b 减少失效开销 ARM架构采用了非阻塞 nonblocking Cache技术 Cache在失效时仍然允许处理器进行其他命中的访问这种失效下命中 hitundermiss 不是完全拒绝处理器的访问而是能处理部分访问从而减少了实际的Cache失效开销此外还可以采用让读失效优于写和二级Cache技术来减少Cache失效开销 b 减少命中时间 Cache命中时间会影响到处理器的时钟频率在许多处理器设计中往往是Cache的访问时间限制了处理器的时钟频率因此减少Cache命中时间不但可提高Cache性能还能提高系统运行速度图2 25ARM3的Cache结构 2 7ARM存储器管理单元MMU 图2 26二级页表存储器寻址示意图 ARM架构处理器中的存储粒度 memorygranularity 根据不同的应用方式可有大页 64K字节小页 4K字节和微小页 TinyPages 1K字节和段 Sections 1M字节常用的是4K字节小页面至于大页和段则用于大数据领域 64K字节的大页可以分成4个16K子页 1 CP15MMU寄存器 R0 ID寄存器只读 R1 控制寄存器 V3版只写 V4版可读写 R2 地址变换表基址 V3版只写 V4版可读写 3114130 位 31 14 提供了18位地址变换表的基址基定位界限为16K字节 4 R3 域访问控制寄存器 V3版只写 V4版可读写 5 R5 故障状态寄存器 V3版只读 V4版可读写 6 R6 故障地址寄存器 V3版只读 V4版可读写 7 R7 快存Cache操作 V3版只读 V4版可读写 8 R8 变换后备缓冲器TLB操作 V4版有效 9 R9 读缓冲操作10 R10 变换后备缓冲器TLB锁住11 R13 进程ID映像12 R14 调试支持13 R15 测试和时钟控制 2 第一级描述符 first leveldescriptors 存储器管理的段页寻址中的段表页表都放在存储器中第一级描述符表示的是表的基址域访问权限以及有关特性第一级描述符也放在存储器中该变换表 translationtable 由CP15协处理器的寄存器给出而表格索引则由虚拟地址 31 20 给出图2 28第一级描述符图2 29段式寻址示意图 3 段寻址 Sectionaddressing 4 二级页式寻址二级页式寻址就是要进行两次页查表第一次查出第一级描述符然后根据组合的地址再进行第二次查表得到第二级描述符最后形成真正的存储器物理地址进行数据的读写图2 30二级页式寻址示意图二级页描述符格式 5 存取权限域 Domain 是一组具有特定访问权限的段页这样可以允许多个不同过程使用同一个转换表执行同时不同程序之间又有一些保护这是一种比较方便的过程切换机制不必使每个过程都有自己的转换表每个段和子页的存取权限AP位与域信息一起用于第一级描述符中域控制信息在CP15的R3寄存器中 CP15的R1寄存器中的S和R位与处理器的用户管理者状态来决定是否允许对所寻址单元进行读写 6 VirtualCache 图2 32物理地址Cache与TLB 图2 34虚拟Cache示意图 2 8地址变换后备缓冲器TLB 由于目录项和页表都存放在主存中从逻辑地址变换至真正物理地址需读2次主存因此在逻辑地址与物理地址之间插入了一个地址变换后备缓冲器TLB TranslationLook asideBuffer 图2 27地址变换后备缓冲器TLB 2 9ARM的I O结构 ARM架构中的处理器核和处理器内核一般都没有直接的I O部件和模块构成ARM架构的处理器中的I O可通过AMBA总线来扩充存储器映像I O直接存储器存取DMA中断IRQ和快速中断FIQ 2 10ARM协处理器接口 ARM为了便于片上系统SOC的设计 ARM处理器内核尽可能精简要增加系统的功能可以通过协处理器来实现协处理器接口可以看作ARM内部总线的扩展 ARM处理器内核能通过协处理器指令对协处理器进行操作在逻辑上 ARM可以扩展16个协处理器每个协处理器可有16个寄存器表2 6协处理器 ARM处理器内核与协处理器接口信号有以下4类时钟和时钟控制信号 MCLK nWAIT nRESET流水线跟随信号 nMREQ SEQ nTRANS nOPC TBIT应答信号 nCPI CPA CPB数据信号 D 31 0 DIN 31 0 DOUT 31 0 2 11ARMAMBA接口 ARM处理器内核可以通过先进微控制器总线架构AMBA AdvancedMicrocontrollerBusArchitecture 来扩展不同体系架构的宏单元及I O部件 AMBA有先进高性能总线AHB AdvancedHigh performanceBus 先进系统总线ASB AdvancedSystemBus 和先进外围总线APB AdvancedPeripheralBus 等三类总线图2 35典型的基于AMBA的系统 1 先进系统总线ASB ASB是目前ARM常用的系统总线用来连接高性能系统模块它支持突发 burst 方式数据传送可支持多主机 1 先进系统总线ASB ASB是目前ARM常用的系统总线用来连接高性能系统模块它支持突发 burst 方式数据传送总线宽度为32bits 可支持多主机系统 2 先进高性能总线AHB 先进高性能总线AHB不但支持突发方式的数据传送还支持分离式总线事务处理以进一步提高总线的利用效率与ASB相比先进高性能总线AHB有以下不同在分离式总线处理中在数据传输时从设备即使响应很慢也不会一直占用总线从而可进一步提高总线利用率 AHB用单时钟边沿来控制所有的操作辅助综合和设计验证通过静态时态分析仪及类似工具 AHB采用三态器件实现中央多路复用总线它与双向总线相比可很方便插入中继器 repeater 来扩展系统 AHB可支持64位或128位高数据带宽传输 3 先进外围总线APB 先进外围总线APS为外围宏单元提供了简单的接口也可以把APS看作为先进系统总线ASB的余部为外围宏单元提供了最简易的接口 2 12ARMJTAG调试接口由测试访问端口TAP TestAccessPort 控制器旁路 Bypass 寄存器指令寄存器和数据寄存器以及与JTAG接口兼容的ARM架构处理器组成图2 37JTAG调试接口示意图 ARM处理器核嵌入了Embedded ICE模块该模块包含了2个观察点 Watchpoint 寄存器和控制与状态寄存器当观察点寄存器的值与地址数据和控制信号匹配时观察点寄存器能中止ARM处理器运行当指令在ROM或RAM中执行时可以把观察点寄存器配置为断点寄存器从而能暂停处理器运行图2 40实时调试的结构图 2 13ARM架构产品 ARM架构的处理器内核有ARM7TDMI ARM8 ARM9TDMI ARM10TDMI及StrongARM SA 1 等 1 处理器内核ARM7TDMI 图2 41ARM7TDMI体系结构图图2 42ARM7TDMI核接口信号图 2 处理器核ARM720T 在最基本的ARM处理器内核其础上可增加了C

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

ARM存储器结构

文档简介

温馨提示

最新文档

评论

ARM存储器结构

文档简介

温馨提示

最新文档

评论

相关文档