ARM体系结构与编程版PPT课件.ppt

上传人：优*** IP属地：广东上传时间：2020-01-03 格式：PPT 页数：45 大小：986.50KB 积分：35 举报 版权申诉

已阅读5页，还剩40页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第5章ARM的存储系统与其他的中低档单片机不同 ARM处理器中可以包含一个存储管理部件本章介绍ARM体系中两种典型的存储管理实现机制并在最后给出一个实例 1 5 1ARM存储系统概述 ARM存储系统的体系结构可以适应多种不同的嵌入式应用系统最简单的存储系统使用普通的地址映射机制就像在一些简单的单片机系统中一样地址空间的分配方式是固定的系统中各部分都使用物理地址而一些复杂的系统可能包括一种或者多种下面的技术从而可以提供功能更为强大的存储系统系统中可能包含多种类型的存储器件通过使用Cache及WriteBuffer技术可以缩小处理器和存储系统的速度差别从而提高系统的整体性能内存管理部件使用内存映射技术实现虚拟空间到物理空间的映射引入存储保护机制增强系统的安全性引入一些机制保证将I O操作映射成内存操作后各种I O操作能够得到正确的结果 2 5 1ARM存储系统概述本章中主要介绍以下内容在介绍相关内容时将以LinkUp公司的通用ARM芯片L7205作为例子 ARM中用于存储管理的系统控制协处理器CP15 ARM中的存储管理部件MMU MemoryManagementUnit ARM中的Cache及WriteBuffer技术快速进程上下文切换技术 3 5 2ARM中用于存储管理的系统控制协处理器CP15 CP15可以包含16个32位的寄存器其编号为0 15 实际上对于某些编号的寄存器可能对应有多个物理寄存器在指令中可指定特定的标志位来区分这些物理寄存器这种机制有些类似于ARM中的寄存器当处于不同的处理器模式时某些ARM寄存器可能是不同的物理寄存器比如对于寄存器SPSR 每一种处理器模式下都对应一个独立的物理寄存器用户模式和系统模式对应同样的物理寄存器这是一个例外 CP15中的寄存器可能是只读的也可能是只写的还有一些是可以读写的对于每一种寄存器将会详细介绍寄存器的访问类型只读只写读写各种访问操作对于寄存器的作用寄存器是否对应有多个物理寄存器寄存器的具体作用 4 5 2 1访问CP15寄存器的指令访问CP15寄存器的指令有下面两种 MCR ARM寄存器到协处理器寄存器的数据传送指令 MRC 协处理器寄存器到ARM寄存器的数据传送指令 MCR指令和MRC指令只能在处理器模式是系统模式时执行在用户模式下执行MCR指令和MRC指令将会触发未定义指令的异常中断 5 5 2 2CP15中的寄存器 1 CP15中的寄存器C0 1 标识符寄存器 ARM7之后的处理器 ARM7处理器 ARM7之前的处理器 2 Cache类型标识符寄存器2 CP15中的寄存器C1CP15中的寄存器C1是一个控制寄存器它包括以下控制功能禁止使能MMU以及其他的与存储系统相关的功能配置存储系统以及ARM处理器中的相关部分的工作方式 6 5 3存储器管理单元MMU 5 3 1存储器管理单元MMU概述在ARM系统中存储器管理单元MMU主要完成以下工作虚拟存储空间到物理存储空间的映射在ARM中采用了页式虚拟存储管理它把虚拟地址空间分成一个个固定大小的块每一块称为一页把物理内存的地址空间也分成同样大小的页页的大小可以分为粗粒度和细粒度两种 MMU就要实现从虚拟地址到物理地址的转换存储器访问权限的控制设置虚拟存储空间的缓冲的特性 7 5 3 1存储器管理单元MMU概述页表 TranslateTable 是实现上述这些功能的重要手段它是一个位于内存中的表页表存放在内存中系统通常用一个寄存器来保存页表的基地址在ARM中系统控制协处理器CP15的寄存器C2用来保存页表的基地址当CPU需要访问内存时先在TLB中查找需要的地址变换条目如果该条目不存在 CPU从位于内存中的页表中查询并把相应的结果添加到TLB中这样当CPU下一次又需要该地址变换条目时就可以从TLB中直接得到了从而使地址变换的速度大大加快 8 5 3 1存储器管理单元MMU概述当内存中的页表内容改变或者通过修改系统控制协处理器CP15的寄存器C2使用新的页表时 TLB中的内容需要全部清除 MMU提供了相关的硬件支持这种操作系统控制协处理器CP15的寄存器C8用来控制清除TLB内容的相关操作 MMU可以将某些地址变换条目锁定 LockedDown 在TLB中从而使得进行与该地址变换条目相关的地址变换速度保持很快在MMU中寄存器C10用于控制TBL内容的锁定 MMU可以将整个存储空间分为最多16个域 Domain 每个域对应一定的内存区域该区域具有相同的访问控制属性 MMU中寄存器C3用于控制与域相关的属性的配置当存储访问失效时 MMU提供了相应的机制用于处理这种情况在MMU中寄存器C5和寄存器C6用于支持这些机制 9 5 3 2禁止使能MMU CP15的寄存器C1的位 0 用于控制禁止使能MMU 当CP15的寄存器C1的位 0 设置成0时禁止MMU 当CP15的寄存器C1的位 0 设置成1时使能MMU 下面的指令使能MMU MRCP15 0 R0 C1 0 0ORRR0 01MCRP15 0 R0 C1 0 01 使能MMU时存储访问过程2 禁止MMU时存储访问过程3 禁止使能MMU时应注意的问题 10 5 3 3MMU中的地址变换过程 ARM支持的存储块大小有以下几种段 section 是大小为1MB的存储块大页 LargePages 是大小为64KB的存储块小页 SmallPages 是大小为4KB的存储块极小页 TinyPages 是大小为1KB的存储块在MMU中采用下面两级页表实现上述地址映射一级页表中包含有以段为单位的地址变换条目以及指向二级页表的指针一级页表实现的地址映射粒度较大二级页表中包含以大页和小页为单位的地址变换条目其中一种类型的二级页表还包含有以极小页为单位的地址变换条目 11 5 3 3MMU中的地址变换过程 1 基于一级页表的地址变换过程 1 基于一级页表的地址变换过程 2 段描述符及其地址变换过程 3 粗粒度页表描述符 4 细粒度页表描述符 12 5 3 3MMU中的地址变换过程 2 基于二级页表的地址变换过程二级页表有两种粗粒度的二级页表和细粒度的二级页表 1 大页描述符以及相关的地址变换 2 小页描述符以及相关的地址变换 3 极小页描述符以及相关的地址变换 13 5 3 4MMU中的存储访问权限控制在MMU中寄存器C1的R S控制位和页表中地址转换条目中的访问权限控制位联合作用控制存储访问的权限具体规则如表5 20所示 14 5 3 5MMU中的域 MMU中的域指的是一些段大页或者小页的集合 ARM支持最多16个域每个域的访问控制特性由CP15中的寄存器C3中的两位来控制这样就能很方便地将某个域的地址空间包含在虚拟存储空间中或者排除在虚拟存储空间之外 CP15中的寄存器C3的格式如下所示 15 5 3 6关于快表的操作 1 使无效 Invalidate 快表的内容2 锁定快表的内容 1 寄存器C10 2 锁定TLB 16 5 3 7ARM中的存储访问失效在ARM中有下面两种机制可以检测存储访问失效并进而中止CPU的执行当MMU检测到存储访问失效时它可以向CPU报告该情况并将存储访问失效的相关信息保存到寄存器中这种机制称为MMU失效 MMUFault 外部存储系统也可以向CPU报告存储访问失效这种机制称为外部存储访问中止 ExternalAbort 上述两种情况统称为存储访问中止 Abort 这时称造成存储访问中止的存储访问被中止 Aborted 如果存储访问中止发生在数据访问周期 CPU将产生数据访问中止异常中断如果存储访问中止发生在指令预取周期当该指令执行时 CPU产生指令预取异常中断 17 5 3 7ARM中的存储访问失效 1 MMU失效 1 MMU中与存储访问失效相关的寄存器 2 MMU存储访问失效的类型2 外部存储访问失效读操作非缓冲的写操作一级描述符的获取二级描述符的获取非缓冲的存储区域中的信号量操作 18 5 4高速缓冲存储器和写缓冲区通常ARM处理器的主频为几十MHz 有的已经达到200MHz 而一般的主存储器使用动态存储器 DRAM 其存储周期仅为100ns 200ns 这样如果指令和数据都存放在主存储器中主存储器的速度将会严重制约整个系统的性能高速缓冲存储器 Cache 和写缓冲区 WriteBuffers 位于主存储器和CPU之间主要用来提高存储系统的性能本节主要介绍与这两种技术相关的基本概念 1993年著名的ARM7诞生之后的ARM9 ARM11风靡世界随后出现了Cortex系列实际上 Cortex就是ARM12 在全国第七届嵌入式系统与单片机学术交流暨Cortex有两大分支高性能的A8系列主频可达到1GHz 低成本计划与8 16位MCU竞争的M3系列 19 5 4 1基本概念高速缓冲存储器是全部用硬件来实现的因此它不仅对应用程序员是透明的而且对系统程序员也是透明的 Cache与主存储器之间以块 CacheLine 为单位进行数据交换不同系统中 Cache的块大小也是不同的通常Cache的块大小为几个字写缓冲区是由一些高速的存储器构成的它主要用来优化向主存储器中的写入操作当CPU进行向主存储器中的写入操作时它先将数据写入到写缓冲区中由于写缓冲区的访问速度很高这种写入操作的速度将很高然后CPU就可以进行下面的操作写缓冲区在适当的时候以较低的速度将数据写入到主存储器中相应的位置通过引入Cache和写缓冲区存储系统的性能得到了很大的提高但同时也带来了一些问题比如由于数据将存在于系统中不同的物理位置可能造成数据的不一致性由于写缓冲区的优化作用可能有些写操作的执行顺序不是用户期望的顺序从而造成操作错误 20 5 4 2Cache的工作原理和地址映像方法 1 Cache的工作原理2 Cache地址映像和变换方法 1 全相联映像方式 2 直接映像方式 3 组相联映像方式 21 5 4 3Cache的分类 1 统一独立的数据Cache和指令Cache2 写通 Write through Cache和写回 Write back Cache可靠性与主存的通信量控制的复杂性硬件实现的代价3 读操作分配Cache和写操作分配Cache 22 2020 1 3 23 5 4 4Cache的替换算法在把主存地址变换成Cache地址的过程中如果发现Cache块失效则需要从主存中调入一个新块到Cache中而来自主存中的这个新块往往可以装入到Cache的多个块中当可以装入这个新块的几个Cache块都已经装满时就要使用cache替换算法从那些块中找出一个不常用的块把它调回到主存中原来存放它的那个地方腾出一个块存放从主存中调来的新块在ARM中常用的替换算法有两种随机替换算法和轮转法 1 随机替换算法通过一个伪随机数发生器产生一个伪随机数用新块将编号为该伪随机数的Cache块替换掉这种算法很简单易于实现但是它没有考虑程序的局部性特点也没有利用历史上的块地址流的分布情况因而效果较差同时这种算法不易预测最坏情况下Cache的性能 2 轮转法维护一个逻辑的计数器利用该计数器依次选择将要被替换出去的Cache块这种算法容易预测最坏情况下Cache的性能但它有一个明显的缺点在程序发生很小的变化时可能造成Cache平均性能急剧的变化 24 5 4 5缓冲技术的使用注意事项通常使用Cache和写缓冲可以提高系统的性能但是由于Cache和写缓冲区的使用可能改变访问主存的数量类型和时间这些技术对于有些类型的存储访问是不适合的本小节介绍使用这些技术时的一些限制 Cache通常需要存储器件具有下面的特性读取操作将返回最后一次写入的内容而且没有其他的副作用写操作除了影响目标单元的内容外没有其他的副作用对同一目标单元的两次连续读取操作将得到相同的结果对同一目标单元的两次连续写取操作将会把第2次写操作的值写入目标单元第1次写操作将没有意义将存储区域设置成unbuffered是为了防止延迟存储访问操作的执行时间对于写回Cache如果设置cached 必然造成存储访问操作执行的延迟因而写回类型的Cache不能设置成cached buffered 在C语言中是通过使用关键词volatile声明存储器映射的I O空间来防止编译器在优化时删掉有用的存储访问操作的 25 5 4 6存储系统的一致性问题 1 地址映射关系变化造成的数据不一致2 指令Cache的数据一致性问题3 DMA造成的数据不一致问题将DMA访问的存储区域设置成非缓冲的 uncachable及unbufferable 将DMA访问的存储区域所涉及的数据Cache块设置成无效或者清空数据Cache 清空写缓冲区执行写缓冲区中延迟的所有写操作在DMA操作期间限制处理器访问DMA所访问的存储区域 26 5 4 7Cache内容锁定这里所说的N锁定块被锁定是指编号为0 N 1的锁定块被锁定在Cache中编号为N ASSOCIATIVITY 1的锁定块可用于正常的cache替换操作实现N锁定块被锁定的操作序列如下 1 确保在整个锁定过程中不会发生异常中断否则必须保证与该异常中断相关的代码和数据必须位于非缓冲 uncachable 的存储区域 2 如果锁定的是指令Cache或者统一的Cache 必须保证锁定过程所执行的代码位于非缓冲的存储区域 3 如果锁定的是数据Cache或者统一的Cache 必须保证锁定过程所涉及的数据位于非缓冲的存储区域 27 5 4 7Cache内容锁定 4 确保将要被锁定的代码和数据位于缓冲 cacheable 的存储区域 5 确保将要被锁定的代码和数据尚未在Cache中可以通过使无效相应的cache中的块达到这一目的 6 对于I 0到N 1 重复执行下面的操作 index I写入寄存器C9 当使用B格式的锁定寄存器时令L 1 对于锁定块I中的各Cache块内容从主存中预取到Cache中对于数据Cache和统一Cache可以使用LDR指令读取一个位于该块中的数据将该块预取到Cache中对于指令Cache 通过操作寄存器C7 将相应的块预取到指令Cache中 7 将index N写入寄存器C9 当使用B格式的锁定寄存器时令L 0 解除N锁定块的锁定只需执行下面的操作将index 0写入寄存器C9 当使用B格式的锁定寄存器时令L 0 28 5 4 8与Cache和写缓冲区相关的编程接口 1 寄存器C1中的相关位2 寄存器C73 寄存器C9 1 寄存器C9的格式 2 访问寄存器C9的指令 29 5 5快速上下文切换技术快速上下文切换技术 FastContextSwitchExtension FCSE 通过修改系统中不同进程的虚拟地址避免在进行进程间切换时造成的虚拟地址到物理地址的重映射从而提高系统的性能本节介绍快速上下文切换技术的原理及其编程接口 30 5 5 1快速上下文切换技术原理快速上下文切换技术 FCSE 的引入避免了这种开销它位于CPU和MMU之间如果两个进程使用了同样的虚拟地址空间则对CPU而言两个进程使用了同样的虚拟地址空间快速上下文切换机构对各进程的虚拟地址进行变换这样系统中除了CPU之外的部分看到的是经过快速上下文切换机制变换的虚拟地址快速上下文切换机制将各进程的虚拟空间变换成不同的虚拟空间这样在进行进程间切换时就不需要进行虚拟地址到物理地址的重映射了快速上下文切换机构将CPU发出的每个虚拟地址按照上述的规则进行变换然后发送到系统中的其他部分变换过程如图5 12所示 31 5 5 2快速上下文切换技术编程接口 CP15中的寄存器C13用于快速上下文切换其编码格式如下所示 3125240访问寄存器C13的指令格式如下所示 MCRp15 0 c0 0MRCp15 0 c0 0当PID的值为0时 MVA VA 相当于禁止了FCSE 系统复位后PID即为0 当PID的值不为0时相当于使能了FCSE 32 5 6与存储系统相关的程序设计指南本节主要介绍与ARM存储系统相关的程序设计用到的一些概念如果说前面的几章介绍了ARM存储系统内部的结构本节是从外部来看ARM的存储系统即ARM存储系统提供的对外接口当用户通过这些接口来访问ARM存储系统时需要遵守一定的规则本节将介绍这些规则 33 5 6 1地址空间 ARM体系使用单一的普通地址空间该地址空间的大小为232个8位字节这些字节单元的地址是一个无符号的32位数值其取值范围为0 232 1 ARM的地址空间也可以看作是230个32位的字单元这些字单元的地址可以被4整除也就是说该地址的低两位为0b00 地址为A的字数据包括地址为A A 1 A 2 A 3四个字节单元的内容在ARM版本4及以上的版本中 ARM的地址空间也可以看作是231个16位的半字单元这些半字单元的地址可以被2整除也就是说该地址的最低位为0b0 地址为A的半字数据包括地址为A A 1两个字节单元的内容 34 5 6 1地址空间各存储单元的地址作为32位的无符号数可以进行常规的整数运算这些运算的结果进行232取模即运算结果发生上溢出和下溢出时地址将会发生卷绕比如如果运算结果为 0 xffffffff 0 x80 实际上地址值为0 x80 为了使程序便于和将来版本兼容在程序中尽量使地址运算的结果在0 0 xffffffff之间如果程序中跳转指令的目标地址依赖于地址值卷绕则指令执行的结果将不可预知所以在程序中应该保证向前跳转不超过0 xffffffff 向后跳转不超过0 x0 在程序的正常执行时每执行一条ARM指令当前指令计数器值加4个字节每执行一条Thumb指令当前指令计数器值加2个字节但是当发生地址值上溢出时执行的结果将是不可预知的 LDC LDM STC及STM指令可能访问一段连续的存储单元每执行一次读取写入操作目标单元的地址值加4个字节如果这种地址更新造成地址值上溢出则指令执行的结果将是不可预知的 35 5 6 2存储器的格式在ARM中如果地址A是字对齐的有下面几种地址为A的字单元包括字节单元A A 1 A 2及A 3 地址为A的半字单元包括字节单元A A 1 地址为A 2的半字单元包括字节单元A 2 A 3 地址为A的字单元包括半字单元A A 2 这样每个字单元中包含4个字节单元或者两个半字单元一个半字单元中包含两个字节单元但是在字单元中 4个字节哪一个是高位字节哪一个是低位字节则有两种不同的格式 Big endian格式和Little endian格式 36 5 6 3非对齐的存储访问操作 1 非对齐的指令预取操作2 非对齐的数据访问操作执行的结果不可预知忽略字单元地址的低两位的值即访问地址为 AddressAND0XFFFFFFC 的字单元忽略半字单元地址的最低位的值即访问地址为 AddressAND0XFFFFFFE 的半字单元忽略字单元地址值中的低两位的值忽略半字单元地址的最低位的值由存储系统实现这种忽略也就是说这时该地址值原封不动地送到存储系统 37 5 6 4指令预取和自修改代码在ARM中允许指令预取在CPU执行当前指令的同时可以从存储器中预取其后的若干条指令具体预取多少条指令不同的ARM实现中有不同的数值当用户读取PC寄存器的值时返回的是当前指令下面第2条指令的地址预取的指令并不一定能够得到执行正如在不同的ARM实现中预取的指令条数可能不同当发生程序跳转时不同的ARM实现中采用的跳转预测算法也可能不同自修改代码指的是代码在执行过程中可能修改自身对于支持指令预取的ARM系统自修改代码可能带来潜在的问题当指令被预取后在该指令被执行前如果有数据访问指令修改了位于主存中的该指令这时被预取的指令和主存中对应的指令不同从而可能使执行的结果发生错误 38 5 6 5IMB IMB是一段特定的代码序列对于每种不同的ARM实现对应有不同的IMB IMB在新的指令被保存到主存中后在该指令被实际执行之前执行使得可自修改代码在ARM体系中能够可靠地执行在很多ARM系统中 IMB中需要的很多指令如使无效Cache等操作只能运行在系统模式下对于包含24位立即数的SWI指令通常使用下面的SWI功能调用提供IMB功能 SWI0XF00000 39 5 6 5IMB 同样在其他的一些场合也需要在适当的时候运行适当的IMB 下面介绍这些IMB的应用场合 1 对于采用了虚拟地址到物理地址映射的系统如果在指令预取之后和该指令得到实际执行之前虚拟地址到物理地址的映射关系发生了改变这时也需要运行适当的IMB 2 如果在指令预取之后和该指令得到实际执行之前该指令所涉及到的存储区域的访问权限发生了改变由允许访问变成了不允许访问或者由不允许访问变成了允许访问这时也需要运行适当的IMB 这种情况下的IMB中一般不需要使无效Cache中相关的内容运行代价相对较低 40 5 6 6存储器映射的I O空间在ARM中 I O操作通常被映射成存储器操作 I O的输出操作可以通过存储器写入操作实现 I O的输入操作可以通过存储器读取操作实现这样I O空间就被映射成了存储空间这些存储器映射的I O空间不满足Cache所要求的上述特性由于写缓冲技术可能推迟写操作它同样不适合对于存储器映射的I O空间的操作比如当CPU向

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

ARM体系结构与编程版PPT课件.ppt

文档简介

温馨提示

最新文档

评论

ARM体系结构与编程版PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档