相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf

上传人：朱*** IP属地：江西上传时间：2020-03-11 格式：PDF 页数：66 大小：1.04MB 积分：0 举报 版权申诉

已阅读5页，还剩61页未读，继续免费阅读

相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

分类号分类号学号学号 M200972335 学校代码学校代码 1 0 4 8 7 密级密级硕士学位论文硕士学位论文相变混合存储系统管理策略与实现技术相变混合存储系统管理策略与实现技术学位申请人学位申请人谢雅旋谢雅旋学科专业学科专业计算机系统结构计算机系统结构指导教师指导教师陈进才陈进才教授教授答辩日期答辩日期 2012 年年 1 月月 9 日日 A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Engineering Implementation of Storage Management Strategy for Hybrid System based on PCRAM Candidate Xie Yaxuan Major Computer Architecture Supervisor Prof Chen Jincai Huazhong University of Science analyze the structure of data storage between file system and external memory system separate the metadata and user data which are respectively stored in PCM and NAND Flash In this paper we focus on the management strategy for PCM with metadata The main idea is to partition the memory into multi area and multi array for data striping We balance the writing operations during the whole system by exchanging adjacent line within a memory array and exchanging hot data area and cold data area Comparing with existing algorithms our solution can make the address mapping more discrete and restrain from repeatedly writing on the same cell so as to lengthen the lifetime of memory system and usability Finally we prove the performance superiority of this algorithm by simulation Key Words Phase Change Memory Wear Leveling Hybrid storage system Dynamic exchange 华中科技大学硕士学位论文 III 目目录录摘要摘要 I Abstract II 1 绪论绪论 1 1 课题背景和意义 1 1 2 国内外研究现状 2 1 3 本课题主要研究内容 3 1 4 本文组织结构 4 2 相关损耗均衡算法相关损耗均衡算法 2 1 闪存损耗均衡算法 6 2 2 相变存储器写均衡算法 10 2 3 内存消耗比较 14 2 4 本章小结 15 3 一种相变存储器的写均衡算法一种相变存储器的写均衡算法 3 1 相变存储器系统划分 17 3 2 邻行拷贝算法 18 3 3 加密算法 25 3 4 动态交换策略 26 3 5 本章小结 28 4 混合系统相变存储写均衡算法的实现混合系统相变存储写均衡算法的实现华中科技大学硕士学位论文 IV 4 1 混合外存系统的硬件架构 29 4 2 相变存储芯片 30 4 3 混合外存系统的数据流结构 31 4 4 写均衡算法的执行过程 33 4 5 本章小结 36 5 实验仿真及性能分析实验仿真及性能分析 5 1 算法模型分析 37 5 2 仿真结果分析与比较 43 5 3 本章小结 48 6 总结与展望总结与展望 6 1 全文总结 37 6 2 展望 51 致谢致谢 53 参考文献参考文献 54 附录附录攻读硕士学位期间发表的论文与申请的发明专利攻读硕士学位期间发表的论文与申请的发明专利 58 华中科技大学硕士学位论文 1 1 绪论绪论 1 1 课题背景课题背景和意义和意义在信息爆炸的时代人们对存储要求越来越高而且随着云存储大数据概念的提出企业的存储架构及数据中心基础设施将面临新的挑战存储应用领域将覆盖金融电信医疗政府能源和公共事业零售物流等对大数据存储管理带来了巨大需求然而这些都离不开存储介质的支持人类现在对存储介质的容量带宽能耗寿命等有更高要求传统的 DRAM 虽具有快速及可靠性高等优点 1 但数据读取的破坏性与挥发性是其致命的缺点同样 Flash 虽具有较高的存储密度和非易失性的优点但伴有速度较慢与可靠性低的问题而且随着 DRAM 与 FLASH 存储器的持续发展 2 这些存储器终将会面临尺寸缩小上极限的限制如闪存的制作工艺为 65nm 以下时其可靠性因受到某些物理限制严重下降 DRAM 与 Flash 都面临着工艺整合与设计上的严重挑战因此开发理想的半导体存储器来解决现有存储器技术所面临的瓶颈刻不容缓为了进一步满足这一要求新一代具有高密度高速度长寿命的存储器相变存储器应运而生相变存储器 Phase Change Random Access Memory 3 简称 PCRAM 或 PCM 是一种新型的电阻式非易失性半导体存储器它以硫系化合物 GST 材料为存储介质利用相变材料在晶态和非晶态时所呈现出显著的电阻值差异性来实现数据存储具体是通过电子脉冲使存储介质发生相变当其处在晶态时电阻值低电流大用以代表 1 当其处在非晶态时电阻值很高电流很小用以表示 0 作为一种新兴的存储技术相变存储器兼具有 RAM 和闪存的性能优点其特点如下 4 6 1一位可变性如同 RAM 或 EEPROM PCM 可变的最小单元是一位所以就不像闪存那样需要单独的擦除步骤从而亦可降低能耗并节省写入时间 2非易失性与闪存一样都是非易失存储器而与 RAM 相比其明显优势在于所写信息是不可挥发的 3读取速度快其读速度与 DRAM 在同一个数量级这使得存储器中的代码可以直接执行无需中间拷贝到 RAM 华中科技大学硕士学位论文 2 4写入速度较快 PCM 能够达到如同 NAND Flash 的写入速度但是 PCM 的反应时间更短且无需单独的擦除步骤 NOR 闪存虽具有稳定的写入速度但是擦除时间较长 5耐写性较好 PCM 单元的写次数可达闪存的 100 倍可达 107 108次 6存储密度更高闪存的结构导致存储器很难进一步缩小体积这是因为门电路的厚度是一定的它需要多于 10V 的供电 CMOS 逻辑门需要 1V 或更少这种缩小通常被称为摩尔定律存储器每缩小一代其密集程度提高一倍而 DRAM 的性能在采用 30nm 工艺时也很难保证但是 PCM 可以达到 22nm 随着存储单元的缩小 GST 材料的体积也在缩小这使得 PCM 具有缩放性具有很大的存储密度提升空间 PCM 的诸多优良特性表明其非常适合作为高密度的独立式或者嵌入式存储器其应用领域可包括 7 8 手机数码相机等消费类电子产品 PC 服务器等需要更复杂芯片组和高性能嵌入式存储器的计算机需要更高存储容量和更快存储器的通信和互联网基础设施等相变存储器除了兼有 DRAM 和 Flash 的有点外还具有自身独特优势这样便具有取代它们的潜力随着相变存储器技术的不断发展和大批量生产它将有望成为下一代主流的存储器 9 1 2 国内外研究现状国内外研究现状相变存储并非一个新的概念早在上世纪六七十年代学者就已开始研究这类技术但并未得到太多关注 10 近十几年来随着材料科学和 IC 设计工艺的发展相变存储器的性能优势和竞争力逐渐显现使得国内外各大半导体公司和科研机构纷纷致力于新型相变存储芯片的研发如镁光 Micron 三星 Samsung 等公司已有相变存储器芯片量产 10 2009 年 9 月三星公司以 60nm 的工艺开始量产 512Mb 容量的 PCM 该芯片的各项技术指标均达到了很高的水平镁光分别于 2008 年 12 月推出一款兼容高速 SPI 接口的 90nm 相变存储器其集串行 NOR 闪存和 EEPROM 两大存储器的技术优点于一身具有字节修改功能以及更高的写入速度和耐写性能 2010 年 4 月再推出一款支持并行口 128Mbit 的相变存储器其写入速度有望达到现有闪存的 300 倍耐写次数达到闪存的 10 倍 11 12 今年镁光官网已开始售卖相变存储芯片也已有嵌入式应用实例 IBM 也于前不久研发出最新的多位的相变存储器 13 华中科技大学硕士学位论文 3 前面几年国际上领先的几家半导体公司在材料和相变存储芯片的研制方面投入了大量的人力物力和财力以为日后实现相变存储芯片奠定了基础近两年来国际的一些存储公司和研究机构等也逐渐从存储系统架构的角度来研究相变存储器从而更好地发挥其性能优势如混合主存系统的研究 14 16 及一些通过减少相变存储器软硬件错误的机制与写均衡策略等来提升相变存储器寿命方法的研究 17 19 国内在相变存储技术的研究已有 20 多年的研究历史比较有代表性研究团队有中国科学院上海光学精密机械研究所中国科学院上海微系统与信息技术研究所和华中科技大学信息存储材料及器件研究所也取得了令人瞩目的成绩今年 4 月份中国科学院成功研制出一款 8Mbit 的 PCM 芯片上海微系统与信息技术研究所拥有其自主知识产权打破了芯片的生产技术长期处于被国外垄断的处境 20 21 在相变存储技术的研究方面国内主要集中在材料及芯片制作技术上发展步伐较国外慢在相变存储器系统架构写均衡策略及安全性等方面国内研究成果鲜见 1 3 本课题主要研究内容本课题主要研究内容本课题来源于国家 863 计划重大项目课题项目编号 No 2009AA01A402 虽然相变存储器有诸多性能优势也有很广阔的运用前景但有一个致命的弱点即单元的耐写次数有限特别当前作为数据可靠性要求高的存储介质时这个缺点成为整个存储系统的性能瓶颈虽然相变存储单元的耐写次数可达 107 108 但当不断地重复写相同单元时该存储单元可在很短时间内失效从而导致整个存储系统不能使用为了充分发挥相变存储器优异的性能设计一种高效的写均衡算法是很有必要的因现有相变存储技术还处在初级研发阶段存储器的位成本很高若单纯用其做外存存储系统的性价比很低所以本实现中结合较成熟的闪存技术及具有较低位成本的 NAND Flash 来设计混合相变存储系统将原有 NAND Flash 外存系统转变为以 PCM 与 NAND Flash 混合的存储系统其中将文件系统的元数据包括文件系统的目录结构数据索引直至文件属性等闪存的转换层 FTL 的元数据包括地址映射表页写状态位表块擦除信息等以及更新的数据存储在相变存储器中而用户数据仍存放在闪存这样能充分发挥相变存储器和闪存各自的优势从而提高整个存储系统的性能华中科技大学硕士学位论文 4 基于以上结构因现有闪存的损耗均衡技术也比较成熟本设计主要将重点放在了相变存储器损耗均衡算法的设计与实现上其主要研究内容如下 1 阐述现有损耗均衡算法的关键技术其中包括现有闪存的动态静态损耗均衡算法和相变存储器写均衡算法并对其算法特点进行分析比较这些算法的内存消耗 2 基于现有损耗均衡算法提出一种低内存消耗利于硬件实现的损耗均衡算法并详述算法实现中所采用的策略及流程的设计其中包括存储系统的合理规划低内存消耗的邻行拷贝算法的设计存储行地址加密结构区域的动态映射写后读策略及写失效的冗余映射策略等从而达到写均衡效果延长相变存储器的寿命使系统的数据更安全可靠 3 详细分析所设计的混合相变存储系统的硬件逻辑结构及所采用的相变存储芯片并在此基础上结合前面的所设计的损耗均衡方法实现混合系统的相变存储器的控制策略 4 对所设计的相变存储器损耗均衡算法进行模型分析并且对所实现的混合存储系统的控制策略进行仿真验证对仿真结果进行分析比较 1 4 本文组织结构本文组织结构第一章主要介绍本课题的背景和意义国内外发展现状简要说明本课题的主要研究内容第二章主要对现有典型的均衡算法的阐述包括闪存的动态静态损耗均衡算法及现有相变存储器的损耗均衡算法并比较这些算法的内存消耗第三章在现有损耗均衡算法的基础上提出一种基于相变存储外存系统的写均衡算法其中主要包含对存储系统的划分低内存消耗的阵列内写均衡算法邻行拷贝算法地址加密操作冷热区交换策略冗余映射等策略来延长整个相变存储器的寿命提高数据的安全可靠性以更能抵御恶意攻击第四章主要是混合相变存储系统控制策略的实现给出系统的硬件逻辑结构图说明设计中采用的相变存储芯片及相变存储阵列的分布分析所设计的混合存储系统中数据流的结构及数据存储的分工最后结合前面所述的相变存储器写均衡算法的关键技术给出相变存储器写均衡算法的流程并作详细阐述华中科技大学硕士学位论文 5 第五章分析所提出的相变存储器损耗均衡算法的模型限制条件对所实现的混合相变存储系统的相变存储写均衡算法进行仿真验证结合仿真结果对实现的算法进行性能分析并作算法比较第六章对本文的工作做总结指出待改善的内容和下一步工作华中科技大学硕士学位论文 6 2 相关相关存储管理策略存储管理策略损耗均衡是一种常用在像闪存相变存储器等有耐写次数限制的存储系统中的技术主要作用是尽力平衡存储单元的写次数即交换写负载重与写负载轻的两类存储单元以延长整个存储系统的使用寿命本章主要是对现有的存储器写均衡算法进行比较分析分析并阐述已有闪存动静态损耗均衡算法及针对相变存储器的损耗均衡算法为设计高效的相变存储器损耗均衡算法提供借鉴 2 1 闪存闪存存储管理策略存储管理策略闪存 Flash memory 是一种被广泛运用在手机数码相机 U 盘手持设备等嵌入式系统中的存储设备具有非易失性读写速度快低功耗耐高温和无噪声等特点而且随着闪存技术及制造工艺的发展近几年来也被广泛运用在固态盘中现在已有多家公司有比较成熟的固态盘产品如 Intel Micron Fusion io 华为等从去年底开始已发布或上市的几乎所有主流平板电脑都使用闪存芯片取代传统硬盘作为存储器 22 闪存的存储单元可分为两种类型分别是 NOR 型和 NAND 型若按存储单元采用的存储方式不同分类则闪存又可分为单层单元 SLC Single Layer Cell 和多层单元 MLC Multi Level Cell 23 NOR 型 Flash 和 NAND 型 Flash 各具特点 23 如 NOR 型的优点是随机存取和对字节执行写编程操作的能力缺点是读和擦除速度慢 NAND 型的优点是写速率快缺点在于随机性差它们自身的特点在很大程度上决定了各自的应用领域 NOR 型闪存主要运用在代码存储领域而 NAND 型闪存主要是在数据存储领域闪存其实可以看成 EPROM 和 EEPROM 的结合体且由于闪存的充放电特性使得它的写次数有物理上的限制这是它的关键瓶颈一般认为 MLC 型 Flash 的耐写次数最高达 104次 SLC 型可达 105次而且 NAND Flash 存在坏块性能不稳定此外闪存需要擦除步骤因为其写过程只能从 1 变为 0 而不能从 0 变为 1 对闪存的擦除步骤其实是将要相应的空间都置为 1 对闪存的写操作其实是写 0 所以就需要采取一定的策略来对坏块进行管理对写次数不均的存储单华中科技大学硕士学位论文 7 元进行平衡以延长整个存储系统的寿命本章节主要讨论基于 NAND 型闪存的嵌入式文件系统的损耗均衡算法 2 1 1 闪存系统结构及术语闪存系统结构及术语虽然目前有一些针对闪存而设计的文件系统如 JFFS2 YAFFS 等并提供了坏块管理负载均衡和 ECC 纠错检错等功能但现有主流的文件系统如 NTFS EXT3 FAT 等都是针对磁盘来设计闪存与磁盘是完全不同的两种存储介质磁盘的读写最小单位是物理扇区而且通过磁头寻道及移动来定位物理地址而闪存芯片没有类似磁头的机械结构不需要寻道及旋转 24 直接通过芯片引脚来进行读写操作其芯片内部包含多个区块 block 一个区块又包含多个页 Page 闪存擦除的最小单位是 block 而其最小读写单位是页一般块大小为 64KB 到 256KB 页大小为 2KB 或 4KB 等这些方面的区别使得现有针对磁盘设计的文件系统不能直接有效地控制闪存存储器所以需要在文件系统与硬件之间加入中间层进行一些映射和管理如图 2 1 所示图 2 1 是闪存系统结构图其一般由这么几个部分组成从上往下应用程序层操作系统文件系统闪存转换层 FTL 存储技术设备层 MTD 及闪存芯片其中闪存从转换层 FTL 主要实现三个功能分配映射机制 Allocator 垃圾回收机制 Garbage Collector 及损耗均衡机制 Wear Leveler 等并尽量减少更新映射表的代价 25 闪存的物理块有 4 中种不同的状态空闲块脏块其存储的数据被丢弃但还未进行擦除时标记该数据块为脏净块未使用过的物理块数据块存放有效数据和坏块物理块失效或者达到耐写次数分配映射机制 Allocator 的主要作用是将逻辑页地址 Logical Page Address 简称 LPA 映射到闪存芯片的物理页地址 Physical Page Address 简称 PPA 并在系统中维护一张映射表以在为逻辑页地址分配或更该其对应的物理也地址时能实时更新表项结构每个页又包含一些表项信息如擦除次数计数器有效标志位脏页标志位版本号校验信息等垃圾回收机制 Garbage Collector 将那些废弃的页进行回收因为闪存的擦除单位是块所以需要将块上面其他页的有效数据拷贝到新的可用物理页上这涉及到分配映射机制并更新映射表此外还需更新系统中维护的一些链表结构如空闲链表华中科技大学硕士学位论文 8 脏块链表净块链表数据块链表等图 2 1 闪存系统结构图损耗均衡机制 Wear Leveler 则待有页写操作时检查页地址映射表中的页写次数计数器值待其达到一定的阈值时将原有的逻辑页地址映射到新的物理页地址并进行数据拷贝按一定的策略修改空闲链表和脏页链表等结构这些表项结构存储在存储控制器中的 RAM 和闪存自身某块指定的物理空间当上层应用程序有读写闪存芯片中的数据请求时则将数据请求的逻辑页地址发送给操作系统操作系统将 LPA 转发给文件系统文件系统继续下传给闪存转换层 FTL 根据 FTL 的分配映射等机制找到用户所请求的物理页 2 1 2 闪存闪存动动态态和静态和静态损耗均衡算法损耗均衡算法闪存的损耗均衡算法可分为两大类分别是动态损耗均衡算法和静态损耗均衡算法 26 因为闪存自身介质的特点在对一个已有有效数据的闪存页进行更新时并不能立即执行而需要先对该页进行一个擦除动作而基于计算机中的时间局部性原理即刚被访问过的数据在近期会不断被访问所以动态损耗均衡算法主要是针对不断更新的动态数据当所更新的页的写次数达到所规定的写阈值时从净块链表中选择华中科技大学硕士学位论文 9 新的物理页来进行替换并更新所维护的链表和映射表以达到损耗均衡的效果但是动态损耗均衡算法主要是均衡动态数据块即需要经常更新的数据块亦称为热数据与空闲块之间的写次数对静态数据块即存放有效数据但很少甚至不更新的数据块亦称为冷数据没有任何影响而在一般的存储系统中经常会有较大比例的静态数据如操作系统内核可执行文件只读文件等等因此为了进一步平衡整个存储系统的写次数出现了静态损耗均衡算法也是当前研究的热点静态损耗均衡算法 27 的基本思想是将按照一定的策略交换热数据块擦除次数多的数据块与冷数据块擦除次数少的数据块复制数据块上的数据并更新映射表等数据结构以使存储系统中所有的存储单元都能执行该算法静态损耗均衡算法按照处理过程中的是否带有随机性可分为随机性算法和确定性算法随机性损耗均衡算法基本思想是不保存各个块的擦写信息而是在多次写或擦除操作后进行写均衡操作触发条件擦除块及空闲块的选择都具有随机性文献 28 中作者 Ban 提出的算法就属于该类算法该算法的一个基本思想是维护一个全局写或擦除计数器每次有写或擦除操作时该计数器加 1 待该计数器达到某个阈值如 1000 时先清空该计数器然后从数据块循环链表中选择一个数据块来擦除在擦除前先从空闲块链表中选择一个空闲块将要擦除的数据块拷贝到该空闲块并将该空闲块放入数据块链表再进行擦除后将被擦除的数据块放入空闲块链表 28 该文献中还给出了另外一种算法触发条件即每次写或擦除操作后按照一定的概率如 1 阈值来判断是否需要执行损耗均衡算法的操作另外按均匀分布的随机概率来选择需要擦除的数据块这种算法的特点是执行算法所需的表结构少系统头部开销小执行效率高但其写均衡效果受随机性的影响确定性损耗均衡算法依赖于复杂的数据结构其记录各个块的擦除次数和数据存放的时长等信息来进行全局决策如文献 29 提出的算法属于这类算法其基本思想是在有拷贝或更新数据块操作时选择擦除次数很少的空闲块用以拷贝该数据块然后再将该数据块擦除依据该块的擦除次数来决定是否放入较频擦除空闲块表或较少擦除空闲块表从而实现冷块与热块间的写均衡该算法初始时维护一些数据结构如下平均擦除次数计数器 AvgC 存储系统中所有的块的擦除次数总和除以总块数的值当对该系统的有块擦除操作时更新一次较少擦除空闲块表一个链表结构每个元素至少包含块号及块的擦除次数等信息其中各个块的擦除次数都比平均擦除华中科技大学硕士学位论文 10 次数低某个特定的比例值可自行设定如 20 而且该链表是一个按擦除次数从小到大排序的有序链表较频擦除空闲块表与较少擦除空闲块表类似两者不同在于该空闲块表中各个块的擦除次数都比平均擦除次数高某个特定的比例值可自行设定如 25 同样是一个有序链表块映射表记录逻辑块地址 Logical Block Address 简称 LBA 到物理块地址 Physical Block Address 简称 PBA 映射的信息主要包含有效数据块或那些不属于较少或较频擦除空闲块表的空闲块每当对逻辑块地址的块数据更新时其所对应的物理块地址值也会经常被替换 29 该算法能够很好地使冷数据也热起来且该写均衡操作实际上是对三个块表的更新执行效率高对系统的性能影响不大但因在操作前对三个块表进行初始化并读入表项信息初始化的时间开销大 2 2 相变存储相变存储器器管理策略管理策略 2 2 1 相变存储相变存储的特点的特点与采用浮栅技术存储信息的闪存不同相变存储器利用硫族化合物的静态与非静态的变化来存储信息而非电荷存储相变存储器主要是通过在不同条件下加热或冷却合金材料的探头使其呈现晶态或非晶态两种具有不同电阻率的状态从而能表示 1 和 0 相变存储器的读写工作过程分为 3 部分 30 Set 写 1 Reset 写 0 和 Read 读其中 Set 过程是通过在相变存储器元件的电极两端施加一个宽脉冲的弱电流脉冲宽度为几十纳秒使得元件内电阻的焦耳热改变相变材料的状态使其处于晶态此时元件的电阻率较低能表示数据 1 Reset 过程与 Set 过程相反其施加的是一个窄脉冲的强电流脉冲宽度约为 10 纳秒较大的焦耳热使得相变融化失去晶态结构成为非晶态而呈现高阻态以其能表示数据 0 Read 过程是在元件的电极两端施加一定的电压幅值较低系统根据检测到的电流回馈来判断存储的信息位是 0 还是 1 因为它们的电阻率不同若回馈的电流很小说明阻值高则该数据位为 0 反之为 1 此外读过程中经过相变区域的电流很小比写过程的电流小 1 2 个数量级基本无焦耳热产生因此不足以引发合金材料的相变对数据无破坏性相变存储器 31 与闪存一样都是非易失存储器与闪存相比其优势在于无需华中科技大学硕士学位论文 11 写前的擦除准备过程位可变即 0 和 1 可相互转化读写速度快读写能耗低缩放比例高耐写次数高超过闪存的 100 倍数据保持时间长数据保持时间可以定义为在某个最高温度下数据保持不变和稳定的特定时间周期 PCM 的数据保持时间约为 10 年此外相变存储器与 DRAM 相比其优势在于具有非易失性缩放比例高容量更大成本低数据保存时间长表 2 1 是高密度存储技术比较表 31 从中可以清晰地看出 PCM 相比于 DRAM 与 Flash 的性能优势表 2 1 高密度存储技术比较表 31 当然作为一种新型存储技术 PCM 也存在一些不足 32 如经多次擦写相变材料常被经历熔化与快冷却过程从而使其界面变得很粗糙导致器件单元失效随着器件单元尺寸的减小及密度的大幅度增加器件单元间会有较大的干扰问题可能导致存储数据被擦除掉目前相变存储器的最大不足在于成本和容量但相信随着相变存储技术的发展其优势也会逐渐显现相比于 DRAM 与 Flash 会更优势 2 2 2 面向相变存储器面向相变存储器的管理策略的管理策略相变存储器写均衡算法的目的是尽量使上层文件系统给出的逻辑地址被均衡地映射到存储系统各个单元中以延长整个存储系统的寿命另一方面通过减少对存储系统的写操作可以减少执行写均衡算法的次数保持存储单元的写次数称这种少写方法为过滤写策略 Write Filtering Scheme Yang Cho Lee Qureshi 等人都提出了自己的过滤写策略 33 36 其中 Yang 等人提出的 DCW Data Comparison Write 算法与 Cho 等人提出的华中科技大学硕士学位论文 12 Flip N Write 都是通过增加存储器件单元的硬件电路采取先读后写策略以找出不一致的位数据然后对这些位数据进行写操作从而减少对存储单元的写次数其中 Yang 等人提出的 DCW 策略 33 主要是在存储器件的单元硬件电路结构上增加一个比较器在写新数据前先将原数据读到缓冲区然后以 bit 为单位进行比较若原数据中的 bit 与新数据中的 bit 不一样则执行相应的写操作从而减少对单元的写次数这种策略主要是应用了相变存储器中读速率比写速率高且读能耗比写能耗低的特性采用此策略后的写耗能比传统方法的写耗能降低一半一般情况下相变存储器的写能耗是读能耗的 6 10 倍 Cho 等人给出的 Flip N Write 策略 34 对 DCW 策略进行改进主要是对每个数据单元增加一个 flip 位且数据单元的位宽为 N 在进行数据写操作前先读出原数据并计算新旧数据之间的海明距离即比较新旧数据中不同位数据的个数当海明距离大于 N 2 时则将新数据按位取反且置 flip 1 否则 flip 0 然后只更新原数据与新数据中不相同的位数据从而减少写次数这种策略能保证每个数据单元需要更新的位数不大于其位宽的一半但是每个数据单元需要增加一位从而增加了一定的存储开销是一种用空间换取性能的策略这类算法特别适用于更新少的文件如固件程序文件系统内核等但是如果对某个存储单元不断进行数据修改该单元可以在很短的时间内失效因为相变存储单元的写次数有限由于相变存储器的缩放比例高存储密度大而且具有非易失性能耗低的优势被看作传统 DRAM 的替代者但是相变存储器相比于 DRAM 存在些不足如读写延迟图 2 2 混合主存系统结构长写耗能大耐写次数有限等为了进一步增强基于 PCM 主存系统的性能 Lee 华中科技大学硕士学位论文 13 Qureshi Ping Zhou 等人提出各自的写均衡算法如图 2 2 所示的基于相变存储器的混合主存系统结构 PCM 作主存 DRAM 作 PCM 的缓存磁盘或固态盘作外存 Lee 1 等人提出的过滤写策略是 Partial Write 利用两级缓存 L1 cache 和 L2 cache 每个 L1 cache line 的大小为 32B 每个 L2 cache line 的大小为 64B 在 L1 cache 中对于每个 word 4B 用一个 dirty 位来记录该数据是否被更新过则每个 L1 缓存行需要 8bit 的状态位然后下传给 L2 缓存行每个 L2 缓存行需要 16bits 的状态位此外 L2 cache 中每个 L2 缓存行增加一个 dirty 位来记录该缓存行是否被更新过当 L2 缓存发布写回通知时主存控制器根据 L2 缓存行的状态信息来决定是否对存储器进行写操作从而实现部分写方法以减少写操作 Qureshi 等人提出的过滤写策略主要是 Lazy Write 和 Line Level Write 策略其组织结构如图 2 3 所示在 DRAM 中的每个图 2 3 延迟写策略组织结构图页都包含一个标志信息 T 其中 D 是 dirty 位标记对应的页是否被修改过 P 用于标志该页是否在 PCM 中 Lazy Write 操作的粒度是页 page 大小为 4KB 当 DRAM 中有页数据要被换出时其只对那些 D 1 被更新过的页或者 P 0 不在 PCM 中的页进行写 PCM 操作为了进一步减少写操作的次数细化写粒度采取 Line Level Write 将页分为多个存储行其大小与处理器缓存行大小一致如大小 256B 若将一个页写入 PCM 中时只写入那些被修改过的存储行用 T 中 TAG 字段来标记页中存储行的更新状态 35 此外该文献中还提出一种页内写均衡算法其以存储行为华中科技大学硕士学位论文 14 单位在页内进行循环移位且在 PCM 中用一个寄存器 W 来记录移位后的偏移量以使系统能得到实际的物理行地址从而均衡页内存储行的写次数这种方法执行比较简单但很局限只实现在页内均衡容易因重复写相同页而使页失效进而导致整个存储系统的失效 Ping Zhou 17 等人提出的相变存储写均衡算法主要包含三部分读修改写 read modify write 策略行移位 Row Shifting 策略和段交换 Segment Swapping 策略其中读修改写策略是以 bit 为单位先读后写只对那些修改的位进行写操作以减少对存储单元的写操作行移位策略是在存储行或称为页的数据结构上进行操作的待该对存储行写操作达到某特定阈值时如 256 对该存储行以字节为单位进行循环移位其是基于写存储行最低有效位的次数比最高有效位的次数高的思想从而平衡存储行的写次数段交换策略将存储系统分成多个段如段大小为 1MB 每个段包含多个存储页如页大小为 4KB 且控制器为每个段维护两个控制数据 write count 用于基于计数每个段的写次数 last swapped 用于记录该段上一次被替换的时间用来防止该段频繁地被换出该算法增加了段交换策略来进一步增强相变存储系统的安全性但其需要较多的控制数据内存消耗大 Qureshi 36 等人提出的写均衡算法 Start Gap 主要基于相变存储的主存系统寿命和安全性考虑的首先将存储系统看成一个大阵列每个阵列包含多个存储行每个存储行大小为 256B 然后以阵列执行写均衡算法操作此外阵列还包含一个存储行 Gap 该行不存储有效数据当对阵列的写次数达到某个阈值时将该 Gap 的上一行的有效数据拷贝到 Gap 上从而达到均衡效果进一步地考虑到安全性问题文献中增加了地址离散化操作 RIB Random Invertible Binary Matrix 用随机产生的可逆位方阵阶数为逻辑地址的位数与逻辑地址进行位运算尽量让逻辑地址分散地映射到各个阵列中以能获得更好的均衡效果该算法在硬件层次上实现均衡不需要像闪存的 FTL 那样维护很多的映射表而是只需要 3 个寄存器及一个可逆方阵来记录操作信息内存开销小简单高效 2 3 内存消耗比较内存消耗比较闪存的写均衡算法主要是均衡系统中存储块的擦除次数相变存储器具有一位可华中科技大学硕士学位论文 15 变性不需要擦除步骤其写均衡算法主要是均衡各个存储单元的写次数因闪存块在写入新数据之前需要先执行擦除步骤系统需要为请求的逻辑地址维护一张地址映射表以使其映射到实际所在的物理块上以及一些诸如空闲块链表这样的结构所以闪存的写均衡操作的内存消耗主要在这些表结构上而相变存储器的写操作可以立即更新可以不用映射表表 2 2 损耗均衡算法内存消耗比较表 27 若令闪存的页大小为 4KB 块大小为 128KB 闪存的写次数为 104 105 在此取 215 相变存储器的存储行大小为 256B 其写次数为 107 108 在此取 225 则上述的四种写均衡算法的内存消耗如表 2 2 所示其中以 Qureshi 等人提出的 Star Gap 算法的内存消耗最低因为该算法不需要记录每个存储行的写次数内存消耗少 2 4 本章小结本章小结本章分两部分来阐述现有典型的写均衡算法并对这几个算法的内存消耗进行比较首先在给出的闪存系统结构的基础上分析闪存动态损耗均衡算法静态确定性算法和静态随机性算法的主要思想及其优缺点因闪存动态损耗均衡算法的均衡效果只局限于热数据块之间对冷数据块影响不大而较少被采用而具有较好的全局均衡效果的静态损耗均衡算法成为当前闪存技术研究特点其中随机性算法具有内存开销小执行效率高的优点但其写均衡效果受随机性影响而依赖于复杂数据结构的确定性算法具有很好的均衡效果但是内存开销大其次在阐述相变存储器的特点后给出现有相变存储器写均衡算法的关键技术包括过滤写策略 Ping Zhou 等人的损耗均衡算法和 Qureshi 等人的算法其中过滤华中科技大学硕士学位论文 16 写策略 Write Filtering Scheme 是通过减少对存储系统的写次数来延长系统寿命其依赖于存储系统的硬件结构一般有以下几种方式部分写 Partial write 延迟写 lazy write 读修改写 read modify write 等 Ping Zhou 等人提出的写均衡算法主要包含读修改写策略行移位策略和段交换策略能提高存储系统的数据安全性但算法的内存开销大 Qureshi 36 等人提出的写均衡算法主要是用 Start Gap 策略通过阵列内冷热存储行的数据交换来达到均衡效果算法执行效率高内存开销小但是数据存储的安全性仍有待提高最后就内存消耗对上述的写均衡算法进行分析比较发现相变存储器写均衡算法具有较低的内存消耗华中科技大学硕士学位论文 17 3 一种一种相变存储器的相变存储器的存储管理策略存储管理策略现有的相变存储器存储管理策略主要是基于将相变存储器作为系统主存而设计的而相变存储器因密度大读写速度快及能耗低等优势被认为是一种闪存芯片很好的替代者而且随着相变存储技术的发展其存储位成本也在逐渐降低据相变存储器存储管理策略的目的本章提出一种以相变存储器作外存的写均衡算法对存储系统进行划分并以类似磁盘条带化存储方式将连续的文件分散存储设计低内存开销的邻行拷贝算法用以均衡存储阵列的写次数分析地址离散化所采用的加密算法及检错机制通过动态交换策略来进一步延长整个存储系统的寿命提高数据的存储的安全性 3 1 相变存储器系统划分相变存储器系统划分写均衡算法总是希望连续的文件能分离成多个数据块并离散存储在系统中基于此本章节采用类似磁盘 RAID 阵列的分条技术的思想对相变存储器进行划分将一个连续文件分散存储将一个相变存储器系统分为多个区域 Region 而每个区图 3 1 500GB 存储系统细分图域包含多个阵列 Array 每个阵列由多个存储行 Line 组成存储行包含若干个字华中科技大学硕士学位论文 18 节如每个存储行为 256B 以 500GB 的相变存储器系统为例来说明该系统划分如图 3 1 的存储系统可划分出 125 个区域其中每个区域包含 4 个阵列即每个阵列的大小为 1GB 其中包含 222个大小为 256B 的存储行假设系统要存储一个 1KB 的文件则可将分为 4 个 256B 数据块分别存储在同个区域的不同阵列上注意每次存储数据最小单位为存储行的大小为了方便硬件上实现数据条带化存储把读写请求数据的行地址按图 3 2 所示进行划分其中地址的最低 a 位表示阵列域值即在区域内部的阵列号最高 r 位表示区域域值即在系统中的区域号接下来 n 位表示阵列内的行号域值形成一个行地址三元组 RegionV LineV ArrayV 如图 3 1 所示的 500GB 系统有 r 7 n 22 a 2 所有的阵列在系统中有唯一的阵列编号 U 则有图 3 2 存储系统地址结构此外为了进一步增强存储系统的寿命本相变存储器的写均衡算法将存储系统的最后一个区域规定为特殊区域如图 3 1 的区域 124 其最后一个阵列定为特殊阵列特殊区域的其他非特殊阵列被用做冗余阵列以在阵列失效时能替换 3 2 邻行拷贝算法邻行拷贝算法 3 2 1 相关术语说明相关术语说明本相变存储器的写均衡算法主要实现阵列内的写均衡该算法要求每个存储阵列还需要一个额外存储行而该存储行不存储有效数据称这样的存储行为空白行用以执行邻行拷贝算法本算法中在初始时将每个存储阵列的空白行以这样的方式映射到特殊阵列上用该存储阵列在整个存储系统中的阵列编号 U 隔行映射即阵列 U 的空白行在特殊阵列的物理行地址为 2U 此外每个存储阵列需要维护三个寄存器来执行阵列内的邻行拷贝操作相关术语定义如下华中科技大学硕士学位论文 19 1 Nr 存储系统中区域的总个数 Na 存储系统中阵列的总个数 N 阵列内存储行的总行数有 N 2n Ln 存储行的大小即字节数 2 空白行不存储有效数据的存储行初始值被映射到特殊阵列上 3 空白行指针 Pblank 用寄存器表示记录阵列内空白行的行号初值为 N 4 起始行指针 Phead 用寄存器表示记录阵列的起始行初始值为 0 5 特殊行存储阵列中被映射到特殊阵列上的一个存储行 6 阵列写次数计数器 Wacnt 用寄存器表示记录阵列写操作的次数 7 阵列写次数阈值 Wamax 当 Wacnt 的值达到该阈值时对该阵列执行一次邻行拷贝写均衡算法一般可设该值为 100 到 1000 之间的数阵列内写均衡算法的映射结构如图3 3所示为阵列i内部映射结构的初始状态图阵列 i 在物理上有 N 行在逻辑上多增加一个特殊行共有 N 1 行行编号为 0 1 N 特殊行的逻辑行号值为 N 用 N 表示而其物理上被映射到特殊阵列的第 2i 行上 Phead 初始时指向行号 0 Pblank 初始时指向 N 图 3 3 阵列内部映射结构图 3 2 2 邻行拷贝算法的设计邻行拷贝算法的设计邻行拷贝算法的主要思想是将每个存储阵列看作一个头尾相接的环形大数组数组的每个元素为存储行逻辑上共有 N 1 个元素待每次写阵列时阵列写次数计数器增 1 待其达到规定的阈值时将空白行的上一个存储行的有效数据拷贝到该空白行上在更新相应的寄存器从而实现存储行之间的损耗均衡华中科技大学硕士学位论文 20 存储阵列的邻行拷贝算法的流程图如图 3 4 所示算法输入阵列写次数计数器 Wacnt 空白行指针 Pblank 起始行指针 Phead 写操作请求的行地址三元组数据 RegionV LineV ArrayV 输出更新后的 Wacnt Pblank Phead 开始开始 PblankPblank 0 0 根据该阵列编号计根据该阵列编号计算出该阵列的特殊算出该阵列的特殊行在特殊阵列的物行在特殊阵列的物理行号理行号将所得行号所指的将所得行号所指的内容拷贝到当前阵内容拷贝到当前阵列的列的 PblankPblank 上上据阵列编号据阵列编号U U从从特殊阵列中找出特殊阵列中找出特殊行所在的物特殊行所在的物理行号理行号 PblankPblank PblankPblank PAPA LineVLineV N N 1 1 请求行地址实际上被请求行地址实际上被映射到特殊阵列上映射到特殊阵列上则通过特殊阵列的物则通过特殊阵列的物理行地址计算方式求理行地址计算方式求得物理行号得物理行号SpecLSpecL 是是 PAPA LineVLineV PAPA LineVLineV 1 1 否否否否返回所求的物理地址返回所求的物理地址开始开始是是 PAPA LineVLineV SpecLSpecL PAPA RegionVRegionV和和 PAPA

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf

文档简介

温馨提示

最新文档

评论

相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf

文档简介

温馨提示

最新文档

评论

相关文档