相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf_第1页
相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf_第2页
相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf_第3页
相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf_第4页
相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

相变混合存储系统管理策略与实现技术论文(PDF 66页).pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号分类号 学号学号 M200972335 学校代码学校代码 1 0 4 8 7 密级密级 硕士学位论文硕士学位论文 相变混合存储系统管理策略与实现技术相变混合存储系统管理策略与实现技术 学 位 申 请 人学 位 申 请 人 谢雅旋谢雅旋 学科专业学科专业 计算机系统结构计算机系统结构 指导教师指导教师 陈进才陈进才 教授教授 答辩日期答辩日期 2012 年年 1 月月 9 日日 A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Engineering Implementation of Storage Management Strategy for Hybrid System based on PCRAM Candidate Xie Yaxuan Major Computer Architecture Supervisor Prof Chen Jincai Huazhong University of Science analyze the structure of data storage between file system and external memory system separate the metadata and user data which are respectively stored in PCM and NAND Flash In this paper we focus on the management strategy for PCM with metadata The main idea is to partition the memory into multi area and multi array for data striping We balance the writing operations during the whole system by exchanging adjacent line within a memory array and exchanging hot data area and cold data area Comparing with existing algorithms our solution can make the address mapping more discrete and restrain from repeatedly writing on the same cell so as to lengthen the lifetime of memory system and usability Finally we prove the performance superiority of this algorithm by simulation Key Words Phase Change Memory Wear Leveling Hybrid storage system Dynamic exchange 华 中 科 技 大 学 硕 士 学 位 论 文 III 目目 录录 摘要摘要 I Abstract II 1 绪论绪论 1 1 课题背景和意义 1 1 2 国内外研究现状 2 1 3 本课题主要研究内容 3 1 4 本文组织结构 4 2 相关损耗均衡算法相关损耗均衡算法 2 1 闪存损耗均衡算法 6 2 2 相变存储器写均衡算法 10 2 3 内存消耗比较 14 2 4 本章小结 15 3 一种相变存储器的写均衡算法一种相变存储器的写均衡算法 3 1 相变存储器系统划分 17 3 2 邻行拷贝算法 18 3 3 加密算法 25 3 4 动态交换策略 26 3 5 本章小结 28 4 混合系统相变存储写均衡算法的实现混合系统相变存储写均衡算法的实现 华 中 科 技 大 学 硕 士 学 位 论 文 IV 4 1 混合外存系统的硬件架构 29 4 2 相变存储芯片 30 4 3 混合外存系统的数据流结构 31 4 4 写均衡算法的执行过程 33 4 5 本章小结 36 5 实验仿真及性能分析实验仿真及性能分析 5 1 算法模型分析 37 5 2 仿真结果分析与比较 43 5 3 本章小结 48 6 总结与展望总结与展望 6 1 全文总结 37 6 2 展望 51 致谢致谢 53 参考文献参考文献 54 附录附录 攻读硕士学位期间发表的论文与申请的发明专利攻读硕士学位期间发表的论文与申请的发明专利 58 华 中 科 技 大 学 硕 士 学 位 论 文 1 1 绪论绪论 1 1 课题背景课题背景和意义和意义 在信息爆炸的时代 人们对存储要求越来越高 而且随着 云存储 大数据 概念的提出 企业的存储架构及数据中心基础设施将面临新的挑战 存储应用领域将 覆盖金融 电信 医疗 政府 能源和公共事业 零售 物流等 对大数据存储管理 带来了巨大需求 然而 这些都离不开存储介质的支持 人类现在对存储介质的容量 带宽 能耗 寿命等有更高要求 传统的 DRAM 虽具有快速及可靠性高等优点 1 但 数据读取的破坏性与挥发性是其致命的缺点 同样 Flash 虽具有较高的存储密度和非 易失性的优点 但伴有速度较慢与可靠性低的问题 而且 随着 DRAM 与 FLASH 存 储器的持续发展 2 这些存储器终将会面临尺寸缩小上极限的限制 如闪存的制作工艺 为 65nm 以下时 其可靠性因受到某些物理限制严重下降 DRAM 与 Flash 都面临着工 艺整合与设计上的严重挑战 因此 开发理想的半导体存储器来解决现有存储器技术 所面临的瓶颈刻不容缓 为了进一步满足这一要求 新一代具有高密度 高速度 长 寿命的存储器 相变存储器应运而生 相变存储器 Phase Change Random Access Memory 3 简称 PCRAM 或 PCM 是一种新型的电阻式非易失性半导体存储器 它以硫系化合物 GST 材料为存储介质 利用相变材料在晶态和非晶态时所呈现出显著的电阻值差异性来实现数据存储 具体 是通过电子脉冲使存储介质发生相变 当其处在晶态时 电阻值低 电流大 用以代 表 1 当其处在非晶态时 电阻值很高 电流很小 用以表示 0 作为一种新兴的存储技术 相变存储器兼具有 RAM 和闪存的性能优点 其特点如 下 4 6 1一位可变性 如同 RAM 或 EEPROM PCM 可变的最小单元是一位 所以就不 像闪存那样需要单独的擦除步骤 从而亦可降低能耗 并节省写入时间 2非易失性 与闪存一样都是非易失存储器 而与 RAM 相比 其明显优势在于所 写信息是不可挥发的 3读取速度快 其读速度与 DRAM 在同一个数量级 这使得存储器中的代码可以 直接执行 无需中间拷贝到 RAM 华 中 科 技 大 学 硕 士 学 位 论 文 2 4写入速度较快 PCM 能够达到如同 NAND Flash 的写入速度 但是 PCM 的反应 时间更短 且无需单独的擦除步骤 NOR 闪存虽具有稳定的写入速度 但是擦除时间 较长 5耐写性较好 PCM 单元的写次数可达闪存的 100 倍 可达 107 108次 6存储密度更高 闪存的结构导致存储器很难进一步缩小体积 这是因为门电路 的厚度是一定的 它需要多于 10V 的供电 CMOS 逻辑门需要 1V 或更少 这种缩小 通常被称为摩尔定律 存储器每缩小一代其密集程度提高一倍 而 DRAM 的性能在采 用 30nm 工艺时也很难保证 但是 PCM 可以达到 22nm 随着存储单元的缩小 GST 材料的体积也在缩小 这使得 PCM 具有缩放性 具有很大的存储密度提升空间 PCM 的诸多优良特性表明其非常适合作为高密度的独立式或者嵌入式存储器 其 应用领域可包括 7 8 手机 数码相机等消费类电子产品 PC 服务器等需要更复杂芯 片组和高性能嵌入式存储器的计算机 需要更高存储容量和更快存储器的通信和互联 网基础设施等 相变存储器除了兼有 DRAM 和 Flash 的有点外 还具有自身独特优势 这样便具有取代它们的潜力 随着相变存储器技术的不断发展和大批量生产 它将有 望成为下一代主流的存储器 9 1 2 国内外研究现状国内外研究现状 相变存储并非一个新的概念 早在上世纪六七十年代学者就已开始研究这类技术 但并未得到太多关注 10 近十几年来 随着材料科学和 IC 设计工艺的发展 相变存储 器的性能优势和竞争力逐渐显现 使得国内外各大半导体公司和科研机构纷纷致力于 新型相变存储芯片的研发 如镁光 Micron 三星 Samsung 等公司已有相变存储 器芯片量产 10 2009 年 9 月 三星公司以 60nm 的工艺开始量产 512Mb 容量的 PCM 该芯片的各项技术指标均达到了很高的水平 镁光分别于 2008 年 12 月推出一款兼容 高速 SPI 接口的 90nm 相变存储器 其集串行 NOR 闪存和 EEPROM 两大存储器的技 术优点于一身 具有字节修改功能以及更高的写入速度和耐写性能 2010 年 4 月 再 推出一款支持并行口 128Mbit 的相变存储器 其写入速度有望达到现有闪存的 300 倍 耐写次数达到闪存的 10 倍 11 12 今年 镁光官网已开始售卖相变存储芯片 也已有 嵌入式应用实例 IBM 也于前不久研发出最新的多位的相变存储器 13 华 中 科 技 大 学 硕 士 学 位 论 文 3 前面几年 国际上领先的几家半导体公司在材料和相变存储芯片的研制方面投入 了大量的人力 物力和财力 以为日后实现相变存储芯片奠定了基础 近两年来 国 际的一些存储公司和研究机构等 也逐渐从存储系统架构的角度来研究相变存储器 从而更好地发挥其性能优势 如混合主存系统的研究 14 16 及一些通过减少相变存储器 软硬件错误的机制与写均衡策略等来提升相变存储器寿命方法的研究 17 19 国内在相变存储技术的研究已有 20 多年的研究历史 比较有代表性研究团队有 中国科学院上海光学精密机械研究所 中国科学院上海微系统与信息技术研究所和华 中科技大学信息存储材料及器件研究所 也取得了令人瞩目的成绩 今年 4 月份 中 国科学院成功研制出一款 8Mbit 的 PCM 芯片 上海微系统与信息技术研究所拥有其自 主知识产权 打破了芯片的生产技术长期处于被国外垄断的处境 20 21 在相变存储技术的研究方面 国内主要集中在材料及芯片制作技术上 发展步伐 较国外慢 在相变存储器系统架构 写均衡策略及安全性等方面 国内研究成果鲜见 1 3 本课题主要研究内容本课题主要研究内容 本课题来源于国家 863 计划重大项目课题 项目编号 No 2009AA01A402 虽然相变存储器有诸多性能优势 也有很广阔的运用前景 但有一个致命的弱点 即单元的耐写次数有限 特别当前作为数据可靠性要求高的存储介质时 这个缺点成 为整个存储系统的性能瓶颈 虽然相变存储单元的耐写次数可达 107 108 但当不断地 重复写相同单元时 该存储单元可在很短时间内失效 从而导致整个存储系统不能使 用 为了充分发挥相变存储器优异的性能 设计一种高效的写均衡算法是很有必要的 因现有相变存储技术还处在初级研发阶段 存储器的位成本很高 若单纯用其做 外存 存储系统的性价比很低 所以本实现中 结合较成熟的闪存技术及具有较低位 成本的 NAND Flash 来设计混合相变存储系统 将原有 NAND Flash 外存系统转变为以 PCM 与 NAND Flash 混合的存储系统 其中将文件系统的元数据 包括文件系统的目 录结构 数据索引直至 文件属性等 闪存的转换层 FTL 的元数据 包括地址映射表 页写状态位表 块擦除信息等 以及更新的数据存储在相变存储器中 而用户数据仍 存放在闪存 这样能充分发挥相变存储器和闪存各自的优势 从而提高整个存储系统 的性能 华 中 科 技 大 学 硕 士 学 位 论 文 4 基于以上结构 因现有闪存的损耗均衡技术也比较成熟 本设计主要将重点放在 了相变存储器损耗均衡算法的设计与实现上 其主要研究内容如下 1 阐述现有损耗均衡算法的关键技术 其中包括现有闪存的动态 静态损耗均衡 算法和相变存储器写均衡算法 并对其算法特点进行分析 比较这些算法的内存消耗 2 基于现有损耗均衡算法 提出一种低内存消耗 利于硬件实现的损耗均衡算法 并详述算法实现中所采用的策略及流程的设计 其中包括存储系统的合理规划 低内 存消耗的邻行拷贝算法的设计 存储行地址加密结构 区域的动态映射 写后读策略 及写失效的冗余映射策略等 从而达到写均衡效果 延长相变存储器的寿命 使系统 的数据更安全可靠 3 详细分析所设计的混合相变存储系统的硬件逻辑结构及所采用的相变存储芯 片 并在此基础上 结合前面的所设计的损耗均衡方法实现混合系统的相变存储器的 控制策略 4 对所设计的相变存储器损耗均衡算法进行模型分析 并且对所实现的混合存储 系统的控制策略进行仿真验证 对仿真结果进行分析比较 1 4 本文组织结构本文组织结构 第一章主要介绍本课题的背景和意义 国内外发展现状 简要说明本课题的主要 研究内容 第二章主要对现有典型的均衡算法的阐述 包括闪存的动态 静态损耗均衡算法 及现有相变存储器的损耗均衡算法 并比较这些算法的内存消耗 第三章在现有损耗均衡算法的基础上 提出一种基于相变存储外存系统的写均衡 算法 其中主要包含对存储系统的划分 低内存消耗的阵列内写均衡算法 邻行拷 贝算法 地址加密操作 冷热区 交换策略 冗余映射等策略来延长整个相变存储器 的寿命 提高数据的安全可靠性 以更能抵御恶意攻击 第四章 主要是混合相变存储系统控制策略的实现 给出系统的硬件逻辑结构图 说明设计中采用的相变存储芯片及相变存储阵列的分布 分析所设计的混合存储系统 中数据流的结构及数据存储的分工 最后结合前面所述的相变存储器写均衡算法的关 键技术 给出相变存储器写均衡算法的流程 并作详细阐述 华 中 科 技 大 学 硕 士 学 位 论 文 5 第五章 分析所提出的相变存储器损耗均衡算法的模型限制条件 对所实现的混合 相变存储系统的相变存储写均衡算法进行仿真验证 结合仿真结果对实现的算法进行 性能分析 并作算法比较 第六章 对本文的工作做总结 指出待改善的内容和下一步工作 华 中 科 技 大 学 硕 士 学 位 论 文 6 2 相关相关存储管理策略存储管理策略 损耗均衡是一种常用在像闪存 相变存储器等有耐写次数限制的存储系统中的技 术 主要作用是尽力平衡存储单元的写次数 即交换写负载重与写负载轻的两类存储 单元 以延长整个存储系统的使用寿命 本章主要是对现有的存储器写均衡算法进行比较分析 分析并阐述已有闪存动静 态损耗均衡算法及针对相变存储器的损耗均衡算法 为设计高效的相变存储器损耗均 衡算法提供借鉴 2 1 闪存闪存存储管理策略存储管理策略 闪存 Flash memory 是一种被广泛运用在手机 数码相机 U 盘 手持设备等嵌 入式系统中的存储设备 具有非易失性 读写速度快 低功耗 耐高温和无噪声等特 点 而且 随着闪存技术及制造工艺的发展 近几年来也被广泛运用在固态盘中 现 在已有多家公司有比较成熟的固态盘产品 如 Intel Micron Fusion io 华为等 从 去年底开始 已发布或上市的几乎所有主流平板电脑都使用闪存芯片取代传统硬盘作 为存储器 22 闪存的存储单元可分为两种类型 分别是 NOR 型和 NAND 型 若按存储单元采 用的存储方式不同分类 则闪存又可分为单层单元 SLC Single Layer Cell 和多层 单元 MLC Multi Level Cell 23 NOR 型 Flash 和 NAND 型 Flash 各具特点 23 如 NOR 型的优点是随机存取和对字节执行写 编程 操作的能力 缺点是读和擦除速度 慢 NAND 型的优点是写速率快 缺点在于随机性差 它们自身的特点在很大程度上 决定了各自的应用领域 NOR 型闪存主要运用在代码存储领域 而 NAND 型闪存主要 是在数据存储领域 闪存其实可以看成 EPROM 和 EEPROM 的结合体 且由于闪存的 充放电特性 使得它的写次数有物理上的限制 这是它的关键瓶颈 一般认为 MLC 型 Flash 的耐写次数最高达 104次 SLC 型可达 105次 而且 NAND Flash 存在坏块 性能 不稳定 此外 闪存需要擦除步骤因为其写过程只能从 1 变为 0 而不能从 0 变为 1 对闪存的擦除步骤其实是将要相应的空间都置为 1 对闪存的写操作其 实是写 0 所以就需要采取一定的策略来对坏块进行管理 对写次数不均的存储单 华 中 科 技 大 学 硕 士 学 位 论 文 7 元进行平衡 以延长整个存储系统的寿命 本章节主要讨论基于 NAND 型闪存的嵌入式文件系统的损耗均衡算法 2 1 1 闪存系统结构及术语闪存系统结构及术语 虽然目前有一些针对闪存而设计的文件系统如 JFFS2 YAFFS 等并提供了坏块管 理 负载均衡和 ECC 纠错检错等功能 但现有主流的文件系统如 NTFS EXT3 FAT 等都是针对磁盘来设计 闪存与磁盘是完全不同的两种存储介质 磁盘的读写最小单 位是物理扇区 而且通过磁头寻道及移动来定位物理地址 而闪存芯片没有类似磁头 的机械结构 不需要寻道及旋转 24 直接通过芯片引脚来进行读写操作 其芯片内部 包含多个区块 block 一个区块又包含多个页 Page 闪存擦除的最小单位是 block 而其最小读写单位是页 一般块大小为 64KB 到 256KB 页大小为 2KB 或 4KB 等 这些方面的区别 使得现有针对磁盘设计的文件系统不能直接有效地控制闪存存储器 所以需要在文件系统与硬件之间加入中间层 进行一些映射和管理 如图 2 1 所示 图 2 1 是闪存系统结构图 其一般由这么几个部分组成 从上往下 应用程序层 操作系统 文件系统 闪存转换层 FTL 存储技术设备层 MTD 及闪存芯片 其 中 闪存从转换层 FTL 主要实现三个功能 分配映射机制 Allocator 垃圾回收机制 Garbage Collector 及损耗均衡机制 Wear Leveler 等 并尽量减少更新映射表的代 价 25 闪存的物理块有 4 中种不同的状态 空闲块 脏块 其存储的数据被丢弃但还未 进行擦除时标记该数据块为 脏 净块 未使用过的物理块 数据块 存放有效数 据 和坏块 物理块失效或者达到耐写次数 分配映射机制 Allocator 的主要作用是将逻辑页地址 Logical Page Address 简 称 LPA 映射到闪存芯片的物理页地址 Physical Page Address 简称 PPA 并在系统 中维护一张映射表 以在为逻辑页地址分配或更该其对应的物理也地址时能实时更新 表项结构 每个页又包含一些表项信息如擦除次数计数器 有效标志位 脏页标志位 版本号 校验信息等 垃圾回收机制 Garbage Collector 将那些废弃的页进行回收 因为闪存的擦除 单位是块 所以需要将块上面其他页的有效数据拷贝到新的可用物理页上 这涉及到 分配映射机制并更新映射表 此外还需更新系统中维护的一些链表结构 如空闲链表 华 中 科 技 大 学 硕 士 学 位 论 文 8 脏块链表 净块链表 数据块链表等 图 2 1 闪存系统结构图 损耗均衡机制 Wear Leveler 则待有页写操作时检查页地址映射表中的页写次数 计数器值 待其达到一定的阈值时 将原有的逻辑页地址映射到新的物理页地址 并 进行数据拷贝 按一定的策略修改空闲链表和脏页链表等结构 这些表项结构存储在 存储控制器中的 RAM 和闪存自身某块指定的物理空间 当上层应用程序有读写闪存芯片中的数据请求时 则将数据请求的逻辑页地址发 送给操作系统 操作系统将 LPA 转发给文件系统 文件系统继续下传给闪存转换层 FTL 根据 FTL 的分配映射等机制 找到用户所请求的物理页 2 1 2 闪存闪存动动态态和静态和静态损耗均衡算法损耗均衡算法 闪存的损耗均衡算法可分为两大类 分别是动态损耗均衡算法和静态损耗均衡算 法 26 因为闪存自身介质的特点 在对一个已有有效数据的闪存页进行更新时 并不 能立即执行 而需要先对该页进行一个擦除动作 而基于计算机中的时间局部性原理 即刚被访问过的数据在近期会不断被访问 所以动态损耗均衡算法 主要是针对不断 更新的动态数据 当所更新的页的写次数达到所规定的写阈值时 从净块链表中选择 华 中 科 技 大 学 硕 士 学 位 论 文 9 新的物理页来进行替换 并更新所维护的链表和映射表 以达到损耗均衡的效果 但 是动态损耗均衡算法主要是均衡动态数据块 即需要经常更新的数据块 亦称为 热 数据 与空闲块之间的写次数 对静态数据块 即存放有效数据但很少甚至不更新的 数据块 亦称为 冷 数据 没有任何影响 而在一般的存储系统中 经常会有较大 比例的静态数据如操作系统内核 可执行文件 只读文件等等 因此 为了进一步平 衡整个存储系统的写次数 出现了静态损耗均衡算法 也是当前研究的热点 静态损耗均衡算法 27 的基本思想是将按照一定的策略交换 热 数据块 擦除次 数多的数据块 与 冷 数据块 擦除次数少的数据块 复制数据块上的数据 并更 新映射表等数据结构 以使存储系统中所有的存储单元都能执行该算法 静态损耗均 衡算法按照处理过程中的是否带有随机性可分为随机性算法和确定性算法 随机性损耗均衡算法基本思想是不保存各个块的擦写信息 而是在多次写或擦除 操作后进行写均衡操作 触发条件 擦除块及空闲块的选择都具有随机性 文献 28 中 作者 Ban 提出的算法就属于该类算法 该算法的一个基本思想是维护一个全局写 或擦除计数器 每次有写或擦除操作时 该计数器加 1 待该计数器达到某个阈值 如 1000 时 先清空该计数器 然后从数据块循环链表中选择一个数据块来擦除 在擦 除前 先从空闲块链表中选择一个空闲块 将要擦除的数据块拷贝到该空闲块 并将 该空闲块放入数据块链表 再进行擦除后 将被擦除的数据块放入空闲块链表 28 该 文献中 还给出了另外一种算法触发条件即每次写或擦除操作后 按照一定的概率 如 1 阈值 来判断是否需要执行损耗均衡算法的操作 另外 按均匀分布的随机概率来选 择需要擦除的数据块 这种算法的特点是执行算法所需的表结构少 系统头部开销小 执行效率高 但其写均衡效果受随机性的影响 确定性损耗均衡算法依赖于复杂的数据结构 其记录各个块的擦除次数和数据存 放的时长等信息来进行全局决策 如文献 29 提出的算法属于这类算法 其基本思想是 在有拷贝或更新数据块操作时 选择擦除次数很少的空闲块用以拷贝该数据块 然后 再将该数据块擦除 依据该块的擦除次数来决定是否放入较频擦除空闲块表或较少擦 除空闲块表 从而实现 冷 块与 热 块间的写均衡 该算法初始时维护一些数据 结构如下 平均擦除次数计数器 AvgC 存储系统中所有的块的擦除次数总和除以总块 数的值 当对该系统的有块擦除操作时更新一次 较少擦除空闲块表 一个链表结构 每个元素至少包含块号及块的擦除次数等信息 其中各个块的擦除次数都比平均擦除 华 中 科 技 大 学 硕 士 学 位 论 文 10 次数低某个特定的比例值 可自行设定如 20 而且该链表是一个按擦除次数从小到 大排序的有序链表 较频擦除空闲块表 与较少擦除空闲块表类似 两者不同在于该 空闲块表中各个块的擦除次数都比平均擦除次数高某个特定的比例值 可自行设定如 25 同样是一个有序链表 块映射表 记录逻辑块地址 Logical Block Address 简 称 LBA 到物理块地址 Physical Block Address 简称 PBA 映射的信息 主要包含 有效数据块或那些不属于较少或较频擦除空闲块表的空闲块 每当对逻辑块地址的块 数据更新时 其所对应的物理块地址值也会经常被替换 29 该算法能够很好地使 冷 数据也 热 起来 且该写均衡操作实际上是对三个块表的更新 执行效率高 对系 统的性能影响不大 但因在操作前对三个块表进行初始化并读入表项信息 初始化的 时间开销大 2 2 相变存储相变存储器器管理策略管理策略 2 2 1 相变存储相变存储的特点的特点 与采用浮栅技术存储信息的闪存不同 相变存储器利用硫族化合物的静态与非静 态的变化来存储信息 而非电荷存储 相变存储器主要是通过在不同条件下加热或冷 却合金材料的探头 使其呈现晶态或非晶态两种具有不同电阻率的状态 从而能表示 1 和 0 相变存储器的读写工作过程分为 3 部分 30 Set 写 1 Reset 写 0 和 Read 读 其中 Set 过程是通过在相变存储器元件的电极两端施加一个宽脉冲的弱 电流 脉冲宽度为几十纳秒 使得元件内电阻的焦耳热改变相变材料的状态 使其处 于晶态 此时元件的电阻率较低 能表示数据 1 Reset 过程与 Set 过程相反 其施 加的是一个窄脉冲的强电流 脉冲宽度约为 10 纳秒 较大的焦耳热使得相变融化失 去晶态结构成为非晶态 而呈现高阻态 以其能表示数据 0 Read 过程是在元件的 电极两端施加一定的电压 幅值较低 系统根据检测到的电流回馈来判断存储的信息 位是 0 还是 1 因为它们的电阻率不同 若回馈的电流很小 说明阻值高 则该 数据位为 0 反之为 1 此外 读过程中经过相变区域的电流很小 比写过程的 电流小 1 2 个数量级 基本无焦耳热产生 因此不足以引发合金材料的相变 对数据 无破坏性 相变存储器 31 与闪存一样 都是非易失存储器 与闪存相比 其优势在于 无需 华 中 科 技 大 学 硕 士 学 位 论 文 11 写前的擦除准备过程 位可变即 0 和 1 可相互转化 读写速度快 读写能耗低 缩放比例高 耐写次数高 超过闪存的 100 倍 数据保持时间长 数据保持时间可以 定义为在某个最高温度下 数据保持不变和稳定的特定时间周期 PCM 的数据保持时 间约为 10 年 此外 相变存储器与 DRAM 相比 其优势在于 具有非易失性 缩放 比例高 容量更大 成本低 数据保存时间长 表 2 1 是高密度存储技术比较表 31 从中可以清晰地看出 PCM 相比于 DRAM 与 Flash 的性能优势 表 2 1 高密度存储技术比较表 31 当然 作为一种新型存储技术 PCM 也存在一些不足 32 如 经多次擦写 相变 材料常被经历熔化与快冷却过程 从而使其界面变得很粗糙 导致器件单元失效 随 着器件单元尺寸的减小及密度的大幅度增加 器件单元间会有较大的干扰问题 可能 导致存储数据被擦除掉 目前相变存储器的最大不足在于成本和容量 但相信随着相 变存储技术的发展 其优势也会逐渐显现 相比于 DRAM 与 Flash 会更优势 2 2 2 面向相变存储器面向相变存储器的管理策略的管理策略 相变存储器写均衡算法的目的是尽量使上层文件系统给出的逻辑地址被均衡地映 射到存储系统各个单元中 以延长整个存储系统的寿命 另一方面 通过减少对存储 系统的写操作可以减少执行写均衡算法的次数 保持存储单元的写次数 称这种少写 方法为过滤写策略 Write Filtering Scheme Yang Cho Lee Qureshi 等人都提出了 自己的过滤写策略 33 36 其中 Yang 等人提出的 DCW Data Comparison Write 算法与 Cho 等人提出的 华 中 科 技 大 学 硕 士 学 位 论 文 12 Flip N Write 都是通过增加存储器件单元的硬件电路 采取先读后写策略 以找出不一 致的位数据 然后对这些位数据进行写操作 从而减少对存储单元的写次数 其中 Yang 等人提出的 DCW 策略 33 主要是在存储器件的单元硬件电路结构上增加一个比较器 在写新数据前 先将原数据读到缓冲区 然后以 bit 为单位进行比较 若原数据中的 bit 与新数据中的 bit 不一样 则执行相应的写操作 从而减少对单元的写次数 这种策略 主要是应用了相变存储器中 读速率比写速率高且读能耗比写能耗低 的特性 采用 此策略后的写耗能比传统方法的写耗能降低一半 一般情况下 相变存储器的写能耗 是读能耗的 6 10 倍 Cho 等人给出的 Flip N Write 策略 34 对 DCW 策略进行改进 主 要是对每个数据单元增加一个 flip 位 且数据单元的位宽为 N 在进行数据写操作前 先读出原数据 并计算新旧数据之间的海明距离即比较新旧数据中不同位数据的个数 当海明距离大于 N 2 时 则将新数据按位取反且置 flip 1 否则 flip 0 然后只更新原 数据与新数据中不相同的位数据 从而减少写次数 这种策略能保证每个数据单元需 要更新的位数不大于其位宽的一半 但是每个数据单元需要增加一位 从而增加了一 定的存储开销 是一种用空间换取性能的策略 这类算法特别适用于更新少的文件如 固件程序 文件系统内核等 但是如果对某个存储单元不断进行数据修改 该单元可 以在很短的时间内失效 因为相变存储单元的写次数有限 由于相变存储器的缩放比例高 存储密度大 而且具有非易失性 能耗低的优势 被看作传统 DRAM 的替代者 但是相变存储器相比于 DRAM 存在些不足如读写延迟 图 2 2 混合主存系统结构 长 写耗能大 耐写次数有限等 为了进一步增强基于 PCM 主存系统的性能 Lee 华 中 科 技 大 学 硕 士 学 位 论 文 13 Qureshi Ping Zhou 等人提出各自的写均衡算法 如图 2 2 所示的基于相变存储器的混 合主存系统结构 PCM 作主存 DRAM 作 PCM 的缓存 磁盘或固态盘作外存 Lee 1 等人提出的过滤写策略是 Partial Write 利用两级缓存 L1 cache 和 L2 cache 每个 L1 cache line 的大小为 32B 每个 L2 cache line 的大小为 64B 在 L1 cache 中 对 于每个 word 4B 用一个 dirty 位来记录该数据是否被更新过 则每个 L1 缓存行需 要 8bit 的状态位 然后下传给 L2 缓存行 每个 L2 缓存行需要 16bits 的状态位 此外 L2 cache 中 每个 L2 缓存行增加一个 dirty 位来记录该缓存行是否被更新过 当 L2 缓 存发布写回通知时 主存控制器根据 L2 缓存行的状态信息来决定是否对存储器进行写 操作 从而实现部分写方法 以减少写操作 Qureshi 等人提出的过滤写策略主要是 Lazy Write 和 Line Level Write 策略 其组织结构如图 2 3 所示 在 DRAM 中的每个 图 2 3 延迟写策略组织结构图 页都包含一个标志信息 T 其中 D 是 dirty 位标记对应的页是否被修改过 P 用 于标志该页是否在 PCM 中 Lazy Write 操作的粒度是页 page 大小为 4KB 当 DRAM 中有页数据要被换出时 其只对那些 D 1 被更新过的页 或者 P 0 不在 PCM 中 的页进行写 PCM 操作 为了进一步减少写操作的次数 细化写粒度 采取 Line Level Write 将页分为多个存储行 其大小与处理器缓存行大小一致 如大小 256B 若将 一个页写入 PCM 中时 只写入那些被修改过的存储行 用 T 中 TAG 字段来标记页 中存储行的更新状态 35 此外 该文献中还提出一种页内写均衡算法 其以存储行为 华 中 科 技 大 学 硕 士 学 位 论 文 14 单位在页内进行循环移位 且在 PCM 中用一个寄存器 W 来记录移位后的偏移量以 使系统能得到实际的物理行地址 从而均衡页内存储行的写次数 这种方法 执行比 较简单 但很局限 只实现在页内均衡 容易因重复写相同页而使页失效 进而导致 整个存储系统的失效 Ping Zhou 17 等人提出的相变存储写均衡算法 主要包含三部分 读修改写 read modify write 策略 行移位 Row Shifting 策略和段交换 Segment Swapping 策略 其中 读修改写策略是以 bit 为单位 先读后写 只对那些修改的位进行写操作 以减少对存储单元的写操作 行移位策略是在存储行 或称为页 的数据结构上进行 操作的 待该对存储行写操作达到某特定阈值时 如 256 对该存储行以字节为单位 进行循环移位 其是基于 写存储行最低有效位的次数比最高有效位的次数高 的思 想 从而平衡存储行的写次数 段交换策略 将存储系统分成多个段 如段大小为 1MB 每个段包含多个存储页 如页大小为 4KB 且控制器为每个段维护两个控制数据 write count 用于基于计数每个段的写次数 last swapped 用于记录该段上一次被替 换的时间 用来防止该段频繁地被换出 该算法增加了段交换策略来进一步增强相变 存储系统的安全性 但其需要较多的控制数据 内存消耗大 Qureshi 36 等人提出的写均衡算法 Start Gap 主要基于相变存储的主存系统寿命 和安全性考虑的 首先将存储系统看成一个大阵列 每个阵列包含多个存储行 每个 存储行大小为 256B 然后以阵列执行写均衡算法操作 此外 阵列还包含一个存储行 Gap 该行不存储有效数据 当对阵列的写次数达到某个阈值时 将该 Gap 的上一行 的有效数据拷贝到 Gap 上 从而达到均衡效果 进一步地 考虑到安全性问题 文献 中增加了地址离散化操作 RIB Random Invertible Binary Matrix 用随机产生的可逆 位方阵 阶数为逻辑地址的位数 与逻辑地址进行位运算 尽量让逻辑地址分散地映 射到各个阵列中 以能获得更好的均衡效果 该算法在硬件层次上实现均衡 不需要 像闪存的 FTL 那样维护很多的映射表 而是只需要 3 个寄存器及一个可逆方阵来记录 操作信息 内存开销小 简单高效 2 3 内存消耗比较内存消耗比较 闪存的写均衡算法主要是均衡系统中存储块的擦除次数 相变存储器具有一位可 华 中 科 技 大 学 硕 士 学 位 论 文 15 变性 不需要擦除步骤 其写均衡算法主要是均衡各个存储单元的写次数 因闪存块 在写入新数据之前需要先执行擦除步骤 系统需要为请求的逻辑地址维护一张地址映 射表以使其映射到实际所在的物理块上以及一些诸如空闲块链表这样的结构 所以闪 存的写均衡操作的内存消耗主要在这些表结构上 而相变存储器的写操作可以立即更 新 可以不用映射表 表 2 2 损耗均衡算法内存消耗比较表 27 若令闪存的页大小为 4KB 块大小为 128KB 闪存的写次数为 104 105 在此取 215 相变存储器的存储行大小为 256B 其写次数为 107 108 在此取 225 则上述的四种写 均衡算法的内存消耗如表 2 2 所示 其中以 Qureshi 等人提出的 Star Gap 算法的内存消 耗最低 因为该算法不需要记录每个存储行的写次数 内存消耗少 2 4 本章小结本章小结 本章分两部分来阐述现有典型的写均衡算法并对这几个算法的内存消耗进行比 较 首先 在给出的闪存系统结构的基础上 分析闪存动态损耗均衡算法 静态确定 性算法和静态随机性算法的主要思想及其优缺点 因闪存动态损耗均衡算法的均衡效 果只局限于 热 数据块之间 对 冷 数据块影响不大 而较少被采用 而具有较 好的全局均衡效果的静态损耗均衡算法成为当前闪存技术研究特点 其中随机性算法 具有内存开销小 执行效率高的优点但其写均衡效果受随机性影响 而依赖于复杂数 据结构的确定性算法具有很好的均衡效果但是内存开销大 其次 在阐述相变存储器的特点后 给出现有相变存储器写均衡算法的关键技术 包括过滤写策略 Ping Zhou 等人的损耗均衡算法和 Qureshi 等人的算法 其中 过滤 华 中 科 技 大 学 硕 士 学 位 论 文 16 写策略 Write Filtering Scheme 是通过减少对存储系统的写次数来延长系统寿命 其 依赖于存储系统的硬件结构 一般有以下几种方式 部分写 Partial write 延迟写 lazy write 读修改写 read modify write 等 Ping Zhou 等人提出的写均衡算法 主要包 含读修改写策略 行移位策略和段交换策略 能提高存储系统的数据安全性 但算法 的内存开销大 Qureshi 36 等人提出的写均衡算法 主要是用 Start Gap 策略通过阵列内 冷热 存储行的数据交换来达到均衡效果 算法执行效率高 内存开销小但是数据 存储的安全性仍有待提高 最后 就内存消耗 对上述的写均衡算法进行分析比较 发现相变存储器写均衡 算法具有较低的内存消耗 华 中 科 技 大 学 硕 士 学 位 论 文 17 3 一种一种相变存储器的相变存储器的存储管理策略存储管理策略 现有的相变存储器存储管理策略 主要是基于将相变存储器作为系统主存而设计 的 而相变存储器因密度大 读写速度快及能耗低等优势 被认为是一种闪存芯片很 好的替代者 而且随着相变存储技术的发展 其存储位成本也在逐渐降低 据相变存 储器存储管理策略的目的 本章提出一种以相变存储器作外存的写均衡算法 对存储 系统进行划分并以类似磁盘条带化存储方式将连续的文件分散存储 设计低内存开销 的邻行拷贝算法用以均衡存储阵列的写次数 分析地址离散化所采用的加密算法及检 错机制 通过动态交换策略来进一步延长整个存储系统的寿命 提高数据的存储的安 全性 3 1 相变存储器系统划分相变存储器系统划分 写均衡算法总是希望连续的文件能分离成多个数据块并离散存储在系统中 基于 此 本章节采用类似磁盘 RAID 阵列的分条技术的思想 对相变存储器进行划分 将 一个连续文件分散存储 将一个相变存储器系统分为多个区域 Region 而每个区 图 3 1 500GB 存储系统细分图 域包含多个阵列 Array 每个阵列由多个存储行 Line 组成 存储行包含若干个字 华 中 科 技 大 学 硕 士 学 位 论 文 18 节 如每个存储行为 256B 以 500GB 的相变存储器系统为例 来说明该系统划分 如图 3 1 的存储系统可划分出 125 个区域 其中每个区域包含 4 个阵列即每个阵列的 大小为 1GB 其中包含 222个大小为 256B 的存储行 假设系统要存储一个 1KB 的文件 则可将分为 4 个 256B 数据块 分别存储在同个区域的不同阵列上 注意每次存储数据 最小单位为存储行的大小 为了方便硬件上实现数据条带化存储 把读写请求数据的行地址按图 3 2 所示进 行划分 其中地址的最低 a 位表示阵列域值即在区域内部的阵列号 最高 r 位表示区域 域值即在系统中的区域号 接下来 n 位表示阵列内的行号域值 形成一个行地址三元 组 RegionV LineV ArrayV 如图 3 1 所示的 500GB 系统 有 r 7 n 22 a 2 所有的阵列在系统中有唯一的阵列编号 U 则有 图 3 2 存储系统地址结构 此外 为了进一步增强存储系统的寿命 本相变存储器的写均衡算法将存储系统 的最后一个区域规定为特殊区域 如图 3 1 的区域 124 其最后一个阵列定为特殊阵 列 特殊区域的其他非特殊阵列被用做冗余阵列 以在阵列失效时能替换 3 2 邻行拷贝算法邻行拷贝算法 3 2 1 相关术语说明相关术语说明 本相变存储器的写均衡算法主要实现阵列内的写均衡 该算法要求每个存储阵列 还需要一个额外存储行 而该存储行不存储有效数据 称这样的存储行为空白行 用 以执行邻行拷贝算法 本算法中 在初始时 将每个存储阵列的空白行以这样的方式 映射到特殊阵列上 用该存储阵列在整个存储系统中的阵列编号 U 隔行映射即阵列 U 的空白行在特殊阵列的物理行地址为 2U 此外每个存储阵列需要维护三个寄存器来执行阵列内的邻行拷贝操作 相关术语定义如下 华 中 科 技 大 学 硕 士 学 位 论 文 19 1 Nr 存储系统中区域的总个数 Na 存储系统中阵列的总个数 N 阵列内 存储行的总行数 有 N 2n Ln 存储行的大小即字节数 2 空白行 不存储有效数据的存储行 初始值被映射到特殊阵列上 3 空白行指针 Pblank 用寄存器表示 记录阵列内空白行的行号 初值为 N 4 起始行指针 Phead 用寄存器表示 记录阵列的起始行 初始值为 0 5 特殊行 存储阵列中被映射到特殊阵列上的一个存储行 6 阵列写次数计数器 Wacnt 用寄存器表示 记录阵列写操作的次数 7 阵列写次数阈值 Wamax 当 Wacnt 的值达到该阈值时 对该阵列执行一次邻 行拷贝写均衡算法 一般可设该值为 100 到 1000 之间的数 阵列内写均衡算法的映射结构如图3 3所示 为阵列i内部映射结构的初始状态图 阵列 i 在物理上有 N 行 在逻辑上多增加一个特殊行共有 N 1 行 行编号为 0 1 N 特殊行的逻辑行号值为 N 用 N 表示 而其物理上被映射到特殊阵列的第 2i 行上 Phead 初始时指向行号 0 Pblank 初始时指向 N 图 3 3 阵列内部映射结构图 3 2 2 邻行拷贝算法的设计邻行拷贝算法的设计 邻行拷贝算法的主要思想是将每个存储阵列看作一个头尾相接的环形大数组 数 组的每个元素为存储行 逻辑上共有 N 1 个元素 待每次写阵列时 阵列写次数计 数器增 1 待其达到规定的阈值时 将空白行的上一个存储行的有效数据拷贝到该空白 行上 在更新相应的寄存器 从而实现存储行之间的损耗均衡 华 中 科 技 大 学 硕 士 学 位 论 文 20 存储阵列的邻行拷贝算法的流程图 如图 3 4 所示 算法输入 阵列写次数计数器 Wacnt 空白行指针 Pblank 起始行指针 Phead 写 操作请求的行地址三元组数据 RegionV LineV ArrayV 输出 更新后的 Wacnt Pblank Phead 开始开始 PblankPblank 0 0 根据该阵列编号计根据该阵列编号计 算出该阵列的特殊算出该阵列的特殊 行在特殊阵列的物行在特殊阵列的物 理行号理行号 将所得行号所指的将所得行号所指的 内容拷贝到当前阵内容拷贝到当前阵 列的列的 PblankPblank 上上 据阵列编号据阵列编号U U从从 特殊阵列中找出特殊阵列中找出 特殊行所在的物特殊行所在的物 理行号理行号 PblankPblank PblankPblank PAPA LineVLineV N N 1 1 请求行地址实际上被请求行地址实际上被 映射到特殊阵列上映射到特殊阵列上 则通过特殊阵列的物则通过特殊阵列的物 理行地址计算方式求理行地址计算方式求 得物理行号得物理行号SpecLSpecL 是是 PAPA LineVLineV PAPA LineVLineV 1 1 否否 否否 返回所求的物理地址返回所求的物理地址 开始开始 是是 PAPA LineVLineV SpecLSpecL PAPA RegionVRegionV和和 PAPA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论