DiLOS:内存解耦中兼容性不应为性能而牺牲_第1页
DiLOS:内存解耦中兼容性不应为性能而牺牲_第2页
DiLOS:内存解耦中兼容性不应为性能而牺牲_第3页
DiLOS:内存解耦中兼容性不应为性能而牺牲_第4页
DiLOS:内存解耦中兼容性不应为性能而牺牲_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DiLOS:内存解耦中,兼容性不应为性能而牺牲记忆分解将计算和内存放置在物理上分离的节点中计算节点的

DRAM用作本地缓存

内存分解的优势

提高内存利用率缓解内存容量壁垒2快速互连计算

节点计算

节点记忆

节点记忆

节点内存解耦配置内存分解系统3兼容性表现无限交换(NSDI'14)另类投资基金经理(OSDI'20)塞梅鲁(OSDI'20)梅姆线(OSDI'22)快速交换(EuroSys'20)飞跃

(ATC'20)内核级分页(虚拟内存)POSIX用户级没有PF应用感知帆布(NSDI'23)​隐士(NSDI'23)​卡宾克(OSDI'22)用户级和内核级系统的性能4C++数据帧更好的预取更好的用户级系统的兼容性妥协5有限的语言支持需要修改应用程序RemHashtable<key_t,int>哈希表;RemArray<data_t>​​arr;空白print_data(std::vector<key_t>&req_keys){intsum=

0;

为了

(自动键:req_keys){

DerefScopes1;

sum+=hashtable.at(key,s1);

}

DerefScopes2;

std::cout

<<arr.at(sum,s2)

<<std::endl;}

内存分解系统高性能分页新型预取器设计6兼容性表现内核级分页(虚拟内存)POSIX用户级没有PF应用感知我们的方法减少

兼容性

税:

翻页

间接费用页面错误(PF)异常处理开销不可避免的(硬件):55%(异常+获取数据)软件开销:45%回收利用开销:29%(无需在PF中处理)页面错误处理程序仍有改进空间!7兼容性预取机制分析Linux的交换缓存会在预取过程中产生页面错误。Linux的交换缓存会产生页面错误来跟踪已访问的页面。页面错误数量较多(87.5%)。我们将努力减少这些错误!应用感知预取对于内核级预取器来说是不切实际的。应用程序和内核之间实现清晰分离(切换开销↑)需要考虑很多因素:安全性、多应用等。8表现我们的方法:基于LibOS的专用内核LibOS(或Unikernel):单模式,应用程序和内核共用一个地址空间

兼容性提供虚拟内存和POSIX分页机制。

表现启用轻量级和专用内核代码路径允许使用特定领域的提示,且成本可忽略不计。9环-0VMM内核子系统应用直接访问LibOSDiLOS的关键见解基于LibOS的内存解耦设计

内核级系统的兼容性分页支持未修改的应用程序LibOS的简洁设计

消除了寻呼过程中所有不必要的成本。

用户级系统的性能新的预取器设计最大限度地减少了页面错误。专业化指南允许以低成本集成领域提示。应用感知预取隐藏

远程内存延迟10+DiLOS的分页和预取11扩展PT以用于远程地址统一页表轻量级PF处理路径页面错误处理程序PF处理程序预取器命中追踪器映射器直接映射远程页面(不使用交换缓存)尽量减少次要的PF预取器向PF处理程序和预取器提供提示专业指南专业指南DiLOS的应用感知预取通用预取器无法预测应用程序的异常访问模式指针追踪模式(例如,列表遍历)

通过集成提高预取精度物体长度信息列表的上一个/下一个节点指针

地址12数据伦对象布局列表节点布局数据上一页下一个执行DiLOS的核

基于OSv4,454LoC两位向导

为了基于Redis结构体的应用感知预取基于malloc信息的

Alloc感知分页(请参阅我们的论文!)13应用感知预取分配感知分页应用感知指南API数据伦数据上一页下一个PF处理程序预取PG经理热门歌曲映射器干净的驱逐UPT迪洛斯应用程序提示指南评估轻量级分页:它能否在提供兼容性的同时降低成本?页面错误处理开销分析与内核(Fastswap)和用户(AIFM)系统的比较

应用感知预取:在不规则访问模式下能否提升性能?键值存储(GET、LRANG)性能,Redis案例研究

配置:计算节点(XeonE5-2670v32.3GHz)+内存节点(DDR4)

+ConnectX-5100GbERoCEv2RDMA14页面错误处理开销分析15问:DiLOS设计是否能提升性能?下降48%下降27%与内核和用户系统的比较

16纽约市出租车分析(C++数据框)压缩(快速)更好的问:DiLOS相较于SotAs是否有性能提升?分别提升47%和37%提升28%键值存储性能17更好的GET(混合尺寸)范围[GET]通过读取对象中的长度字段获取确切大小[LRANGE]通过读取指针获取下一个节点问:应用感知预取能否隐藏不规则访问的延迟?提升10%提升60%DiLOS(支持应用)的性能优于Fastswap2.2倍。结论我们提出了基于LibOS的内存解耦系统DiLOS。通过使用POSIX和分页技术来保持兼容性。通过轻量级和分配/应用感知分页来提升性能。18备用幻灯片19统一页表20I/O放大分析延迟开销比获取128B数据只多延迟0.6微秒。带宽开销由于远程访问单元比实际单元更大,因此仍然存在。21DiLOS的分配感知分页I/O带宽放大这是由于应用程序和内核之间的访问单元不匹配造成的。可变对象大小与页面大小(4KB)

分配感知分页使用来自用户级分配器的分配信息使用页面中的区域进行获取和驱逐将所有必要信息嵌入到UPT中,以避免软件开销。22带宽消耗Redis工作负载(约40分钟)获取(40分钟)原来的使用mimalloc分配感知分页仅使用页面区域获取和驱逐23基于分配感知的页面分页可以节省多少带宽?笔记论文被接收的作者需在会议期间进行报告。EuroSys2023将以线下形式举办,我们不提供远程报告服务,因此我们希望您的论文由作者本人在会场进行报告。每场报告时间为15分钟,之后是5分钟的问答环节。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论