下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、零拷贝是服务器网络编程的关键,任何性能优化都离不开。在 Java 程序员的世界,常用的零拷贝有 mmap 和 sendFile。那么,他们在 OS 里,到底是怎么样的一个的设计?本文将简单聊聊 mmap 和 sendFile 这两个零拷贝。初学 Java 时,我们在学习 IO 和 网络编程时,会使用以下代码: 我们会调用 read 方法读取 index.html 的内容 变成字节数组,然后调用 write 方法,将 index.html 字节流写到 socket 中,那么,我们调用这两个方法,在 OS 底层发生了什么呢?我这里借鉴了一张其他文字的图片,尝试解释这个过程。 File file =
2、 new File(index.html); RandomAccessFile raf = new RandomAccessFile(file, rw); byte arr = new byte(int) file.length(); raf.read(arr); Socket socket = new ServerSocket(8080).accept(); socket.getOutputStream().write(arr); 传统数据读写的劣势前言上图中,上半部分表示用户态和内核态的上下文切换。下半部分表示数据复制操作。下面说说他们的步骤:1. read 调用导致用户态到内核态的一次变
3、化,同时,第一次复制开始:DMA(Direct Memory Access,直接内存存取,即不使用 CPU 拷贝数据到内存,而是 DMA 引擎传输数据到内存,用于解放 CPU) 引擎从磁盘读取 index.html 文件,并将数据放入到内核缓冲区。2. 发生第二次数据拷贝,即:将内核缓冲区的数据拷贝到用户缓冲区,同时,发生了一次用内核态到用户态的上下文切换。3. 发生第三次数据拷贝,我们调用 write 方法,系统将用户缓冲区的数据拷贝到 Socket 缓冲区。此时,又发生了一次用户态到内核态的上下文切换。4. 第四次拷贝,数据异步的从 Socket 缓冲区,使用 DMA 引擎拷贝到网络协议引
4、擎。这一段,不需要进行上下文切换。5. write 方法返回,再次从内核态切换到用户态。如你所见,复制拷贝操作太多了。如何优化这些流程?mmap 通过内存映射,将文件映射到内核缓冲区,同时,用户空间可以共享内核空间的数据。这样,在进行网络传输时,就可以减少内核空间到用户控件的拷贝次数。如下图:mmap 优 化如上图,user buffer 和 kernel buffer 共享 index.html。如果你想把硬盘的 index.html 传输到网络中,再也不用拷贝到用户空间,再从用户空间拷贝到 Socket 缓冲区。现在,你只需要从内核缓冲区拷贝到 Socket 缓冲区即可,这将减少一次内存拷
5、贝(从 4 次变成了 3 次),但不减少上下文切换次数。那么,我们还能继续优化吗? Linux 2.1 版本 提供了 sendFile 函数,其基本原理如下:数据根本不经过用户态,直接从内核缓冲区进入到 SocketBuffer,同时,由于和用户态完全无关,就减少了一次上下文切换。sendFile如上图,我们进行 sendFile 系统调用时,数据被 DMA 引擎从文件复制到内核缓冲区,然后调用,然后掉一共 write 方法时,从内核缓冲区进入到Socket,这时,是没有上下文切换的,因为在一个用户空间。最后,数据从 Socket 缓冲区进入到协议栈。此时,数据经过了 3 次拷贝,3 次上下文
6、切换。那么,还能不能再继续优化呢? 例如直接从内核缓冲区拷贝到网络协议栈?实际上,Linux 在 2.4 版本中,做了一些修改,避免了从内核缓冲区拷贝到 Socket buffer 的操作,直接拷贝到协议栈,从而再一次减少了数据拷贝。具体如下图:现在,index.html 要从文件进入到网络协议栈,只需 2 次拷贝:第一次使用 DMA 引擎从文件拷贝到内核缓冲区,第二次从内核缓冲区将数据拷贝到网络协议栈;内核缓存区只会拷贝一些 offset 和 length 信息到 SocketBuffer,基本无消耗。等一下,不是说零拷贝吗?为什么还是要 2 次拷贝?答:首先我们说零拷贝,是从操作系统的角度
7、来说的。因为内核缓冲区之间,没有数据是重复的(只有 kernel buffer 有一份数据,sendFile 2.1 版本实际上有 2 份数据,算不上零拷贝)。例如我们刚开始的例子,内核缓存区和 Socket 缓冲区的数据就是重复的。而零拷贝不仅仅带来更少的数据复制,还能带来其他的性能优势,例如更少的上下文切换,更少的 CPU 缓存伪共享以及无 CPU 校验和计算。再稍微讲讲 mmap 和 sendFile 的区别。1. mmap 适合小数据量读写,sendFile 适合大文件传输。2. mmap 需要 4 次上下文切换,3 次数据拷贝;sendFile 需要 3 次上下文切换,最少 2 次数据拷贝。3. se
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 47180-2026政务服务统一咨询服务工作规范
- 产后夫妻关系调适
- 双胎妊娠的孕期妊娠期贫血护理策略
- 博乐灾害性天气监测及人工影响天气能力提升建设项目环境影响报告书
- 山西省朔州怀仁县联考2026届初三1月调研测试物理试题理试题含解析
- 安徽省合肥市北城片区市级名校2026年初三下学期中考模拟卷(一)英语试题试卷含解析
- 2026年浙江省绍兴市海亮初三下第一次(4月)检测试题英语试题试卷含解析
- 2026公司级新员工安全培训教材
- 河北省沧州市东光县重点名校2026届高中三年级第一次模拟考试试题英语试题含解析
- 2026年四川省广福初级中学初三下学期期末考试(一模)语文试题含解析
- 安徽中职护理单招试题及答案
- 收费站班组管理课件
- 2025年江西省高考地理试卷真题(含答案)
- 《传感器原理及应用》课件-第14章+生物传感器
- 云南省事业单位统考《职业能力倾向测验A类》真题及答案解析
- 医学检验技术职业道德
- 2025年爆破公司自查自纠报告及整改措施范文
- 试验样机管理办法
- 安徽省合肥市四十五中学2026届中考二模英语试题含答案
- 珍惜时间200字11篇
- 幼儿园谷雨课件
评论
0/150
提交评论