版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Hi3521A V100R001C0 xSPC030文档版本00B01发布日期2015-11-302015。保留一切权利。非经本公司式。,任何和个人不得擅自摘抄、本文档内容的部分或全部,并不得以任何形商标、海思和其他海思商标均为市海思半导体的商标。本文档提及的其他所有商标或商标,由各自的所有人拥有。注意您的产品、服务或特性等应受海思公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的或使用范围之内。除非合同另有约定,海思公司对本文档内容不做任何明示或默示的或保证。由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文档中的所有
2、陈述、信息和建议不任何明示或暗示的担保。市海思半导体:518129地址:市龙岗区坂田电气生产中心:http:/客户服务:客户服务传真:客户服务邮箱:supHi3521A V100R001C0 xSPC030前 言前言Hi3521A V100 性能测试摘要本文档描述 Hi3521AV100_SDK性能测试及指标数值。测试基于 DEMO 板,基于 SDK版本号为 Hi3521AV100R001C0 xSPC030。缩略语iAbbreviations 缩略语Full spelling 英文全名Chiexplanation 中文解释VIInput输入VOOutput输出VENCEncode编码VDEC
3、DecodeAIAudio Input音频输入AOAudio Output音频输出AENCAudio Encode音频编码ADECAudio Decode音频MDMotion Detect运动侦测、移动侦测UDUser Data用户数据、私有信息OSDOn Screen Display屏上显示DVRDigitalRecord数字录象机SDIOSecure Digital I/O数字安全输入输出Hi3521A V100R001C0 xSPC030前 言修订修订容。累积了每次文档更新的说明。版本的文档包含以前所有文档版本的更新内iiDate日期Revi Ver修订版本Section Number修
4、改章节Change Description修改描述Author作者2015-09-1500B01第一次版本发布Abbreviations 缩略语Full spelling 英文全名Chiexplanation 中文解释USBUniversal Serial Bus通用串行总线PCIPeripheral Componenterconnect周边器件互连OTGOn The GoHi3521A V100R001C0 xSPC030目 录目录前 言ii12主要结论2测试环境及组网图2测试环境2测试组网图23性能测试设计2场景性能测试关注项2其他关注项24驱动性能测试24.1驱动测试主要结论24.1.1
5、 USB 设备测试结论2SATA 设备性能结论2SATA 机械硬盘性能结论:2SATA 固态硬盘性能结论:24.2.3 IOZONE. 2SATA 刻录机性能结论:2网络性能结论2测试环境及组网图24.3.1 外设测试环境24.4驱动性能关注项24.5 USB.24.5.3测试环境2测试方法2. 24.6 SATA.24.6.3机械硬盘测试环境2机械硬盘测试方法2. 2机械硬盘4.6.4 SATA 固态硬盘测试环境2iiiHi3521A V100R001C0 xSPC030目 录4.6.5 SATA 固态硬盘测试方法24.6.6 固态硬盘. 2SATA 刻录
6、机测试环境2SATA 刻录机测试方法25网络性能25.1 Iperf 2.0.5 测试.25.1.3不加损伤 TSO 性能对比测试2不加损伤 UFO 性能对比测试2加损伤TSO 性能对比测试26附件2ivHi3521A V100R001C0 xSPC030插图目录插图目录图 2-1 测试组网图2图 5-1 tcp 不加损伤组网模型2图 5-2 UDP 测试环境2图 5-3 tcp 加损伤组网模型2vHi3521A V100R001C0 xSPC030表格目录表格目录表 2-1 测试环境及设备2表 4-1 USB 性能测试环境2表 4-2 U 盘 2.0 性能测试. 2表 4-
7、3 移动硬盘 2.0 性能测试. 2表 4-4 SATA 性能测试环境2表 4-5 SATA 固态硬盘性能测试环境2表 4-6 SATA 刻录机性能测试环境2表 4-7 SATA 刻录机性能测试. 2表 5-1 Iperf 分段发送性能表2表 5-2 4 线程发送发送性能表2表 5-3 Iperf 接收测试表2表 5-4 Iperf片数据发送测试表2表 5-5 Iperf 分片数据测试表2表 5-6 Iperf片数据发送测试表2表 5-7 Iperf 多进程发送测试表2表 5-8 Tso 带drop 3%损伤 Iperf 分段数据测试表2表 5-9 Tso 带drop 2%损伤 Iperf 分
8、段数据测试表2表 5-10 Tso 带 reorder 3%32 损伤 Iperf 分段数据测试表2表 5-11 Tso 带 delay 10m 损伤Iperf 分段数据测试表26Hi3521A V100R001C0 xSPC0301 主要结论1主要结论测试主要结论:1场景场景描述备注960H 16 编预览VI:16 路 N 制 960H30fpsVPSS: 处理 16 路 960H30fps,预览开启 NR、 DIE、DCI、IE、OSD(时间+通道号)、 MOSAICx1,大码流压缩打开VENC:16 路 960H 30fps2Mbps + 16 路 CIF 30fps512Kbps +
9、16 路 JPEG960H2fpsVO:HD0 1080P60 16 画面预览,开启倍帧 + WBC 回写 D1 + SD0 显示 WBC 图像FB: G0 1080P5fps + G1 D15fps + G248x4810fpsVDA:16 路 MD CIF5fps音频:16 路音频和 G711a 编码,1 路音频,2 路音频输出,开启混音硬盘:16 路大码流存盘点播:16 路大码流点播DDR:46.42%49.76%,aveg= 47.93%CPU 占用率:68.5%84.9%, aveg=75.63%MMZ used:216MB码率降低 25%的结果:CPU 占用率:55%68.5%,a
10、veg=63.17%960H 16 编 4 解回放VI:16 路 N 制 960H30fps VDEC:4 路 960H30fpsVPSS: 处理 20 路 960H30fps,预览 GROUP开启 NR、DIE、DCI、IE、OSD(时间+通道号)、MOSAICx1,大码流压缩打开VENC:16 路 960H 30fps2Mbps + 16 路 CIF 30fps512Kbps + 16 路 JPEG960H2fpsVO:HD0 1080P60 四画面回放 + WBC 回写 D1 + SD0 显示 WBC 图像FB: G0 1080P5fps + G1 D15fps + G2DDR:51.2
11、4%54.26%,aveg=52.25%CPU 占用率:74%86.7%,aveg=78.79%MMZ used:224MBHi3521A V100R001C0 xSPC0301主要结论2场景场景描述备注48x4810fpsVDA:16 路 MD CIF5fps音频:16 路音频和 G711a 编码,1 路音频,2 路音频输出,开启混音硬盘:16 路大码流存盘 , 4 路大码流读盘点播:16 路小码流点播720P 8 编 4 解回放VI:8 路 720P30fps VDEC:4 路 720P30fpsVPSS: 处理 12 路 720P30fps,预览GROUP开启 NR、DCI、IE、OSD
12、(时间+通道号)、 MOSAICx1,大码流压缩打开VENC:8 路 720P 30fps4Mbps + 8 路 CIF 30fps512Kbps + 8 路 JPEG 720P2fpsVO:HD0 1080P60 4 画面回放 + WBC 回写D1 + SD0 显示 WBC 图像FB: G0 1080P5fps + G1 D15fps + G248x4810fpsVDA:8 路 MD CIF5fps音频:8 路音频和 G711a 编码,1 路音频,2 路音频输出,开启混音硬盘:8 路大码流存盘 , 4 路大码流读盘点播:8 路大码流点播DDR:52.6%53.45%,aveg=52.99%C
13、PU 占用率:25%47.3%,aveg=39.32%MMZ used:236MB关闭编码 cache 时的CPU 占用率:80.5%88%,aveg=83.7%关闭 TSO 时的 CPU占用率: 56.6%72.8%,aveg=64.44%1080P 4 编 1 解回放VI:4 路 1080P30fps VDEC:1 路 1080P30fpsVPSS: 处理 5 路 1080P30fps,预览GROUP开启 NR、DCI、IE、OSD(时间+通道号)、 MOSAICx1,大码流压缩打开VENC:4 路 1080P 30fps8Mbps + 4 路 CIF 30fps512Kbps + 4 路
14、 JPEG 1080P2fpsVO:HD0 1080P60 单画面回放 + WBC 回写 D1 + SD0 显示 WBC 图像FB: G0 1080P5fps + G1 D15fps + G248x4810fpsVDA:4 路 MD CIF5fps音频:4 路音频和 G711a 编码,1 路音频,2 路音频输出,开启混音硬盘:4 路大码流存盘 , 1 路大码流读盘点播:4 路大码流点播DDR:62.36%63.5%,aveg=62.73%CPU 占用率:42.7%53.7%,aveg=48.1%MMZ used:260MBHi3521A V100R001C0 xSPC0301主要结论3场景场景
15、描述备注720P 16 编预览非实时 15fps 混合VI:混合16 路 720P15fps + 640 x36015fpsVPSS: 大码流 GRP 开启图像筛选,处理 16 路 720P15fps,开启 NR、DCI、IE、OSD(时间+通道号)、MOSAICx1,大码流压缩打开小码流 GRP 开启预缩放,处理 16 路 720P15fps + 640 x36015fps,开启 NR、DCI、 IE、OSD(时间+通道号)、MOSAICx1VENC:16 路 720P 15fps2Mbps + 16 路 CIF 15fps512Kbps + 16 路 JPEG720P2fpsVO:HD0
16、1080P60 16 画面预览 + WBC 回写 D1 + SD0 显示 WBC 图像FB: G0 1080P5fps + G1 D15fps + G248x4810fpsVDA:16 路 MD CIF5fps音频:16 路音频和 G711a 编码,1 路音频,2 路音频输出,开启混音硬盘:16 路大码流存盘点播:16 路大码流点播DDR:54.3%55.31%,aveg=54.9%CPU 占用率:44.3%56.8%,aveg=50.88%MMZ used:386MB需要将 VO各通道的 ChnReceiveT hreshold 调整为 4。需要使用 VGS 进行预缩放。720P 16 编
17、8 解回放非实时 15fps混合VI:混合16 路 720P15fps + 640 x36015fpsVDEC:8 路 720P15fpsVPSS: 大码流 GRP 开启图像筛选,处理 16 路 720P15fps,开启 NR、DCI、IE、OSD(时间+通道号)、MOSAICx1,大码流压缩打开回放通道处理 8 路 720P15fps,关闭 NR、IE、 DCIVENC:16 路 720P 15fps4Mbps + 16 路 CIF 15fps512Kbps + 16 路 JPEG720P2fpsVO:HD0 1080P60 9 画面回放 + WBC 回写D1 + SD0 显示 WBC 图像
18、FB: G0 1080P5fps + G1 D15fps + G248x4810fpsVDA:16 路 MD CIF5fps音频:16 路音频和 G711a 编码,1 路音频,2 路音频输出,开启混音硬盘:16 路大码流存盘,16 路大码流读盘点播:16 路大码流点播DDR:55.39%56.11%,aveg=55.72%CPU 占用率:62.4%72.6%,aveg=68.19%MMZ used:410MB需要将VO 高清各通道的 ChnReceiveT hreshold 调整为 4。Hi3521A V100R001C0 xSPC0301 主要结论CPU 占用百分比的计算按照:占用百分比=1
19、00% - idle%-io_wait%;所有 DVR 场景均开启了以下业务:FD、边框;DVR 预览场景在VPSS 中均开启了 DCI、Nr、IE,DIE 设置为 AUTO 模式;标清预览场景 VO 开启倍帧;测试基于DEMO 板,基于 SDK 版本号为 Hi3521AV100R001C0 xSPC030所有 DVR 场景VO1920 x1080;设备使用 1080P60 时序, VO设备层大小为VO 图形层使用 ARGB1555 格式,刷新频率为 5fps;图形层开启压缩;如未特别说明,点播都为大码流;TSO 默认打开;如未特别说明,默认打开编码码流Cache;硬盘存取都使用dvrfms
20、文件系统;(注:dvrfms:DigitalRecorder File System)4Hi3521A V100R001C0 xSPC0302 测试环境及组网图2 测试环境及组网图2.1 测试环境表2-1 测试环境及设备5产品Hi3521A DEMO 板AHD 模拟机源PCThinkSion S30el Xeon E5-1650/Nvidia Quadro K4000 /22LCD监视器JVC TM-A170显示器DELL u2410Hi3521A V100R001C0 xSPC0302测试环境及组网图2.2 测试组网图图2-1 测试组网图6Hi3521A V100R001C0 xSPC030
21、3 性能测试设计3 性能测试设计3.1 场景性能测试关注项HD/SD 的通道显示是否重复;带宽占用;(是否出现低带宽);CPU 占用;帧率(瞬时帧率、器中是否流堆积);编码帧率;(平均帧率和万帧丢帧数,根据 PTS);编码码率;SATA 的数据传输速率;点播;3.2 其他关注项OSD 出现时间;系统启动时间;最大编性能;鼠标灵敏度(在参考设计上测试);7Hi3521A V100R001C0 xSPC0304驱动性能测试4驱动性能测试整个性能测试是单板 Memory 与目标介质的数据传输性能测试,其中 CPU 占有率是拷贝过程中 CPU 占有率的平均值。4.1驱动测试主要结论4.1.1 USB
22、设备测试结论测试涉及 2 款不同品牌的 U 盘,两款移动硬盘,测试了不同文件系统(fat32、ext2、ext3、ext4)。fat32、ext2、ext3 和ext4 比较:同一个 U 盘和移动硬盘不同的文件系统来的读速率没有明显差别,写速率有较大差别,其中 ext4 的写速率表现相对最快,而 Vfat 和 Ext3 相对较慢。具体情况参考附件“不同文件系统下的性能数据”SATA 设备性能结论SATA 机械硬盘性能结论:cpu 占用率对比(sys+user)CPU 占用率和 sata 的读写速率有关,速率越高,占用率越高,具体结果见 4.6.3 “机械硬盘读写性能”。单线程平均写速率在 50
23、MB/s 以上,读速率平均达到 100MB/s(列表)。信息查看兼容性8Hi3521A V100R001C0 xSPC0304驱动性能测试其中抽取 WD(WD20PURX 2TB)进行 16 写 8 读性能测试,读性能可达到 1.8MB,而写速率可达到 1.7MB/s, sys 占用率约为 31%,io 占用率约为 62%。 1.5g、3.0g 和 6.0g 模式对比6.0Gbps、3.0Gbps、1.5Gbps 的性能依次降低,但是差别不是很显著。SATA 硬盘和 PM 兼容性测试见 Hi3521AV100R001 Compatibility Test Report4.2.2 SATA 固态
24、硬盘性能结论:cpu 占用率对比(sys+user):CPU 占用率和 sata 的读写速率有关,速率越高,占用率越高,具体结果见 4.6.6 “固态硬盘读写性能”。固态硬盘排除了机械硬盘本身的限制,更加准确体现了被测试设备的性能。固态硬盘在 6Gbps 下读速率可以达到 267.3MB/s,写速率可以达到 117.3MB/s,3Gbps 的读速率为 218.6MB/s,写速率为 108.5MB/s,1.5Gbps 的读速率为 128.1MB/s,写速率为 121.4MB/s。6Gbps 模式下,16 写 8 读,平均写速率为 5.5MB/s,读速率为 21.2MB/s。1.5g、3.0g 和
25、 6.0g 模式对比6.0Gbps 和 3.0Gbps 性能相差不是很明显,但是显著优于 1.5Gbps。 SATA 硬盘和 PM 兼容性测试见 Hi3521AV100R001 Compatibility Test Report4.2.3 IOZONEIOZONE 测试选取 WD(WD20PURX,2T,资产编码 HSC7061),主要测试了 read,write,reread,rewrite 等磁盘性能,具体结果见 6 “附件”IOZONE。4.2.4 SATA 刻录机性能结论:cpu 占用率对比(sys+user)SATA 刻录机单线程写的 CPU 占用率约为 18.6%,单线程读的 CP
26、U 占用率约为5.4%。读写性能SATA 刻录机单线程写的速率约为 2.9MB/s,单线程读的速率约为 4.1MB/s。4.2.5 网络性能结论Ftp 工具测试网口 TCP 性能结果为 bypass 方式下,ftpget 为 103MB/s,该速率下 CPU 占用率约为 86.3%;ftpput 为42MB/s,该速率下 CPU 占用率约为 67.1%。 tso 方式下,ftpget 为 103MB/s,该速率下 CPU 占用率约为 87%;ftpput 为 34MB/s,该速率下 CPU 占用率约为 34.1%。 gso 方式下,ftpget 为 101MB/s,该速率下 CPU 占用率约为
27、 72.3%;ftpput 为41MB/s,该速率下 CPU 占用率约为 44.2%。9Hi3521A V100R001C0 xSPC0304驱动性能测试Nuttcp 工具测试网口 TCP 性能结果为 bypass 方式下:单进程发送平均速率:649.6033Mbps,该发送速率下 CPU 占用率约 100%;单进程接收平均速率:649.4140Mbps,该接收速率下 CPU 占用率约 98.9%。 tso 方式下:单进程发送平均速率:909.1370Mbps,该发送速率下 CPU 占用率约48.8%;单进程接收平均速率:941.1124Mbps,该接收速率下 CPU 占用率约 100%。 g
28、so 方式下:单进程发送平均速率:853.5434Mbps,该发送速率下 CPU 占用率约100%;单进程接收平均速率:941.0583Mbps,该接收速率下 CPU 占用率约 100%。Iperf 工具测试网口性能结果为:在 TSO 和 GSO 相对 Bypass 模式下,发送相同的网络速率,占用的 cpu 资源更少,或消耗相同 cpu 资源的条件下,TSO 具备更高的网络速率。这些优势的大小同时取决于发送的数据长度大小。比如在 100M 网络下,在相同的发送速率下 94.2Mbit/sec:发送长度为 65536Byte 时,3 种模式的占用 cpu 率分别为: 8.3%(TSO), 15
29、.6%(GSO),20.3%(Bypass)。发送长度为 4096byte 时,3 种模式的占用 cpu 率分别为: 10%(TSO), 16.1%(GSO),20%(Bypass)。在 1000M 网络下,测试中发送相同数据量尽可能消耗 cpu:发送长度为 65536Byte 时,3 种模式的的网络速率分别为: 932Mbit/sec 占用 cpu率 40.3% (TSO),880 Mbit/sec 占用cpu 率 100%(GSO),603 Mbit/sec 占用 cpu率 100% (Bypass)。发送长度为 4096byte 时,3 种模式的网络速率分别为:929 Mbit/sec
30、占用cpu率 50.1%(TSO),556 Mbit/sec 占用cpu 率 100%(GSO),577 Mbit/sec 占用cpu率 100% (Bypass)。在 UFO 相对 Bypass 模式下,发送相同的网络速率,占用的 cpu 资源更少,或消耗相同 cpu 资源的条件下,UFO 具备更高的网络速率。这些优势的大小同时取决于发送的数据长度大小。比如在 100M 网络下:发送长度为 65507Byte 时, Bypass 发送速率为 95.8Mbit/sec,占用 8.3%的CPU资源。UFO 发送速率为 94.2 Mbit/sec,占用 0.1%的 CPU 资源。发送长度为 295
31、92byte 时,Bypass 发送速率为 94.5 Mbit/sec,占用 0.9%的CPU资源。UFO 发送速率为 92.3 Mbit/sec,占用 0.3%的 CPU 资源。在 1000M 网络下:发送长度为 65507Byte 时,Bypass 发送速率为 830 Mbit/sec,占用 57.7%的 CPU资源。UFO 发送速率为 756 Mbit/sec,占用 4.2%的CPU 资源。发送长度为 29592byte 时,Bypass 发送速率为 804 Mbit/sec,占用 65.3%的 CPU资源。UFO 发送速率为 692 Mbit/sec,占用 26.7%的 CPU 资源。
32、10Hi3521A V100R001C0 xSPC0304驱动性能测试4.3 测试环境及组网图4.3.1 外设测试环境4.4驱动性能关注项CPU 占用率;USB/SATA 接口外设的数据传输速率;Fat32、ext2、ext3、ext4 文件系统对外设传输速率的影响;11产品Hi3521A DEMO 板, CPU 为 ARM Cortex HYPERLINK mailto:A71.1GHz A71.1GHz内核Linux3.10.yU 盘移动硬盘(usb)机械硬盘固态硬盘刻录机Hi3521A V100R001C0 xSPC0304驱动性能测试4.5 USB4.5.1 测试环境表4-1 USB
33、性能测试环境兼容性测试发现U 盘性能因品牌、主控、容量大小不同而差异较大,此处选择少数主流设备进行性能测试,信息请参考兼容性测试。4.5.2 测试方法cpu 占用率:使用 top 命令 cpu 占用率;dd 速率统计:使用带有速率计算功能的 dd 命令进行统计;使用格式化参数进行格式化,如下: mkfs.vfat -F 32 /dev/sda1 mkfs.ext2 /dev/sda1 mkfs.ext3 /dev/sda1 mkfs.ext4 /dev/sda1mount USB设备到/mnt/hd1 目录,例如: mount -t vfat /dev/sda1 /mnt/hd1 mount
34、-t ext2 /dev/sda1 /mnt/hd1 mount -t ext3 /dev/sda1 /mnt/hd1 mount -t ext4 /dev/sda1 /mnt/hd1写速率:dd if=/dev/zero of=/mnt/hd1/test bs=4096 count=524288读速率:dd if=/mnt/hd1/test of=/dev/zero bs=4096 count=52428812品牌容量传输协议备注HSC300SanDisk64GBUSB3.0&USB2.0Master Chip: SanDisk S241-PKA905HSC7412Kingston64GBU
35、SB3.0&USB2.0Master Chip: PS2251-01-LHSC388Lenovo1TBUSB3.0&USB2.0移动硬盘HSC358WD1TBUSB3.0&USB2.0移动硬盘Hi3521A V100R001C0 xSPC0304驱动性能测试4.5.3fat32 U 盘、移动硬盘测试(更详细数据见附件)表4-2 U 盘 2.0 性能测试表4-3 移动硬盘 2.0 性能测试SATA机械硬盘测试环境表4-4 SATA 性能测试环境4.6.2 机械硬盘测试方法cpu 占用率:使用 top 命令 cpu 占用率;dd 速率统计:使用带有速率计算功能的 dd 命令进行统计;13品牌容量模
36、式备注HSC7061WD(WD20PURX)2TBSATA1.0&2.0&3.064MB 缓存,紫盘(级)移动硬盘 2.0 性能品牌容量dd 命令读dd 命令写读速度(MB/s)cpu 占用(%)写速度(MB/s)cpu 占用(%)Lenovo1TB33.517.534.221.8WD1TB33.62225.318.3U 盘 2.0 性能品牌容量Capacitydd 命令读dd 命令写读速度(MB/s)cpu 占用(%)写速度(MB/s)cpu 占用(%)SanDisk32GB33.719.517.710.9Kingston32GB33.723.418.110.9Hi3521A V100R00
37、1C0 xSPC0304驱动性能测试使用格式化参数进行格式化,如下:mkdosfs -F 32 /dev/sda1mount 硬盘到/mnt/hd1 目录,例如:mount -t vfat /dev/sda1 /mnt/hd写速率:dd if=/dev/zero of=/mnt/hd/test bs=4096 count=524288读速率:dd if=/mnt/hd1/test of=/dev/null bs=4096 count=524288编译内核时,选择 1.5G、3.0G 和 6.0G 分别编译4.6.3 机械硬盘中 SATA 兼容性列表)机械硬盘读写平均性能测试(详见兼容性1.5G
38、 模式、fat32 SATA 测试3.0G 模式、fat32 SATA 测试14HSC7061 WD(WD20PURX)2TB写速率(MB/S)读速率(MB/s)CPU 占用率(%)Sys+user(%)idle(%)io(%)sriq(%)单线程写(dd)59.739.9+1.3056.42.1单线程读(dd)139.246.8+0.8045.07.316 写 8 读1.71.833.4+1.0062.82.8HSC7061 WD(WD20PURX)2TB写速率(MB/s)读速率(MB/s)CPU 占用率(%)Sys+user(%)idle(%)io(%)sriq(%)单线程写(dd)59.
39、141.8+0.4056.81.0单线程读(dd)123.840.8+1.4049.77.916 写 8 读1.51.622.7+1.1073.22.7Hi3521A V100R001C0 xSPC0304驱动性能测试6.0G 模式、fat32 SATA 测试4.6.4 SATA 固态硬盘测试环境表4-5 SATA 固态硬盘性能测试环境4.6.5 SATA 固态硬盘测试方法cpu 占用率:使用 top 命令 cpu 占用率;dd 速率统计:使用带有速率计算功能的 dd 命令进行统计;使用格式化参数进行格式化,如下:mkdosfs -F 32 /dev/sda1mount SATA 固态硬盘到/
40、mnt/hd1 目录,例如:mount -t vfat /dev/sda1 /mnt/hd写速率:dd if=/dev/zero of=/mnt/hd/test bs=4096 count=524288读速率:dd if=/mnt/hd1/test of=/dev/null bs=4096 count=524288编译内核时,选择 1.5G、3.0G 和 6.0G 分别编译4.6.6 固态硬盘中 SATA 兼容性列表)固态硬盘读写平均性能测试(详见兼容性1.5G 模式、fat32 固态硬盘测试15HSC247 SanDisk 120G品牌容量模式备注HSC247SanDisk120GSATA1
41、.0&2.0&3.0HSC7061 WD(WD20PURX)2TB写速率(MB/S)读速率(MB/s)CPU 占用率(%)Sys+user(%)idle(%)io(%)sriq(%)单线程写(dd)62.445.0+1.0052.51.4单线程读(dd)142.545.1+0.6045.38.816 写 8 读1.71.831.1+2.4062.14.2Hi3521A V100R001C0 xSPC0304驱动性能测试3.0G 模式、fat32 固态硬盘测试6.0G 模式、fat32固态硬盘测试16HSC247 SanDisk 120G写速率(MB/S)读速率(MB/s)CPU 占用率(%)S
42、ys+user(%)idle(%)io(%)sriq(%)单线程写(dd)129-92.8+单线程读(dd)-257.383.7+3.000.21316 写 8 读4.214.589.6+2.1008.1HSC247 SanDisk 120G写速率(MB/S)读速率(MB/s)CPU 占用率(%)Sys+user(%)idle(%)io(%)sriq(%)单线程写(dd)124.5-89.5+1.406.42.6单线程读(dd)-218.580.4+2.5011.84.516 写 8 读4.413.789.4+1.800.77.8写速率(MB/s)读速率(MB/s)CPU
43、占用率Sys+user(%)idle(%)io(%)sriq(%)单线程写(dd)109.3-78.6+1.1018.21.9单线程读(dd)-127.946.3+1.7051.30.616 写 8 读4.37.371.9+1.4022.64.0Hi3521A V100R001C0 xSPC0304驱动性能测试4.6.7 SATA 刻录机测试环境表4-6 SATA 刻录机性能测试环境4.6.8 SATA 刻录机测试方法运行./growisofs写性能。pat -speed=4 -Z/dev/sr0=/home/wwx151374/apk.iso,将刻录机挂载在目录下:mount -t iso9
44、660 /dev/sr0 /mnt/cdrom利用 dd 从刻录机中读数据:dd if=/mnt/cdrom/record.rar bs=4096 count=250000of=/dev/null,读性能。SATA 刻录机1.5G 内核SATA Record 单线程读写性能表4-7 SATA 刻录机性能测试17模式写速率(MB/s)读速率(MB/s)Sys+usr(%)Idle(%)Io(%)Sriq(%)1.5G 模式2.9-5.3+0.3081.412.8-4.13.3+0.1094.61.7品牌容量模式备注C0003292PIONEERSATA 1.5G 模式-Hi3521A V100R
45、001C0 xSPC0305 网络性能5网络性能5.1 Iperf 2.0.5 测试Hi3521A 在网络上主要是实现了 TSO 和 UFO 功能,所以这里主要针对这两个特性功能的开关时,网络的发送和接收的对比来反映 Hi3521A 的网络性能。本项测试采用 iperf 进试,以及在测试中使用 linux 的top 命令获取系统运行数据。Top 命令获取的参数如下:tcp 测试参数说明:服务器参数是“./iperf -s ”;客户端参数是“./iperf c 对端 ip 地址 -i 1 t 120 l”(多线程的话就加-P,双向的话加-d) (-ludp 测试参数说明:代表数据长度 )服务器参
46、数是“./iperf -s -u”;客户端参数是“./iperf c 对端ip 地址 -i 1 t 120 u b 带宽”(多线程的话就加-P带宽大小随具体情况而定,直至丢包率在 5%以内,双向的话加-d),由于要测试的性能,通过-l 设置读写缓冲区的长度(TCP 方式默认为 8KB,UDP 方式默认为1470 字节),可以发挥出的实际性能,一般TCP 方式设置为 64KB;18usr用户空间占用 CPU 百分比sys内核空间占用 CPU 百分比idle空闲 CPU 百分比sirq软中断占用 CPU 百分比Hi3521A V100R001C0 xSPC0305 网络性能5.1.1 不加损伤 T
47、SO 性能对比测试测试环境说明测试环境组网模型如图 5-1 所示:图5-1 tcp 不加损伤组网模型本环境直接在的 212 服务器上用小网(12)测试的,不加损伤,不算100%纯净但是测试期间服务器很少人用。性能对比测试数据在不加损伤的环境下,部分进行了 100M 网口和 1000M 网口的性能测试,具体测试以下表格。Iperf 分段数据测试测试目的:TSO 功能主要优化在于,协议栈不再分段,由下的性能数据。负责分段,需测试以下几种分类情况a.比较 3 种模式下的性能,包括协议栈处理分段的 Bypass 模式,延迟分段的 GSO模式,TSO 模式以及只开启 COE。数据长度 29200(20*
48、1460),14601(10*1460+1),4096(1460*2b.),分别代表长度为 MSS 整数倍,长度为 MSS 整数倍加较小长度,长度为 MSS 整数倍加较大长度。./iperf s./iperf -c 12 -i 1 -t 120 -l(-l代表数据长度)表5-1 Iperf 分段发送性能表19用例描述(发送长度)模式Rx (Mbits/sec)Tx (Mbits/sec)Usr(%)Sys(%)Idle(%)Sirq(%)65536Byte (100M 网口)Bypass-79.716.4COE94.50.08.980.110.8TSO-
49、91.76.1Hi3521A V100R001C0 xSPC0305网络性能20用例描述(发送长度)模式Rx (Mbits/sec)Tx (Mbits/sec)Usr(%)Sys(%)Idle(%)Sirq(%)GSO-94.302.484.413.029200Byte (100M 网口)Bypass-79.616.1COE94.40.09.283.57.2TSO-92.16.1GSO-85.712.414601Byte (100M 网口)Bypass-79.615.7COE94.40.07.081.811.1TS
50、O-91.46.3GSO-84.313.14096Byte (100M 网口)Bypass-80.015.7COE94.40.0TSO-90.96.6GSO-83.913.365536Byte (1000M 网口)Bypass-6030.780.60.018.6COE6440.981.30.017.6TSO-9320.618.259.721.3GSO-8801.066.90.031.929200Byte (1000M 网口)Bypass-6180.980.10.018.9C
51、OE6350.980.10.018.8TSO-9320.617.361.320.7GSO-8001.268.00.030.614601Byte (1000M 网口)Bypass-5941.480.90.017.5COE6261.981.30.016.6TSO-9311.224.953.919.7GSO-7231.771.10.027.04096Byte (1000M 网口)Bypass-5772.877.00.019.9COE6040.978.40.020.5TSO-9292.528.649.918.8GSO-5562.775.70.021.4Hi3521A V100R001C0 xSPC03
52、05 网络性能数据分析:在本组测试中分别测试了 100M 和 1000M 网络中的数据发送测试。在 100M 网络中,单独开启 TSO 或 GSO 或同时开启 TSO 和 GSO 时的 CPU 的空闲(idle)时间数据比不开启时(Bypass)时的数据,有相对明显的优势。而且这一特点在发送的数据长度越大时,更为明显。在 1000M 的网络中, 由于数据发送速率较快,已消耗完 CPU 的资源(idle 为 0.00%),但是可以通过 Tx 这个值可以反应出 TSO 功能的优势(idle 为 60%)。在系统的 CPU 条件下,开 TSO 可以达到更高的网络速率。由于 COE 处理的是 chec
53、ksum,只是负责处理校验计算,所以相比bypass,在加速以及 cpu 性能上并不是很明显。Iperf 多线程发送测试HI3521A 的是单 CPU,理应单进程进行性能测试即可获得需要的数据。但需要考虑在多线程情况下,系统的性能表现。所以将 4 线程发送和 16 线程发送作为补充测试添加进来。./iperf -s./iperf -c 12 -i 1 -t 120 -l 64k -P 4表5-2 4 线程发送发送性能表Iperf 接收测试测试目的:理应接收方向上没有性能。性能数据仅刷出来做参考。./iperf -s./iperf -c 12 -i 1 -t 120 -l 64k21用例描述模式
54、Rx (Mbits/se c)Tx (Mbits/sec)Usr(%)sys(%)idle(%)sirq(%)4 线程发送(1000M 网口)Bypass-6230.081.30.018.6COE6360.084.30.015.6GSO-8840.061.70.038.2TSO-9381.016 线程发送(1000M 网口)Bypass-6110.986.10.012.8COE6100.986.10.012.8GSO-8751.966.30.031.6TSO-9421.015.760.023.1Hi3521A V100R001C0 xSPC0305 网络性能表5-3 I
55、perf 接收测试表Iperf片数据发送测试测试目的:理应小于等于 MSS 长度的数据发送,没有性能./iperf -s./iperf -c 12 -i 1 -t 120 -l 1。性能数据仅刷出来做参考。表5-4 Iperf片数据发送测试表22用例描述模式Rx (Mbits/sec)Tx (Mbits/sec)usr(%)sys(%)idle(%)sirq(%)发送长度 1byte (100M 网口)Bypass279Kbits/sec0.00.01000.0TSO279Kbits/sec0.00.01000.0发送长度 16byte (100M 网口)Bypass4.470.00.0100
56、0.0TSO4.470.00.01000.0发送长度 512byte (100M 网口)Bypass94.21.810.870.816.4TSO83.76.2发送长度 1460byte (100M 网口)Bypass78.216.1TSO89.36.4用例描述模式Rx (Mbits/sec)Tx (Mbits/sec)usr(%)sys(%)idle(%)sirq(%)64K 数据接收(1000M 网口)Bypass740-0.041.00.058.9TSO739-0.642.70.056.632K 数据接收(1000M 网口)Byp
57、ass736-0.343.00.056.6TSO738-0.642.00.057.2Hi3521A V100R001C0 xSPC0305网络性能5.1.2 不加损伤 UFO 性能对比测试测试环境图5-2 UDP 测试环境Iperf 分片数据测试测试目的:UFO 功能主要优化在于,协议栈不再分段,由下的性能数据。负责分段,需测试以下几种分类情况a.b.分片由协议栈 IP 层处理,分片由逻辑处理。数据长度 65507(max),数据长度 29592,数据长度 4096,数据长度 1473./iperf -s -u./iperf -u -c 12 -i 1 -t 120 -l 65507 -b 1
58、00M或 ./iperf -u -c 12 -i 1 -t 120 -l 65507 -b 1000M(100M 网口时)(1000M 网口时)表5-5 Iperf 分片数据测试表23用例描述模式Lose packet(%)Tx(Mbits/sec)usr(%)sys(%)idle(%)sirq(%)发送长度 65507byte (100M 网口)Bypass094.80.06.391.71.8UFO094.20.00.099.90.1发送长度 29592byte (100M 网口)Bypass094.50.00.299.10.6UFO094.30.00.099.70.2发送长度 4096by
59、te (100M 网口)Bypass080.30.00.098.91.0UFO091.80.00.099.90.0发送长度 1473byte (100M 网口)Bypass081.60.00.099.50.4UFO081.60.00.099.80.2发送长度 65507byte (1000M 网口)Bypass0.00988300.239.442.317.9UFO0.0187560.04.095.80.0Hi3521A V100R001C0 xSPC0305 网络性能数据分析:在本组测试中分别测试了 100M 和 1000M 网络中的数据发送测试。在 100M 网络中,因为带宽限制,导致优势相
60、对不是很明显,但是在切换到 1000M的网络中,在发送较长的数据时,开启 UFO 时的 CPU 的空闲(idle)时间数据比不开启时(Bypass)的明显要大。其中,UFO 的速率低于 bypass 的这个是可以解释的,因为对于 UFO,-l 参数为 65507(相当于 64K)时,一个 UDP 大包(64K)才能,而 UDP 上层协议栈的 snd_buf 的限制大概是需要逻辑全部发送完,160K(相当于 3 个 UDP 大包),由于逻辑的行为,1 个大包完全发完才能,导致 UDP 层 snd_buf 不够用而等待的时间会比较长。对于 bypass,送到逻辑的一个个是MTU(1500)长度的包
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 47678.7-2026城市运行管理服务平台第7部分:数据
- 临床 皮肤针 实操实训|手把手教学操作指南
- 船舶电子电气工程专业职业生涯规划书
- 《经外周静脉置入中心静脉导管专科护理|导管管理 + 全套护理措施》
- 临床 护理疼痛干预 实操实训|手把手教学操作指南
- 跨境基础及电商1Chapter 3- Product Description
- 化妆品行业产品研发与创新策略指南
- 房地产行业智能家居设计与安装解决方案
- 商洽2026年新产品专利保护合作事宜函8篇范本
- 湖南省长沙市岳麓区2025届数学三年级第二学期期中调研模拟试题含解析
- 上海市网络与信息安全应急管理事务中心招聘笔试真题2025
- 2026年北师大版(一起)小学英语五年级下册期末综合测试卷及答案(2套)
- 2025年山西晋中市地理生物会考真题试卷+答案
- 2026春北师大版三年级下册数学期末综合练习卷含答案
- 2026年版思想道德与法治考试题及答案
- 2026年交安c试题及答案
- 剪叉式升降工作平台作业专项施工方案
- YY/T 0825-2026牙科学牙齿外漂白产品
- GB/T 33589-2026微电网接入电力系统技术规定
- 专利申请与维护管理流程模板
- 2026年医师定期考核内科专业试题及答案
评论
0/150
提交评论