下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大数据离线计算POC性能测试报告第一章概述1.1编写目的本测试报告为spark离线计算hbase性能测试报告,目的在于总结及分析性能测试结果。1.2背景中心适配器的Hbase中存储着海量的电子健康档案数据,当数据量达到一定程度时,对离线计算时的效率产生影响,因此计划使用不同数据量测试Spark的离线计算时间,便于对系统环境进行正确的分析以及评价。第二章测试环境2.1测试网组MapReduce.HBase,zookeeperHadoopHDFS.Spark,amuriCPU8核.L6G内存、600Gfflfi.centOS741083121CPU8核、16G内存、600G硬点、centOS741
2、083122CPU8核.16G内CPU8核、L6G内存、600G硬乱centOS741083124序.600GSS.centOS741083L23CPU曝、16G内序、600G®fi.centOS7410831242.2软件配置类别名称说明操作系统Centos7.4操作系统版本Ambari2.6.0大数据安装平台Hadoop2.6.3分布式系统基础框架Spark2.2.0分布式离线计算框架Mariadb10.2.8计算结果存储数据库2.3硬件配置序号设备名称数量CPU内存硬盘说明1ambari服务器18核16G600G2Hbase节点38核16G600G3Spark节点38核16G6
3、00G与HBASE使用相同服务器第三章测试用例和结果2.1测试内容测试方案采用spark的多线程模型方案,在提交任务时,参数化配置源表、线程数、进程数。在任务提交到yarn集群后,由yarn集群的集群管理器统一分配资源。任务完成后,在yarn集群监控页面获取任务执行时间,记录并对比不同配置下,任务所消耗的时间。本测试目标主要由以下几点:1. 统计离线计算1000万数据量在分配不同服务器资源下的性能。2. 对比不同服务器资源下,计算相同数据量的数据所花费的时间。3. 对比在分配相同服务器资源的前提下,离线计算不同数据量所花费的时间。概念说明1. Executor:并发执行的任务进程数。2. Ex
4、ecutorCore:单个进程下同时执行的线程数。3. ExecutorMemory:单个进程分配的内存空间大小。2.2测试结果集群配置Executor:1Executor:3Executor:3ExecutorMemory:2GExecutorMemory:2GExecutorMemory:2GExecutorCore:3ExecutorCore:3ExecutorCore:6数据量14W14W14W第一次88s57s59s第二次58s66s69s第三次82s61s56s平均lml6sImOlsImOls集群配置Executor:1Executor:3Executor:3ExecutorMe
5、mory:2GExecutorMemory:2GExecutorMemory:2GExecutorCore:3ExecutorCore:3ExecutorCore:6数据量187W187W187W第一次267s123s107s第二次220s128s137s第三次259s183s169s平均4m08s2m242ml7集群配置Executor:1Executor:3Executor:3ExecutorMemory:2GExecutorMemory:2GExecutorMemory:2GExecutorCore:3ExecutorCore:3ExecutorCore:6数据量1000W1000W1000W第一次9m44s3ml2s4m2s第二次8m40s4m49s3m42s第三次8m42s4m50s3m37s平均9m02s4ml73m47第四章测试结论3.1测试结论1. 在相同数据量下,分配的服务器资源越多,计算时间越少。2. 在大数据量下,分配更多的服务器资源,能有效减少计算时间。3. 在分配的资源足够的条件下,分配更多的服务器资源并不会显著减少计算时间。4. 浙江省卫生厅每天上传
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030智慧城市建设技术产业格局竞争格局及投资分析报告
- 2025-2030智慧城市基础设施规划发展分析评估投资
- 2025-2030智慧城市基础设施建设项目规划与发展分析研究
- 2025-2030智慧城市基础设施产业调研分析及行业发展趋势与投资价值分析
- 2025-2030智慧城市先行规划研究及未来增长空间投资潜力深度洞察报告
- 2025-2030智慧城市产业发展前景分析及市场调研报告
- 2025-2030智慧图书馆行业数字化转型发展思考
- 2025-2030智慧园区服务行业市场发展现状及企业创新投资布局规划考察报告
- 2025-2030智慧医疗技术应用趋势与医疗服务体系重构战略报告
- 2025-2030智慧医疗产业市场深度调研及发展趋势与投资价值预测研究
- 淤地坝知识培训课件
- 保密知识培训课件
- 2025昆明幼儿师范高等专科学校引进高层次人才(6人)考试模拟试题及答案解析
- 徐志摩的诗课件
- 五年级上册体育全册教案(2025-2026学年)(表格式)
- GB/T 46225-2025柔性多孔聚合物材料层压用聚氨酯泡沫规范
- 2025年日照盐粮集团有限公司公开招聘工作人员备考考试题库附答案解析
- 2025学年第一学期江浙皖高中(县中)发展共同体高三语文10月联考试题文言文详解:《宋史·陈兢传》、王夫之《宋论》
- 2025年农村会计考试试题及答案
- 2025浙江杭州市发展和改革委员会所属事业单位招聘高层次、紧缺人才4人笔试模拟试题及答案解析
- 2025-2026学年高一生物上学期第一次月考生物试卷(江苏)
评论
0/150
提交评论