




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
LSF作业管理系统使用方法这份文档将指导您通过LSF提交和管理作业。文档包含了使用LSF提交、查看、删除作业的相关内容。遵循文档的操作规范和反馈方法,将帮助您顺利完成工作。也欢迎大家对文档内容提出建议,谢谢!Contentshide 1通过LSF查看集群运行状态o 1.1查看LSF计算节点列表bhostso 1.2查看LSF队列bqueueso 1.3查看计算节点负载lsload 2使用LSF提交作业bsubo 2.1手动提交作业o 2.2交互式批量提交o 2.3编写LSF作业控制脚本o 2.4一个功能更完整的LSF作业控制脚本 3其他作业管理操作o 3.1查看作业状态bjobso 3.2终止作业bkillo 3.3监视作业输出bpeeko 3.4作业历史信息bhist 4参考资料通过LSF查看集群运行状态查看LSF计算节点列表bhosts# bhostsHOST_NAME STATUS JL/U MAX NJOBS RUN SSUSP USUSP RSVfat01 ok - 16 0 0 0 0 0fat02 ok - 16 0 0 0 0 0fat03 ok - 16 0 0 0 0 0fat04 ok - 16 0 0 0 0 0fat05 ok - 16 0 0 0 0 0fat06 ok - 16 0 0 0 0 0fat07 ok - 16 0 0 0 0 0fat08 ok - 16 0 0 0 0 0fat09 ok - 16 0 0 0 0 0fat10 ok - 16 0 0 0 0 0.查看LSF队列bqueues查看所有队列的整体信息:# bqueuesQUEUE_NAME PRIO STATUS MAX JL/U JL/P JL/H NJOBS PEND RUN SUSPcpu 40 Open:Active - - - - 2072 0 2072 0fat 40 Open:Active - - - - 0 0 0 0gpu 40 Open:Active - - - - 288 0 288 0mic 40 Open:Active - - - - 0 0 0 0cpu-fat 40 Open:Active - - - - 16 0 16 0查看某个队列的信息:# bqueues fatQUEUE_NAME PRIO STATUS MAX JL/U JL/P JL/H NJOBS PEND RUN SUSPfat 40 Open:Active - - - - 0 0 0 0查看计算节点负载lsload查看整体负载:# lsloadHOST_NAME status r15s r1m r15m ut pg ls it tmp swp memnode011 ok 0.0 0.3 0.4 0% 0.0 0 49024 193G 62G 61Gnode039 ok 0.0 0.6 0.5 0% 0.0 0 49024 194G 62G 61Gnode041 ok 0.0 0.0 0.0 0% 0.0 0 49024 194G 62G 61Gnode050 ok 0.0 0.0 0.0 0% 0.0 0 49024 194G 62G 60Gnode064 ok 0.0 0.7 0.6 0% 0.0 0 49024 194G 62G 61Gnode077 ok 0.0 0.7 0.5 0% 0.0 0 49024 194G 62G 61G.查看某个节点的负载:# lsload node001HOST_NAME status r15s r1m r15m ut pg ls it tmp swp memnode001 ok 0.3 0.1 0.1 1% 0.0 0 332 152G 62G 61G使用LSF提交作业bsub手动提交作业LSF使用bsub提交作业。bsub命令的格式是:bsub -n Z -q QUEUENAME -i INPUTFILE -o OUTPUTFILE COMMAND其中:Z提交作业需要的线程数,-q指定作业提交的队列。如果不添加-q选项,系统将把作业提交到默认的作业队列。INPUTFILE表示程序需要读入的文件名,OUTPUTFILE表示输出文件名,作业提交后的输出到标准输出信息将会保存在这个文件中。对于串行作业,COMMAND可以直接使用您的程序名。 例如,将串行程序mytest的通过LSF提交:bsub -n 1 -q q_default -o mytest.out ./mytest对于MPI并行作业,COMMAND的格式为-a mpich_gm mpirun.lsf PROG_NAME。 例如,将并行程序mytest,通过LSF提交,使用16个线程运行这个作业:bsub -n 16 -q q_default -o mytest.out -a mpich_gm mpirun.lsf ./mytest交互式批量提交使用bsub还可以启动一个交互式的shell环境,一次提交多个运行参数相同的并行作业。例如下面的操作:# bsubbsub -n 16bsub -q q_defaultbsub -o output.txtbsub COMMAND1bsub COMMAND2bsub COMMAND3等价于:bsub -n 16 -q q_default -o output.txt COMMAND1bsub -n 16 -q q_default -o output.txt COMMAND2bsub -n 16 -q q_default -o output.txt COMMAND3编写LSF作业控制脚本#BSUB -n 16#BSUB -q q_default#BSUB -o output.txt-a mpich_gm mpirun.lsf ./mytestbsub还接受来自标准输入的作业说明。 因此,我们可以编写LSF脚本提交作业。 bsub脚本简单易写,上面一段代码是名为bsub.script的完整例子,将bsub.script通过输入重定向,提交给LSF:bsub & /dev/nulltouch nodelisttouch nodesNP=0for host in echo $LSB_MCPU_HOSTS |sed -e s/ /:/g| sed s/:n/nn/gdoecho $host nodelistecho $host | cut -d : -f1 nodesnn=echo $host | cut -d : -f2NP=echo $NP+$nn | bcdone其他作业管理操作查看作业状态bjobs检查已提交的作业的运行状态:bjobs以宽格式来显示作业运行状态:bjobs -w显示所有作业:bjobs -a显示正在运行的作业:bjobs -r显示等待运行(pending)的作业和等待的原因:bjobs -p显示已经挂起(suspending)的作业和挂起的原因:bjobs -s显示JOBID这个作业的所有信息:bjobs -l JOBID终止作业bkill终止不需要的作业:bkill终止JOBID这个作业:bkill JOBID直接将作业JOBI
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 执行调解协议书
- 农村分房协议书范本
- 金属材管拉拔工复杂设备故障预判考核试卷及答案
- 装修公司施工安全协议书
- 送受话器装调工安全隐患排查考核试卷及答案
- 高低压电器及成套设备装配工标准化技术规程
- 安徽省阜阳颍东区四校联考2026届数学八上期末复习检测模拟试题含解析
- 2026届山东省邹平县实验中学数学七上期末教学质量检测模拟试题含解析
- 2025临时资金借款合同模板
- 专职网格员业务知识培训课件
- 第三单元第2课时儿童乐园(教学设计)数学北师大版二年级上册2025
- 建设用地审查报批课件
- 2025年企业首席质量官培训考核试题(含答案)
- 2025-2030儿童心理健康服务市场需求分析与行业趋势及发展策略报告
- 人工智能+新能源设备研发应用分析报告
- 公路施工汇报材料
- 对银行消防培训课件
- 保安节前安全培训课件
- 临床运动处方实践专家共识(2025)解读 3
- 2025-2030礼品包装品牌化运营策略及消费者偏好与市场营销渠道研究
- 弹簧测力计的原理
评论
0/150
提交评论