华师大高性能计算集群作业调度系统简明手册 华师大高性能计算集群.docx_第1页
华师大高性能计算集群作业调度系统简明手册 华师大高性能计算集群.docx_第2页
华师大高性能计算集群作业调度系统简明手册 华师大高性能计算集群.docx_第3页
华师大高性能计算集群作业调度系统简明手册 华师大高性能计算集群.docx_第4页
华师大高性能计算集群作业调度系统简明手册 华师大高性能计算集群.docx_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华师大高性能计算集群作业调度系统简明手册华师大高性能计算集群采用曙光的Gridview作业管理系统,其中集成了torque+Maui,是十分强大的作业调度器。下面将依次介绍华师大的的作业调度系统的设定,使用,以及相关作业调度命令一:华师大作业调度系统队列策略设定由于华师大的超级计算中心共分三期建设,其作业调度设定较为复杂:CPU 节点名(pestat可查看)节点Core个数队列备注第一期E5450b110-b149b210-b2298(2*4)mid1,huge第二期E5640b310-b339b410-b4398(2*4)mid2,hugeA(需申请)其中hugeA队列提交后需经批准第三期X5675,GPU(c2050)a110-a149a210-a249a310-a339a410-a44712(2*6)mid3,small,serial,gpuhugeB(需申请),shu(私有队列)itcs(私有队列)其中hugeB队列提交后需经批准shu和itcs为私有队列,不向公共用户开放 在命令行输入cchelp 可以查看详细的华师大的作业调度系统策略,如下二:作业调度系统的使用华师大计算中心共有两个登陆节点login(59.78.189.188)和login1(59.78.189.187),供用户登陆提交相关作业。一般来说,可直接使用命令行提交作业。不过为了规范和易于管理,建议使用PBS脚本进行作业提交,提交命令为qsub *.pbs(pbs脚本文件)。下面将简要的分别给出串行作业和并行作业的PBS样本(已放至/home/目录下),仅供参考,更多高级功能,请自行查阅相应手册。1. 串行作业pbs脚本样本#PBS -N test 表示该作业名称为test。#PBS -l nodes=1:ppn=1 表示申请1 个节点上的1 颗CPU。#PBS -j oe 表示系统输出,如果是oe,则标准错误输出(stderr)和标准输出(stdout)合并为stdout#PBS q serial 表示提交到集群上的serial 队列。./jobjob.log 为提交的作业。2. 并行作业PBS脚本样本并行作业脚本与串行类似,只需指定相应的mpi,并采用infiniband网络相应的格式即可。如下图,上图中使用的是intel mpi, 略作修改即可使用openmpi,如下图:三:作业调度系统相关命令1. 查看队列中的作业状态:qstat 利用qstat可以查看作业的运行状态:输入以上命令后,将会有如下输出:以上几列的含义分别为:作业号、作业名、用户名、使用的时间、状态、队列名。其中状态R表示运行中,Q表示排队中,H表示Hold。2. 终止作业:qdel 如果一个用户想终止一个作业,可以用qdel+作业号来取消。例如:qdel 34703. 查看集群整体负载情况:pestat如下图4. 显示节点信息:pbsnodes 利用pbsnodes可以显示系统各个节点的信息,比如空闲(free)、当机(down)、离线(offline)。例如:显示所有空闲的节点:p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论