版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、PBS作业管理系统内 容任务管理系统概述PBS作业调度系统作业调度系统的使用2022/9/212任务管理系统的功能单一系统映象机群松散的结构的整合系统资源整合异构系统的整合多用户的管理用户提交的任务的统一安排,避免冲突用户权限的管理非授权用户的控制2022/9/213任务管理系统的简史2022/9/214任务管理系统的比较2022/9/216内 容任务管理系统概述PBS作业调度系统作业调度系统的使用2022/9/217PBS的技术特色力求控制对批处理的初始化和调度执行,允许作业在不同主机间的路由。独立的调度模块存有各个可用的排队作业、运行作业和系统资源使用信息,并且允许系统管理员定义资源和每个
2、作业可使用的数量。在作业调度策略上,PBS提供了默认的公平共享和独占FIFO调度策略,还提供了TCL、BACL、C三种过程语言和调度类,并定义了一些调度需要的函数和完整的API,方便实现新的调度策略。提供文件传送,File Stage-in 和Stage-out。满足POSIX1003.2d 标准,支持作业依赖,和完整的安全认证。提供用户映射功能,使PBS 能用于用户不一致的系统中。2022/9/219PBS的结构2022/9/2110PBS 的组成服务器:pbs_server调度器:pbs_sched执行器:pbs_mom命令行:用户脚本,管理命令等2022/9/2111PBS 的基本原理2
3、022/9/2112PBS 的优缺点支持系统级检查点功能(需底层操作系统支持)很好的大规模扩展性独立的调度模块*支持作业依赖 符合POSIX 1003.2d 标准-只支持Unix类操作系统-多集群协作功能有限-不支持用户级检查点功能2022/9/2113术 语节点(node) 一个单一的操作系统映像,一个统一的虚拟内存映像一个或多个cpu,一个或多个IP地址的计算机系统被称之为一个节点。通常执行主机(execution host)也被称之为节点。节点属性 队列、服务器和节点都有与自己相关的属性,这些属性提供控制信息。与节点相关的属性有:状态、类型、虚拟处理器的个数、作业列表(本节点被分配给的作
4、业)以及节点的特性。 节点特性 为了提供一组节点的分配的方法,零个或者多个特性被赋给每个节点。这个特性不过是一串对于PBS没有含义的字母和数字的组合(第一个字符必须是字母)。2022/9/2114PBS在机群上安装由于节点系统相同,因而可以用如下SHELL script在node2node8上安装; 2022/9/2116服务进程配置和启动文件系统配置文件/etc/pbs.conf #!/bin/sh pbs_home=/var/spool/pbs 指定系统的pbs的设置的目录位置 pbs_exec=/usr/local 指定pbs可执行程序的目录位置 start_server=1 start
5、_sched=1 当为1是表示守护进程启动,0为守护进程不启动 start_mom=1 系统启动脚本 /etc/init.d/openpbs Server的系统启动脚本 /etc/init.d/pbs_server Scheduler系统启动脚本 /etc/init.d/pbs_sched Mom系统启动脚本 /etc/init.d/pbs_mom 2022/9/2117mom端设置mom配置目录: /var/spool/pbs/mom_priv/mom配置文件: /var/spool/pbs/mom_priv/config2022/9/2119Server端的动态设置PBS要能正常运行还需要
6、通过qmgr命令的server进行配置,设置一些属性。输入qmgr命令进入配置交互命令。下面是让PBS可以正常运行的一些步骤。2022/9/2120qmgr命令(管理员使用)输入qmgr进入交互式模式后即可输入各种命令 qmgr动作:对象类型和操作符 2022/9/2121PBS队列设置导入server配置文件:rootnode1 root# qmgr queue.conf配置文件例子:2022/9/2122Scheduler调度行为配置Scheduler的行为由配置目录下的sched_priv/sched_config文件进行控制Sort_by关键字控制调度算法可以选择的选项为 no_sor
7、t ,shortest_job_first,longest_job_first ,smallest_memory_first,largest_memory_first,high_priority_first,low_priority_first,multi_sort,fair_share,large_walltime_first,short_walltime_first修改这个文件后重新启动scheduler即可。2022/9/2123内 容任务管理系统概述PBS作业调度系统作业调度系统的使用2022/9/2124PBS 的基本命令在PBS系统中,用户使用qsub 命令提交用户程序。用户运行程
8、序的命令及PBS环境变量设置组成PBS作业脚本,作业脚本使用如下格式提交到PBS系统运行:2022/9/2126qsub运行参数2022/9/2127PBS的环境变量2022/9/2129PBS 作业脚本注释,以“#”开头PBS指令,以“#PBS”开头SHELL命令2022/9/2130PBS 作业脚本举例2022/9/2131详细示例编辑PBS脚本内容如下:(注意,#PBS行不是注释,所有说明行均以#开始,即红色字体部分)#声明作业名为mpi#PBS -N mpi #申请资源数为10个节点,每个节点16个cpu #PBS -l nodes=10:ppn=16#将标准输出信息与标准错误信息合并
9、输出到文件中#PBS -j oe#指定作业提交到low队列#PBS q low#估计最大运算时间为1000小时,若没有设置这项,系统为自动按所在队列默认walltime处理#PBS -l walltime=1000:00:002022/9/2132#在作业结束时,给用户发邮件#PBS -m e#声明邮箱地址,如#PBS -M #进入作业调度目录cd $PBS_O_WORKDIR#计算申请的cpu数目NP=cat $PBS_NODEFILE | wc -l#设置计算所需要的环境变量,如使用GNU版OpenMPI运行程序source /public/software/mpi/openmpi1.4-
10、gnu.sh#程序运行部分,使用infiniband网运行此程序mpirun -np $NP -machinefile $PBS_NODEFILE -mca btl self,openib cpi-openmpi2022/9/2133一个复杂的PBS作业脚本2022/9/2134查询和取消作业2022/9/2135查询作业运行的位置2022/9/2136ansys单节点计算ansys110 -np 4 -i wing.inp跨节点计算:ansys110 -dis -machines node22:4:node23:4 -i wing.inp2022/9/2137ansys.pbs#!/bin/
11、bash#PBS -N ansys_wing#PBS -l nodes=1:ppn=8#PBS -j oerm host.list -rffor node in cat $PBS_NODEFILEdoecho -e MPI_REMSH=/usr/bin/rsh -h $node -np 1 /home/demo/fluent/bin/ansys_inc/v110/ansys/bin/ansysdis110 -dis -mpi HPMPIdone host.listansys110 -mpifile ./host.list -i wing.inp2022/9/2138创建ma-node22nod
12、e23-需要注意最后有一个空行。fluent 3d t16 cnf=./ma p -g i fluent.jou2022/9/2139fluent.pbs#!/bin/bash#PBS -N fluent_8cpu#PBS -l nodes=2:ppn=4#PBS -j oeNPROCS=wc -l & m1_n2p8.out2022/9/2140cfxcfx5solve -def Benchmark.def -par-dist -start-method “HP MPI distributed Parallel” node1*2,node2*22022/9/2141cfx.pbs#!/bin
13、/bash#PBS -N CFX_8cpu#PBS -l nodes=4:ppn=2CFX_DEF_FILE=Benchmark.def# You dont need to modify the lines below #PeHostfile2MachineFile() cat $1 | while read line; do # echo $line host=echo $line2022/9/2142 # add here code to map regular hostnames into ATM hostnames if -z $mList ; then mList=$host*1 e
14、lse mList=$mList,$host*1 fi echo $mList doneCFX_PBS_NODEFILE=/tmp/cfx_whoami_$PBS_JOBIDPeHostfile2MachineFile $PBS_NODEFILE $CFX_PBS_NODEFILENPROCS=wc -l $PBS_NODEFILEcd $PBS_O_WORKDIR/public/software/ansys_inc/v110/CFX/bin/cfx5solve -def $CFX_DEF_FILE -par-dist tail -n1 $CFX_PBS_NODEFILE -start-met
15、hod HP MPI Distributed Parallel2022/9/2143abaqus/public/software/ABAQUS/6.8-PF3/site/abaqus_v6.env-mp_mpi_implementation = HPhpmpipath = driverUtils.locateFile(os.environ.get(ABA_PATH, ), External/mpi/hpmpi-/bin, mpirun)mp_mpirun_path = HP: hpmpipathmp_rsh_command = rsh -n -l %U %H %Cmp_host_list=no
16、de1,8,node2,8-abq68pf3 -j example cpus=162022/9/2144abaqus.pbs#!/bin/sh#PBS -N ABAQUS_4cpu#PBS -l nodes=2:ppn=2#PBS -j oeINPUT_FILE=circuit.inpOUTPUT_FILE=abaqus.logABAQUS_EXEC=/public/software/abaqus/Commands/abaqusABAQUS_ENV=/public/software/abaqus/6.5-6/site/abaqus_v6.env# for abaqus/standardABAQ
17、US_STANDARD_MEMORY=4096 mbABAQUS_PRE_MEMORY=4096 mbABAQUS_SCRATCH=/tmpABAQUS_MP_MODE=THREADS2022/9/2145# for abaqus/explictABAQUS_MP_MODE=MPI# You dont need to modify the lines below #GetNodeList() np=1 while read line; do host=$line if ! -z $lasthost ; then if $host = $lasthost ; then np=expr $np +
18、 12022/9/2146 else if -z $mList ; then mList=$lasthost,$np else mList=$mList,$lasthost,$np fi np=1 fi fi lasthost=$host done $12022/9/2147 if -z $mList ; then mList=$lasthost,$np else mList=$mList,$lasthost,$np fi echo $mListNODE_LIST=GetNodeList $PBS_NODEFILENPROCS=wc -l $PBS_NODEFILEcd $PBS_O_WORK
19、DIR2022/9/2148cp $ABAQUS_ENV abaqus_v6.envcat abaqus_v6.envstandard_memory=$ABAQUS_STANDARD_MEMORYpre_memory=$ABAQUS_PRE_MEMORYscratch=$ABAQUS_SCRATCHmp_mode=$ABAQUS_MP_MODEmp_host_list=$NODE_LISTEOFecho $ABAQUS_EXEC int j=$INPUT_FILE cpus=$NPROCS & $OUTPUT_FILE$ABAQUS_EXEC int j=$INPUT_FILE cpus=$NPROCS & $OUTPUT_FILE2022/9/2149feko.pbs#!/bin
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高职(老年服务与管理)老年人康复护理试题及答案
- 2025年高职(环境工程技术)环境监理基础试题及答案
- 2025年高职美发与形象设计(形象设计创意)试题及答案
- 2025年高职新材料(高分子应用实操)试题及答案
- 2025年大学安全教育(食品安全知识)试题及答案
- 2025年高职移动应用技术与服务(用户体验设计)试题及答案
- 2025年大学心理学(人格心理学实验)试题及答案
- 2026年税务实务(税务登记)试题及答案
- 2026年行政管理(公文流转效率)试题及答案
- 2025年高职(摄影后期)后期处理专项测试试题及答案
- GB/T 45610-2025煤矸石回填塌陷区复垦技术规程
- 装载通知单的构成及填制规定TheCompositionan
- 项目组合管理
- 渔业安全文化建设-深度研究
- 广西北海市2024-2025学年七年级上学期期末地理试题(含答案)
- 2025年度医养结合养老机构健康管理咨询合同
- 《烫金工艺技术要点》课件
- 2025中国供销集团校园招聘高频重点提升(共500题)附带答案详解
- 不扰民协议书范文多人签字模板
- 两人工地合作协议书范文范本
- 玻璃阳光房合同模板
评论
0/150
提交评论