PBS,QSUB任务管理命令_第1页
PBS,QSUB任务管理命令_第2页
PBS,QSUB任务管理命令_第3页
PBS,QSUB任务管理命令_第4页
PBS,QSUB任务管理命令_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1、后台提交作业qsub       语法: qsub -a date_time -A account_string -e path -h -I -j join -k keep -l resource_list -m mail_options -n Node_allocation_Method -L v1,v2,v3,v4 -M user_list -N name -o path -p priority -q pool -r y|n -u user_list -v variable_list -V script  

2、      参数: script参数被省略时,该命令可以从标准输入获得脚本文件名。       -a 间。格式为CCYYMMDDhhmm.SS。CC表示世纪,YY表示年(后两位数字),MM表示月(两位数字),DD表示天(两位数 字),hh表示小时(两位数字),mm表示分(两位数字),SS表示秒(两位数字)。如果DD指定的是未来日子,而未指定MM,则MM缺省值为当前月,否 则,MM的缺省值为下个月。如果hhmm指定的未来时间,而未指定DD,则DD的缺省值为当天,否则,DD的缺省值为明天。如果提交作

3、业时使用该选项,当 指定时间还没到时,作业状态显示为”W”。       -e 指定错误输出文件名,格式为hostname:path_home。Hostname是返回错误输出文件的主机名,path_home是错误输出文件 的绝对路径,如果指定了相对路径,则相对用户的主目录。不使用该选项时,缺省值是在用户主目录下,以“作业名.e作业ID”命名的文件       -o 指定输出文件名,格式为hostname:path_home。缺省值是在用户主目录下,以“作业名.e作业ID”命名

4、的文件       -h 指定在提交作业时,设置用户级u挂起。如果不指定,则设置挂起类型为n,即不挂起。       -I 指定作业以交互方式运行。       -j 指定合并错误输出和实际输出。如果指定oe,则合并到标准输出文件中;如果指定eo,则合并到标准错误输出文件中.       -k 指定执行主机是否保留错误输出和实际输出。如果指定o,则仅保留标准

5、输出;如果指定e,则仅保留标准错误输出;如果指定oe或eo,则保留标准输出和标准错误输出;如果指定n,则不保留任何输出。       -l 指定作业所需要的资源,设定对可消耗资源的限制。如果不设置,则无限制。例如: resource_name=value,resource_name=value,       LINUX系统可以设置的资源有cput, file, pcput, pmem, pvmem, vmem, walltime, arch, nodes, ncpus等;&#

6、160;      Cput指作业的所有进程使用cpu最长时间;       File指作业可以建立单个文件大小的最大限制;       Pcput指作业的单个进程可以使用CPU的最长时间;       vmem指作业可以使用的物理内存的最大值;       Pmem指作业的单个进程可以使用的物理内存的最大值

7、;       Pvmem指作业的单个进程可以使用的虚拟内存的最大值;       walltime指作业处于运行状态的最长时间;       arch 指定系统管理员所定义的系统结构类型;       host指定作业运行的主机名;       nodes指定作业独占使用的结点数目和属性,使用“+

8、”可以连接多种结点的定义。       结点的属性和主机名或数目之间通过“:”分隔。如果不指定结点数,则缺省为1。结点的属性包括ppn(每个结点上的进程数,缺省为1)和系统管理员设置的属性(如batch、bigmem)       例如:请求12个结点,不管其属性           -l nodes=12      

9、 请求12个属性为batch的结点和14个属性为bigmem的结点           -l nodes=12:batch+14:bigmem       请求4个结点,每个结点上使用2个CPU           -l nodes=4:ppn=2       software

10、指作业要求的软件包       -m 定义何时给用户发送有关作业的邮件。可设定的选项有:           n 不发送邮件           a 当作业被批处理系统中断时,发送邮件            b 当作业开始执行时,发送邮件  

11、0;        e 当作业执行结束时,发送邮件       -M 指定发送有关作业信息的邮件用户列表。格式为userhost,userhost,缺省值为提交作业的用户。       -N 指定作业的名字。缺省值为脚本的名字,如果没有指定脚本,则为STDIN。       -p 指定作业的优先级,优先级的范围是-1024, +1023。缺省值是没有优先级。

12、       -q 指定作业的目的地(结点池),目的地可有三种格式:              pool              server           &#

13、160;  poolserver       -r y|n 指定作业是否可重新运行。指定y时,作业可以重新运行;指定n时,作业不能重新运行。缺省值为n。       -v 格式为variable1,variable2,或variable1=value,variable2=value,这些变量和其值可以传递到作业中。       -V 指定qsub命令的所有的环境变量都传递到批处理作业中。 

14、0;         作用: 以脚本文件的形式向批处理服务器提交作业。           举例:           运行MPI程序的脚本cpi.ljrs如下:           #!/bin/sh 

15、60;         # Job name           #LJRS -N test           # Declare job non-rerunable           #LJRS -r n 

16、;          # Output files           #LJRS -e test.err           #LJRS -o test.log           # Mail to use

17、r           #LJRS -m ae           # pool name (small, medium, long, verylong)           #LJRS -q dque        &

18、#160;  # Number of nodes (node property ev67 wanted)           #LJRS -l nodes=8:batch           # This jobs working directory           echo Work

19、ing directory is $LJRS_O_WORKDIR           cd $LJRS_O_WORKDIR           echo Running on host hostname           echo Time is date   

20、60;       echo Directory is pwd           echo This jobs runs on the following processors:           echo cat $LJRS_NODEFILE       

21、0;   # Define number of processors           NPROCS=wc -l < $LJRS_NODEFILE           echo This job has allocated $NPROCS nodes          

22、# Run the parallel MPI executable “a.out”           mpirun -v -machinefile $LJRS_NODEFILE -np $NPROCS cpi                     1、把脚本文件cpi.ljrs提交到结点池dqu

23、e中运行。              $ qsub cpi.ljrs              35.console              $ qstat    &#

24、160;         Job id Name User TimeUse S Pool              35.console cpi zhangxq 0:00:00 R dque           2、把脚本作业cpi.ljrs提交到结点池long中运行,并且当作业开始运行时

25、,给用户发送电子邮件。              $qsub -P long -m b cpi.ljrs $qstat              Job id Name User TimeUse S Pool            

26、;  36.console cpi zhangxq 0 R long           3、使用15个结点运行cpi.ljrs,运行时间不能大于2小时,作业占用的内存能大于15mb              $qsub l nodes=15,walltime=2:00:00,mem=15mb cpi.ljrs    

27、        4、综合考虑CPU、内存、缓冲区、硬盘等因素的使用情况,设置其权值分别为5, 4, 3, 2.              $qsub l nodes=5 -n syn L 5, 4, 3, 2 cpi.ljrs           5、使用-I和l选项在指定的结点上交互式运行作业&#

28、160;             $ qsub I -l nodes=c0101              运行该命令后,系统将自动切换到c0101的虚拟终端,所有的标准输入和标准输出和标准错误输出均都显示在该终端上. 在系统出现”waiting to jobid to start”时,用户若按C键,即可中断该交互作业.当该交互作业已经启动后,用户

29、除了交互式运行作业外,还可进行以下操作:              . 该命令将使qsub退出,且终止作业。              Z挂起qsub,作业依然保持运行状态,无任何输入输出。用户可以在本地shell上提交命令。         

30、60;    Y部分挂起qsub,因为还可以给作业发送输入,而且接受作业的输出的同时,还可以在本地shell提交命令。     2、查看状态qstat       语法:qstat -f-W site_specific job_identifier. | destination.             qstat -Q -f-W site_specific

31、 destination.             qstat -B -f -W site_specific server_name.       参数:destination可以为pool,server,poolserver       作用:查看作业、结点池和批处理服务器的状态。命令格式一可以输出所指定作业ID或者结点池中所有作业的状态,命令格式二可以输出每个结点

32、池的状态信息,命令格式三可以输出服务器的状态。       举例:       1. 显示已经配置的所有结点池状态信息。           qstat -q       2. 显示已经提交的作业状态信息         

33、0; qstat -a       3. 显示指定作业的所有状态信息           $ qstat -f 23.console           mtime = Sun Apr 28 19:54:48 2002          

34、Output_Path = console:/home/zhangxq/cpi.o23           Priority = 0           qtime = Sun Apr 28 19:54:48 2002           Rerunable = True  &#

35、160;        Resource_List.cput = 00:00:59           Resource_List.nodect = 2           Resource_List.nodes = 2:ppn=1        &

36、#160;  Variable_List = LJRS_O_HOME=/home/zhangxq,LJRS_O_LANG=en_US                  4. 显示服务器的状态           $qstat B        

37、60;  Server Max Tot Que Run Hld Wat Trn Ext Status           console 0 0 0 0 0 0 0 0 Active     3、查询作业qselect       语法:qselect -a opdate_time -A account_string -h old_list -l resource_list -N nam

38、e -p oppriority -q destination -r y|n -s states -u user_list       参数:op表示某一个作业属性值和选项参数值之间的关系。如       .eq. (等于)       .ne. (不等于)       .ge. (大于或等于)     

39、60; .gt. (大于)       .le. (小于)       其它参数含义见qsub命令。       作用:列出符合选项要求的作业ID。这些作业来自于单个服务器。如果没有任何选项,该命令则列出该用户被授权的服务器上的所有作业。对那些普通用户来说,该命令只显示该用户所提交的作业。       举例:    &

40、#160;  1. 查询用户所提交的作业           $ qsub -q long cpi.ljrs           28.console           $ qselect        &#

41、160;  25.console           28.console       2. 查询指定结点池中的作业           $ qstat           Job id Name User TimeUse S P

42、ool           25.console cpi zhangxq 0 Q dque           29.console cpi zhangxq 0 R long           $ qselect -P dque      

43、;     25.console       3. 查询指定主机上的作业           $ qstat           Job id Name User TimeUse S Pool         

44、  25.console cpi zhangxq 0 Q dque           29.console cpi zhangxq 0 R long           $ qselect -P console           25.console   

45、        29.console     4、挂起作业qhold        语法:qhold -h hold_list job_identifier         作用:挂起批处理作业。挂起有三种类型:普通用户级u、管理员级(操作员级)o、系统级s,缺省值为不挂起n。用户只能在用户级别挂起自己提交的作业,操作员可以在用户级和操作员级挂起任何作业,系统管理员可

46、以在任何级别上挂起任何作业。        在执行该命令时,如果作业在运行结点池里排队,那么作业将直接被挂起;如果作业处于运行状态,为了中断作业的执行,必须采取其他办法。如果被挂起作业的主 机系统支持一致点检查或者重新启动,则挂起正在运行作业将引发以下操作:首先检查作业的一致性,然后释放该作业所占用的资源,最后该作业位于执行结点池 中,处于挂起状态;如果被挂起作业的主机系统不支持一致点检查或者重新启动,则仅设置指定的挂起作业类型,而实际上并不能挂起,除非调用qrerun命令 重新运行该作业时,该挂起请求才生效。  

47、      举例:        1. 使用普通用户身份挂起作业           $ qhold -h u 25.console $ qstat           Job id Name User TimeUse S Pool         

48、   25.console cpi zhangxq 0 H dque        2. 以操作员身份挂起作业            $ qhold -h o 25           qhold: Unauthorized Request 25.console       &#

49、160;   $ su root            $ qhold -h o 25           $ qstat           Job id Name User TimeUse S Pool          &#

50、160; 25.console cpi zhangxq 0 H dque     5、释放作业qrls        语法:qrls -h hold_list job_identifier .        作用:释放被挂起的批处理作业。由于作业的挂起有三种类型:USER、OPERATOR和SYSTEM。所以,要释放不同类型的作业挂起,用户就必须具有相应的权限。缺省为USER级      

51、;  举例:释放在普通用户和操作员级被挂起的作业。            $ qstat           Job id Name User TimeUse S Pool           25.console cpi zhangxq 0 H dque      &

52、#160;     $ qrls -h uo 25           $ qstat           Job id Name User TimeUse S Pool            25.console cpi zhangxq 0 Q dque   

53、0; 6、重新运行作业qrerun       语法:qrerun job_identifier .       作用:重新运行所指定的作业。       举例:如果作业允许别重新执行(缺省值是可以重新运行)。ROOT用户运行该命令,可以终止本次运行,把该作业放入其原来所在的结点池中,重新运行。           $

54、 qrerun 27           qrerun: Unauthorized Request 27.console           $ su root           $ qstat        

55、0;  Job id Name User TimeUse S Pool           25.console cpi zhangxq 0 Q dque           27.console cpi zhangxq 0 R dque           $ qrerun 27

56、0;          $ qstat           Job id Name User TimeUse S Pool           25.console cpi zhangxq 0 Q dque        

57、0;  27.console cpi zhangxq 0 R dque     7、更改作业属性qalter       语法:qalter -a date_time -A account_string -e path -h hold_list -j join -k keep -l resource_list -m mail_options -M user_list -N name -o path -p priority -r c -u user_list job_identifier

58、.       参数:各参数的含义见qsub命令。       作用:更改批处理作业的属性。主要修改所指定作业ID的相关属性(选项表中所列出的属性)。       举例:1. 更改批处理作业的运行时间属性。           $ qalter -a 0309251000 23.console  &

59、#160;    2. 更改给用户发送邮件的时间为作业中止和运行结束时           $ qalter m ae 23.console     8、删除作业qdel       语法:qdel -W delay|force job_identifier .       参数:-W 当指定delay 时,

60、表示在删除作业前需要等待的时间(秒)当指定force时,强制删除该作业。       作用:删除批处理作业。按照命令行中所指定的作业ID的顺序来删除作业。       举例:$ qstat           Job id Name User TimeUse S Pool         

61、  22.console cpi zhangxq 0 Q long           $ qdel 22     9、给作业发送消息qmsg       语法:qmsg -E -O message_string job_identifier .       参数:-E 将消息串写入错误输出文件   

62、;          -O将消息串写入输出文件       作用:给批处理作业发送消息。该命令通过给作业的所有者(批处理服务器)发送消息,从而把消息写入作业的输出文件,也就是说,该命令并不是直接把消息写入作业的输出文件。       举例:给正在运行的作业发送消息,该消息被写入所指定作业的错误输出文件中。        

63、;   $ qstat           Job id Name User TimeUse S Pool           25.console cpi zhangxq 0 Q dque           26.console cpi zhangxq 0 R dque

64、60;          $ qmsg “The job is running” 26           $ more cpi.e26           The job is running     10、在结点池之间移动作业qmove  

65、60;    语法:qmove destination job_identifier .       参数:destination可以为结点池名       作用:把批处理作业移到其他结点池中去运行。即把作业从所在的结点池中删除,并放在其他结点池中。       举例:          

66、 $ qstat           Job id Name User TimeUse S Pool           22.console cpi zhangxq 0 Q dque           $ qmove long 22      &

67、#160;    $ qstat           Job id Name User TimeUse S Pool           22.console cpi zhangxq 0 Q long     11、给作业发送信号qsig       语法:qsig -

68、s signal job_identifier .       参数:参数signal可以为信号名称,如SIGKILL,KILL,SIGNULL或者无符号整数,如9、0。       作用:给正在运行的批处理作业发送信号。如果不指定-S选项,则发送“SIGTERM”信号。如果有下列原因之一,如用户无权给作业发送信号、作业未处于运行状态和该信号请求对作业所运行的系统无效,则拒绝执行该命令请求。     12、查看和管理结点ljrsnode

69、s       语法:ljrsnodes - c|o|r nodename ljrsnodes - a|l        参数:-a 列出所有结点及其属性,属性包括“state”和“properties”       -c 清除结点列表中的“offline”或“down”状态设置,使结点可以被分配给作业。       -l 以行的方式列出被标记的结点的状态

70、-o 将指定结点的状态标记为“offline”。这将帮助管理员暂时停止某些结点的服务。       -r 清除指定结点的“offline”状态       作用:该命令可以标记结点的状态为“offline”、“down”或“free”,也可以帮助用户查看结点信息。除了”-a” 和“-l”选项外,使用其他选项需要拥有操作员和管理员权限。       举例:1、查看所有结点信息   

71、0;       ljrsnodes -a       2、将结点标记为“offline”状态           ljrsnodes o c0108       3、清除结点的“offline”状态设置         

72、0; ljrsnodes c c0108 或 ljrsnodes r c0108     13、查看所有计算结点的状态shownodes       语法:shownodes -h       作用:按照结点池分类显示各结点池中结点的状态,结点状态以不同颜色显示。并在结点名后以数字代表可用CPU数和总共CPU数。例如c0101-2/2, 表示c0101结点可用2CPU总共2CPU,c0102-1/2表示C0102可用1CPU总共2CPU

73、。       举例:$shownodes h用户通过qsub命令来向系统提交任务,有两种方式提交:脚本方式和命令行方式。(一般情况下,不允许root用户使用qsub命令提交作业)。下面先讲一下用这两种方式提交作业的过程。脚本方式提交用户将需要执行的程序或命令写入脚本中,再加入一些必要或者可选的语句,就可以通脚本方式提交。脚本提交比较方便,用户可以用最简单的文字编辑器(例如 vi)编写一个脚本,然后使用 qsub 命令提交该脚本,pbs 会按照脚本内容执行相应的任务。脚本提交的不足之处就是需要用户执行任务前编写脚本。脚本方式提交任务的

74、一般格式为:qsub script_name,script_name 是任务脚本的名称。下面介绍 pbs 任务脚本的编写方法。pbs 任务脚本包括三部分:    * shell 说明语句:用来说明用户使用的是哪种 shell,例如 #!/bin/sh说明用户需要使用 Bourne shell,如果用户没有指定,则默认为 Bourne shell    * pbs 指示语句:pbs 指示语句是用户用来请求任务运行时所需的资源或设置任务的一些属性的。以#PBS开头,如#PBS N taskname 是用来设置任务名称的

75、。pbs 指示语句是可选的,用户可以不用关心它如何写,系统会自动设置。    * pbs 指示句的一个主要作用是请求任务执行时所需要的系统资源,如 cpu 数目,存储容量,运行时间,运行优先级等等。以脚本方式提交的任务的资源请求是通过 pbs 指示语句,一般格式为 #PBS l 选项= 选项对应的值,如#PBS l ncpus=5 表示请求 5 个cpu为之服务。系统资源如下所示arch 所需要的系统结构,只用在资源块中 -l arch=linuxcput 任务的所有进程拥有的最大 cpu 执行时间 -l cput=1:00:00file 任务能够创建的

76、文件的大小 -l file=45mbhost 指定执行主机的名称 -l nodes=X:host 分配 X个主机名称 中含有 host的执行节点mem 任务的所有进程能够分配到的最大物理内存数 -l mem=100mbncpus 请求的 cpu数 -l ncup=5nice 任务运行时的 nice 优先级值 -l nice=3pcput 任务的任何一个进程拥有的最大 cpu 执行时间 -l pcput=1:00:00pmem 任务的任何一个进程能够分配到的最大物理内存数 -l pmem=45mbpvmem 任务的任何一个进程能够使用的虚拟内存的最大数 -l pvmem=100mbvmem 任务

77、的所有并发进程能够使用的最大虚存数 -l pvmem=100mbwalltime 任务可以处于运行态的最大 wall-clock 时间 -l walltime=1:00:00custom resources 用户自定义资源最常用的几种资源是:walltime, ncpus, mem, host。其它可以不用太关心。 资源请求的两种方式:a、资源块方式:资源块是将任务所需的资源作为一个整体,这个整体中说明了所需要的各种资源的数目。其格式为:-l select=N:chunk+N:chunk,如qsub l select=2:ncpus=3:mem=4gb:arch=linux ,sel

78、ect=2表示需要2个这样的资源块,一个资源块包括3个cpu,4gb的内存,系统结构要求是linux,即总共需要6个cpu,8gb的内存。再如:-l select=2:ncpus=1:mem=10GB+3:ncpus=2:mem=8GB:arch=solaris注意中间的+号,是两个资源块的分隔符b、请求全任务(job-wide)资源:格式为 l  keyword=value,keyword=value .如:qsub -l ncpus=4,mem=123mb,arch=linux任务(程序或命令):可以是用户程序(如C程序),也可以是系统命令下面是一个完整的任务脚本例子,

79、脚本名为 mytask:       1. #!/bin/sh                 /指明所用的 shell       2. #PBS N mytask     /设置任务名称    &

80、#160;  3. #PBS -l walltime=1:00:00       /请求任务执行时间       4. #PBS -l select=ncpus=4:mem=400mb    /请求任务执行所需资源       5. #PBS -j oe      &#

81、160;                /设置相关属性(文件合并)       6. date /t                      

82、60;    /系统命令(打印日期时间)       7. .my_application                 /所要执行的任务(当前目录名为 my_application的任务)       8. date /t  

83、     /  系统命令第 1 行说明所用的 shell;第 2 至5 行是 pbs 指示语句,设置了任务的一些属性,并请求了资源;第 6 至8行是要执行的命令及任务。编写完脚本后,使用 qsub 命令提交脚本,在 shell下输入:    qsub mytask后敲回车。系统会输出一个任务标识符:sequence-number.servername,如 ode01。sequence-number是任务编号,后面需要用这个号查看任务的执行状态,ervername是 pbs server

84、的名称。命令行方式提交命令行方式提交不用写脚本,用户可以直接从命令行输入。输入的内容基本上和在脚本中输入的相同。其基本格式如下:qsub <return>         /输入qsub命令后回车directives     /pbs指示语句(以#PBS为前缀)tasks       /任务或命令ctrl-D     

85、0;  /结束输入,提交任务对于上面用脚本方式提交的任务,用命令行方式提交的格式如下:       1. qsub       2. #PBS N mytask       3. #PBS l walltime=1:00:00       4. #PBS l select=ncpus=4:mem=4

86、00mb       5. #PBS -j oe       6. date /t       7. ./my_application       8. date /t注:以命令行方式提交任务时,这些命令选项都要以 pbs 指示语句的格式给出,即选项之前要加前缀#PBS。任务提交后,用户如果要知道任务的当前运行状态,可

87、以通过 qstat 命令查询。qstat 命令的常用选项有:无选项:当 qstat 命令不带任何选项时,以默认方式显示任务信息,例如    soofreenode32$ qstat    Job id           Name             User &#

88、160;      Time Use   S               Queue    -   -      -         

89、60; 569.node32    test             soofree          0             R    

90、0;          small其中,Job id 是任务的标识符,Name 是任务名称,User是任务所有者,Time Use 是CPU使用时间,S 是任务当前状态(本例中 R表示正在运行),Queue表示任务所在队列。任务的状态如下:        * B  只用于任务向量,表示任务向量已经开始执行        

91、;* E  任务在运行后退出        * H  任务被服务器或用户或者管理员阻塞        * Q  任务正在排队中,等待被调度运行        * R  任务正在运行        *

92、S  任务被服务器挂起,由于一个更高优先级的任务需要当前任务的资源        * T  任务被转移到其它执行节点了        * U  由于服务器繁忙,任务被挂起        * W  任务在等待它所请求的执行时间的到来(qsub -a)  

93、0;     * X  只用于子任务,表示子任务完成再举一例,使用-a 选项指定任务开始执行时间:    soofreenod32$ qsub -a 2102 test    571.node32    soofreenode32$ qstat    Job id         

94、;  Name     User    Time Use S  Queue    - - -     ode01      test       soofree     0   &

95、#160;W    default此时任务状态(S)显示 W,表示任务正在等待执行时间的到来PBS 命令与使用PBS(Portable Batch System)是由NASA开发的灵活的批处理系统。它被用于集群系统、超级计算机和大规模并行系统。PBS主要有如下特征:· 易用性:为所有的资源提供统一的接口,易于配置以满足不同系统的需求,灵活的作业调度器允许不同系统采用自己的调度策略。· 移植性:符合POSIX 1003.2标准,可以用于shell和批处理等各种环境。· 适配性:可以适配与各种管理策略,并提供可扩展的认证和安全模

96、型。支持广域网上的负载的动态分发和建立在多个物理位置不同的实体上的虚拟组织。· 灵活性:支持交互和批处理作业。OpenPBS( http:/www.OpenPBS.org/)是PBS的Open Source的实现。商业版本的PBS可以参照: 1、PBS命令   PBS提供4条命令用于作业管理。(1)     qsub 命令用于提交作业脚本命令格式:qsub  -a date_time -c interval -C directive_prefix-e path -I

97、 -j join -k keep -l resource_list  -m mail_options-M user_list-N name -o path -p priority -q destination -r c-S path_list -u user_list-v variable_list -V-W additional_attributes -zscript参数说明:因为所采用的选项一般放在pbs脚本中提交,所以具体见PBS脚本选项。例:# qsub  aaa.pbs      &#

98、160;  提交某作业,系统将产生一个作业号(2)     qstat 命令用于查询作业状态信息命令格式:qatat -f-a-i -n-s -R -Q-q-B-u参数说明:-f  jobid  列出指定作业的信息-a        列出系统所有作业-i         列出不在运行的作业-n &#

99、160;      列出分配给此作业的结点-s        列出队列管理员与scheduler所提供的建议-R       列出磁盘预留信息-Q       操作符是destination id,指明请求的是队列状态     -q   &

100、#160;    列出队列状态,并以alternative形式显示-au userid  列出指定用户的所有作业-B       列出PBS Server信息-r        列出所有正在运行的作业-Qf queue 列出指定队列的信息-u        若操作符为作业号,则列出其状态。若操作符为

101、destination id,则列出运行在其上的属于user_list中用户的作业状态。例:# qstat -f 211      查询作业号为211的作业的具体信息。(3) qdel 命令用于删除已提交的作业命令格式:qdel  -W 间隔时间 作业号命令行参数:例:# qdel -W 15 211            15秒后删除作业号为211的作业(4)

102、60;    qmgr 命令用于队列管理  qmgr -c "create queue batch queue_type=execution"  qmgr -c "set queue batch started=true"  qmgr -c "set queue batch enabled=true"  qmgr -c "set queue batch resources_default.node

103、s=1"  qmgr -c "set queue batch resources_default.walltime=3600"  qmgr -c "set server default_queue=batch"2、PBS脚本文件PBS脚本文件由脚本选项和运行脚本两部分组成。(1) PBS作业脚本选项 (若无-C选项,则每项前面加#PBS)            -a  date_time : date_time格式为:CCYYMMDDhhmm.SS                                &#

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论