



免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
服务器的基本状况:一个2T硬盘的前端存储节点,名称为tccl_front;9台8核的计算节点,名称分别为tccl01-tccl09。操作系统为CentOS 5.3 x86_64版本的Linux系统。NIS服务已经配置好,存储节点的磁盘用NFS挂载在每个计算节点上作为共享磁盘。所有的应用软件都安装在此共享磁盘上。1.ssh免密码登录.对每个用户都要设置。2.下载Torque,解压缩,编译。目前,torque 2.3是稳定版本,2.4是beta版本。为了稳定,我下载的是2.3.9版本。下载地址:/downloads/torque在PBS服务器节点上:tar xvfz torque-2.3.9.tar.gzconfigure需要加参数./configure -enable-docs -with-scp -enable-syslog makemake packagesmake install将torque-package-mom-linux-i686.sh,torque-package-clients-linux-i686.sh安装到计算节点上。将这两个文件拷贝到计算节点上(或者是共享磁盘上),登录进计算节点,运行:./torque-package-mom-linux-i686.sh -install./torque-package-clients-linux-i686.sh -install可以使用dsh之类的工具来辅助。或者手工写一个脚本来完成这些工作。3.配置pbs_mom为服务在torque源码包contrib目录中有一个文件cp contrib/init.d/pbs_mom /etc/init.d/pbs_momchkconfig -add pbs_mom在所有的机器(pbs服务器和计算节点)上都需要如此设置。写脚本来完成吧!比如for i in seq 1 9do echo tccl0$issh tccl0$i some commanddone4.配置torque1) ldconfig2) Specify Compute Nodes编辑文件/var/spool/torque/server_priv/nodes内容如下(注意,这里使用的都是机器的简称,与使用免密码登录时的机器名称相同):tccl01 np=8 smallmemtccl02 np=8 smallmemtccl03 np=8 bigmemtccl04 np=8 bigmemtccl05 np=8 bigmemtccl06 np=8 24G_Mem fastcputccl07 np=8 24G_Mem fastcputccl08 np=8 20G_Mem fastcputccl09 np=8 24G_Mem fastcpu3)Configure TORQUE on the Compute Nodes按照系统的情况,配置如下:在计算节点上编辑文件/var/spool/torque/mom_priv/config内容如下:$pbsserver tccl_frontarch x86_64opsys RHEL$logevent 255$ideal_load 4.0$max_load 8.0$tmpdir /tmp4)初始化torque.setup root这会生成最基本的一个设置,有一个batch队列。如果需要比较复杂的队列,建议自己写一个配置文件,比如queue.conf文件。下面是一个有short,medium,long 共3个队列的配置文件:# Create queues and set their attributes.# Create and define queue batch#create queue batch#set queue batch queue_type = Execution#set queue batch resources_default.nodes = 1#set queue batch resources_default.walltime = 01:00:00#set queue batch enabled = True#set queue batch started = True#Short queuecreate queue shortset queue short queue_type = Executionset queue short resources_default.nodes=1set queue short Priority = 1000set queue short max_running=20set queue short max_queuable=40set queue short max_user_run=10set queue short max_user_queuable=20set queue short resources_min.walltime=00:00:10set queue short resources_max.walltime=12:00:00set queue short resources_default.walltime = 12:00:00set queue short resources_default.neednodes = smallmemset queue short enabled = Trueset queue short started = True#Medium queuecreate queue mediumset queue medium queue_type = Executionset queue medium resources_default.nodes=1set queue medium Priority = 100set queue medium max_running=12set queue medium max_queuable=20set queue medium max_user_run=4set queue medium max_user_queuable=8set queue medium resources_min.walltime=12:00:10set queue medium resources_max.walltime=48:00:00set queue medium resources_default.walltime = 24:00:00set queue medium enabled = Trueset queue medium started = Trueset queue medium resources_default.neednodes = fastcpu#Long queuecreate queue long set queue long queue_type = Executionset queue long resources_default.nodes=1set queue long Priority = 10set queue long max_running=10set queue long max_queuable=12set queue long max_user_run=3set queue long max_user_queuable=6set queue long resources_min.walltime=48:00:00set queue long resources_max.walltime=480:00:00set queue long resources_default.walltime = 72:00:00set queue long resources_default.neednodes = bigmemset queue long enabled = Trueset queue long started = True# Set server attributes.#set server scheduling = Trueset server acl_hosts = tccl_frontset server acl_hosts += tccl_front.tccl_groupset server acl_hosts += tccl01,tccl02,tccl03,tccl04,tccl05,tccl06,tccl07,tccl08,tccl09set server acl_host_enable = trueset server managers = roottccl_front.tccl_groupset server operators = roottccl_front.tccl_groupset server default_queue = shortset server log_events = 511set server mail_from = admset server scheduler_iteration = 10set server node_check_rate = 120set server tcp_timeout = 6set server mom_job_sync = Trueset server keep_completed = 120#set server next_job_number = 0set server query_other_jobs = True运行qmgr queue.conf即可完成两个队列(long,short)的基本设置。需要注意的问题:/etc/hosts设置# Do not remove the following line, or various programs# that require network functionality will fail. localhost localhost:1 tccl_front6.tccl_group localhost618 tccl_front.tccl_group tccl_front tccl01.tccl_group tccl01 tccl02.tccl_group tccl02 tccl03.tccl_group tccl03 tccl04.tccl_group tccl04 tccl05.tccl_group tccl05 tccl06.tccl_group tccl06 tccl07.tccl_group tccl07 tccl08.tccl_group tccl080 tccl09.tccl_group tccl09包含tccl_front的应该是192.168.*.*的IP,而不能是外网IP或者的IP,切记!5.安装mpiexec,这个是为了方便运行nwchem等程序。否则,删除任务以后,实际上没有将mpirun杀死。/djohnson/mpiexec/index.php下载,解压缩以后./configure -with-pbs=/var/spool/torque -with-prefix=/home_srv/scicons/mpich/mpiexe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年版中外合作经营企业合同示范文本
- 第13课 长短参差说课稿-2025-2026学年小学书法练习指导六年级上册湘美版
- 2025电竞馆收银员雇佣合同
- 塑料厂消防演练实施管理规定
- Module 7 Unit 1说课稿-2024-2025学年外研版英语-九年级上册
- 化肥厂复合肥运输管控细则
- 快递行业服务合同协议(2025修订版)
- 《红楼梦》整本书阅读起始课 教学设计 2023-2024学年统编版高中语文必修下册
- 环保技术研发合同协议
- 第20课《天上的街市》说课稿 2024-2025学年统编版语文七年级上册
- 2024-2030年中国化工新材料行业需求趋势及发展可行性分析报告
- 中煤集团公司职称计算机试卷高级
- DB35T 772-2023 行业用水定额
- 心血管内科介入管理制度、岗位职责及工作流程
- 浙江省宁波市鄞州区曙光中学2024-2025学年九年级上学期10月月考科学试卷(1-3章)
- 2026年全年日历表带农历(A4可编辑可直接打印)预留备注位置
- 载人航天术语
- 2024年高考英语训练动词(谓语、非谓语)单句语法填空50题
- 旅游项目可行性分析报告
- 招商代理及商业运营服务 投标方案(技术方案)
- 中心静脉深静脉导管维护操作评分标准
评论
0/150
提交评论