用户使用手册ppt课件_第1页
用户使用手册ppt课件_第2页
用户使用手册ppt课件_第3页
用户使用手册ppt课件_第4页
用户使用手册ppt课件_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国科学院合肥分院物质科学计算中心,浪潮天梭用户手册,目录,集群硬件配置集群软件配置登录、退出系统主要目录使用计算任务投放软件安装及使用规范关机和启动维护人员联系方式,一:集群硬件配置,集群物理拓扑图,用户,提交作业,编译调试可视化,31,32,集群的并行配置信息,Inspurgroup,集群硬件配置,112个NX7140N计算刀片(双路四核Nehalem2.8GHz处理器,DDR33GB/core)一个刀片为两颗CPU,8核心,最大内存为24Gb24XeonX7460(2.66GHz/6c)/16ML3/1066MHz,4GB/core共两个胖节点,每个胖节点四颗CPU,24核心,最大内存为96Gb16.2T容量的LUSTRE并行文件系统8T容量的存储系统(4Gb光纤存储)1个登陆节点和管理节点,2个网格节点高速互联网络环境(20GbpsInfiniBand计算网络+1000M管理网络)合肥分中心的聚合计算能力为10万亿次/秒,总存储容量24.2T。,二:集群软件配置,三:登录、退出系统,1.登录方式SSH:缺省提供,该登录方式有一定强度的加密安全保证软件可以使用Putty,Sshclient,Xmanager等2.文件上传与下载SFTP:缺省提供,暂不提供FTP方式Windows下传送文件:Sshclient,Xmanager等自带文件传输功能软件还可以使用SecureFX、WinSCP等Linux下传送文件:scp-r文件夹名dyliu32:/lustre/ISSP2/dyliu/scp文件名dyliu32:/lustre/ISSP2/dyliu/,三:登录、退出系统,3.长时间误操作,请结束访问,避免占用系统资源4.结束系统访问必要操作非停电、断网等意外设备故障导致,严禁在终端上直接关闭访问窗口或直接关闭终端电源实现结束系统访问。SSH访问必需主动使用exit命令一到多次确保最终结束连接。5.为安全考虑,系统具有防火墙配置,用户如果发现在非断网情况下无法登陆节点,有可能是自己的IP不在防火墙允许的IP段,需要查看自己的IP地址,把IP段告知管理员开放。,登陆天梭集群系统:提交作业登陆节点ssh-lyourcount32用户可以在登录节点查看目录、编辑文件、查看提交作业情况等。但是用户不允许在登录节点运行计算程序或前后处理程序,也不允许进行程序编译。编译、调试、可视化胖节点1ssh-lyourcount31用户可以登录编译节点(胖节点1)进行程序编译。第一次登陆,修改密码yppasswdusername设置环境变量vi/.bashrcsource/opt/intel/impi/3.1/bin64/mpivars.shsource/opt/intel/cce/10.1.021/bin/iccvars.shsource/opt/intel/fce/10.1.021/bin/ifortvars.shsource/opt/intel/mkl/25/tools/environment/mklvarsem64t.sh保存退出后source/.bashrc,三:登录、退出系统,四:主要目录使用,主目录:为登录后缺省进入的目录/home/每用户默认限制容量为50Gb,用于安装自用软件,备份文件,保存计算结果文件主目录用于系统存放管理用户的登陆和所使用软件配置文件,可以安装个人所需软件,严禁用户随意存放执行程序的临时文件和非相关的文件,避免占用和耗费宝贵的系统存储资源,影响登陆连接服务。每次登陆后在属主目录下使用命令du-kh|sortn主动检查异常或较大的文件并作相应清理。2.工作目录:/lustre/yourid总容量9.6TB,单用户无容量限制,作为运算临时文件目录,请及时删除临时文件,三个月内无访问的文件将被系统自动删除,存储空间使用,系统使用lustre并行文件系统提高I/O性能,作为工作目录,由于其承载压力较大,容易出现硬盘故障,因此,该目录只存放计算中的临时文件,请及时将结果文件备份回主目录或自己的个人电脑中。主目录(home)只允许存放最终结果文件,严禁将运算临时目录指向属主目录,如违规操作,造成属主目录损坏,管理员有权追究其责任。主目录有磁盘配额限制,如需扩大容量(例如需要安装专用软件),可向管理员申请协调。应及时清除临时文件和计算中程序设计生成的监控跟踪记录文件。临时性文件存放不要超过三个月。重要数据应打包或再压缩存放。工作目录(lustre)中存放的临时文件,请及时清除,管理员会定期清理长时间无访问文件,如因未及时备份而被误删,管理员不承担任何责任。严禁在主目录中存放无关文件,如发现违反,管理员将调低该用户磁盘配额。,五:计算任务投放,1.不论任务有多紧急,请务必先检测提交程序的正确性以及资源占用的合理适度,通过小批量测试数据预估占用CPU、内存和存储资源,强烈建议进行代码优化以减少CPU、内存、I/O资源占用,及时释放申请的内存,优化文件目录读写访问等I/O功能,避免资源和计算时间的浪费。总内存利用不能超过(平均每刀片节点:24Gb+8Gb(swap);大内存任务投放至胖节点队列(fuque):96Gb+16Gb(swap),否则会造成作业杀不掉、死机等情况。2.大规模资源占用(占用实际内存超过1/4)或紧急任务时务必先联系管理员协调。3.计算任务提交后,应注意定时查看自己任务状态,当需要杀死自己进程或删除任务时,以用qdel命令,如果无法删除必要时联系管理员协助。4.应及时清除临时文件和计算中程序设计生成的监控跟踪记录文件。临时性文件存放不要超过三个月。重要数据应打包或再压缩存放。5.不能在主目录(home)下存放任务临时文件,提交作业时必须指定作业输出路径为工作目录(lustre)。6.不能在登陆节点上直接运行任务,只能在登陆节点提交查看作业、简单的vi编辑、查看、管理自己的数据以及程序。,PBS基本组件pbscommand:用于提交、监视、修改和删除作业。pbsserver:提供基本的批处理服务,例如接收/创建一个批处理作业,管理维护作业队列,管理输出结果等。pbsmom:是一个守护进程,从pbsserver处接收作业后放入其执行队列中等待执行。scheduler(maui):对用户提交的作业进行调度,五:计算任务投放,在登录节点,用户必须通过作业脚本提交作业!,作业调度软件采用ProPBS,计算任务是通过脚本文件提交到作业管理系统的。,PBS基本命令qsub作业提交脚本qstat参数qdel作业号,五:计算任务投放,(1)提交作业的命令qsub作业提交脚本此命令执行后,会给出个作业号(2)查询作业命令qstat参数-q列出系统队列信息-Q:列出队列的一些限制信息-an:列出队列中的所有作业-r:列出正在运行的作业-fjobid:列出指定作业在信息-Qfqueue:列出指定队列的所有信息-B:列出PBS服务器的相关信息,目前可用队列:paraque并行队列,可用资源:108nodesx8核心;serique串行队列,可用资源:4nodesx8核心;fuque胖节点队列,可用资源:2nodesx24核心,(3)作业删除命令qdel作业号其中作业号为qsub提交后系统所给出的一个号码注意事项1、非root用户只能查看、删除自己提交的作业2、在提交作业时一定要根据自己的使用的机器数估算内存,选择正确的队列:串行作业一定要放在serique队列,并行作业放在paraque,大内存需求(24Gb)作业放在fuque队列。3、检查PBS脚本是否正确,一定要严格按照规范格式书写。不规范的PBS脚本可导致作业提交失败,甚至造成作业杀不掉,计算刀片死机等。,五:计算任务投放,提交作业,查询作业(1),五:计算任务投放,作业管理,查询作业(2),查询作业(3),作业管理,五:计算任务投放,删除作业,作业管理,五:计算任务投放,五:计算任务投放,作业脚本的编写基本参数#!/bin/bash#PBS-d/lustre/ISSP2/dyliu/workdir#PBS-o/lustre/ISSP2/dyliu/output#PBS-e/lustre/ISSP2/dyliu/error#PBS-lnodes=2:ppn=8#PBS-lwalltime=240:00:00#PBS-lmem=4gb#PBS-qparaque作业脚本可到计算中心网页下载,五:计算任务投放,配置MPI环境(VASP)ulimit-sunlimitedsource/opt/intel/Compiler/11.1/046/bin/intel64/iccvars_intel64.shsource/opt/intel/Compiler/11.1/046/bin/intel64/ifortvars_intel64.shsource/opt/intel/mkl/25/tools/environment/mklvarsem64t.shsource/opt/intel/impi/3.1/bin64/mpivars.shEXEC=/opt/issp2/vasp_4.6.28,五:计算任务投放,配置MPI环境(VASP)NP=cat$PBS_NODEFILE|wc-lNN=cat$PBS_NODEFILE|sort|uniq|tee/tmp/nodes.$|wc-lcat$PBS_NODEFILE/tmp/nodes.$sed-is/$/-ib:8/tmp/nodes.$mpdboot-n$NN-f/tmp/nodes.$-rsshmpiexec-genvI_MPI_DEVICErdma-machinefile/tmp/nodes.$-n$NP$EXECmpdallexitrm-f/tmp/nodes.$,五:计算任务投放,配置环境wien2kaliaslsi=ls-aslp*.in*aliaslso=ls-aslp*.ou*aliaslsd=ls-aslp*.defaliaslsc=ls-aslp*.cl*aliaslss=ls-aslp*.sc*aliaslse=ls-aslp*.erroraliaspslapw=ps-ef|greplapwaliascdw=cd$curdirexportEDITOR=xterm-eviexportSCRATCH=$curdir,四:计算任务投放,配置环境wien2kexportWIENROOT=/opt/issp2/wien2kexportW2WEB_CASE_BASEDIR=$curdirexportSTRUCTEDIT_PATH=$WIENROOT/SRC_structeditor/binexportPDFREADER=acroreadexportPATH=$PATH:$WIENROOT:$STRUCTEDIT_PATH:.exportOCTAVE_EXEC_PATH=$PATH:exportOCTAVE_PATH=$STRUCTEDIT_PATH:exportPATH=$PATH:$WIENROOT:.ulimit-sunlimitedaliasoctave=octave-p$OCTAVE_PATH,五:计算任务投放,配置环境wien2kEXEC=/opt/issp2/wien2k/runsp_lapw-ec0.00001-cc0.00001-i400-pcat$PBS_NODEFILEnodelist.$sed-is/$/-ib/nodelist.$echo#.machinesechogranularity:1.machinesecholapw0:sed-n1pnodelist.$.machinesforiincatnodelist.$doecho1:$i.machinesdoneechoextrafine:1.machinesrm-fnodelist.$EXEC,五:计算任务投放,配置环境GaussianexportGAUSS_EXEDIR=/opt/issp2/g03exportg03root=/opt/issp2/exportPATH=/opt/issp2/g03:/opt/issp2/g03/linda7.2/opteron-linux-I8/bin:$PATHexportGAUSS_SCRDIR=/lustre/ISSP2/dyliu/g03tmpexportLINDA_PATH=/opt/issp2/g03/linda7.2/opteron-linux-I8source/opt/issp2/g03/bsd/file/opt/issp2/g03$FILENAME,作业脚本注意事项为减少资源消耗,系统配置采用autofs,20分钟无操作,即会卸载目录,因此,在脚本中,需使用绝对路径,保证任务可以正常运行作业脚本参考VASPWien2kg03castepdmol3espresso,五:计算任务投放,六:软件安装及使用规范,1.系统默认安装了部分公用软件,位置在/opt下,主要为Intel编译器、MPI及数学库。2.各研究室公用应用软件分别安装在/opt/目录下3.用户如果有特殊软件需求,可以申请安装于公用目录下,也可以安装于自己属主目录下,如果该软件使用人员较多,推荐安装于公用目录下,减少对属主目录的空间占用。4.使用时,应注意用户的环境变量,修改属主目录下的.bashrc文件,设置正确的用户环境变量。5.作业脚本中,应使用软件绝对路径指明应用软件所在位置。6.严禁未经许可擅自修改公用软件。,六:软件安装及使用规范,应用软件按照各研究室安装于/opt/目录下,如issp2:,六:软件安装及使用规范,用户环境变量配置举例:vi/.bashrc#g03#exportGAUSS_EXEDIR=/opt/issp2/g03exportg03root=/opt/issp2exportPATH=/opt/issp2/g03/:/opt/issp2/g03/linda7.2/opteron-linux-I8/bin:$PATHexportGAUSS_SCRDIR=/lustre/ISSP2/exportLINDA_PATH=/opt/issp2/g03/linda7.2/opteron-linux-I8source/opt/issp2/g03/bsd/file#intel#source/opt/intel/impi/3.1/bin64/mpivars.shsource/opt/intel/cce/10.1.021/bin/iccvars.shsource/opt/intel/fce/10.1.021/bin/ifortvars.shsource/opt/intel/mkl/25/tools/environment/mklvarsem64t.sh,七:关机和启动,1.遇有紧急情况和计划

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论