




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国科学院合肥分院,浪潮集群使用规范,Inspurgroup,集群的软硬件配置,Inspurgroup,集群物理拓扑图,Inspurgroup,图例:,图例:,Inspurgroup,内容提要,账号的申请和使用登录、退出系统连接属主目录使用计算任务投放存储空间使用软件安装及使用规范关机和启动维护人员联系方式,一:账号的申请和使用,1.严禁使用集群账号及计算、存储资源进行与账号所属项目无关的任何活动和行为,违者必究并将视影响、损失轻重予以锁闭账号等处理。2.主机资源申请,联系系统管理员进行申请。管理员联系方式见本指南维护人员联系方式。3.建议避免公用账号,避免项目移交的时候数据混乱。4.人员发生调动时,请调动人员做好数据移交,并及时通知管理员申请权限改动。5.临时用户项目结束或阶段性完成时,请及时通知管理员清理/锁闭/注销临时账号及项目组成员账号。6.注销账号时请整理好用此账号建立的所有数据,做好移交及备份清理工作,并至少提前一天通知管理员。7.数据和程序(非公用程序)文件一律存放于自己的属主目录下,计算临时文件存放于工作目录下(lustre),计算临时文件不得存放于自己的属主目录下。8.个人账号只限个人使用,严禁将帐号和密码泄露给外单位和项目组外人员,公共组账号由管理员负责控制和使用分发。9.密码应定期(三个月)更换,建议8位以上并注意加强密码复杂度。,Inspurgroup,二:登录、退出系统连接,1.登录方式SSH:缺省提供,该登录方式有一定强度的加密安全保证软件可以使用Putty等2.文件上传与下载SFTP:缺省提供,暂不提供FTP方式软件可以使用SecureFX、WinSCP等3.登录系统后的必要操作使用mail命令,检查系统发送给用户的通知和信息在属主目录下使用命令du-kh|sort-n,查看异常或较大的文件,并做相应的清理,Inspurgroup,二:登录、退出系统连接,4.长时间误操作,请结束访问,避免占用系统资源5.结束系统访问必要操作非停电、断网等意外设备故障导致,严禁在终端上直接关闭访问窗口或直接关闭终端电源实现结束系统访问。SSH访问必需主动使用exit命令一到多次确保最终结束连接。,Inspurgroup,登陆天梭集群系统ssh-l(yourcount)32第一次登陆设置环境变量vi/.bashrcsource/opt/intel/impi/3.1/bin64/mpivars.shsource/opt/intel/cce/10.1.021/bin/iccvars.shsource/opt/intel/fce/10.1.021/bin/ifortvars.shsource/opt/intel/mkl/25/tools/environment/mklvarsem64t.sh保存退出后source/.bashrc使用命令du-kh|sort-n,查看异常或较大的文件,11/20/2019,Inspurgroup,二:登录、退出系统连接,三:属主目录使用,1.属主目录为登录后缺省进入的目录:/home/2.属主目录用于系统存放管理用户的登陆和所使用软件配置文件,严禁用户随意存放执行程序的临时文件和非相关的文件,避免占用和耗费宝贵的系统存储资源,影响登陆连接服务。每次登陆后在属主目录下使用命令du-kh|sortn主动检查。异常或较大的文件并作相应清理。3.属主目录可以安装个人所需软件,如果软件所占空间较大,请联系管理员,修改属主目录文件配额。,Inspurgroup,四:计算任务投放,1.不论任务有多紧急,请务必先检测提交程序的正确性以及资源占用的合理适度,通过小批量测试数据预估占用CPU、内存和存储资源,强烈建议进行代码优化以减少CPU、内存、I/O资源占用,及时释放申请的内存,优化文件目录读写访问等I/O功能,避免资源和计算时间的浪费。2.大规模资源占用(占用实际内存超过1/4)或紧急任务时务必先联系管理员协调。3.计算任务提交后,应注意定时查看自己任务状态,当需要杀死自己进程或删除任务时,以用qdel命令,如果无法删除必要时联系主机组协助。4.应及时清除临时文件和计算中程序设计生成的监控跟踪记录文件。临时性文件存放不要超过三个月。重要数据应打包或再压缩存放。5.不能在属主目录(登陆目录)下存放任务临时文件,必须在工作目(lustre)录中存放临时文件。6.不能在登陆节点上直接运行任务,只能在登陆节点做简单的vi编辑、查看、管理自己的数据以及程序。7.刀片节点单个任务不能超过24GB内存。大内存任务投放至fuque上。,Inspurgroup,PBS基本组件pbscommand:用于提交、监视、修改和删除作业。pbsserver:提供基本的批处理服务,例如接收/创建一个批处理作业,管理维护作业队列,管理输出结果等。pbsmom:是一个守护进程,从pbsserver处接收作业后放入其执行队列中等待执行。scheduler(maui):对用户提交的作业进行调度,Inspurgroup,四:计算任务投放,Torque应该如何使用?熟悉Torque提供的几个命令编写作业提交脚本了解使用注意事项PBS命令qsub作业提交脚本qstat参数qdel作业号,Inspurgroup,四:计算任务投放,PBS命令详解提交作业的命令qsub作业提交脚本此命令执行后,会给出个作业号查询作业命令qstat参数其中参数可为:-q列出系统队列信息-Q:列出队列的一些限制信息-an:列出队列中的所有作业-r:列出正在运行的作业-fjobid:列出指定作业在信息-Qfqueue:列出指定队列的所有信息-B:列出PBS服务器的相关信息,Inspurgroup,四:计算任务投放,PBS命令详解作业删除命令qdel作业号其中作业号为qsub提交后系统所给出的一个号码注意事项1、非root用户只能查看、删除自己提交的作业2、在提交作业时一定要根据自己的使用的机器数估算内存,把其写进作业提交脚本里。3、root用户无法提交作业4、检查PBS脚本是否正确,任务投放到testque上,Inspurgroup,四:计算任务投放,Inspurgroup,四:计算任务投放,作业脚本的编写基本参数#!/bin/bash#PBS-d/lustre/ISSP2/dyliu/workdir#PBS-o/lustre/ISSP2/dyliu/output#PBS-e/lustre/ISSP2/dyliu/error#PBS-lnodes=2:ppn=8#PBS-lwalltime=240:00:00#PBS-lmem=4gb#PBS-qallque,Inspurgroup,四:计算任务投放,配置MPI环境(VASP)ulimit-sunlimitedsource/opt/intel/Compiler/11.1/046/bin/intel64/iccvars_intel64.shsource/opt/intel/Compiler/11.1/046/bin/intel64/ifortvars_intel64.shsource/opt/intel/mkl/25/tools/environment/mklvarsem64t.shsource/opt/intel/impi/3.1/bin64/mpivars.shEXEC=/opt/issp2/vasp_4.6.28,Inspurgroup,四:计算任务投放,配置MPI环境(VASP)NP=cat$PBS_NODEFILE|wc-lNN=cat$PBS_NODEFILE|sort|uniq|tee/tmp/nodes.$|wc-lcat$PBS_NODEFILE/tmp/nodes.$sed-is/$/-ib:8/tmp/nodes.$mpdboot-n$NN-f/tmp/nodes.$-rsshmpiexec-genvI_MPI_DEVICErdma-machinefile/tmp/nodes.$-n$NP$EXECmpdallexitrm-f/tmp/nodes.$,Inspurgroup,四:计算任务投放,配置环境wien2kaliaslsi=ls-aslp*.in*aliaslso=ls-aslp*.ou*aliaslsd=ls-aslp*.defaliaslsc=ls-aslp*.cl*aliaslss=ls-aslp*.sc*aliaslse=ls-aslp*.erroraliaspslapw=ps-ef|greplapwaliascdw=cd$curdirexportEDITOR=xterm-eviexportSCRATCH=$curdir,Inspurgroup,四:计算任务投放,配置环境wien2kexportWIENROOT=/opt/issp2/wien2kexportW2WEB_CASE_BASEDIR=$curdirexportSTRUCTEDIT_PATH=$WIENROOT/SRC_structeditor/binexportPDFREADER=acroreadexportPATH=$PATH:$WIENROOT:$STRUCTEDIT_PATH:.exportOCTAVE_EXEC_PATH=$PATH:exportOCTAVE_PATH=$STRUCTEDIT_PATH:exportPATH=$PATH:$WIENROOT:.ulimit-sunlimitedaliasoctave=octave-p$OCTAVE_PATH,Inspurgroup,四:计算任务投放,配置环境wien2kEXEC=/opt/issp2/wien2k/runsp_lapw-ec0.00001-cc0.00001-i400-pcat$PBS_NODEFILEnodelist.$sed-is/$/-ib/nodelist.$echo#.machinesechogranularity:1.machinesecholapw0:sed-n1pnodelist.$.machinesforiincatnodelist.$doecho1:$i.machinesdoneechoextrafine:1.machinesrm-fnodelist.$EXEC,Inspurgroup,四:计算任务投放,配置环境GaussianexportGAUSS_EXEDIR=/opt/issp2/g03exportg03root=/opt/issp2/exportPATH=/opt/issp2/g03:/opt/issp2/g03/linda7.2/opteron-linux-I8/bin:$PATHexportGAUSS_SCRDIR=/lustre/ISSP2/dyliu/g03tmpexportLINDA_PATH=/opt/issp2/g03/linda7.2/opteron-linux-I8source/opt/issp2/g03/bsd/file/opt/issp2/g03$FILENAME,作业脚本注意事项为减少资源消耗,系统配置采用autofs,20分钟无操作,即会卸载目录,因此,在脚本中,需使用绝对路径,保证任务可以正常运行作业脚本参考VASPWien2kg03castepdmol3espresso,Inspurgroup,四:计算任务投放,Inspurgroup,提交作业,查询作业(1),四:计算任务投放,作业管理,查询作业(2),Inspurgroup,查询作业(3),作业管理,四:计算任务投放,删除作业,Inspurgroup,作业管理,四:计算任务投放,五:存储空间使用,1.系统使用lustre并行文件系统提高I/O性能,作为工作目录,由于其承载压力较大,容易出现硬盘故障,因此,该目录只存放计算中的临时文件,请及时将结果文件备份回属主目录中。2.属主目录只允许存放最终结果文件,严禁将运算临时目录指向属主目录,如违规操作,造成属主目录损坏,管理员有权追究其责任。3.属主目录有磁盘配额限制,如需扩大容量(例如需要安装专用软件),可向管理员申请协调。4.应及时清除临时文件和计算中程序设计生成的监控跟踪记录文件。临时性文件存放不要超过三个月。重要数据应打包或再压缩存放。5.工作目录(lustre)中存放的临时文件,请及时清除,管理员会定期清理长时间无访问文件,如因未及时备份而被误删,管理员不承担任何责任。6.严禁在属主目录中存放无关文件,如发现违反,管理员将调低该用户磁盘配额。,Inspurgroup,五:存储空间使用,1.工作目录:/lustre/yourid(总容量9.6TB,单用户无容量限制,作为运算临时文件目录,请及时删除临时文件,30天无访问文件将被删除)2.属主目录:/home/yourid(每用户默认限制容量为50GB,用于安装自用软件,备份文件,保存计算结果文件),Inspurgroup,六:软件安装及使用规范,1.系统默认安装了部分公用软件,位置在/opt下,主要为Intel编译器、MPI及数学库。2.各研究室公用应用软件分别安装在/opt/目录下3.用户如果有特殊软件需求,可以申请安装于公用目录下,也可以安装于自己属主目录下,如果该软件使用人员较多,推荐安装于公用目录下,减少对属主目录的空间占用。4.使用时,应注意用户的环境变量,修改属主目录下的.bashrc文件,设置正确的用户环境变量。5.作业脚本中,应使用软件绝对路径指明应用软件所在位置。6.严禁未经许可擅自修改公用软件。,Inspurgroup,六:软件安装及使用规范,用户环境变量配置举例:vi/.bashrc#g03#exportGAUSS_EXEDIR=/opt/issp2/g03exportg03root=/opt/issp2exportPATH=/opt/issp2/g03/:/opt/issp2/g03/linda7.2/opteron-linux-I8/bin:$PATHexportGAUSS_SCRDIR=/lustre/ISSP2/exportLINDA_PATH=/opt/issp2/g03
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师招聘之《幼儿教师招聘》综合提升练习试题含答案详解【培优a卷】
- 教师招聘之《幼儿教师招聘》自测题库及参考答案详解(达标题)
- 2025年教师招聘之《幼儿教师招聘》押题练习试卷附答案详解(基础题)
- 教师招聘之《小学教师招聘》通关试卷提供答案解析一套附答案详解
- 教师招聘之《幼儿教师招聘》含答案详解【达标题】
- 教师招聘之《小学教师招聘》自我提分评估含答案详解【考试直接用】
- 2025行政执法人员执法资格证考试题库及答案
- 2025年北京教师资格证试题(附答案)
- 教师招聘之《小学教师招聘》附答案详解(完整版)
- 2025年教师招聘之《小学教师招聘》题库必刷100题【b卷】附答案详解
- 青海“8·22”川青铁路尖扎黄河特大桥施工绳索断裂事故案例学习安全警示教育
- 9.3纪念抗日战争胜利80周年阅兵式观后感
- 2025年70周岁以上老年人换长久驾照三力测试题库(含答案)
- 人才匹配算法的优化
- 兵团普通职工考试试题及答案
- 家庭劳动教育的制度性困境与教育主体重构研究
- 桥梁照明系统设计方案
- 时事政治考试题(含答案)
- 生物标本课程讲解
- 专八备考单词讲解
- 2025年儿童康复学考试题库
评论
0/150
提交评论