版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、机群管理/使用培训厦门大学Agenda机群介绍Linux操作系统LCOMS机群管理系统账号管理Intel HPC tools机群性能监控有问题怎么办?机群介绍高性能计算机群中的基础概念机群硬件配置机群软件配置机群系统配置开启/关闭机群机群介绍高性能计算机群中的基础概念管理结点(Management Node/Head Node/HN):机群中的一个结点,负责管理整个高性能计算机群。登录结点(Login Node/LN):机群中的一个或者多个结点,用于提供用户登录服务,受控于管理结点。存储结点(IO Node):机群中的一个或者多个结点,用于提供共享文件系统,受控于管理结点。计算结点(Compu
2、te Node/CN):机群中的一个或者多个节点,专用于处理计算问题,受控于管理节点。机群硬件配置39个计算结点2*Intel 5675 6核处理器32 GB内存2*E7-4860256GB内存1个管理结点(也作为存储结点/登陆结点)2*Intel E5645 6核处理器24 GB内存1套管理网络:GigaByte Ethernet机群软件配置软件名称版本RHEL5.7lcoms11.7Intel Cluster Studio2011 XELcoms-paramon1.2.3Lcoms-paratune1.2.3机群系统配置外网IP地址登陆结点名称结点IP使用者console192.168.1
3、.251管理员,用户机群系统配置系统管理员账号ID: rootPW:*用户账号询问管理员开启/关闭机群开启机群存储结点 管理结点 计算结点关闭机群 计算结点 管理结点 存储结点Warning:开关机顺序很重要Linux操作系统基础命令基础文件BASHLinux操作系统基础命令(1)序号命令说明1ls查看文件2cp拷贝文件3mv移动或重命名文件4rm删除文件5touch创建空文件或更新文件时间6cd改变当前路径7pwd查看当前完整路径8mkdir创建新目录9rmdir删除空目录Linux操作系统基础命令(2)序号命令说明10cat/more/less查看文件内容11date显示当前时间12cal
4、显示日历13df显示磁盘用量14du计算目录下文件占用磁盘的大小15head显示文件开头部分内容16tail显示文件结尾部分内容17shutdown -r now/init 6重启18shutdown -h now/init 0关机Linux操作系统基础文件(2)序号命令说明9/proc虚拟文件系统,包含系统信息等资料10/rootroot用户的主目录11/sbin存储系统管理指令12/tmp临时文件的存放路径13/usr存放与用户直接相关的文件与目录14/var存储在系统运行中可能会更改的数据Linux操作系统BASHShell:命令行解释器,是用户与系统沟通的媒介bash:shell的一种
5、,是Bourne Again Shell的缩写与BASH相关的文件:/.bashrc/.bash_profile /.bash_history lcoms介绍lcoms是一个十分方便的机群管理软件,不但安装和管理比较容易,还自带了许多管理和应用软件管理服务器管理用户管理网络管理软件Help任何Rocks的命令都是在后面加上help得到帮助信息如:# rocks list host helplcoms管理结点查看结点信息# rocks list host# rocks list host interface删除结点信息# rocks remove host cn001同步系统信息# rocks
6、sync config# rocks sync users并行运行命令# rocks run host “command” 重新安装结点# ssh cn001 /boot/kickstart/cluster-kickstart账号管理创建/删除用户(以root用户身份在管理结点上操作)# useradd user1 #添加用户user1# passwd user1#修改用户user1的密码# userdel -r user1#删除用户user1# rocks sync users#同步到所有结点账号管理设置磁盘quota# quotaon -auvg#开启quota功能# quotaoff -
7、auvg#关闭quota功能# repquota /export/home#显示quota使用情况# edquota -u user1#给user设置quota# edquota -p user1 -u user2#设置user1的配置给user2Intel Cluster Studio安装目录/share/apps/intel设置环境变量source /export/soft/intel/Compiler/11.1/073/bin/iccvars.sh intel64source /export/soft/intel/impi/3.2.0.011/bin64/mpivars.sh作业调度软件
8、介绍作业调度软件介绍创建作业脚本提交/删除作业查看作业运行状态作业调度软件介绍基础的使用命令qsub 作业提交qstat 作业状态查询qdel 从队列中删除作业qhost 显示现在在线的主机qconf 作业相关信息的配置创建作业脚本# cat linpack.qsub 脚本内容如下: #!/bin/bash #$ -S /bin/bash#使用bash shell #$ -cwd#将作业输出文件存放在当前提交目录 #$ -j y#标准输出和错误输出合并 #$ -N $JOB_NAME#指定作业显示名称 #$ -pe make 8#指定并行处理环境,并申请8个处理单元source /share/
9、soft/intel/Compiler/11.1/073/bin/iccvars.sh intel64source /share/soft/intel/impi/3.2.0.011/bin64/mpivars.shexport I_MPI_DEVICE=rdssm#设置Intel MPI的环境变量 cd /em64t/#进入作业所在目录 mpirun -r ssh -np $NSLOTS ./xhpl#运行linpack可执行文件查看作业运行状态# qstat#查看所有作业状态# qstat -j $JOB_ID#查看指定作业详细信息# qstat -t#查看作业运行在哪些结点 机群性能监控Lcoms-paramonLcoms-paramonLcoms-paramon应用运行特征收集器性能数据CPU/内存/磁盘/网络快速上手颜
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 营销方案的论文大纲(3篇)
- 闻道纹绣营销方案(3篇)
- 项目施工风险应急预案(3篇)
- 主题教育使命担当-1
- 改性合成树脂装置操作工岗前安全宣教考核试卷含答案
- 罐头杀菌工岗前基础操作考核试卷含答案
- 水工混凝土维修工安全规程知识考核试卷含答案
- 电机制造工创新实践能力考核试卷含答案
- 碳化钨制备工岗前安全行为考核试卷含答案
- AIGC 与视觉营销设计课件
- 鸿业市政道路软件常见问题与解答
- 电泳涂装生产线安全操作规程2025
- 《工程造价指标分类及编制指南》附录A 房屋建筑工程
- 自闭症儿童早期识别
- 《西游记》与中国传统文化学习通超星期末考试答案章节答案2024年
- 民法典与生活同行宣传手册
- GB/T 15822.3-2024无损检测磁粉检测第3部分:设备
- DB50T 231-2024 城市桥梁养护技术规程
- 医共体信息化项目建设方案(技术方案)
- DB11T 500-2024 城市道路城市家具设置与管理规范
- 耳鼻喉科普小知识问答
评论
0/150
提交评论