高性能集群并行环境安装与配置_第1页
高性能集群并行环境安装与配置_第2页
高性能集群并行环境安装与配置_第3页
高性能集群并行环境安装与配置_第4页
高性能集群并行环境安装与配置_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、并行环境安装与调试 本文讲解的是基于Red Hat Enterprise Linux 4为平台的高性能计算集群安装与调试,假设你使用过Red Hat Enterprise Linux 4并且理解了高性能计算的原理,所以本文稿的重点讲解如何安装与调试,关于高性能计算的原理请自行查阅相关的资料。 你可以拒绝学习 但你的竞争对手不会-杰克.韦尔奇QQ:11217404MAIL:pcstart特洛伊整理,转载请保留,前言LINUX集群中的每个节点都有自己的处理器和内存,运行独立的操作系统,不能直接访问其他节点的处理器,内存或其他设备。而MPI环境却要求这样的访问,这就需要内部网络和协议的支持。首先,每

2、个节点要能互访,需进行基本网络配置;其次,由于并行计算的特点,每个节点的计算程序是通常是相同的,只是所分配的计算区间不同。这就需要:(1)高效率的用户身份验证方法,并且能执行用户发出的计算指令。(2)每个计算节点能够使用载入同一个计算程序,并能进行相应初始化。对于第一个要求,可通过网络信息服务(NIS)和SHELL命令服务(RSH、SSH)实现。对于第二个要求,可以使用Linux的NFS文件系统实现,将服务器节点的用户文件让所有计算共享。所以NIS、NFS、RSH、SSH是集群的基本网络服务。1网络信息服务(NIS)NIS是一个简单的客户机/服务器数据库系统,提供一个简易网络查询服务。NIS是

3、网络信息系统的简称,包含了网络用户的信息,由数据库与处理程序构成,目的是为网络上所有机器提供所需信息。数据库建立在服务器上,用于统一管理集群中服务器和节点机的用户信息,使得一个用户可以登入集群中任何一台节点机,而不需要管理员另外为用户在每台节点机上设置用户和密码。虽然NIS存在一定的安全隐患,但在内部网络,安全问题不大。2远程SHELL命令(RSH、SSH)基于MPI的并行计算需要在每个计算节点启动并行计算任务,用户需要登入每个节点,然后递交计算任务。不过这通常效率比较低,那么,高效的做法是,不需要登入远程机器,就可以在远程机器上启动并递交计算任务,而RSH与SSH提供了这样的机制。MPI安装

4、于服务器节点,其启动命令包含有在每个可供使用的节点机上启动计算的批处理命令。NIS为节点机接受这样的命令提供身份验证机制,但是,远程SHELL命令需要由程序来发出和响应。RSH与SSH就是这样的程序。命令执行之前,节点机检查服务器是否有权限发出这样的命令。之后,节点机通过/etc/hosts.equiv文件对服务器IP做可信赖检查,通过检查,就命令执行;没通过,则需口令才能执行命令。对于集群来说,做的是高效率的并行计算,无口令登入,无疑带来了更高的计算效率。 3网络文件系统(NFS)并行任务启动时,需要所有节点都能载入并行计算程序的执行代码。并行计算程序执行代码文件、输入输出数据文件等必须让所

5、有节点机共享,这可以通过NFS实现,用户在任何节点登入,看到的是单一系统印象,感觉不到多台计算机的存在。微机集群一般通过NFS来实现文件共享。NFS是一个可靠的协议,提供服务过程中不保留信息,客户机出现问题,并不影响服务器。虽然NFS也存在比较大的安全隐患,但在内部网络,问题就不明显了。 4MPICH并行环境MPICH是Linux平台下最重要的一种MPI实现,是一个与MPI规范同步发展的版本。每当MPI标准推出新的版本时,MPICH就会有相应的实现版本。MPICH是一个MPI的库,它提供了不同版本MPI的库结构,编程人员可以使用MPICH来使用这些MPI接口,以便写出适合自己的基于消息传递的并

6、行程序。编程人员使用C 或者是Fortran语言来调用这些标准库,实现程序的并行性。MPICH使用的是MPI标准,所以它开发的程序可移植性很强,而且它提供统一的编程接口,所以程序的可开发性很强。本次测试就是MPICH的基础实现的,所以我们将介绍如何的安装和使用MPICH具体安装步骤如下(以两节点集群为例): 集群中各节点所安装的系统为Red Hat Enterprise Linux 4 U3 32bit,在安装操作系统时,预安装所有软件包,以免以后用到的软件在重新安装带来的麻烦,在安装服务器和节点机操作系统时,设置服务器和节点机的主机名分别为:node1,node2;其中node1充当服务器兼

7、管理节点和I/O节点,node2充当计算节点。node1的IP为:eth0: eth1:node2的IP为: eth0: eth1:配置完成后,可以用机群部署系统软件(曙光DCIS)把node2的系统镜像分发到其它计算节点上。NIS配置在一个大型的网域当中,如果有多部 Linux 主机时,万一要每部主机都设定相同的账号与密码的设定,还真是啰唆。所以,适时的使用一部主要主机 ( master server ) 管理网域中的所有账号,其它的主机则使用这部主要主机提供的账号与密码来达成让使用者登入的作用即可!这样的功

8、能有很多的服务器软件可以达成,这里我们要介绍的则是 Network Information Services, NIS server 这个服务器软件!NIS服务器具体配置1安装NIS服务默认配置安装的RedHat,其安装程序会将NIS服务安装在系统上,在RedHat中我们只需使用下面的命令检查系统是否已经安装了NIS服务:rootnode1 # rpm -qa |grep yp如果系统显示有如下软件包,表示NIS服务已经正确安装yp-tools-2.8-1ypserv-2.8-1ypbind-1.12-1否则表示还没有安装NIS服务,在RedHat AS 4的第1张与第2张安装光盘的/RedH

9、at/RPMS目录有NIS服务器的RPM安装包,该安装包的文件名分别为ypserv-2.13-9.i386.rpm,yp-tools-2.8-7.i386.rpm, ypbind-1.17.2-8.i386.rpm 。放入光盘然后进行装载,并使用下面的命令安装:rootnode1 # mount -t iso9660 /dev/cdrom /mnt/cdromrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/ypserv-2.13-9.i386.rpmrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/yp-tools-

10、2.8-7.i386.rpm rootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/ypbind-1.17.2-8.i386.rpm注意:要提供NIS服务,必须安装portmap服务,并且portmap服务是运行的,查看是否安装与安装方法同上,RedHat默认会安装portmap服务。2配置NIS服务(1)启动 portmap 并设定开机时启动:rootnode1 # service portmap startrootnode1 # chkconfig -level 35 portmap on(2)启动 time 与 time-udprootnode1 # v

11、i /etc/xinetd.d/time#将 disable = yes 改成 disable = no 即可!rootnode1 # vi /etc/xinetd.d/time-udp # 同样的将 disable = yes 改成 disable = no 即可! rootnode1 # service xinetd restart rootnode1 # chkconfig -level 35 xinetd onrootnode1 # netstat -utl Active Internet connections (only servers) Proto Recv-Q Send-Q L

12、ocal Address Foreign Address State tcp 0 0 *:time *:* LISTEN tcp 0 0 *:sunrpc *:* LISTEN udp 0 0 *:time *:* udp 0 0 *:sunrpc *:*目前至少也要有上面四个 LISTEN 的 port 才行喔!分别是 UDP 与 TCP 封包的啦! (3) 建立 NIS 的领域名称 ( nisdomainname )建立 NIS 的领域名称 (我这里是设定为 cluster ): rootnode1 # nisdomainname cluster rootnode1 # vi /etc/r

13、c.d/rc.local # 将底下这一行加入这个档案的最后一行: /bin/nisdomainname cluster 设定好网络参数: rootnode1 # vi /etc/sysconfig/network # 加入底下这一行: NISDOMAIN=cluster(3)建立网络信任群组: rootnode1 # touch /etc/netgroup(4)启动 ypserv 与yppasswdd,并且设定开机时启动:rootnode1 # service ypservstart rootnode1 # service yppasswdd startrootnode1 # chkconf

14、ig -level 35 ypserv on rootnode1 # chkconfig -level 35 yppasswdd on(5)制作数据库、并重新启动 ypserv 与 yppasswd :rootnode1 # /usr/lib/yp/ypinit -mAt this point, we have to construct a list of the hosts which will run NIS servers. server.cluster is in the list of NIS server hosts. Please continue to add the name

15、s for the other hosts, one per line. When you are done with the list, type a . next host to add: node1 next host to add: =在这里按下ctrl + d跳出 The current list of NIS servers looks like this: node1Is this correct? y/n: y y We need a few minutes to build the databases. Building /var/yp/cluster/ypservers.

16、Running /var/yp/Makefile. gmake1: Entering directory /var/yp/cluster Updating passwd.byname. Updating passwd.byuid. Updating group.byname. Updating group.bygid. Updating hosts.byname. Updating hosts.byaddr. Updating rpc.byname. Updating rpc.bynumber. Updating services.byname. Updating services.byser

17、vicename. Updating netid.byname. Updating protocols.bynumber. Updating protocols.byname. Updating mail.aliases. gmake1: Leaving directory /var/yp/cluster node1 has been set up as a NIS master server. Now you can run ypinit -s node1 on all slave server.# 这个动作是每次修改使用者数据后一定要做的动作!,就是重新制作数据库, rootnode1 #

18、 service ypserv restart rootnode1 # servcie yppasswdd restart# 然后并且需要重新启动 ypserv 与 yppasswdd 喔! 3管理NIS服务启动NIS服务rootnode1 # service ypserv start rootnode1 # service yppasswdd start停止NIS服务rootnode1 # service ypserv stoprootnode1 # service yppasswdd stop重新启动NIS服务rootnode1 # service ypserv restartrootno

19、de1 # service yppasswdd restartNIS客户机具体配置1安装NIS服务默认配置安装的RedHat,其安装程序会将NIS服务安装在系统上,在RedHat中我们只需使用下面的命令检查系统是否已经安装了NIS服务:rootnode1 # rpm -qa |grep yp如果系统显示有如下软件包,表示NIS服务已经正确安装yp-tools-2.8-1ypserv-2.8-1ypbind-1.12-1否则表示还没有安装NIS服务,在RedHat AS 4的第1张与第2张安装光盘的/RedHat/RPMS目录有NIS服务器的RPM安装包,该安装包的文件名分别为ypserv-2.

20、13-9.i386.rpm,yp-tools-2.8-7.i386.rpm, ypbind-1.17.2-8.i386.rpm 。放入光盘然后进行装载,并使用下面的命令安装:rootnode1 # mount -t iso9660 /dev/cdrom /mnt/cdromrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/ypserv-2.13-9.i386.rpmrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/yp-tools-2.8-7.i386.rpm rootnode1 # rpm -ivh /mnt/cdr

21、om/RedHat/RPMS/ypbind-1.17.2-8.i386.rpm注意:要提供NIS服务,必须安装portmap服务,并且portmap服务是运行的,查看是否安装与安装方法同上,RedHat默认会安装portmap服务。2配置NIS服务(1)启动 portmap 并设定开机时启动:rootnode2 # service portmap startrootnode2 # chkconfig -level 35 portmap on(2) 设定 NIS Server 的 IP 对应主机名称:rootnode2 # vi /etc/hosts # 要有底下这一行喔! 192.168.0.

22、1 node1 gnode1(3) 设定 NIS 的 domain 与 NIS 的主机: 建立 NIS domain name:rootnode2 # nisdomainname cluster rootnode2 # vi /etc/rc.d/rc.local # 加入底下这一行: /bin/nisdomainname cluster rootnode2 # vi /etc/sysconfig/network # 加入底下这一行: NISDOMAIN=cluster 建立 NIS 查寻的主机名称:rootnode2 # vi /etc/yp.conf # 加入这两行: d

23、omain cluster ypserver node1 #那个 cluster 是你的 NIS 的 domain ,至于 node1则是 NIS Server 的主机名称(4) 修改密码验证的方式:密码文件的修改: rootnode2 # vi /etc/passwd # 在这个档案的最后面加入这一行: +: # 注意喔!在 + 之后连续加六个 : ,并且中间没有空格符! 查寻密码的程序: # 因为我们有很多方式来查寻密码,需要修改 /etc/nsswitch.conf 这个档案才行 rootnode2 # vi /etc/nsswitch.conf # 找到相关的参数,并改成底下这样: p

24、asswd: nis files shadow: nis files group: nis files hosts: nis files dns # 至于 nis 则是透过 NIS 来进行查寻# 这个档案在设定一些信息的查寻程序!那个 files 指的是本机的相关档案, 3管理NIS服务启动 ypbind 与设定开机启动:rootnode2 # service ypbind startrootnode2 # chkconfig -level 35 ypbind on4测试NIS服务 NIS Client 端检验 NIS 设定:yptest, ypwhich, ypcat在node2上运行ypt

25、est:rootnode2 # yptestTest 1: domainnameConfigured domainname is clusterTest 2: ypbindUsed NIS server: node1Test 3: yp_matchWARNING: No such key in map (Map passwd.byname, key nobody)(这里报错,我也不知为什么)Test 4: yp_firstpc pc:$1$R0RKP5Vx$Wmu79QE1zt43v8L45Orsk1:500:501:/home/pc:/bin/bashTest 5: yp_nextTest

26、6: yp_masternode1Test 7: yp_order1156259277Test 8: yp_maplistprotocols.bynumbergroup.bygidservices.bynamepasswd.bynameypserversrpc.bynumberservices.byservicenamemail.aliasespasswd.byuidhosts.bynameprotocols.bynamerpc.bynamenetid.bynamegroup.bynamehosts.byaddrTest 9: yp_allpc pc:$1$R0RKP5Vx$Wmu79QE1z

27、t43v8L45Orsk1:500:501:/home/pc:/bin/bash1 tests failed#如果你看到以上信息,说明客户端可以与服务器端正常工作。在node2上运行ypwhich:rootnode2 # ypwhichnode1rootnode2 #如果你看到以上信息,说明客户端可以与服务器端正常工作。在node2上运行上运行ypcat:rootnode2 # ypcat passwdpc:$1$R0RKP5Vx$Wmu79QE1zt43v8L45Orsk1:500:501:/home/pc:/bin/bashrootnode2 #如果你看到以上信息,说明客户端可以与服务器端

28、正常工作。NIS服务的配置也很简单吧!其中node1为NIS服务器端,其它节点为NIS客户端,以上的NIS服务器端配置在node1上进行,NIS客户端配置在其它节点(如,node2,node3)上进行。在这里有一个特别说明的地方大家一定要注意,当你配置NIS服务成功后,不管你用哪个普通用户(如本例中的pc)rsh到任何一个节点,都应是不用输入用户名与密码的,不用在做其它配置!至此NIS服务配置完成!RSH配置在高性能计算集群中,每个节点都需要分担一定的任务,而这些任务都是由执行任务的主机发起的,剩余的节点通过远程的通信协议来完成任务的接收和执行。当前用于远程通信的协议很多,其中比较出名的是SS

29、H(Secure Shell)和RSH。RSH是通过网络将要执行的命令分发给目的机,目的机在接收命令后根据用户的情况和当前的环境判断是否执行发送来的命令。SSH是RSH的一种改进,RSH存在一种很大的缺陷那就是安全问题。RSH在发送命令时使用的是明文的方式,这样一来命令在网络中传输很容易被截获,并且会被一些不法份子给窜改。出于这样的原因,出现了现在比较流行的SSH,它是通过SSL的加密方式来发送数据,这样就避免了数据被偷窃和窜改的可能。RSH服务具体配置1安装RSH服务默认配置安装的RedHat,其安装程序会将RSH服务安装在系统上,在RedHat中我们只需使用下面的命令检查系统是否已经安装了

30、NFS服务:rootnode1 # rpm -qa |grep rsh如果系统显示如下内容,表示NFS服务已经正确安装rsh-0.17-25.3rsh-server-0.17-25.3否则表示还没有安装RSH服务,在RedHat AS 4的第2张与第4张安装光盘的/RedHat/RPMS目录分别有RSH服务客户端与RSH服务器端的RPM安装包,该安装包的文件名分别为rsh-0.17-25.3.i386.rpm 与rsh-server-0.17-25.3.i386.rpm。放入光盘然后进行装载,并使用下面的命令安装:mount -t iso9660 /dev/cdrom /mnt/cdromrp

31、m -ivh /mnt/cdrom/RedHat/RPMS/rsh-0.17-25.3.i386.rpm (第2张)rpm -ivh /mnt/cdrom/RedHat/RPMS/rsh-server-0.17-25.3.i386.rpm (第4张)以上设置必须得在每一个节点上运行。2配置RSH服务编辑/etc/hosts.equiv (若不存在,请自行建立)如下: node1node2gnode1gnode2编辑/etc/hosts (若不存在,请自行建立)如下: localhost node1 node2

32、gnode1 gnode2编辑/root/.rhosts (若不存在,请自行建立,其中root为当前用户目录下)如下: node1node2gnode1gnode2编辑/etc/securetty文件,在末尾处新起一行加入:rexecrloginrsh 以上设置必须得在每一个节点上运行。3管理RSH服务启动RSH服务/etc/rc.d/init.d/rsh start/etc/rc.d/init.d/rlogin start停止RSH服务/etc/rc.d/init.d/rsh stop/etc/rc.d/init.d/rlogin stop重新启动RSH服务/etc/rc

33、.d/init.d/rsh restart/etc/rc.d/init.d/rlogin restart自动启动RSH服务chkconfig level 35 rexec onchkconfig level 35 rlogin onchkconfig level 35 rsh on以上设置必须得在每一个节点上运行。4测试RSH服务首先,在RSH服务器端保证RSH服务启动,运行如下命令:rootnode1 # rsh node2如果你能看到以下信息,说明RSH服务配置成功,并且不用密码可以登陆其它节点。connect to address : Connection refu

34、sedTrying krb4 rlogin.connect to address : Connection refusedtrying normal rlogin (/usr/bin/rlogin)Last login: Fri Aug 25 17:11:38 from node1You have mail.rootnode2 #我想大家都看明白了吧,每个节点既是RSH服务器,又可充当RSH客户机,最后要达到的效果是在任何一节点rsh到任何一节点上,都能成功并且不需要输入用户名与密码。至此RSH服务配置完成!SSH配置在高性能计算集群中,每个节点都需要分担一定的任务,而这

35、些任务都是由执行任务的主机发起的,剩余的节点通过远程的通信协议来完成任务的接收和执行。当前用于远程通信的协议很多,其中比较出名的是SSH(Secure Shell)和RSH。RSH是通过网络将要执行的命令分发给目的机,目的机在接收命令后根据用户的情况和当前的环境判断是否执行发送来的命令。SSH是RSH的一种改进,RSH存在一种很大的缺陷那就是安全问题。RSH在发送命令时使用的是明文的方式,这样一来命令在网络中传输很容易被截获,并且会被一些不法份子给窜改。出于这样的原因,出现了现在比较流行的SSH,它是通过SSL的加密方式来发送数据,这样就避免了数据被偷窃和窜改的可能。SSH服务器具体配置1安装

36、SSH服务:默认配置安装的RedHat,其安装程序会将RSH服务安装在系统上,在RedHat中我们只需使用下面的命令检查系统是否已经安装了SSH服务:rootnode1 # rpm -qa |grep ssh如果系统显示如下内容,表示SSH服务已经正确安装openssh-clients-3.9p1-8.RHEL4.9openssh-askpass-3.9p1-8.RHEL4.9openssh-server-3.9p1-8.RHEL4.9openssh-askpass-gnome-3.9p1-8.RHEL4.9openssh-3.9p1-8.RHEL4.9否则表示还没有安装SSH服务,在RedH

37、at AS 4的第2张与第4张安装光盘的/RedHat/RPMS目录分别有SSH服务客户端与SSH服务器端的RPM安装包,放入光盘然后进行装载,并使用下面的命令安装:mount -t iso9660 /dev/cdrom /mnt/cdromrpm -ivh /mnt/cdrom/RedHat/RPMS/openssh-clients-3.9p1-8.RHEL4.9.i386.rpmrpm -ivh /mnt/cdrom/RedHat/RPMS/openssh-askpass-3.9p1-8.RHEL4.9.i386.rpmrpm -ivh /mnt/cdrom/RedHat/RPMS/ope

38、nssh-server-3.9p1-8.RHEL4.9.i386.rpmrpm -ivh /mnt/cdrom/RedHat/RPMS/openssh-askpass-gnome-3.9p1-8.RHEL4.9.i386.rpmrpm -ivh /mnt/cdrom/RedHat/RPMS/openssh-3.9p1-8.RHEL4.9.i386.rpm2配置SSH服务在node1生成SSH秘钥对:rootnode1 # ssh-keygen -t rsa 一路回车即可查看是否有.ssh文件夹:rootnode1 # ls a进入.ssh目录rootnode1 # cd .sshrootnod

39、e1 .ssh#生成authorized_keys文件:rootnode1 .ssh# cp id_rsa.pub authorized_keys建立本身的信任连接:rootnode1 .ssh# ssh node1 按提示输入yes(三个字母要打全)设置node2(node2的root目录下) rootnode2 #ssh-keygen -t rsa 生成.ssh文件夹 rootnode2 #rcp node1:/root/.ssh/* /root/.ssh 拷贝node1上的.ssh文件夹覆盖本地的 rootnode2 #ssh node1 提示处输入yes回车 确认两台机器的信任连接已建

40、立 对每个节点执行: #ssh node01 #ssh node02 在提示处输入yes回车,最后确定无需输入密码并且没有任何提示信息即可登陆(Last login:时间日期提示信息除外) 3管理SSH服务启动SSH服务/etc/rc.d/init.d/sshd start停止SSH服务/etc/rc.d/init.d/sshd stop重新启动SSH服务/etc/rc.d/init.d/sshd restart自动启动SSH服务chkconfig -level 35 sshd on以上设置必须得在每一个节点上运行。4测试SSH服务:首先,在SSH服务器端保证RSH服务启动,运行如下命令:ro

41、otnode1 # ssh node2如果你能看到以下信息,说明SSH服务配置成功,并且不用密码可以登陆其它节点。Last login: Sat Aug 26 19:39:21 2006 from node1rootnode2 #我想大家都看明白了吧,每个节点既是SSH服务器,又可充当SSH客户机,最后要达到的效果是在任何一节点ssh到任何一节点上,都能成功并且不需要输入用户名与密码。至此SSH服务配置完成!NFS配置编辑文件NFS文件输出表文件/etc/exports,输出/usr/local和/home文件让节点机共享。其中/usr/local用于安装MPI并行环境和存放其他公用程序。/h

42、ome是普通用户登录目录,通过这样的机制,可以统一集群中的应用程序目录及用户目录,更体现集群的单一系统印象。虽然NFS可以在网络中进行文件共享。但是NFS协议本身并没有提供数据传输的功能,它必须借助于过程调用(RPC)协议来实现数据的传输。RPC定义了一种进程间通过网络进行交互通信的机制,它允许客户端进程通过远程服务器上的服务进程请求服务,而不需要了解底层通信协议的细节。 NFS服务器具体配置1安装NFS服务默认配置安装的RedHat,其安装程序会将NFS服务安装在系统上,在RedHat中我们只需使用下面的命令检查系统是否已经安装了NFS服务:rootnode1 root# rpm -qa |

43、grep nfs如果系统显示如下内容,表示NFS服务已经正确安装nfs-utils-1.0.6-46否则表示还没有安装NFS服务,在RedHat AS 4的第2张安装光盘的/RedHat/RPMS目录有NFS服务器的RPM安装包,该安装包的文件名为nfs-utils-1.0.6-46.i386.rpm 。放入光盘然后进行装载,并使用下面的命令安装:mount -t iso9660 /dev/cdrom /mnt/cdromrpm -ivh /mnt/cdrom/RedHat/RPMS/nfs-utils-1.0.6-46.i386.rpm2配置NFS服务编辑/etc/exports文件内容如下

44、: /home *(rw,sync,no_root_squash)/usr/local *(rw,sync,no_root_squash) 3管理NFS服务启动NFS服务/etc/rc.d/init.d/nfs start停止NFS服务/etc/rc.d/init.d/nfs stop重新启动NFS服务/etc/rc.d/init.d/nfs restart自动启动NFS服务chkconfig level 35 nfs on4测试NFS服务首先,在服务器端保证NFS服务启动,使用下面的命令来查看NFS服务器的共享使用和相关的配置信息showmount -e 服务器IP也可以输入:showmou

45、nt -a 服务器IP查看nfs共享在客户端的加载情形。NFS客户机具体配置编辑/etc/fstab文件,使节点机启动时自动挂载NFS服务器输出的文件目,在该文件中加入: node1:/home /home nfs defaults 0 0node1:/usr/local /usr/local nfs defaults 0 0 可用mount 命令,测试是否能挂载NFS服务器上的输出文件目录 mount -t nfs node1:/home /home 若正确,进入节点机/home 目录,可看到服务器上的/home 目录 。这个NFS也比较简单了,我们的目地是以node1充当NFS的服务器端,

46、其它节点充当NFS的客户端,因此以上的服务器端配置需要在node1上进行,客户机的配置需要在所有其它节点机上进行,以达到所以节点机启动时能自动挂载node1上的/home与/usr/local目录,并且对这些目录有读写的权限!至此NFS服务配置完成!MPICH1配置我们要让我们的集群发挥它的效能就必须让它能够执行并行程序,而我们要执行并行程序就必须使用并行运算软件,MPICH是MPI的一种实现,下面就介绍安装的方法。(本次使用的mpich-1.2.7.tar版本的)MPICH1具体配置1安装MPICH1从/mpi/mpich/index.ht

47、m下载MPICH1安装包,这里我们下载到/root/mpich1目录里,并安装到node1上。rootnode1 mpich1# tar zxvf mpich-1.2.7.tar#解压mpich-1.2.7.tarrootnode1 mpich1# cd mpich-1.2.7#进入到mpich-1.2.7.tar目录里rootnode1 mpich-1.2.7# mkdir /usr/local/mpich-1.2.7#建立安装目录/usr/local/mpich-1.2.7rootnode1 mpich-1.2.7./configure -prefix=/usr/local/mpich-1

48、.2.7| tee configure.log#配置mpich-1.2.7的安装目录rootnode1 mpich-1.2.7make | tee make.log#建筑mpich-1.2.7rootnode1 mpich-1.2.7make install | tee install.log#安装mpich-1.2.72配置MPICH1编辑/etc/profile,在文件的最后新起一行,新建以下一行如下: PATH=/usr/local/mpich-1.2.7/bin:$PATH#增加mpich1的环境变量rootnode1 mpich-1.2.7#source /etc/profile#使

49、环境变量立即生效环境变量设置完成后,我们需要测试环境变量设置是否成功,用如下命令:rootnode1 mpich-1.2.7# which mpirun/usr/local/mpich-1.2.7/bin/mpirun如果显示以上信息,表示设置环境变量已成功。3测试MPICH13.1 单节点测试rootnode1 mpich-1.2.7cd /usr/local/mpich-1.2.7/examples#进到/usr/local/mpich-1.2.7/examplesrootnode1 mpich-1.2.7make#Make一下生成算例,如cpi等执行如下命令:rootnode1 mpic

50、h-1.2.7mpirun np 4 cpi 如果你看到如下信息,表示安装成功:Process 1 on node1Process 2 on node1Process 3 on node1Process 0 on node1pi is approximately 3.1416009869231249, Error is 0.0000083333333318wall clock time = 0.0000003.2 多节点测试rootnode1 mpich-1.2.7 vi /usr/local/mpich-1.2.7/share/machines.LINUX#编辑machines.LINUX文

51、件,内容如下:# Change this file to contain the machines that you want to use# to run MPI jobs on. The format is one host name per line, with either# hostname# or# hostname:n# where n is the number of processors in an SMP. The hostname should# be the same as the result from the command hostnamenode1 在这里,要加

52、上所有的计算节点,本机为node1,要加入node2、node3等node2rootnode1 mpich-1.2.7 cd /usr/local/mpich-1.2.7/examples#回到/usr/local/mpich-1.2.7/examplesrootnode1 examples# mpirun -np 8 cpi -machinefile#执行mpirun -np 8 cpi machinefile,如看到以下信息,说明配置正确!Process 2 on node1Process 6 on node1Process 4 on node1Process 0 on node1Proc

53、ess 1 on node2Process 7 on node2Process 5 on node2Process 3 on node2pi is approximately 3.1416009869231249, Error is 0.0000083333333318wall clock time = 0.003906如果你能看到以上信息,说明MPICH1配置成功,至此MPICH1服务配置完成!MPICH2配置我们要让我们的集群发挥它的效能就必须让它能够执行并行程序,而我们要执行并行程序就必须使用并行运算软件,MPICH是MPI的一种实现,下面就介绍安装的方法。(本次使用的mpich2-1.0.4p1.tar版本的)当前的最新版本。MPICH2具体配置1安装MPICH2从/mpi/mpich/index.htm下载MPICH2安装包,这里我们下载到/root/mpich2目录里,并安装到node1上。rootnode1 mpich2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论