- 論壇徽章:
- 0
|
1.linux安裝
采用ubuntu 6.06.1 LTS 版本。
2.創(chuàng)建NFS服務(wù)
sudo apt-get install nfs-common nfs-kernel-server
在服務(wù)器節(jié)點(diǎn)/home目錄下建立mpi目錄,并將其配置成NFS服務(wù)器,在/etc/exports
文件中加入一行:
/home/mpi node1(rw) node2(rw)
在客戶端節(jié)點(diǎn)的/etc/fstab文件中增加一行:
node1:/home/mpi /home/mpi nfs rw,bg,soft 0 0
將/home/mpi這個(gè)目錄從服務(wù)器節(jié)點(diǎn)輸出,并裝載在各客戶端的/home/mpi目錄下,從而便于在各節(jié)點(diǎn)間分
發(fā)任務(wù).
3.修改/etc/hosts文件,將所有節(jié)點(diǎn)名稱極其ip地址填入。例如:
127.0.0.1 localhost.localdomain localhost
219.242.255.161 node1
219.242.255.162 node2
......................
每個(gè)節(jié)點(diǎn)都進(jìn)行類似的配置。這樣做的目的是使節(jié)點(diǎn)之間能夠通過node1 ... noden的名
稱相互訪問。你可以通過ping noden 或 ssh noden進(jìn)行測試。
4.安裝配置ssh
sudo apt-get install openssh-client openssh-server
以設(shè)定的用于啟動mpi計(jì)算的用戶登錄,運(yùn)行
ssh-keygen -t rsa #對于所有提示直接回車即可
這將生成一個(gè)密鑰對,分別存放在~/.ssh/id_rsa和~/.ssh/id_rsa.pub文件內(nèi)。
然后進(jìn)行訪問授權(quán),運(yùn)行:
cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
chmod go-rwx ~/.ssh/authorized_keys
ssh-agent $SHELL
ssh-add
在每個(gè)節(jié)點(diǎn)重復(fù)一遍。收集所有節(jié)點(diǎn)下的authorized_keys文件,合并為一個(gè)authorized_keys,然后再分發(fā)到每個(gè)節(jié)點(diǎn)的$HOME/.ssh目錄下去。
試著在某一節(jié)點(diǎn)上登錄所有節(jié)點(diǎn)(包含自身),ssh noden,則在$HOME/.ssh/下生成一個(gè)名為known_hosts的文件,里面放著訪問該主機(jī)的身份指紋,也在各個(gè)節(jié)點(diǎn)上將known_hosts文件作同樣的拷貝。
以上的目的是使各節(jié)點(diǎn)相互之間訪問無需輸入密碼。
5.開啟各項(xiàng)必需的服務(wù)
ssh
nfsd
networking
6.在各節(jié)點(diǎn)編譯、安裝mpich2.(詳情參考安裝文檔)
./configure --prefix=/usr/local
make
make install
7.配置
在$HOME目錄下執(zhí)行
touch ~/.mpd.conf
在里面輸入
secretword= #為任意你所想填寫的字符串,如"mysecret"
再執(zhí)行
chmod 600 ~/.mpd.conf
編寫一個(gè)mpd.hosts文件,內(nèi)容如下:
node1 #集群中各節(jié)點(diǎn)名,一行一個(gè)
node2
......
8.測試安裝是否正確
mpdboot -n number -f mpd.hosts #number為要啟動的節(jié)點(diǎn)數(shù),mpd.hosts為包含機(jī)器名的文件
mpdtrace #查看已啟動的節(jié)點(diǎn)
mpdallexit #所有節(jié)點(diǎn)退出
拷貝/usr/local/share/examples_graphics下的用例到其他目錄,編譯cpi.c:
mpicc -o cpi cpi.c
再執(zhí)行:
mpdboot -n 2 -f mpd.hosts
mpiexec -n 2 cpi
將會獲得如下信息
Process 0 on node1
Process 1 on node2
..................
單機(jī)上模擬多節(jié)點(diǎn)可以用如下方式:
mpd& #啟動mpi任務(wù)管理服務(wù),只啟動本節(jié)點(diǎn)的mpd
mpiexec -n 2 cpi
如果都能正常運(yùn)行即證明集群環(huán)境安裝成功。
本文來自ChinaUnix博客,如果查看原文請點(diǎn):http://blog.chinaunix.net/u/7654/showart_304669.html |
|