IBM LSF10.1安装教程

集群管理 1 2036 李艳青 收藏

作为测试,在 VMware 上安装 centos7,然后在 centos7 上安装 lsf 10.2 社区版 (其实是 10.1 版本),社区版和正式版的安装基本一致,不过不需要 license。

redhat 上安装步骤基本相同。

下面是具体的安装步骤:

机器设置

1.1 设置 hostname 及 IP

通过修改 /etc/hostname 设置机器名,机器名不要太长,也不要带特殊字符。

通过 ifconfig 指令获取机器的 IP 地址。注意如果是通过 VMware 安装的虚拟机,每次重启后 ip 地址都会变,所以最好将其 IP 设置为静态地址。

2.jpg通过修改 /etc/hosts 来标明 hostname 和 IP 的对应关系。

重启机器使之生效。

1.2 设置 ssh

确认 sshd 服务已开启,如未开启,用 root 账号执行

 service sshd start

开启。

  配置 ssh 免密登陆。

  用 ssh-keygen 命令产生公钥和私钥。

5.jpg把本机上的公钥写入本机,所以本机登陆本机不需要密码。

如果有多个机器节点,需要依次复制。(如下为示意)

scp ~/.ssh/authorized_keys root@node01:~/.ssh/
scp ~/.ssh/authorized_keys root@node02:~/.ssh/

1.3 设置共享存储

如果有多台机器,需要在所有机器上启动 NFS 服务,设置好共享目录,lsf 需要安装在共享目录,以保证所有的机器都能够读取同一份设置。

1.4 关闭防火墙

    采用命令

systemctl status firewalld

获取防火墙状态。如下绿色部分字体可知,防火墙仍然处于 running 状态。

10.jpg采用

systemctl stop firewalld

命令可以临时关闭防火墙,我们看到其状态变为 dead。

11.jpg采用 systemctl disable firewalld 命令则可以彻底关闭防火墙,机器重启后也不会再自动开启。

2. 安装

2.1 安装包下载

从如下地址可以下载到 10.2 版本的 lsfsce 安装包。

https://www-01.ibm.com/marketing/iwm/mrs/DownloadList?source=swerpzsw-lsf-3&lang=en_US#dh

lsfdown.jpg

下载 “IBM Spectrum LSF Suite for Community 10.2.0.6 Installation Package for Linux x86-64” 备用。

2.2 安装包解压

拷贝到 linux 中的工具路径下,解压缩。(如下操作,如无说明均采用 root 账号)

22.jpg进入解压路径下,lsf 为 lsf sce 版的安装文件目录。

   进入 lsf 目录下,继续解压缩文件 lsf10.1_lsfinstall_linux_x86_64.tar.Z。(glibc 文件无需处理)

23.jpg进入解压后的安装包路径下。

2.3 安装

    其中 install.config 为安装配置文件,我们将其备份一下(到 install.config.orig),然后更新其中的设置。

我们的配置如下。

24.jpgLSF_TOP : 设置安装路径。

LSF_ADMINS : 设置管理员账号,当前设置为我自己的账号,但是企业中建议创建一个公用的管理员账号 lsfadmin。

LSF_CLUSTER_NAME : 集群名称。

LSF_MASTER_LIST :master 机器列表,如果有多台机器,建议至少设置两台 master,作为冗余备份。

LSF_TARDIR : 安装文件解压缩路径。

CONFIGURATION_TEMPLATE :配置模式,如果是 IC 应用场景,建议设置为 HIGH_THROUGHPUT 高性能模式。

LSF_ADD_SERVERS :添加计算机节点机器,也可以安装后配置。

LSF_ADD_CLIENTS :添加客户机(投递机)节点,也可以安装后配置。

执行

./lsfinstall -f install.config

来安装 lsf。

25.jpg此处选 1,继续。

26.jpg此处也选 1 ,继续,会自动安装完成。

2.4 配置

    到安装目录的 conf 路径下,将如下信息插入到 lsf.conf 文件中。

LSF_RSH=“ssh”

将 conf 路径下的 cshrc.lsf 和 profile.lsf 两个文件拷贝到 /etc/profile.d/ 下面。(可以开机自动加载 lsf 环境)

手工载入环境。如果是 csh/tcsh 则 source cshrc.lsf,否则 source profile.lsf。

    在所有机器上,用 root 账号执行如下命令以启动守护进程。

31.jpg登陆 master 节点,用 root 账号执行

lsfstartup

以启动 lsf 集群。(请注意,lsf 社区版不允许机器 cpu 核数超过两个核,否则 lsfstartup 无法启动)

32.jpg执行 lsid 确定 lsf 服务启动无误。

2.5 测试

    切换到普通账号测试一下。

1 号任务,睡一会。

   从 queue 和 hosts 上可以看到这两个 slots 占用,也可以查看机器的静态资源及动态负载状况。

41.jpglsf 安装配置成功。

相关推荐:

网友留言:

  1. tel_uynqn3b9
    回复
    https://www-01.ibm.com/marketing/iwm/mrs/DownloadList?source=swerpzsw-lsf-3&lang=en_US#dh
    楼主 安装包可以提供下吗 各种搜索都找不到下载连接 谢谢
您需要 登录账户 后才能发表评论

我要评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码