IBM LSF移除一个节点

集群管理 0 2712 佚名 收藏

从LSF中移除一个节点,就是要阻止其他作业再在这个节点上运行,从而使节点从集群中分离出来。

注意:请不要把LSF的主节点移除。如果你要把当前默认的主节点从LSF集群中移除,请先修改lsf.cluster.cluster_name文件,把默认主节点指向其他节点。 然后在移出这个节点。

1 以Root身份登录到这个LSF节点。

2 使用badmin hclose命令关闭此节点。这可以停止向此节点再派发作业,并且允许现有的作业运行完毕。

3 手动停止所有的LSF后台进程。

4 在LSF_CONFDIR/lsf.cluster.cluster_name文件中,Host部分移出此节点所有相关的设置;

5 在下列文件中,移出所有与该节点相关的设置。

¨ LSF_CONFDIR/lsf.shared
¨ LSB_CONFDIR/集群_name/configdir/lsb.hosts
¨ LSB_CONFDIR/集群_name/configdir/lsb.queues
¨ LSB_CONFDIR/集群_name/configdir/lsb.resources

6 从该节点退出,并使用Root与LSF的首席管理员身份登录到其它节点上。

7 运行lsadmin reconfig命令来重设LIM。

8 运行badmin reconfig命令来重设mbatchd。

9 如果你设置了在系统启动时LSF服务进程自动加载,请从启动文件中移出LSF的相关设置。

10 如果节点上有用户使用lstcsh 作为其登录shell,请更改他们的登录shell为tcsh或csh,并从/etc/shells文件中移除lstcsh。

从候选主节点列表中移除一个节点

你可以从候选主节点列表中移除一个节点,这样该节点在热备切换发生时,就不会再有机会成为主节点了。你可以在集群中依然保留这个节点,也可以移除它。

1 关闭当前的LIM:limshutdown host_name,如果这个节点是当前的主节点,那么就会发生热备切换。

2 在lsf.conf文件中,从LSF_MASTER_LIST参数中移除该节点名称。

3 运行lsadmin reconfig命令,来重设其他的候选节点。

4 如果你只想从候选主节点列表中移除该节点,并想在集群中保留这个节点,那么请再启动LIM:limstartup host_name


相关推荐:

网友留言:

您需要 登录账户 后才能发表评论

我要评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码