从LSF中移除一个节点,就是要阻止其他作业再在这个节点上运行,从而使节点从集群中分离出来。
注意:请不要把LSF的主节点移除。如果你要把当前默认的主节点从LSF集群中移除,请先修改lsf.cluster.cluster_name文件,把默认主节点指向其他节点。 然后在移出这个节点。
1 以Root身份登录到这个LSF节点。
2 使用badmin hclose命令关闭此节点。这可以停止向此节点再派发作业,并且允许现有的作业运行完毕。
3 手动停止所有的LSF后台进程。
4 在LSF_CONFDIR/lsf.cluster.cluster_name文件中,Host部分移出此节点所有相关的设置;
5 在下列文件中,移出所有与该节点相关的设置。
¨ LSF_CONFDIR/lsf.shared
¨ LSB_CONFDIR/集群_name/configdir/lsb.hosts
¨ LSB_CONFDIR/集群_name/configdir/lsb.queues
¨ LSB_CONFDIR/集群_name/configdir/lsb.resources
6 从该节点退出,并使用Root与LSF的首席管理员身份登录到其它节点上。
7 运行lsadmin reconfig命令来重设LIM。
8 运行badmin reconfig命令来重设mbatchd。
9 如果你设置了在系统启动时LSF服务进程自动加载,请从启动文件中移出LSF的相关设置。
10 如果节点上有用户使用lstcsh 作为其登录shell,请更改他们的登录shell为tcsh或csh,并从/etc/shells文件中移除lstcsh。
从候选主节点列表中移除一个节点
你可以从候选主节点列表中移除一个节点,这样该节点在热备切换发生时,就不会再有机会成为主节点了。你可以在集群中依然保留这个节点,也可以移除它。
1 关闭当前的LIM:limshutdown host_name,如果这个节点是当前的主节点,那么就会发生热备切换。
2 在lsf.conf文件中,从LSF_MASTER_LIST参数中移除该节点名称。
3 运行lsadmin reconfig命令,来重设其他的候选节点。
4 如果你只想从候选主节点列表中移除该节点,并想在集群中保留这个节点,那么请再启动LIM:limstartup host_name
网友留言: