IBM LSF控制后台进程

集群管理 0 1036 佚名 收藏

所需权限

要控制集群内所有后台进程,你必须:登录身份是root用户或是在/etc/lsf.sudoer文件中所列出的用户。请参看PlatformTM LSF配置参考手册,来查看如何设置lsf.sudoers。

能够在所有LSF节点上,使用rsh和ssh命令登录并且不用键入密码。请参看你所使用的操作系统文档,来查看如何来配置rsh 与ssh 命令。在lsf.conf文件中LSF_RSH参数所指定的shell命令,要优先于rsh被使用。

控制后台进程的命令

下面是一个简要的命令列表,你可以用它们来控制LSF的后台进程


后台进程操作
命令权限
所有启动lsfstartup

登录身份是root 用户或是

在/etc/lsf.sudoer文件中所列出的用户。

关闭lsfshutdown
sbatchd启动badmin hstartup

[host_name ...|all]

登录身份是root 用户或是

在/etc/lsf.sudoer文件中所列出的用户。

重启

badmin hrestart

[host_name ...|all]

登录身份是root用户或是LSF管理员,

能够处理相关命令。

关闭

badmin hshutdown

[host_name ...|all]


mbatchd

mbschd

重启badmin mbdrestart

登录身份是root用户或是LSF管理员,

能够处理相关命令。

关闭

1 badmin hshutdown

2 badmin mbdrestart


重新设置badmin reconfig
RES
启动

lsadmin resstartup

[host_name ...|all]

登录身份是root 用户或是

在/etc/lsf.sudoer文件中所列出的用户。

关闭

lsadmin resshutdown

[host_name ...|all]

登录身份是root用户或是LSF管理员,

能够处理相关命令。

重启

lsadmin resrestart

[host_name ...|all]


LIM启动

lsadmin limstartup

[host_name ...|all]

登录身份是root用户或是LSF管理员,

能够处理相关命令。

关闭

lsadmin limshutdown

[host_name ...|all]

登录身份是root用户或是LSF管理员,

能够处理相关命令。

重启

lsadmin limrestart

[host_name ...|all]



重新设置lsadmin reconfig

Sbatchd

重启一个节点上的sbatchd进程并不会影响运行在其上的作业。如果sbatchd关闭了,这个节点只是不能运行新的作业了。正运行在其上的作业不会停下来,但是其运行的结果只能在sbatchd重新启动后,才能被发送给用户。

LIM和RES

重启一个节点上的LIM和RES进程并不会影响运行在其上的作业。如果某个后台进程不对其相应的网络连接请求作回应的话,那么lsadmin会显示相应节点的名称与错误。这样情况下,你就必须手动杀掉并重启相应节点上的这个进程。

如果当前主节点上的LIM或其他后台进程关闭了,那么就会有其他的节点起来担当主节点的角色。如果一个节点的RES进程关闭了,而此时一个远程的交互式作业还运行在其上,那么这个交互作业会继续,但这个节点不会再接受新的任务。


相关推荐:

网友留言:

您需要 登录账户 后才能发表评论

我要评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码