IBM LSF队列管理

集群管理 0 1145 张长瑞 收藏

限制节点只为某队列服务

你可能希望某个节点只运行提交到某个队列的作业。例如,你为某个部门(比如说是工程部)添加一个节点,那么你就可能希望只有提交到engineering1和engineering2队列的作业才能在这个节点上运行。

==============================

1 以Root或LSF管理员身份登录到集群中任何一个节点;

2 修改lsb.queues文件,在队列的HOST段上添加节点;

Begin Queue
QUEUE_NAME = queue1
...
HOSTS=mynewhost hostA hostB
...
End Queue

3 保存对lsb.queues文件的修改;

4 使用

badmin ckconfig

命令来检测定义中是否有错误;若有任何错误,请修改后再次检测;

5 运行

badmin reconfig

命令来重新设定mbatchd;

6 在你重新配置前提交的作业不会知道这个新添加的节点,若想让他们知道,请使用

badmin mbdrestart

来重新启动mbatchd。

===========================================

添加队列管理员

队列管理员是安装完成后的可选配置。他们的权限限于制定的队列,可以管理队列的状态,如开启、关闭、激活以及阻止,还可以管理运行在队列中的作业。队列管理员不能修改配置文件,也不能对LSF进程进行操作 ,同时也不能管理没有指定的队列。

要将作业从一个队列转移到另一个队列,你必须同时具有两个队列的管理权限。

===============================

在lsb.queues文件中,在相应队列的Begin Queue与End Queue之间,添加ADMINISTRATORS参数并在其后填入管理员列表,你可以使用用户名或用户组名,用空格分开。

Begin Queue
ADMINISTRATORS = User1 GroupA
End Queue

================================


相关推荐:

网友留言:

您需要 登录账户 后才能发表评论

我要评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码