IBM Spectrum LSF队列控制

集群管理 0 881 张长瑞 收藏

 控制队列前提:

LSF 管理员或 Root 用户,可以通过命令或设置运行窗口或派发窗口来控制队列。 

一、关闭一个队列 :

=================== 

运行 badmin qclose 命令: 

 Badmin qclose normal 

 Queue 《normal 》 is closed 

 若有用户向已经关闭了队列提交作业的时候,他会收到如下的信息: 

 Bsub –q normal … 

 Normal:Queue has been closed 

==================== 

二、开启一个队列:

==================== 

运行 badmin qopen: 

 Badmin qopen normal 

 Queue 《normal 》 is opened 

=====================

三、 阻止一个队列

 ===================== 

运行 badmin qinact: 

 Badmin qinact normal

 Queue 《normal 》 is inactivated 

===================== 

四、激活一个队列 

====================== 

运行 badmin qact: 

 Badmin qact normal

 Queue 《normal 》 is activated

 ====================== 

五、当作控制一个队列的操作时登记注释信息

 ======================= 

1、在使用 badmin qclose, qopen, qact, qinact 命令的同时使用-C 选项, 就可以向 lsb.events 文件中登记一条注释信息。

Badmin qclose –C “change configuration”normal

这个注释信息“change configuration”将被登记在 lsb.events 文件中。

 每个队列时间都会登记一条新的日志信息;例如:

Badmin qclose –C “add user” normal

紧接着输入 

Badmin qclose –C “add user user1” normal


 这样就会在 lsb.events 文件中如下的记录:

 "QUEUE_CTRL" "7.0 1050082373 1 "normal" 32185 "lsfadmin" "add user"
 "QUEUE_CTRL" "7.0 1050082380 1 "normal" 32185 "lsfadmin" "add user user1"

2、使用 badmin hist 或 badmin qhist 来显示管理员在操作队列时登记的注 释信息。 Badmin qhist 

badmin qhist


Fri Apr 4 10:50:36: Queueclosed by administrator
change configuration.

bqueues -l  命令还可以显示如下的所登记的注释信息: 

bqueues -l normal 
QUEUE: normal
 -- For normal low priority jobs, running only if hosts are lightly loaded. This is the default queue.
PARAMETERS/STATISTICS
PRIO NICE STATUS MAX JL/U JL/P JL/H NJOBS PEND RUN SSUSP USUSP RSV 
30   20   Closed:Active  -  -  -  -  0  0  0  0  0  0 
Interval for a host to accept two jobs is 0 seconds

THREADLIMIT
   7 
   
SCHEDULING PARAMETERS 
          r15s  r1m  r15m  ut  pg  io  ls  it  tmp  swp  mem 
loadSched    -    -    -    -    -   -   -   -   -    -    -
loadStop     -    -    -    -    -   -   -   -   -    -    - 

              cpuspeed bandwidth 
loadSched         -        - 
loadStop          -        - 

JOB EXCEPTION PARAMETERS 
              OVERRUN(min) UNDERRUN(min) IDLE(cputime/runtime) 
Threshold           -             2               - 
    Jobs           -             0               - 
    
USERS: all users 
HOSTS: all 
RES_REQ: select[type==any] 

ADMIN ACTION COMMENT: "change configuration"


相关推荐:

网友留言:

您需要 登录账户 后才能发表评论

我要评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码