IBM LSF任务级资源请求

集群管理 0 1015 佚名 收藏

每个作业都能指定资源请求。作业级资源请求覆盖了任何在远端作业列表中指定的资源请求。在某些情况下,队列说明在一个资源上设置了一个上界或者下界。如果企图超出那个界限,作业将被拒绝。

语法

为了给您的作业指定资源请求,使用bsub -R且象通常那样指定资源请求串您可以指定多个-R order, same, rusage,及select段。

提示:用esub,您必须使用&&操作符来指定多个资源请求。在esub中的LSB_SUB_RES_REQ变量不支持多个-R段的使用。

示例

bsub -R "swp > 15 && hpux order[ut]" myjob

或者

bsub -R "select[swp > 15]" -R "select[hpux] order[ut]" myjob

这样就会在一个低负荷的(CPU使用率)及至少有15MB可用交换内存的HP-UX节点上运行myjob。

bsub -R "select[swp > 15]" -R "select[hpux] order[r15m]"
-R "order[r15m]" -R rusage[mem=100]" -R "order[ut]" -R "same[type]
-R "rusage[tmp=50:duration=60]" -R "same[model]" myjob

LSF把多个-R选项合并到一个串中,并且如果所有的资源请求都能得到满足,就分发该作业。

通过支持多个资源请求串及把它们自动合并到一个串中,LSF简化了包装脚本多个层次的使用。

查看作业级资源请求

1.使用bjobs -l来查看为作业定义的资源请求。

bsub -R "type==any" -q normal myjob
Job <2533> is submitted to queue <normal>.
bjobs -l 2533
Job <2533>, User <user1>, Project <default>, Status <DONE>, Queue
<normal>,
Command <myjob>
Fri May 10 17:21:26: Submitted from host <hostA>, CWD <$HOME>,
Requested Resources <type==any>;
Fri May 10 17:21:31: Started on <hostB>, Execution Home
</home/user1>,Execution CWD </home/user1>;
Fri May 10 17:21:47: Done successfully. The CPU time used is 0.3
seconds.
...

Job-level Resource Requirements

290 Administering Platform LSF

2.在作业完成后,使用bhist -l来查看为该作业定义的资源请求。

bhist -l 2533
Job <2533>, User <user1>, Project <default>, Command <myjob>
Fri May 10 17:21:26: Submitted from host <hostA>, to Queue
<normal>, CWD
<$HOME>, Requested Resources <type==any>;
Fri May 10 17:21:31: Dispatched to <hostB>;
Fri May 10 17:21:32: Starting (Pid 1850232);
Fri May 10 17:21:33: Running with execution home </home/user1>,
Execution
CWD </home/user1>, Execution Pid <1850232>;
Fri May 10 17:21:45: Done successfully. The CPU time used is 0.3
seconds;
...


注意:如果您使用bsub –R选项的多个选择串来提交一个作业,bjobs -l和bhist -l显示一个单一、合并了的选择串。


相关推荐:

网友留言:

您需要 登录账户 后才能发表评论

我要评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码