IBM LSF队列级资源请求

集群管理 0 979 佚名 收藏

每个队列能够定义可以应用到队列中所有作业的资源请求。当给一个队列指定资源请求,且没有指定作业级或应用的资源请求时,队列级资源请求成为该作业默认的的资源请求。

在运行badmin reconfig后,由队列确定的资源请求不再使用于一个运行的作业。例如,在一个队列中改变RES_REQ参数并且重新配置集群,之前运行作业的队列级资源请求就丢失了。

语法

分发一个作业到一个节点的条件可由lsb.queues中队列定义的队列级参数RES_REQ来指定。

示例

这样使得一个包含LINUX2.4和AIX节点的队列,可以针对不同类型的节点有不同的阈值。

RES_REQ=select[((hname==hostA && mem > 50)||(hname==hostB && mem >100))]

使用在资源请求串中的hname资源,使得您能在同一队列中的不同节点设置不同的条件。

负荷阈值

通过您的LSF管理员配置负荷阈值来调度队列中的作业。

负荷阈值指定了一个负荷指数值。

loadSched

确定分发挂起作业的负荷条件的调度阈值。如果一个节点的负荷超出了任何定义的loadSched,作业不能在该节点上启动。该阈值同样可被用作恢复挂起作业的条件。

loadStop

确定运行作业何时被挂起的挂起条件。可以给每个队列,每个节点,或者两者的组合的配置阈值。为了调度一个作业给一个节点,此节点的负荷水平必须同时满足配置给这个节点的以及分发该作业所在队列的阈值。负荷指数的值可能随着负荷增加或者减少,这取决于所指定的负荷指数的含义。

因此,当把节点负荷条件与阈值作比较时,您需要或者使用大于(>)或者使用小于(<),这取决于负荷指数。

查看队列级资源请求

使用bqueues -l来查看为该队列定义的资源请求(RES_REQ)。

bqueues -l normal
QUEUE: normal
-- No description provided. This is the default queue.
...
RES_REQ: select[type==any]
rusage[mem=10,dynamic_rsrc=10:duration=2:decay=1]
...


相关推荐:

网友留言:

您需要 登录账户 后才能发表评论

我要评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码