LSF Waiting for dispatch ...

集群管理 0 869 团子精英 收藏

问题现象:

在提交节点进行Job提交的时候。提示<<Waiting for dispatch ...>>,如下图所示

1.jpg

问题原因:

提交节点的DNS解析出现问题

问题分析:

1、使用了DNS服务器来进行解析,但是dns在解析的时候出现了问题,如A记录丢失,dns负载过高导致解析过慢。

2、使用了hosts进行解析,但是hosts并没有解析到合适的地址(如果使用hosts这种问题可能很少发生),最大的可能是提交服务器,计算服务器,master服务器的hosts解析不一致。

问题解决:

1、A记录丢失,如果使用静态dns,可以手动重新添加A记录解析

2、A记录丢失,如果使用动态dns,可以在提交节点使用命令更新dns

更新dns的命令如下:

net ads dns register -P submit.fasteda.cn

注意,上面的submit.fasteda.cn 是当前提交节点的域名。必须是完整的。

3、hosts解析问题,使用相同的hosts解析文件,可以使用证书+scp的方式将hosts文件快速同步到所有服务器

其他内容:

反向DNS解析:

在使用动态提交节点的时候,不管需要将动态节点的A记录进行解析,同时还需要提供反向DNS解析功能,也就是一个IP对应一个域名

正向ping

submit.fasteda.cn ------>  10.10.10.10

反向nslookup

10.10.10.10     ------>  submit.fasteda.cn

在动态节点解析中,必须正向与反向必须一对一,否则lsfmaster无法解析到动态节点,使得JOB无法提交.


相关推荐:

网友留言:

您需要 登录账户 后才能发表评论

我要评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码