遇到一个同事报告,搭建的matlab LSF集群出现一个很奇特的现象,除了NFS/NIS 服务器上可以打开matlab GUI界面之外,其他lsf 计算服务器均不可以打开,太奇怪了!
现场查看,找了很久,发现配置问题还挺多的,只能一个一个修复了再说。
1.配置的是Xmanager登陆。
因为其使用的是本地X Server,所以我考虑修改为vnc,这个更可靠点儿。
2.默认配置的是nfs v4。
考虑到当前还是使用nfs v3更加可靠,修改/etc/sysconfig/nfs文件,取消nfs v4支持,默认都采用v3.
3.Selinux和firewall都开启了。
selinux disabled,iptables off.
发现以上做法还是不行,怎么办?
4. autofs先取消
测试直接在fstab文件中写好,然后mount上。
依然不行!
发现一个现象,在nis client上,ypcat passwd都正常,但是su - user的时候,非常慢。
5. mv .cshrc chsrc.bak 取消默认的shell配置
依然慢
6. 检查nis客户端设置,没问题
嗯,好像setup配置的时候,看到没开cache,开上,提示缺少nscd文件
7. 安装nscd
yum install nscd
chkconfig --level 345 nscd on
/etc/init.d/nscd start
8. su - user
ok.....一切正常了
再次打开matlab,发现一切都正常了,可以打开GUI了。
总结: nscd是cache认证信息的,如果没有,会导致客户端认证的时候,不断去nis server查询,正常情况下,是可以的。。但是在某些情况下,缺少信息,可能导致不断去查询,然后导致应用认证超时而无法启动。
注意: Cliosoft SOS 6.32以前的版本也需要nscd服务的支持,否则会出现找不到用户名的问题
网友留言: