标准输出重定向。 sh:资源暂时不可用

标准输出重定向。 sh:资源暂时不可用

我有大批量的 bash 进程。每个 bash 脚本都会调用可执行文件,这些可执行文件的标准输出重定向到不同的日志文件。大约 5% 的运行最终会出现: sh: [日志名称]: 资源暂时不可用 我尝试减少并行运行的作业量,但某些 bash 脚本上仍然存在错误。

附加信息:

  • 使用 ESXi 在虚拟机上运行的 Ubuntu 14.04 LTS
  • 发生在分配了 gparted 和 LVM 的新分区上(由整个分区组成的新逻辑卷)
  • 使用 nfs-kernel-server 导出 LV
  • LV 还可以使用 Samba 共享到 Windows
  • LV使用ext4格式化
  • 我拥有这台机器的管理员权限

更详细的信息

  • 一切都使用 Sun-Grid-Engine 在集群中运行
  • 有4个虚拟机:m1、m2、m3、m4
  • m1 运行 sge master、sge exec 和 ldap 服务器
  • m2、m3、m4 运行 sge exec
  • m3 运行 nfs-kernel-server,导出位于使用本地磁盘上的分区的逻辑卷(使用 LVM)中的文件夹,m1、m2、m4
  • m3 有一个软链接到文件夹
  • m1、m2、m4 安装通过 fstab 访问文件夹,因此所有机器最终都指向同一个文件夹
  • m3、m2、m4 运行 ldap 客户端,连接到 m1
  • 所有作业均通过m1(配置为提交主机)提交到集群
  • 作业仅在 m3(导出磁盘)上失败。不过,m3 上的大部分工作都已经过去了。失败是随机的,但仅在 m3 上是一致的。
  • m3 还分享了通过 Samba 到 Windows 客户端

任何帮助将不胜感激:)(如何调试,哪些日志是相关的,如何从系统中获取更多信息,等等......)

先感谢您!

答案1

感谢所有试图提供帮助的人!

通过使用 nfs 在 m3 上安装逻辑卷(与作为 nfs 客户端的其余机器 m1/m2/m4 上的安装方式完全相同)解决了该问题,而不是在 m3 上使用到逻辑卷的软链接。只需将以下行添加到 /etc/fstab: 中<nfs server>:/ /mnt nfs auto 0 0,然后调用sudo mount -a.

提示是事实上,m3(nfs 服务器)上持续发生故障,并且自动重新提交失败的作业也解决了该问题。 m1/m2/m4(nfs 客户端)上从未出现过故障。记住m3是nfs服务器,它有一个简单的软链接到逻辑卷,而所有客户端都使用nfs来连接这个逻辑卷。

在我的脑海里,我有一种感觉,nfs 可能会保护它的客户端免受这些问题的影响,但我认为逻辑卷上的文件系统不应该失败,如果失败了,那么我遇到了一个真正的问题,我必须根本原因。顺便说一句,情况可能仍然如此。

如果您对这个问题和解决方案有见解 - 请写下来。如果问题确实存在,我不想掩盖它们。

相关内容