我们的计算集群拥有多个文件系统,许多用户存储了大量大型文件。我们希望监控文件系统并帮助他们优化文件系统的使用,并制定扩展计划。
为了实现这一点,我们需要某种方法来监控这些文件系统的使用情况。本质上,我想知道有关这些文件的各种统计数据:
- 年龄
- 访问频率
- 上次访问时间
- 类型
- 尺寸
理想情况下,这些信息将以任何目录的汇总形式提供,以便我们可以根据项目或用户对其进行监控。
除了自己用 Python 编写一些东西外,我找不到任何能够执行这些任务的工具。有什么推荐吗?
答案1
您可能需要一些可以记录文件系统事件的东西通知. 也许是这样的日志发送.另请参阅inotify 工具。
答案2
哇。Novell 的 NSS 卷上的 Open Enterprise Server 有很多类似的东西,可以提供大部分信息。不是访问频率,这是通过上次访问日期代理的,但肯定是其余部分。这是一个 Java 进程,它抓取卷树来构建他们所谓的清单。我很确定它不是开源的,但那份报告还是不错的。
答案3
我会采用 python 方式。 os.walk()
使用起来很容易,并且每个文件所需的所有信息都在 中stat()
。