合并大型 IIS 日志

Question

鉴于您在尝试对一天的数据进行排序时遇到问题，我会考虑以下两种策略之一。

找到更好的排序方式。看看能否让 Windows 排序工具为您工作。出于某种原因，日志首先使用日期和时间，采用适合 ASCII 文本排序的格式。它占用的内存少得多，并且不必解析行进行排序。我敢打赌这对您有用。
编写一个交错程序，打开所有 14 个文件并从每个文件的顶部提取最早的行，同时遍历 14 个文件。想到这一点我就不寒而栗，但每个文件只需要 64KB 内存。

旧答案：

分而治之。编写一个脚本，读取日志并按日期将它们放入新文件中，并使用包含日期的已知文件名（weblog-20110101.log）。对每个文件进行按时间排序的排序。将您需要的文件放在一起。

Answer 1

鉴于您在尝试对一天的数据进行排序时遇到问题，我会考虑以下两种策略之一。

找到更好的排序方式。看看能否让 Windows 排序工具为您工作。出于某种原因，日志首先使用日期和时间，采用适合 ASCII 文本排序的格式。它占用的内存少得多，并且不必解析行进行排序。我敢打赌这对您有用。
编写一个交错程序，打开所有 14 个文件并从每个文件的顶部提取最早的行，同时遍历 14 个文件。想到这一点我就不寒而栗，但每个文件只需要 64KB 内存。

旧答案：

分而治之。编写一个脚本，读取日志并按日期将它们放入新文件中，并使用包含日期的已知文件名（weblog-20110101.log）。对每个文件进行按时间排序的排序。将您需要的文件放在一起。

相关内容