大数据文件信息提取方法

Question

您正在为每个文件执行一个新的 cmd，这非常昂贵。这并不是什么新鲜事：

将 CMD.exe 与 FORFILES 一起使用有一些缺点，FORFILES 处理的每个文件都会创建一个新进程并销毁它，因此如果循环遍历 1000 个文件，那么将打开和关闭 1000 个 CMD.exe 副本，这会影响性能。

TreeSize Free 在 MFT（主文件表）上运行，扫描速度极快。扫描操作在线程中运行，因此，当 TreeSize Free 在后台运行时，您几乎可以立即看到结果。

您可以通过不调用更多可执行文件来做得更好。PowerShell 在这方面很棒，即使对于我的新手级别也是如此：

Get-ChildItem D:\path\ -recurse |
Where-Object {$_.CreationTime -and $_.CreationTime -lt "2/21/2017" } | 
Select-Object FullName, LastWriteTime |
Export-Csv myfile.csv

所需的输出格式和其他文件是读者的练习。

Answer 1

您正在为每个文件执行一个新的 cmd，这非常昂贵。这并不是什么新鲜事：

将 CMD.exe 与 FORFILES 一起使用有一些缺点，FORFILES 处理的每个文件都会创建一个新进程并销毁它，因此如果循环遍历 1000 个文件，那么将打开和关闭 1000 个 CMD.exe 副本，这会影响性能。

相比之下，尺寸实用程序TreeSize 已针对速度进行了优化：

TreeSize Free 在 MFT（主文件表）上运行，扫描速度极快。扫描操作在线程中运行，因此，当 TreeSize Free 在后台运行时，您几乎可以立即看到结果。

您可以通过不调用更多可执行文件来做得更好。PowerShell 在这方面很棒，即使对于我的新手级别也是如此：

Get-ChildItem D:\path\ -recurse |
Where-Object {$_.CreationTime -and $_.CreationTime -lt "2/21/2017" } | 
Select-Object FullName, LastWriteTime |
Export-Csv myfile.csv

所需的输出格式和其他文件是读者的练习。

大数据文件信息提取方法

答案1

相关内容