文件重复数据删除和过滤

文件重复数据删除和过滤

我不得不在其中一个驱动器上运行 TestDisk 文件恢复软件。结果发现有 16,000 多个文件,这些文件的名称基本上都是字母数字字符串。其中许多文件包含重复或无关紧要的内容,可以直接删除。

我可以使用 Visual Studio Code 在文件内运行批量关键字搜索,并且效果很好,但如果不手动定位每个文件,我就无法从搜索结果中删除/或移动文件。

如何使用 Windows 10 或其他软件筛选文件并批量删除具有重复内容和特定关键字的文件?

答案1

为什么不使用 Windows 搜索,在非索引文件,或者免费的第三方工具,例如特工搜捕 Lite,它可让您根据文件内容查找文件,并允许您删除任何或所有匹配的文件?Agent Ransack 甚至会显示内容预览,以帮助做出这样的决定。

特工搜查

答案2

您可以使用 powershell 来实现这一点。但在删除之前要小心。重复项。以下是列出重复项的示例目录:\temp及以下:

Get-ChildItem -Path C:\Temp -File -Recurse | Get-FileHash | Group -Property Hash | WHERE Count -gt 1 | % {
    $firstGroupHashInfo = $_.Group | Select -First 1
    Write-Host "[Hash: $($firstGroupHashInfo.Hash)]"
    Write-Host "  First: $($firstGroupHashInfo.Path)"
    Write-Host "  Duplicates:"
    $_.Group | Select -Skip 1 | % { Write-Host "    $($_.Path)" }
}

相关内容