当我在 Windows 资源管理器 (Windows10) 中搜索包含许多 PDF 文档的目录时,我得到的结果在第一列中显示文件名,在第二列中显示路径和部分内容的预览。当我将鼠标悬停在内容部分上时,会显示有关内容的更多信息。
我认为这意味着 PDF 文件的内容以某种方式被索引。
我现在想将搜索结果中的内容信息(包括或不包括路径和文件名)导出到文本文件或 xls。
我想一次性导出搜索中的所有文件的内容信息。
是否可以通过 Windows 资源管理器或其他方式执行此操作?
答案1
zef,
如果要将所有 PDF 文档内容复制到 TXT 文件,您可以使用以下命令:
通过命令行打开cmd.exe
并输入:
FOR %1 in (Documents\*.pdf) DO echo f | xcopy "%1" "%~dp1new-files\%~n1.txt"
- 假设你的终端在以下文件夹中打开:C:\Users\zef\
- 这将对您想要的文件夹进行循环搜索,仅查找 PDF 文件
- 复制
your_folder/new-files/
并重命名为.txt
- 这仅搜索并将您的 PDF 重命名为 TXT 文件,这不是转换
- 如果你想要转换,你需要一个第三方应用程序来执行此操作,例如GhostScript
参考:
- https://ss64.com/nt/syntax-args.html
- 如何在 DOS 中将文件复制到目录,并在必要时创建目录?
- https://stackoverflow.com/questions/30651776/xcopy-returns-error-invalid-number-of-parameters-when-exclude-parameter-is-set
- https://stackoverflow.com/questions/11192039/how-to-do-a-for-loop-in-windows-command-line
如果只想要结果列表:
- 打开 Windows 资源管理器并搜索所需内容
- 当搜索结果显示时,选择全部
(Ctrl + A)
- 持有转移钥匙和右键点击在搜索结果中
- 选择
"Copy as Path"
(仅当您按住 Shift 键并单击鼠标右键时才会显示此选项) - 粘贴到记事本窗口、Excel 电子表格等...
结果将被格式化为:
"\path\to\first\item"
"\path\to\second\item"
通过命令行打开cmd.exe
并输入:
dir C:\Users\zef\Documents\*.pdf" /s /b > result.txt