优化/替换“查找”命令

Question 1

通过使用仅会导致分叉一次的+结尾，可以实现性能改进。-execfind-exec

而在的情况下;，-exec每次都会为新的参数分叉。

所以你可以使用：

find path -type f -name '*.cdr.xml' -mmin +1 -exec mv -t /path {} +

如果有可能出现重复的文件名：

find path -type f -name '*.cdr.xml' -mmin +1 -exec mv -it /path {} +

或者

find path -type f -name '*.cdr.xml' -mmin +1 -exec mv --backup=numbered -t /path {} +

--backup=numberedmv如果目标中的文件名相同，则将导致文件的编号备份，而不是覆盖。

Answer

通过使用仅会导致分叉一次的+结尾，可以实现性能改进。-execfind-exec

而在的情况下;，-exec每次都会为新的参数分叉。

所以你可以使用：

find path -type f -name '*.cdr.xml' -mmin +1 -exec mv -t /path {} +

如果有可能出现重复的文件名：

find path -type f -name '*.cdr.xml' -mmin +1 -exec mv -it /path {} +

或者

find path -type f -name '*.cdr.xml' -mmin +1 -exec mv --backup=numbered -t /path {} +

--backup=numberedmv如果目标中的文件名相同，则将导致文件的编号备份，而不是覆盖。

Question 2

你可以看一下看门狗（https://github.com/gorakhargosh/watchdog/）为了将所有逻辑保留在 python 中，您可以监视目录并在一分钟后移动每个文件而不进行修改。

另一种解决方案是使用同步传输所有文件寻找输出而不是构造-执行。

一点解释：

find ... -exec ... \;-> 这将为每个结果执行命令，这会增加很多开销并且非常慢。

find ... -exec ... +-> 这将连接所有结果并仅执行一次命令，这非常快，但您可能会达到命令的 shell 字符限制（特别是对于数百万个文件）。

现在与同步:

find path -name *.cdr.xml -mmin +1 -print0 | rsync --remove-source-files -0 --files-from=- ${DESTINATION}

解释：

find ... -print0 |-> 这会将所有 NULL 分隔的结果传递到管道，由另一端的 rsync 处理。

--remove-source-files-> 这是不言自明的，就像mv.

--files-from=--> 这将从管道读取标准输入

-0-> 这将从管道中读取以 NULL 结尾的列表而不是行。

为什么 NULL？...为了加快一点速度，NULL 比新行占用更少的字节，将其增加到一百万，您可以节省一堆字节。

Answer