与 Linux 查找正则表达式的混淆

与 Linux 查找正则表达式的混淆

find我对 Linux命令的正则表达式用法感到非常困惑。

我知道有一个选项regextype,但如果没有这个选项,根据当前的手册页,它应该使用 Emacs 正则表达式。 这一页似乎说支持字符类(“这是一个 POSIX 功能”),但我的实验似乎表明,类似[[:ascii:]][[:digit:]][[:alnum:]]的任何东西都不起作用,除了这些确实是处理字符类的古老方法这一事实之外。相反,您似乎必须使用[a-zA-Z]this,除了其他任何东西之外,对于 Unicode 字符来说毫无用处。

所以我转向regextype: 我发现您可以通过转到 获得可能设置的列表find -regextype help。这给出:

find: Unknown regular expression type ‘help’; valid types are ‘findutils-default’, ‘awk’, ‘egrep’, ‘ed’, ‘emacs’, ‘gnu-awk’, ‘grep’, ‘posix-awk’, ‘posix-basic’, ‘posix-egrep’, ‘posix-extended’, ‘posix-minimal-basic’, ‘sed’.

...所以我假设通过包含-regextype posix-basic,例如,我能够运行如下所示的东西:

find . -maxdepth 1 -regextype posix-basic -regex .*\d.*

这会产生结果,但不是我所希望的结果:当前目录中的所有文件和文件夹名称中都带有小写字母“d”!我期待所有名字都至少有一位数字。

我在 Stack Exchange 上查看了相当多的 Linuxfind正则表达式问题,但我认为我没有看到任何一个演示了“现代”字符类处理的问题。是否有任何regextype选项能够处理这样的事情:

find . -maxdepth 1 -regextype ??? -regex '.*\d{3}\s+.*'

我的意思是“包含三位数字,后跟一个或多个空格字符”。即来自 Java、Python、Javascript 等普通语言的正则表达式规则之类的东西?

稍后,根据评论

这是一个练习:创建一个目录并在其中放入一些随机名称的文件。然后添加具有以下名称的文件:“ctb117b”、“ctb117c”、“trt117a”。

然后我想隔离“117”文件。可能有名为“xxx0009333qqq”的文件。因此,使用现代正则表达式引擎,我会像这样,例如(允许前面的 ./):

find . -regex './\w{3}\d\{3}.*' 

使用这些更古老的 Linux 正则表达式规则,我该写什么才有效呢?

find . -regextype posix-basic -regex '.*[[:digit:]]{3}.*' 

什么也不产生。'.*[[:digit:]]+.*'例如,也没有。如果有人足够感兴趣,请向我展示一些适合您的东西(列出上述文件)。

答案1

我建议使用这个:

find . -maxdepth 1 -regextype posix-extended -regex '.*[[:digit:]]{3}\s+.*'

相关内容