find
我对 Linux命令的正则表达式用法感到非常困惑。
我知道有一个选项regextype
,但如果没有这个选项,根据当前的手册页,它应该使用 Emacs 正则表达式。 这一页似乎说支持字符类(“这是一个 POSIX 功能”),但我的实验似乎表明,类似[[:ascii:]]
或[[:digit:]]
或[[:alnum:]]
的任何东西都不起作用,除了这些确实是处理字符类的古老方法这一事实之外。相反,您似乎必须使用[a-zA-Z]
this,除了其他任何东西之外,对于 Unicode 字符来说毫无用处。
所以我转向regextype
: 我发现您可以通过转到 获得可能设置的列表find -regextype help
。这给出:
find: Unknown regular expression type ‘help’; valid types are ‘findutils-default’, ‘awk’, ‘egrep’, ‘ed’, ‘emacs’, ‘gnu-awk’, ‘grep’, ‘posix-awk’, ‘posix-basic’, ‘posix-egrep’, ‘posix-extended’, ‘posix-minimal-basic’, ‘sed’.
...所以我假设通过包含-regextype posix-basic
,例如,我能够运行如下所示的东西:
find . -maxdepth 1 -regextype posix-basic -regex .*\d.*
这会产生结果,但不是我所希望的结果:当前目录中的所有文件和文件夹名称中都带有小写字母“d”!我期待所有名字都至少有一位数字。
我在 Stack Exchange 上查看了相当多的 Linuxfind
正则表达式问题,但我认为我没有看到任何一个演示了“现代”字符类处理的问题。是否有任何regextype
选项能够处理这样的事情:
find . -maxdepth 1 -regextype ??? -regex '.*\d{3}\s+.*'
我的意思是“包含三位数字,后跟一个或多个空格字符”。即来自 Java、Python、Javascript 等普通语言的正则表达式规则之类的东西?
稍后,根据评论
这是一个练习:创建一个目录并在其中放入一些随机名称的文件。然后添加具有以下名称的文件:“ctb117b”、“ctb117c”、“trt117a”。
然后我想隔离“117”文件。可能有名为“xxx0009333qqq”的文件。因此,使用现代正则表达式引擎,我会像这样,例如(允许前面的 ./):
find . -regex './\w{3}\d\{3}.*'
使用这些更古老的 Linux 正则表达式规则,我该写什么才有效呢?
find . -regextype posix-basic -regex '.*[[:digit:]]{3}.*'
什么也不产生。'.*[[:digit:]]+.*'
例如,也没有。如果有人足够感兴趣,请向我展示一些适合您的东西(列出上述文件)。
答案1
我建议使用这个:
find . -maxdepth 1 -regextype posix-extended -regex '.*[[:digit:]]{3}\s+.*'