使用 SED 从文件名中提取部分内容

Question

你说的非常正确。下面是我的看法。

find . -iname '*.txt'查找扩展名为的文件的名称txt，忽略大小写（因此 ./wibble/wobble/wubble.Txt 可能是一个示例）

sed -e 's/.*_\([0-9]\{4\}_[0-9|A-z]*\).*/\1./i'查找最后一个下划线序列，后跟 4 个数字，后跟下划线，可选地后跟文件路径中的一系列字母、数字、竖线以及可能的其他字符。如果它找到这样的序列，它会丢弃所有其他内容，丢弃前导_并附加一个.字符，否则它会保持文件名不变。

sort -对文件名进行排序，尊重大小写（尽管区域设置排序算法可能在第一个实例中忽略大小写）。

uniq -ui拒绝出现多次的名称，忽略大小写差异。

tr -d '\n'通过删除换行符将所有文件名连接在一起。

这段代码看起来很脆弱！它可能期望有一个名为类似的文件sub/dir/pics_2023_happyxmas!/company/party/photos.txt并想要提取2023_happyxmas..添加另一个带有 txt 扩展名的文件可能会为结果变量提供另一个组件username，尽管您可以使用.字符将它们分开。

允许匹配哪些字符可能取决于locale运行脚本的环境。

添加扩展名为的另一个文件，txt但名称中不含下划线，将破坏使用.拆分名称的功能。

如果程序在受控环境中运行，那可能没问题，但我肯定会拒绝sed它发现的任何与预期模式不匹配的行，而不是将它们原封不动地传递。

Answer 1