我有超过 10000 行的 in.txt 文件,该文件中的一些文本位于括号之间,例如(此文本),并且括号中的文本未导出,我想将()之间的所有文本导出到 out.txt,但前提是在如果超过 140 个字母不导出,则为 140 个字母,并且在新行 out.txt 中导出每个文本。我不希望脚本在 ubuntu 中执行此操作,并且文本由非拉丁字母(utf-8)编写。问候
答案1
假设括号之间的文本本身不能包含括号,并且您的意思是小于或等于 140 个字符,请尝试
grep -Po '(?<=\().{1,140}?(?=\))' in.txt > out.txt