如何删除或抓取文件内的特定文本

Question 1

文本中可能有空格、符号和点，但文本中的原始分隔符始终/ / / :不会出现在文本内的任何其他地方。

~~不对。您举了一个例子14:00 to 16:00。我们暂时假设它是真的。~~这允许一种简单的方法：

tr ':' '/' | cut -d '/' --output-delimiter=';' -f 3,5

tr统一分隔符，然后cut选择正确的字段。

笔记：

--output-delimiterPOSIX 不要求。如果你cut不支持它，这是替代方案：
```
tr ':' '/' | cut -d '/' -f 3,5 | tr '/' ';'
```
请注意，我们不能将其用作tr ':' ';'管道中的第一个命令（这会简化其余部分），因为您不能保证它;不会出现在输入中（cut如果出现则会感到困惑）。
cut采取字段 3 和 5（而不是 2 和 4），因为第一个分隔符之前的所有内容已经是字段 1（在您的情况下为空字符串）。

但是，如果只有第一个:应该是分隔符，那么命令可能是：

sed 's|:|/|' | cut -d '/' --output-delimiter=';' -f 3,5

sed 's|:|/|'将仅替换第一次出现的:（与之相对sed 's|:|/|g'，相当于我们原来的tr ':' '/'）。

如果你不熟悉使用此类过滤器处理文件的标准方法，这是正确的语法（符合sedPOSIX 标准cut）：

< File1.txt sed 's|:|/|' | cut -d '/' -f 3,5 | tr '/' ';' > Result.txt

Answer

文本中可能有空格、符号和点，但文本中的原始分隔符始终/ / / :不会出现在文本内的任何其他地方。

~~不对。您举了一个例子14:00 to 16:00。我们暂时假设它是真的。~~这允许一种简单的方法：

tr ':' '/' | cut -d '/' --output-delimiter=';' -f 3,5

tr统一分隔符，然后cut选择正确的字段。

笔记：

--output-delimiterPOSIX 不要求。如果你cut不支持它，这是替代方案：
```
tr ':' '/' | cut -d '/' -f 3,5 | tr '/' ';'
```
请注意，我们不能将其用作tr ':' ';'管道中的第一个命令（这会简化其余部分），因为您不能保证它;不会出现在输入中（cut如果出现则会感到困惑）。
cut采取字段 3 和 5（而不是 2 和 4），因为第一个分隔符之前的所有内容已经是字段 1（在您的情况下为空字符串）。

但是，如果只有第一个:应该是分隔符，那么命令可能是：

sed 's|:|/|' | cut -d '/' --output-delimiter=';' -f 3,5

sed 's|:|/|'将仅替换第一次出现的:（与之相对sed 's|:|/|g'，相当于我们原来的tr ':' '/'）。

如果你不熟悉使用此类过滤器处理文件的标准方法，这是正确的语法（符合sedPOSIX 标准cut）：

< File1.txt sed 's|:|/|' | cut -d '/' -f 3,5 | tr '/' ';' > Result.txt

Question 2

sed这样做：

echo '/Text1/Text2/Text3:Text4' | sed -E 's/\/([a-zA-Z0-9]+)\/([a-zA-Z0-9]+)\/([a-zA-Z0-9]+):([a-zA-Z0-9]+)/\2;\4/'

-E使用扩展正则表达式
\/使用转义字符来表示特定/字符
([a-zA-Z0-9]+)定义让我们说单词模式地区。
\2;\4访问第二和第四区域部分。

根据您的上一版本：

sed -E 's/\/([^/]+)\/([^/]+)\/([^/:]+):([^/]+)$/\2;\4/' FileName

Answer

sed这样做：

echo '/Text1/Text2/Text3:Text4' | sed -E 's/\/([a-zA-Z0-9]+)\/([a-zA-Z0-9]+)\/([a-zA-Z0-9]+):([a-zA-Z0-9]+)/\2;\4/'

-E使用扩展正则表达式
\/使用转义字符来表示特定/字符
([a-zA-Z0-9]+)定义让我们说单词模式地区。
\2;\4访问第二和第四区域部分。

根据您的上一版本：

sed -E 's/\/([^/]+)\/([^/]+)\/([^/:]+):([^/]+)$/\2;\4/' FileName

Question 3

虽然不是最短/最快的解决方案，但可以完成工作并且易于理解：

#!/bin/bash

while read -r line; do
    echo -n "$line" | cut -d "/" -f 3 | tr -d $'\n'
    echo -n ";"
    echo "$line" | cut -d ":" -f 2
done < "File1.txt"

-n因为前两个echos 很重要，所以它们都放在一行中。

由于您的版本cut不支持，-z因此| tr -d $'\n'需要删除 cut 的尾随换行符。

Answer

虽然不是最短/最快的解决方案，但可以完成工作并且易于理解：

#!/bin/bash

while read -r line; do
    echo -n "$line" | cut -d "/" -f 3 | tr -d $'\n'
    echo -n ";"
    echo "$line" | cut -d ":" -f 2
done < "File1.txt"

-n因为前两个echos 很重要，所以它们都放在一行中。

由于您的版本cut不支持，-z因此| tr -d $'\n'需要删除 cut 的尾随换行符。

如何删除或抓取文件内的特定文本

答案1

答案2

答案3

相关内容