如何将文件中的所有列截断为特定长度？

Question 1

sed 's/\([^,]\{0,3\}\)[^,]*/\1/g'会将每列截断为前 3 个字符。列由“,”字符分隔。

怎么运行的：

正如评论中指出的，如果您使用，则可以优化第一步([^,]\{3\}\)。这样我们只匹配确切地3 个字符。如果较少，我们不在乎，因为我们不必截断该字段。所以最终的命令是：

`sed 's/\([^,]\{3\}\)[^,]*/\1/g'`

Answer

sed 's/\([^,]\{0,3\}\)[^,]*/\1/g'会将每列截断为前 3 个字符。列由“,”字符分隔。

怎么运行的：

正如评论中指出的，如果您使用，则可以优化第一步([^,]\{3\}\)。这样我们只匹配确切地3 个字符。如果较少，我们不在乎，因为我们不必截断该字段。所以最终的命令是：

`sed 's/\([^,]\{3\}\)[^,]*/\1/g'`

Question 2

我可以想象，文件按列结构并不重要，因为您写道您对长网址感到恼火。至少在解析文件而不是查看文件的情况下。

在这种情况下我的解决方案是

perl -pe 's%(http://\S+)%substr($1, 0, 15)%ge' <file_with_long_urls> | column -t

这会删除 url 后第十五个字符后面的所有字符http://。

如果列不是由空格分隔而是由字符&（代表任意分隔符）分隔，我的解决方案如下所示

perl -pe 's%(http://\S+?)(?=&|$)%substr($1, 0, 15)%ge' <file_with_long_urls> | column -s '&' -t

也许你可以用这个！？

Answer

我可以想象，文件按列结构并不重要，因为您写道您对长网址感到恼火。至少在解析文件而不是查看文件的情况下。

在这种情况下我的解决方案是

perl -pe 's%(http://\S+)%substr($1, 0, 15)%ge' <file_with_long_urls> | column -t

这会删除 url 后第十五个字符后面的所有字符http://。

如果列不是由空格分隔而是由字符&（代表任意分隔符）分隔，我的解决方案如下所示

perl -pe 's%(http://\S+?)(?=&|$)%substr($1, 0, 15)%ge' <file_with_long_urls> | column -s '&' -t

也许你可以用这个！？

相关内容