我正在运行一个脚本来从命令行检查我的 gmail 并显示标题中的前 35 个字符。
curl -u username:password --silent "https://mail.google.com/mail/feed/atom" | \
grep -oPm1 "(?<=<title>)[^<]+" | sed '1d'|cut -b 1-35
该脚本工作正常,除非标题包含特殊字符,如'
、&
等。我怎样才能让它们正确显示?剪切并粘贴到此处可以正确显示它,但是当我将其打印到终端时,我得到了'
for'
和&
for &
。
Up to 93% Off - Valentine's Day Today's Deals Live Now:
Michael Vince • FENDI & More for Men
答案1
您必须解码 html,因此通过解码器传输输出:
和perl
:
$ your cammand | perl -MHTML::Entities -le 'while(<>) {print decode_entities($_);}'
参见示例:
$ echo "Ambersand & and Single quote '" | perl -MHTML::Entities -le 'while(<>) {print decode_entities($_);}'
Ambersand & and Single quote '