我有一个文本文件,其中包含以下带有常规文本的 unicode 字符串。
目录a.txt
{"relationship":{"type:Memberkey","id""824-\u0001\u0019BFGHDICA2166-01-01","source"}
这里\u0001
和\u0019
是 unicode 字符串,导致我们的程序失败。
是否有通用命令来替换任何此类字符串?
答案1
答案2
如果你只是想摆脱这些控制字符,你可以使用 sed:
sed -i 's/\\u001[[:xdigit:]]//;s/\\u000[0-9bBcCeEFF]//' your_file
我假设您想保留 CR 和 LF 字符,即使它们被编码为\u000a
和\u000d
。