从具有任意文本的文本文件中提取 .json

Question

sed '/^{/,/^}/!d' < input

{将提取以开头的行和以开头的下一行之间包含的文件部分}。

pcregrep -Mo '(?s)(\{(?:[^{}"]++|"(?:\\.|[^"])*+"|(?1))*\})' < file

会提取顶级{...}s 对，无论它们在哪里，足够智能来处理像{"x":{"y":1}}(nested {}) 或{ "x}" }( }inside strings) 或{ "x\"}" }(escaped quote in strings) 这样的输入。

如果您没有并且无法安装pcregrep（随 PCRE 库一起提供），但您有grep使用 PCRE 构建的 GNU ，您可以替换为，grep -zo尽管它将整个文件加载到内存中。或者使用perl -l -0777 -ne 'print for m{regexp-above}g'.

Answer 1

sed '/^{/,/^}/!d' < input

{将提取以开头的行和以开头的下一行之间包含的文件部分}。

pcregrep -Mo '(?s)(\{(?:[^{}"]++|"(?:\\.|[^"])*+"|(?1))*\})' < file

会提取顶级{...}s 对，无论它们在哪里，足够智能来处理像{"x":{"y":1}}(nested {}) 或{ "x}" }( }inside strings) 或{ "x\"}" }(escaped quote in strings) 这样的输入。

如果您没有并且无法安装pcregrep（随 PCRE 库一起提供），但您有grep使用 PCRE 构建的 GNU ，您可以替换为，grep -zo尽管它将整个文件加载到内存中。或者使用perl -l -0777 -ne 'print for m{regexp-above}g'.

相关内容