我有样品:
"name": "The title of website",
"sync_transaction_version": "1",
"type": "url",
"url": "https://url_of_website"
我想得到以下输出:
"The title of website" url_of_website
我需要从 URL 中删除协议前缀,这样就只剩下协议前缀了(前面url_of_website
没有)。http
问题是我不太熟悉sed
阅读多行,做一些研究可以找到我https://unix.stackexchange.com/a/337399/256195,仍然无法得出结果。
我试图解析的有效 json 对象是Bookmark
google chrome 的,示例:
{
"checksum": "9e44bb7b76d8c39c45420dd2158a4521",
"roots": {
"bookmark_bar": {
"children": [ {
"children": [ {
"date_added": "13161269379464568",
"id": "2046",
"name": "The title is here",
"sync_transaction_version": "1",
"type": "url",
"url": "https://the_url_is_here"
}, {
"date_added": "13161324436994183",
"id": "2047",
"meta_info": {
"last_visited_desktop": "13176472235950821"
},
"name": "The title here",
"sync_transaction_version": "1",
"type": "url",
"url": "https://url_here"
} ]
} ]
}
}
}
答案1
这适用于问题中给出的 JSON 文档:
$ jq -r '.roots.bookmark_bar.children[]|.children[]|["\"\(.name)\"",.url]|@tsv' file.json
"The title is here" https://the_url_is_here
"The title here" https://url_here
这将访问.children[]
每个.roots.bookmark_bar.children[]
数组条目的数组,并创建一个根据您在问题中显示的内容格式化的字符串(在两条数据之间有一个制表符)。
如果双引号不是必需的,您可以将繁琐的更改["\"\(.name)\"",.url]
为仅[.name,.url]
.
https://
要从URL 中删除,请使用
.url|ltrimstr("https://")
而不仅仅是.url
.