如何组合 JSON 值中的字符串,仅保留字符串的一部分?

如何组合 JSON 值中的字符串,仅保留字符串的一部分?

我有样品:

           "name": "The title of website",
           "sync_transaction_version": "1",
           "type": "url",
           "url": "https://url_of_website"

我想得到以下输出:

"The title of website"    url_of_website

我需要从 URL 中删除协议前缀,这样就只剩下协议前缀了(前面url_of_website没有)。http问题是我不太熟悉sed阅读多行,做一些研究可以找到我https://unix.stackexchange.com/a/337399/256195,仍然无法得出结果。

我试图解析的有效 json 对象是Bookmarkgoogle chrome 的,示例:

{
   "checksum": "9e44bb7b76d8c39c45420dd2158a4521",
   "roots": {
      "bookmark_bar": {
         "children": [ {
            "children": [ {
               "date_added": "13161269379464568",
               "id": "2046",
               "name": "The title is here",
               "sync_transaction_version": "1",
               "type": "url",
               "url": "https://the_url_is_here"
            }, {
               "date_added": "13161324436994183",
               "id": "2047",
               "meta_info": {
                  "last_visited_desktop": "13176472235950821"
               },
               "name": "The title here",
               "sync_transaction_version": "1",
               "type": "url",
               "url": "https://url_here"
            } ]
            } ]
        }
    }
}

答案1

这适用于问题中给出的 JSON 文档:

$ jq -r '.roots.bookmark_bar.children[]|.children[]|["\"\(.name)\"",.url]|@tsv' file.json
"The title is here"     https://the_url_is_here
"The title here"        https://url_here

这将访问.children[]每个.roots.bookmark_bar.children[]数组条目的数组,并创建一个根据您在问题中显示的内容格式化的字符串(在两条数据之间有一个制表符)。

如果双引号不是必需的,您可以将繁琐的更改["\"\(.name)\"",.url]为仅[.name,.url].

https://要从URL 中删除,请使用

.url|ltrimstr("https://")

而不仅仅是.url.

相关内容