Bash:将带有空格和引号的字符串转换为数组

Bash:将带有空格和引号的字符串转换为数组

我有一个函数(不是我创建的),它在引号内输出一系列字符串:

command <args>

“Foo”
“FooBar”
“Foo Bar”
“FooBar/Foo Bar”

当我尝试将它分配给一个数组(Bash;BSD/Mac)时,我得到的是 7 个元素,而不是 4 个元素。例如,对于${array[2]}应该get “Foo Bar”,但相反,我得到的”Foo下一个元素是Bar”.任意元素没有空间工作正常(即${array[0]}=“Foo”)

如何将引号之间的每个元素(包括空格)分配给元素本身由空格(?)分隔的数组?

现在,我正在考虑使用 sed/awk 来“去掉”引号,但我认为应该有更好、更有效的方法。

目前,我将命令的输出(看起来与上面的输出完全相同,包括引号)分配给临时变量,然后将其分配给数组。

_tempvar=“$(command <args>)”

declare -a _array=(${_tempvar})

答案1

在 中bash,您可以将readarray文件的行或某些命令的输出读取到数组中;然而那是仅有的 在 2009 年发布的 4.0 版本中添加了该功能,但 macOS 仍然附带 bash 3.2。

macos 附带了 zsh,但这是一个更好的 shell。

要获取命令输出的非空行,您可以使用f参数扩展标志(在行 eed 上拆分f)将其拆分,并删除"(U+0022)、(U+0201C) 和(U+ 201D) 字符,使用${var//pattern[/replacement]}运算符例如:

#! /bin/zsh -
array=( ${(f)${"$(cmd)"//['"“”']}} ) || exit

如果这些是用 U+0022 ASCII 字符引用的字符串,并且引用与语言中引号的工作方式兼容zsh,您还可以使用其z/Z标志(以与语言解析器相同的方式标记文本)和Q标志(以删除引号)而不是按行分割(假设带引号的字符串不能跨越多行)。

#! /bin/zsh -
array=( ${(Q)${(Z[n])"$(cmd)"}} ) || exit

你的

declare -a array=(${tempvar})

inbash使用 split+glob 运算符,当扩展未加引号(通常是无意的)时会调用该运算符。它使用复杂的算法将输出分割为特殊$IFS参数的字符(在 bash 中默认包含空格、制表符和换行符),并且生成的单词受制于通配又名文件名生成(这几乎是不可取的)。

在这里, split+glob 可用于获取命令输出的非空行,但您需要先对其进行调整:

IFS=$'\n' # split on newline only:
set -o noglob # disable the glob part which we don't want
array=( $(cmd) ) # split+glob

然后你也可以删除"“”with ${var//pattern[/replacement]},但在 bash 中必须在随后完成,因为它不能累积参数扩展运算符,并且语法(继承自 ksh93)有点尴尬:

array=( "${array[@]//['"“”']}" )

请注意,与该方法相反zsh,它不会处理诸如"foo \"bar\" and \\backslash".

答案2

您得到 7 个元素,因为空格引起了分词。

IFS=$'\n'在将字符串添加到数组之前设置,然后您将获得 4 个元素,但带有双引号。

例子:

IFS=$'\n'

arr=($(command <args>))

如果你想要 4 个不带引号的元素,请执行以下操作:

IFS=$'\n'

arr=($(command <args> | sed s'#"##'g))

完整示例:

IFS=$'\n'

# tst.txt has your strings:
arr=($(cat tst.txt | sed s'#"##'g))

declare -p arr

输出:

declare -a arr=([0]="Foo" [1]="FooBar" [2]="Foo Bar" [3]="FooBar/Foo Bar")

答案3

readarray -t array <<< $(echo $'"a a"\n"b   b"\n"c   c"')
declare -p array
declare -a array=([0]="\"a a\"" [1]="\"b   b\"" [2]="\"c   c\"")
readarray -t array <<< $(command <args>)

相关内容