我有一个函数(不是我创建的),它在引号内输出一系列字符串:
command <args>
“Foo”
“FooBar”
“Foo Bar”
“FooBar/Foo Bar”
当我尝试将它分配给一个数组(Bash;BSD/Mac)时,我得到的是 7 个元素,而不是 4 个元素。例如,对于${array[2]}
我应该get “Foo Bar”
,但相反,我得到的”Foo
下一个元素是Bar”
.任意元素没有空间工作正常(即${array[0]}
=“Foo”)
如何将引号之间的每个元素(包括空格)分配给元素本身由空格(?)分隔的数组?
现在,我正在考虑使用 sed/awk 来“去掉”引号,但我认为应该有更好、更有效的方法。
目前,我将命令的输出(看起来与上面的输出完全相同,包括引号)分配给临时变量,然后将其分配给数组。
_tempvar=“$(command <args>)”
declare -a _array=(${_tempvar})
答案1
在 中bash
,您可以将readarray
文件的行或某些命令的输出读取到数组中;然而那是仅有的 在 2009 年发布的 4.0 版本中添加了该功能,但 macOS 仍然附带 bash 3.2。
macos 附带了 zsh,但这是一个更好的 shell。
要获取命令输出的非空行,您可以使用f
参数扩展标志(在行 eed 上拆分f
)将其拆分,并删除"
(U+0022)、“
(U+0201C) 和”
(U+ 201D) 字符,使用${var//pattern[/replacement]}
运算符例如:
#! /bin/zsh -
array=( ${(f)${"$(cmd)"//['"“”']}} ) || exit
如果这些是用 U+0022 ASCII 字符引用的字符串,并且引用与语言中引号的工作方式兼容zsh
,您还可以使用其z
/Z
标志(以与语言解析器相同的方式标记文本)和Q
标志(以删除引号)而不是按行分割(假设带引号的字符串不能跨越多行)。
#! /bin/zsh -
array=( ${(Q)${(Z[n])"$(cmd)"}} ) || exit
你的
declare -a array=(${tempvar})
inbash
使用 split+glob 运算符,当扩展未加引号(通常是无意的)时会调用该运算符。它使用复杂的算法将输出分割为特殊$IFS
参数的字符(在 bash 中默认包含空格、制表符和换行符),并且生成的单词受制于通配又名文件名生成(这几乎是不可取的)。
在这里, split+glob 可用于获取命令输出的非空行,但您需要先对其进行调整:
IFS=$'\n' # split on newline only:
set -o noglob # disable the glob part which we don't want
array=( $(cmd) ) # split+glob
然后你也可以删除"“”
with ${var//pattern[/replacement]}
,但在 bash 中必须在随后完成,因为它不能累积参数扩展运算符,并且语法(继承自 ksh93)有点尴尬:
array=( "${array[@]//['"“”']}" )
请注意,与该方法相反zsh
,它不会处理诸如"foo \"bar\" and \\backslash"
.
答案2
您得到 7 个元素,因为空格引起了分词。
IFS=$'\n'
在将字符串添加到数组之前设置,然后您将获得 4 个元素,但带有双引号。
例子:
IFS=$'\n'
arr=($(command <args>))
如果你想要 4 个不带引号的元素,请执行以下操作:
IFS=$'\n'
arr=($(command <args> | sed s'#"##'g))
完整示例:
IFS=$'\n'
# tst.txt has your strings:
arr=($(cat tst.txt | sed s'#"##'g))
declare -p arr
输出:
declare -a arr=([0]="Foo" [1]="FooBar" [2]="Foo Bar" [3]="FooBar/Foo Bar")
答案3
readarray -t array <<< $(echo $'"a a"\n"b b"\n"c c"')
declare -p array
declare -a array=([0]="\"a a\"" [1]="\"b b\"" [2]="\"c c\"")
readarray -t array <<< $(command <args>)