帮助理解 Bash 命令行参数解析代码

帮助理解 Bash 命令行参数解析代码

我想为我正在开发的脚本采用两个参数和第三个可选参数。我是 bash 的新手,所以我一直在复制并尝试理解以下代码,它可以实现我想要的功能(我猜)

while [[ $# -gt 0 ]]; do
   case $1 in
   -f1|-fasta1)
       FASTA1=$2
       shift
       ;;
   -f1=*|-fasta1=*)
       FASTA1=${1#*=}
       ;;
   -d|-directory)
       DIRECTORY=$2
       shift
       ;;
   -d=*|-directory=*)
       DIRECTORY=${1#*=}
       ;;
   -f2|fasta2)
       FASTA2=$2
       shift
       ;;
   -f2=*|-fasta2=*)
       FASTA2=${1#*=}
       ;;
   -*)
       echo "Invalid option: $1" >&2
       exit 1
       ;;
   --)
       # Do FILES+=("${@:2}") maybe
       break
       ;;
   *)
       # TODO
       # Do FILES+=("$1") maybe
       ;;
   esac

   shift
done

问题是,这段代码的很多部分我并不真正理解是什么,例如 the -gt或 the1#*=或为什么每个参数需要在第一行写两次

-f1|-fasta1)
       FASTA1=$2
       shift

和两个

 -f1=*|-fasta1=*)
       FASTA1=${1#*=}

有人可以告诉我在哪里可以找到对此的解释。我一直在阅读教程,但通过更简单的示例我无法理解这一点。

答案1

您发布的代码确实是一种解析命令行参数的非常“手动”的方式。使用getopt和/或getopt_long用于该目的通常被认为是良好的做法。另请注意,仅用一个破折号引入“长选项”(如-fasta1)是不常见的;通常您会期望它们前面有两个破折号(另请参见这个问题关于命令行参数的格式)。

也就是说,您看到的大部分内容都是基本的 shell 语法,即字符串操作,case声明测试结构

[[ $# -gt 0 ]]语句只是一个测试$#,其中包含命令行参数数量的特殊参数,检查它是否大于 ( -gt) 零。这被用作while循环中的条件,因为参数处理例程使用shift在处理后丢弃第一个命令行参数的语句,从而连续减少参数的数量。处理完所有参数后,选项处理循环需要完成。

至于其他问题:程序希望允许用户在可能的语法变量中指定第一个 FASTA 文件,即:

-f1 <filename>
-fasta1 <filename>
-f1=<filename>
-fasta1=<filename>

该程序通过“手动”迭代命令行参数来实现这一点,即它总是检查“当前第一个”参数 ( $1) 是什么,解释它,然后使用shift命令丢弃它(其中所有命令行参数移动“上升一位”)。

为了接受“短”和“长”选项名称,该case语句接受-f1and -fasta1(对于空格分隔的语法)和-f1=*and -fasta1=*(对于=-分隔的语法)作为当前参数。但是,它需要根据语法不同地对待选项的“值”部分。

  • 对于空格分隔语法,第一个 FASTA 文件的语句通过$1或 来-f1识别-fasta1。程序知道选项的“值”位于下一个命令行参数中$2,因此它将 的内容分配$2FASTA1变量。还需要附加一个shift来丢弃下一个命令行参数,因为它已经在本次迭代中处理了。
  • 对于=-separated 语法,第一个 FASTA 文件的语句通过$1匹配 或 来-f1=*识别-fasta1=*。这意味着选项的“值”是当前值的一部分$1,需要通过字符串操作来提取。该声明
    ${variablename#pattern}
    
    表示“返回 的值$variablename,但删除匹配的最短字符串pattern 从一开始就的值”。所以,
    ${1#*=}
    
    表示“返回 的值,但删除从开头$1匹配的最短字符串”,有效地从值中删除或。剩下的就是文件名。*=-f1=-fasta1=

如果您想深入了解 shell 编程,我建议GreyCat&Lhunath 的 Bash 指南供进一步阅读。

相关内容