考虑以下简单的 shell 脚本(使用pdftk
):
#!/bin/sh
echo "" | ps2pdf -sPAPERSIZE=a4 - blank.pdf
pdftk \
A=blank.pdf \
B=blank.pdf \
C=blank.pdf \
cat A C \
output foo.pdf
现在,如果我注释掉一行,就会出现古怪的情况。这是修改后的脚本。
#!/bin/sh
echo "" | ps2pdf -sPAPERSIZE=a4 - blank.pdf
pdftk \
A=blank.pdf \
# B=blank.pdf \
C=blank.pdf \
cat A C \
output foo.pdf
输出看起来像:
Done. Input errors, so no output created.
cat: A: No such file or directory
cat: C: No such file or directory
cat: output: No such file or directory
%PDF-1.4
%<E2><E3><CF><D3>
4 0 obj
<<
/Filter /FlateDecode
/Length 23
>>
stream
x<9C>+T0<D0>3T0^@A(<9D><9C><CB>^U<C8>^E^@5I^De
endstream
endobj
3 0 obj
<<
/Resources
<<
/ProcSet [/PDF]
>>
/Type /Page
/Parent 1 0 R
/Contents 4 0 R
/MediaBox [0 0 595 842]
>>
endobj
7 0 obj
<<
/Filter /FlateDecode
/Length 23
>>
stream
x<9C>+T0<D0>3T0^@A(<9D><9C><CB>^U<C8>^E^@5I^De
endstream
endobj
6 0 obj
<<
/Resources
<<
/ProcSet [/PDF]
>>
/Type /Page
/Parent 1 0 R
/Contents 7 0 R
/MediaBox [0 0 595 842]
>>
endobj
1 0 obj
<<
/Kids [3 0 R 6 0 R]
/Type /Pages
/Count 2
>>
endobj
9 0 obj
<<
/Type /Catalog
/Pages 1 0 R
>>
endobj
10 0 obj
<<
/ModDate (D:20160103144953+05'30')
/CreationDate (D:20160103144953+05'30')
/Creator (pdftk 2.02 - www.pdftk.com)
/Producer (itext-paulo-155 \(itextpdf.sf.net-lowagie.com\))
>>
endobj xref
0 11
0000000000 65535 f
0000000455 00000 n
0000000000 65535 f
0000000112 00000 n
0000000015 00000 n
0000000000 65535 f
0000000332 00000 n
0000000235 00000 n
0000000000 65535 f
0000000520 00000 n
0000000571 00000 n
trailer
<<
/Info 10 0 R
/ID [<cd7858cb595d5fbe3dd38c1258972091><390fa471e3236a790d9231e931a73695>]
/Root 9 0 R
/Size 11
>>
startxref
767
%%EOF
谁能解释为什么这样做会出现问题?我认为sh
(或者bash
,这没有什么区别)会忽略该行并继续前进。
另外,我可以做一些类似的事情吗?当我使用 时pdftk
,我会向它传递一个文件列表,其中一些我可能想不时地注释或取消注释。
pdftk
我在 Debian 8.2 (jessie) 上使用2.02-2。
对于那些想知道这种行为的人来说,最小的再现者:
$ cat test.sh
#!/bin/sh
echo \
A \
# B \
C
$ ./test.sh
A
./test.sh: line 5: C: command not found
答案1
原因
首先我们看一下bash的手册页:
不带引号的反斜杠 () 是转义字符。它保留后面的下一个字符的字面值,但 除外。如果出现 \<newline> 对,并且反斜杠本身未加引号,则 \<newline> 被视为行延续(也就是说,它被从输入流中删除并被有效地忽略)。
\
因此,当您在 a 之前使用时<newline>
,它会将其视为续行。但是在您的第二个脚本中,代码的继续A=blank.pdf
是注释,并且因为\
之后B=blank.pdf
也是注释的一部分,所以它不会导致行继续。因此,脚本的其余部分将被视为另一个唯一的命令。所以 bash 会认为你的脚本是这样的:
#!/bin/sh
echo "" | ps2pdf -sPAPERSIZE=a4 - blank.pdf
pdftk A=blank.pdf # B=blank.pdf \
C=blank.pdf cat A C output foo.pdf
在这里,您很可能会收到类似 的错误消息C=blank.pdf: command not found
。
反引号来拯救!
但是,您可以通过使用反引号的命令替换功能在行延续中使用注释,如下所示:
#!/bin/sh
echo "" | ps2pdf -sPAPERSIZE=a4 - blank.pdf
pdftk \
A=blank.pdf \
`# B=blank.pdf` `#You added left-side comment and I added this comment and everything is awesome` \
C=blank.pdf \
cat A C \
output foo.pdf
这不是我的聪明才智。这是马尔万·阿尔萨巴格的。请参阅以下链接了解更多详细信息: