我有一个 PDF,其中一些内容分为 2 页。
第一部分占用小于或等于第一页的下半部分,第二部分占用小于第二页的上半部分。例如,如果x
是第一页上所需的内容,y
是第二页上所需的内容,-
是我不希望出现在输出文档中的内容:
|-| |y|
|-| |y|
|-| |-|
|x| |-|
|x| |-|
我想要
|x|
|x|
|y|
|y|
在一页上。
是否可以在 Linux 上以这种方式合并这些部分?
答案1
相信您应该能够调整此脚本来完成您想要的操作:
使用它有点实用:
- pdfinfo - 获取尺寸。
- gs - 从页面中提取框。
- pdftk - 整理为一份 PDF。
- pdfjam - 生成 2 页中的 1 页。
到目前为止,它适用于从顶部/底部提取的相同尺寸。 (目前硬编码为offs=50 AKA 50%)。通过一些调整,您应该能够使其工作,例如 70% - 30% 或其他。
pdf50x50
:
#!/bin/bash
if ! [ -r "$1" ]; then
printf "Unable to read file \`%s'\n" "$1" >&2
exit 1
fi
fn_in="$1"
# A (debug) counter for "temp" files.
# NOTE: Printing to file .pdftestnr in working directory
fn_nr=.pdftestnr
[ -r $fn_nr ] && nr=$(<$fn_nr) || nr=0
((++nr))
printf %d $nr > $fn_nr
# File names.
fn_top=$(printf "top-%03d.pdf" $nr)
fn_bottom=$(printf "bottom-%03d.pdf" $nr)
fn_combi=$(printf "combi-%03d.pdf" $nr)
fn_fine=$(printf "fine-%03d.pdf" $nr)
# Get dimensions
read -r p w h <<<$(pdfinfo $fn_in | awk '/^Pages:/{print $2}/^Page size/{print $3, $5}')
# Calculate pixel dimensions (might fail.)
((pix_w = w * 10))
((pix_h = h * 10))
printf "Size %dx%d pts of %d pages\n" $w $h $p
# Percent
offs=50
((offs = h * offs / 100))
((pix_crop_h = pix_h - offs * 10 ))
echo $pix_crop_h $offs
# Extract top box to own pdf.
gs \
-o $fn_top \
-sDEVICE=pdfwrite \
-g${pix_w}x$pix_crop_h \
-c "<</PageOffset [0 -$offs]>> setpagedevice" \
-f $fn_in
# Extract bottom box to own pdf.
gs \
-o $fn_bottom \
-sDEVICE=pdfwrite \
-g${pix_w}x$pix_crop_h \
-c "<</PageOffset [0 0]>> setpagedevice" \
-f $fn_in
# Combine top and bottom files to one file.
pdftk \
A=$fn_top \
B=$fn_bottom \
cat A1 B2 \
output $fn_combi \
verbose
# Combine 2 pages to one.
pdfjam $fn_combi --nup 1x2 --outfile $fn_fine