合并 PDF 文档的部分页面

合并 PDF 文档的部分页面

我有一个 PDF,其中一些内容分为 2 页。

第一部分占用小于或等于第一页的下半部分,第二部分占用小于第二页的上半部分。例如,如果x是第一页上所需的内容,y是第二页上所需的内容,-是我不希望出现在输出文档中的内容:

|-|  |y|
|-|  |y|
|-|  |-|
|x|  |-|
|x|  |-|

我想要

|x|
|x|
|y|
|y|

在一页上。

是否可以在 Linux 上以这种方式合并这些部分?

答案1

相信您应该能够调整此脚本来完成您想要的操作:

使用它有点实用:

  • pdfinfo - 获取尺寸。
  • gs - 从页面中提取框。
  • pdftk - 整理为一份 PDF。
  • pdfjam - 生成 2 页中的 1 页。

到目前为止,它适用于从顶部/底部提取的相同尺寸。 (目前硬编码为offs=50 AKA 50%)。通过一些调整,您应该能够使其工作,例如 70% - 30% 或其他。


pdf50x50:

#!/bin/bash

if ! [ -r "$1" ]; then
    printf "Unable to read file \`%s'\n" "$1" >&2
    exit 1
fi
fn_in="$1"

# A (debug) counter for "temp" files.
# NOTE: Printing to file .pdftestnr in working directory
fn_nr=.pdftestnr

[ -r $fn_nr ] && nr=$(<$fn_nr) || nr=0
((++nr))
printf %d $nr > $fn_nr

# File names.
fn_top=$(printf "top-%03d.pdf" $nr)
fn_bottom=$(printf "bottom-%03d.pdf" $nr)
fn_combi=$(printf "combi-%03d.pdf" $nr)
fn_fine=$(printf "fine-%03d.pdf" $nr)

# Get dimensions
read -r p w h <<<$(pdfinfo $fn_in | awk '/^Pages:/{print $2}/^Page size/{print $3, $5}')
# Calculate pixel dimensions (might fail.)
((pix_w = w * 10))
((pix_h = h * 10))

printf "Size %dx%d pts of %d pages\n" $w $h $p

# Percent
offs=50

((offs = h * offs / 100))
((pix_crop_h = pix_h - offs * 10 ))

echo $pix_crop_h $offs

# Extract top box to own pdf.
gs \
    -o $fn_top \
    -sDEVICE=pdfwrite \
    -g${pix_w}x$pix_crop_h \
    -c "<</PageOffset [0 -$offs]>> setpagedevice" \
    -f $fn_in

# Extract bottom box to own pdf.
gs \
    -o $fn_bottom \
    -sDEVICE=pdfwrite \
    -g${pix_w}x$pix_crop_h \
    -c "<</PageOffset [0 0]>> setpagedevice" \
    -f $fn_in


# Combine top and bottom files to one file.
pdftk \
  A=$fn_top \
  B=$fn_bottom \
  cat A1 B2 \
  output $fn_combi \
  verbose

# Combine 2 pages to one.
pdfjam $fn_combi --nup 1x2 --outfile $fn_fine

相关内容