如何裁剪多页(图像/扫描)pdf 文件(无法使用 pdfcrop 裁剪)?

如何裁剪多页(图像/扫描)pdf 文件(无法使用 pdfcrop 裁剪)?

通常情况下,我很乐意使用pdfcrop,尽管裁剪后的输出通常会占用更多磁盘空间。请注意,代码 存在,它解决并解决了这个问题。但是,如果要裁剪扫描的(图像)pdf 文件,我的印象是它pdfcrop根本就失败了。我想象ImageMagick能够做到这一点,可能还通过让我们pdftk

我正在寻找一个高效的单行代码(多行脚本也可以......)来将这样的 pdf 文件从上到下、左到右各裁剪 x 厘米(或者更好的是,分别裁剪 abcd 厘米),从 input.pdf 一直裁剪到 output.pdf。

附言:解决方案不需要涉及ImageMagick;只要它能工作(干净、可靠和高效),我就很高兴了……;)

答案1

你可以尝试布里斯。它非常简单,但可以完成工作。不过它是一个 GUI 应用程序。

下载 zip 文件并解压到您选择的文件夹并启动它:

java -jar briss-0.9.jar

要永久地、全系统地安装它,并且能够从任何地方启动它briss,您需要解压下载的文件/usr/local/lib/,然后创建一个/usr/local/bin/briss包含以下内容的可执行文件:

#!/bin/sh
java -jar /usr/local/lib/briss-0.9/briss-0.9.jar

答案2

这是最好、最简单的,并且具有出色的 GUI:Krop

从作者处下载 deb:http://arminstraub.com/computer/krop

审查:http://www.hecticgeek.com/2013/08/crop-pdf-ubuntu-13-04-krop/

编辑:我从 13.10 开始使用 krop,我注意到最新版本开始支持通过右键单击使用 krop 打开 pdf。我也切换到 snap 版本,因为它已经可用,它也支持右键单击,已在 18.10 - 20.04 上确认。Snap 版本的 GUI 不如后者丰富多彩,但功能相同:

sudo snap install krop

答案3

全部功劳归于亚历克斯顺便说一下路过发布了此问题的解决方案这里,为了完整起见并且不至于丢失(!),我在下面引用。

与上述问题相关的是修剪选项中描述man

使用示例:

#default operation
pdfcrop.sh orig.pdf cropped.pdf
pdfcrop.sh -m 10 orig.pdf cropped.pdf
pdfcrop.sh -hires orig.pdf cropped.pdf

#trimming pages
pdfcrop.sh -t "10 20 30 40" orig.pdf trimmed.pdf

内容pdfcrop.sh

#!/bin/bash

function usage () {
  echo "Usage: `basename $0` [Options] <input.pdf> [<output.pdf>]"
  echo
  echo " * Removes white margins from each page in the file. (Default operation)"
  echo " * Trims page edges by given amounts. (Alternative operation)"
  echo
  echo "If only <input.pdf> is given, it is overwritten with the cropped output."
  echo
  echo "Options:"
  echo
  echo " -m \"<left> [<top> [<right> <bottom>]]\""
  echo "    adds extra margins in default operation mode. Unit is bp. A single number"
  echo "    is used for all margins, two numbers \"<left> <top>\" are applied to the"
  echo "    right and bottom margins alike."
  echo
  echo " -t \"<left> [<top> [<right> <bottom>]]\""
  echo "    trims outer page edges by the given amounts. Unit is bp. A single number"
  echo "    is used for all trims, two numbers \"<left> <top>\" are applied to the"
  echo "    right and bottom trims alike."
  echo
  echo " -hires"
  echo "    %%HiResBoundingBox is used in default operation mode."
  echo
  echo " -help"
  echo "    prints this message."
}

c=0
mar=(0 0 0 0); tri=(0 0 0 0)
bbtype=BoundingBox

while getopts m:t:h: opt
do
  case $opt
  in
    m)
    eval mar=($OPTARG)
    [[ -z "${mar[1]}" ]] && mar[1]=${mar[0]}
    [[ -z "${mar[2]}" || -z "${mar[3]}" ]] && mar[2]=${mar[0]} && mar[3]=${mar[1]}
    c=0
    ;;
    t)
    eval tri=($OPTARG)
    [[ -z "${tri[1]}" ]] && tri[1]=${tri[0]}
    [[ -z "${tri[2]}" || -z "${tri[3]}" ]] && tri[2]=${tri[0]} && tri[3]=${tri[1]}
    c=1
    ;;
    h)
    if [[ "$OPTARG" == "ires" ]]
    then
      bbtype=HiResBoundingBox
    else
      usage 1>&2; exit 0
    fi
    ;;
    \?)
    usage 1>&2; exit 1
    ;;
  esac
done
shift $((OPTIND-1))

[[ -z "$1" ]] && echo "`basename $0`: missing filename" 1>&2 && usage 1>&2 && exit 1
input=$1;output=$1;shift;
[[ -n "$1" ]] && output=$1 && shift;

(
    [[ "$c" -eq 0 ]] && gs -dNOPAUSE -q -dBATCH -sDEVICE=bbox "$input" 2>&1 | grep "%%$bbtype"
    pdftk "$input" output - uncompress
) | perl -w -n -s -e '
  BEGIN {@m=split /\s+/, $mar; @t=split /\s+/, $tri;}
  if (/BoundingBox:\s+([\d\.\s]+\d)/) { push @bbox, $1; next;}
  elsif (/\/MediaBox\s+\[([\d\.\s]+\d)\]/) { @mb=split /\s+/, $1; next; }
  elsif (/pdftk_PageNum\s+(\d+)/) {
    $p=$1-1;
    if($c){
      $mb[0]+=$t[0];$mb[1]+=$t[1];$mb[2]-=$t[2];$mb[3]-=$t[3];
      print "/MediaBox [", join(" ", @mb), "]\n";
    } else {
      @bb=split /\s+/, $bbox[$p];
      $bb[0]+=$mb[0];$bb[1]+=$mb[1];$bb[2]+=$mb[0];$bb[3]+=$mb[1];
      $bb[0]-=$m[0];$bb[1]-=$m[1];$bb[2]+=$m[2];$bb[3]+=$m[3];
      print "/MediaBox [", join(" ", @bb), "]\n";
    }
  }
  print;
' -- -mar="${mar[*]}" -tri="${tri[*]}" -c=$c | pdftk - output "$output" compress

相关内容