合并 pdf 文件并自动创建一个目录,每个文件作为一个条目

合并 pdf 文件并自动创建一个目录,每个文件作为一个条目

我有几个 pdf 文件(chapter1.pdfchapter2.pdf等等),每个文件都是一本书的一个章节。我现在知道如何将它们合并为一个 pdf(我使用pdfunitepoppler 的命令),但由于输出文件很大,如果不将它们编入目录,很难找到章节。那么如何创建一个嵌入式目录,其中每个合并的章节都是一个条目?

请注意,我不想在输出文件中创建包含章节列表及其各自页码的页面。我想要 pdf 文件的索引/目录元数据,可以在任何支持此类功能的 pdf 阅读器(或电子书设备)中浏览。

答案1

非破坏性@bu5hman 的答案版本:

#!/bin/bash

out_file="combined.pdf"
bookmarks_file="/tmp/bookmarks.txt"
bookmarks_fmt="BookmarkBegin
BookmarkTitle: %s
BookmarkLevel: 1
BookmarkPageNumber: %d
"

rm -f "$bookmarks_file" "$out_file"

declare -a files=(*.pdf)
page_counter=1

# Generate bookmarks file.
for f in "${files[@]}"; do
    title="${f%.*}"
    printf "$bookmarks_fmt" "$title" "$page_counter" >> "$bookmarks_file"
    num_pages="$(pdftk "$f" dump_data | grep NumberOfPages | awk '{print $2}')"
    page_counter=$((page_counter + num_pages))
done

# Combine PDFs and embed the generated bookmarks file.
pdftk "${files[@]}" cat output - | \
    pdftk - update_info "$bookmarks_file" output "$out_file"

它的工作原理是:

  1. 生成bookmarks.txt.
  2. 将 PDF 合并为combined.pdf.
  3. 更新combined.pdfbookmarks.txt.

答案2

我一直使用的函数就是为了完成此任务。只需确保 pdf 在扩展中按顺序正确排序即可。

tp="/tmp/tmp.pdf"
td="/tmp/data"
for i in *.pdf; do
    echo "Bookmarking $i"
    printf "BookmarkBegin\nBookmarkTitle: %s\nBookmarkLevel: 1\nBookmarkPageNumber: 1\n" "${i%.*}"> "$td"
    pdftk "$i" update_info "$td" output "$tp"
    mv "$tp" "$i"
done
pdftk *.pdf cat output myBook.pdf

相关内容