递归提取 PDF 的页数并将其转储到 CSV

递归提取 PDF 的页数并将其转储到 CSV

我需要获取目录结构的各个子文件夹中的 PDF 列表以及每个 PDF 文件的页数。全部保存到 CSV 文件中,即<filename>,<number_of_pages>.

我用过FDqpdf递归提取页数:

fd ".pdf" --type f -x qpdf --show-npages {/}

我尝试在命令行中合并echoprintf来生成 CSV,但没有成功。

答案1

请记住,我刚刚安装,fd所以这是我第一次使用它。

由于它没有像我最初预期的那样工作,因此我选择了一种不同的方法,并将输出通过管道传输fd到 Read-While 循环中,并将其分配给变量。

fd -e pdf -x echo {} | while read -r line; do 
    var1="$line" && var2=$(qpdf --show-npages "$line"); 
    echo "var1,var2" > myfile.csv;
done

我应该指出,我也没有接受过 RTFM 教育。 ;)

相关内容