一个快速（不是很多）且肮脏（很多）的解决方案

Question

一个快速（不是很多）且肮脏（很多）的解决方案

我跳出 LaTeX 的思维框架，从 PDF 文件入手来解决这个问题。这远不是一个 LaTeX 解决方案，或者正确的一、以下是一个快速而真正肮脏的解决方案，在特定情况下有效，但它可以作为更完整解决方案的基础。

使用外部工具（pdfgrep^[1，2]），我能够在 PDF 文件组中搜索关键字（方式与 grep 在文本文件组中执行的操作类似）。

然后，问题是解析输出并以首选方式格式化输出。下面是脚本（这是一个工作文件，甚至没有清理；应该以纯粹的awk计划方式重写它）。
它很丑陋，有驼峰，但它工作（足够）。它可以从解析字典文件（带有关键字和定义的文件）的脚本中调用（或包含在其中），以生成我们可以包含在文件中的输出tex。

您可以使用关键字作为参数来运行该脚本，它会以类似 [File1:1-3,5,9-12; File3:2,7-122] 的字符串作为答案。

#!/bin/bash
# ----------------------------------------------- 
#   Search for a key in all pdf files
#    e.g L1.pdf L2.pdf...
#     and answers with collapsed page number
#      for each file [L1: 1, 3-7; L2:2-12, 22]
# ----------------------------------------------- 
#    Version 2.0 
#      Mon Apr 16 13:50:42 2018
# ----------------------------------------------- 

Key="$1"
Where='*pdf'

All=$(
pdfgrep -Hin "$Key" $Where | \
     awk -F ':' '{ if ($2 != P[$1,CountA[$1]])
                 {CountA[$1]++;P[$1,CountA[$1]]=$2} }
                 END{for (i in CountA ) {
                   printf ("%s ", i); 
                   for (j = 1 ; j<=CountA[i]; j++) {
                       printf( "%d ", j)
                       } ; 
                       printf "\n"  
                       }
                   }' | sort 
)
## Collapsing number sequences 1 2 3 4 7 9 10--> 1-4, 7. 9-10
A3=$(echo "$All" | awk '{ printf ("%s: ",$1) ; r=nxt=0; for(i=2;i<=NF;i++) if($i+1==$(i+1)){ if(!r) r=$i"-";nxt=$(i+1) } else { printf "%s%s",(r)?r nxt:$i,(i==NF)?ORS:FS; r=0 } } END{printf("\n") }')

## Collapsing output in 1 line [L1: 1, 3-7; L2:2-12, 22]
echo "$A3" | awk 'BEGIN{ printf "[";MySep=""}{printf ("%s%s", MySep,$0);MySep="; "} END{ printf "]\n"}' | sed 's/\[\: \]//g ; s/\.pdf//g'

exit 0

Ps> 剧本确实需要杰出的外科医生帮助它的驼峰
-驼峰哪个驼峰？ ^[3]

Answer 1

一个快速（不是很多）且肮脏（很多）的解决方案

我跳出 LaTeX 的思维框架，从 PDF 文件入手来解决这个问题。这远不是一个 LaTeX 解决方案，或者正确的一、以下是一个快速而真正肮脏的解决方案，在特定情况下有效，但它可以作为更完整解决方案的基础。

使用外部工具（pdfgrep^[1，2]），我能够在 PDF 文件组中搜索关键字（方式与 grep 在文本文件组中执行的操作类似）。

然后，问题是解析输出并以首选方式格式化输出。下面是脚本（这是一个工作文件，甚至没有清理；应该以纯粹的awk计划方式重写它）。
它很丑陋，有驼峰，但它工作（足够）。它可以从解析字典文件（带有关键字和定义的文件）的脚本中调用（或包含在其中），以生成我们可以包含在文件中的输出tex。

您可以使用关键字作为参数来运行该脚本，它会以类似 [File1:1-3,5,9-12; File3:2,7-122] 的字符串作为答案。

#!/bin/bash
# ----------------------------------------------- 
#   Search for a key in all pdf files
#    e.g L1.pdf L2.pdf...
#     and answers with collapsed page number
#      for each file [L1: 1, 3-7; L2:2-12, 22]
# ----------------------------------------------- 
#    Version 2.0 
#      Mon Apr 16 13:50:42 2018
# ----------------------------------------------- 

Key="$1"
Where='*pdf'

All=$(
pdfgrep -Hin "$Key" $Where | \
     awk -F ':' '{ if ($2 != P[$1,CountA[$1]])
                 {CountA[$1]++;P[$1,CountA[$1]]=$2} }
                 END{for (i in CountA ) {
                   printf ("%s ", i); 
                   for (j = 1 ; j<=CountA[i]; j++) {
                       printf( "%d ", j)
                       } ; 
                       printf "\n"  
                       }
                   }' | sort 
)
## Collapsing number sequences 1 2 3 4 7 9 10--> 1-4, 7. 9-10
A3=$(echo "$All" | awk '{ printf ("%s: ",$1) ; r=nxt=0; for(i=2;i<=NF;i++) if($i+1==$(i+1)){ if(!r) r=$i"-";nxt=$(i+1) } else { printf "%s%s",(r)?r nxt:$i,(i==NF)?ORS:FS; r=0 } } END{printf("\n") }')

## Collapsing output in 1 line [L1: 1, 3-7; L2:2-12, 22]
echo "$A3" | awk 'BEGIN{ printf "[";MySep=""}{printf ("%s%s", MySep,$0);MySep="; "} END{ printf "]\n"}' | sed 's/\[\: \]//g ; s/\.pdf//g'

exit 0

Ps> 剧本确实需要杰出的外科医生帮助它的驼峰
-驼峰哪个驼峰？ ^[3]

一个快速（不是很多）且肮脏（很多）的解决方案

问题

情况

我需要

我做了什么

结论

答案1

一个快速（不是很多）且肮脏（很多）的解决方案

相关内容