当我将 PDF 转换为纯文本时，文本变得混乱

Question

我已经使用glyphtounicodeTeX Live 中的支持文件（甚至带有捷克语/斯洛伐克语相关的 IL2 字体编码）一段时间了，遗憾的是我无法使用 MiKTeX 对其进行测试。我们运行：

pdflatex mal-sk.tex
pdftotext -enc UTF-8 mal-sk.pdf

结果是：1 ľščťžýáíéäúôň，它显示了页码和文档内容。我附上了代码。如果它符合您的需求，请尝试一下。

% pdflatex mal-sk.tex
% pdftotext -enc UTF-8 mal-sk.pdf
\documentclass[12pt, oneside]{book}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{graphicx}
\usepackage[slovak]{babel}
\linespread{1.2}
\input glyphtounicode
\pdfgentounicode=1
\begin{document}     
ľščťžýáíéäúôň
\end{document}

Answer 1

我已经使用glyphtounicodeTeX Live 中的支持文件（甚至带有捷克语/斯洛伐克语相关的 IL2 字体编码）一段时间了，遗憾的是我无法使用 MiKTeX 对其进行测试。我们运行：

pdflatex mal-sk.tex
pdftotext -enc UTF-8 mal-sk.pdf

结果是：1 ľščťžýáíéäúôň，它显示了页码和文档内容。我附上了代码。如果它符合您的需求，请尝试一下。

% pdflatex mal-sk.tex
% pdftotext -enc UTF-8 mal-sk.pdf
\documentclass[12pt, oneside]{book}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{graphicx}
\usepackage[slovak]{babel}
\linespread{1.2}
\input glyphtounicode
\pdfgentounicode=1
\begin{document}     
ľščťžýáíéäúôň
\end{document}

当我将 PDF 转换为纯文本时，文本变得混乱

答案1

相关内容