PDF 中有正确的字母,但当我尝试将其解析为文本时,得到的是错误的编码文本

PDF 中有正确的字母,但当我尝试将其解析为文本时,得到的是错误的编码文本

在此处输入图片描述

这张图片实际上解释了整个问题。我使用 UTF-8-dos 在 AUCTeX 中编译 pdf 文件。这又带来了另一个问题,当我尝试将此 PDF 转换为 DOCX 时,我得到的正是与我在 Google 上下文菜单中得到的一样的错误编码文本。

最小示例:

%\documentclass[a4paper,12pt]{article}
\documentclass[a4paper,14pt]{extarticle}
\usepackage{geometry}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[english,russian]{babel}
\usepackage{amsmath, amssymb, amsfonts,mathtext,cite,enumerate,float}
\usepackage{textcomp}
\usepackage{graphicx}
\usepackage{tocloft}
\usepackage{xcolor}
\usepackage{float}
\usepackage{enumitem}
\usepackage{hyperref}
\usepackage{chngcntr}

\linespread{1.3}

\counterwithin{figure}{section}

\renewcommand\cftsecfont{\normalfont}
\renewcommand\cftsecpagefont{\normalfont}
\renewcommand{\cftsecleader}{\cftdotfill{\cftsecdotsep}}
\renewcommand\cftsecdotsep{\cftdot}
\renewcommand\cftsubsecdotsep{\cftdot}


\makeatletter
\newcommand*{\textoverline}[1]{$\overline{\hbox{#1}}\m@th$}
\makeatother

\newcounter{SavedCounter}

\graphicspath{{auto/}}
\DeclareGraphicsExtensions{.png}

\makeatletter
\renewcommand{\@biblabel}[1]{#1.}
\makeatother

\renewcommand{\labelenumii}{\theenumii}
\renewcommand{\theenumii}{\theenumi.\arabic{enumii}.}


\usepackage{geometry}
\geometry{left = 2cm}
\geometry{right = 1.5cm}
\geometry{top = 1cm}
\geometry{bottom = 2cm}


\newenvironment{numerated}%
{\begin{list}{\arabic{enumi}.}%
    {\setlength{\leftmargin}{2.5em}%
      \setlength{\itemsep}{-\parsep}%
      \setlength{\topsep}{-\parskip}%%
      \usecounter{enumi}}%
  }{\end{list}}

\newenvironment{numerated_1}%
{\begin{list}{\theenumi.\arabic{enumii}.}%
    {\setlength{\leftmargin}{2.5em}%
      \setlength{\itemsep}{-\parsep}%
      \setlength{\topsep}{-\parskip}%%
      \usecounter{enumii}}%
  }{\end{list}}




\begin{document}
\begin{titlepage}
  \begin{center}
    \large
    МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ\\ РОССИЙСКОЙ ФЕДЕРАЦИИ

    \textbf{Федеральное агентство по образованию}
    \vspace{0.5cm}

    МОСКОВСКИЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ СВЯЗИ И ИНФОРМАТИКИ
    \vspace{0.25cm}

    факультет Радио и Телевидения

    \textsc{Курсовая работа по теме:}\\[15mm]

    {\LARGE Дистанционное Зондирование Земли}
    \bigskip
    \end{center}
    \end{titlepage}
\end{document}

答案1

这解决了我的问题:

\usepackage{cmap}
\usepacakge[cp1251]{inputenc}

将 emacs 编码更改为cp1251( windows-1251-dos) ->

M-x revert-buffer-with-coding-system Enter cp1251

现在它运行良好

在此处输入图片描述

相关内容