从 PDF 中复制的文本包含希腊字符

从 PDF 中复制的文本包含希腊字符

我遇到一个问题,如果我从 PDF(使用 XeLaTeX 生成)中复制单词,复制​​出的文本包含随机的希腊字符。

\documentclass[12pt,a4paper,english]{report}
% setup encoding
\usepackage[utf8]{inputenc}
%set language
\usepackage[british,english]{babel}
\usepackage[T1]{fontenc}
\usepackage{lmodern,cmap}
%setup font
\usepackage{fontspec}
\setmainfont{Calibri}

\begin{document}
{\large A dissertation submitted in partial fulfilment of\\
the requirements for the degree of\\}
\end{document}

(为了简单起见,我省略了文字)。

为上述内容生成 PDF 并复制正文,得到以下字符串:

A dissertaƟon submiƩed in parƟal fulĮlment of the requirements for the degree of

如果我删除字体,复制粘贴就可以正常工作,所以我有理由相信这是我使用字体的方式的问题?有人有什么想法吗

答案1

不要在 XeLaTeX 或 LuaLaTeX 中使用inputenclmodern和。但除此之外,连字也存在问题。它们无法在 XeLaTeX 中正确映射到 unicode 条目。在 LuaLaTeX 中可以正常工作cmapfontenc

\documentclass[12pt,a4paper,english]{report}
\usepackage[british,english]{babel}

\usepackage{fontspec}
\setmainfont{Calibri.ttf}

\begin{document}
{\large A dissertation submitted in partial fulfilment of\\
the requirements for the degree of\par}
\end{document} 

XeLaTeX:

论文

相关内容