如何获得连字输出?

如何获得连字输出?

我正在用冰岛语写一篇论文,但 LaTeX 不知道如何正确地拆分单词。我试图创建一个它拆分的单词列表并对其进行更正。我有 100 多页的文本,我希望能够获得所有带连字符的单词的列表。

\documentclass[a4paper,12pt,icelandic]{report}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{palatino,babel,setspace}
     \hyphenation{Eyja-fjalla-jökull}
     \hyphenation{Hall-orms-staðar-skógur}
     \hyphenation{norður-ljós}

\begin{document}
text here about Eyjafjallajökull.
Text here about Hallormsstaðarskógur.
Text here about norðurljósin.
\end{document}

有数百个单词被错误地拆分。我想获取它拆分的单词列表,以便为它们定义新的连字符。代码中提到的单词只是一些示例。我并没有在论文中真正使用这些单词,而 babel 包可能会正确地拆分它们。

我有一篇论文,大约有 40,000 个字。我只想要一份 LaTeX 分解的单词列表。- 所以我可以将它们放在里面:

“\babelhyphenation[icelandic]{ 此处为单词列表 }

我自己定义正确的连字符。我可以直接向下滚动每一页并手动输入单词。但我只是想节省一些时间。如果可能的话。

我对查看每个单词目前是如何定义的没有兴趣。

答案1

如果我添加\usepackage[icelandic]{babel},我会得到这三个单词的以下连字点:

Eyja-fjalla-jök-ull
Hall-orms-stað-ar-skóg-ur
norð-ur-ljós

如果你觉得这些单词的附加连字符点不好,你可以向字典中添加例外情况:

\documentclass[a4paper,12pt]{report}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[icelandic]{babel}

\babelhyphenation[icelandic]{
  Eyja-fjalla-jökull
  Hall-orms-staðar-skógur
  norður-ljós
}

\begin{document}
\parbox{0pt}{\hspace{0pt}Eyjafjallajökull
Hallormsstaðarskógur
norðurljós}
\end{document}

只是\parbox为了强制 TeX 在每个可能的断点处进行连字符连接。输出是

在此处输入图片描述

请注意,添加连字符例外北乌尔柳斯不影响北约辛,但仅限确切的单词。

如果您认为许多单词的断字不正确,您应该向连字模式的维护者(由 Mojca Miklavec 负责)提交错误报告。

答案2

如果您选择使用 LuaLaTeX,您可以使用该showhyphens包(需要 LuaLaTeX)用一条细细的垂直红线显示 LaTeX 认为有效的每个连字符点。您无需查看文档的所有 100 多页;一般来说,只需检查前几页的连字符点就足够了。

在此处输入图片描述

% !TEX TS-program = lualatex
\documentclass[a4paper,12pt]{article}
\usepackage{polyglossia}
\setdefaultlanguage{icelandic}
\usepackage{fontspec,showhyphens}
\setmainfont{TeX Gyre Pagella} % choose a font that has all characters of Icelandic alphabet
\begin{document}
Eyjafjallajökull

Hallormsstaðarskógur

norðurljósin

%% now provide an explicit hyphenation exception list
\hyphenation{Eyja-fjalla-jökull Hall-orms-staðar-skógur norður-ljósin}

\bigskip  % repeat the same words
Eyjafjallajökull

Hallormsstaðarskógur

norðurljósin
\end{document}

答案3

正如@egreg在评论中指出的那样,\usepackage[icelandic]{babel}应该给出正确的连字模式。您可以使用testhyphens包来检查这一点。

\documentclass[a4paper,12pt]{report}
\usepackage[icelandic]{babel}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{testhyphens}

\begin{document}
\begin{checkhyphens}
Eyjafjallajökull
Hallormsstaðarskógur
norðurljósin
\end{checkhyphens}
\end{document}

在此处输入图片描述

相关内容