我正在用冰岛语写一篇论文,但 LaTeX 不知道如何正确地拆分单词。我试图创建一个它拆分的单词列表并对其进行更正。我有 100 多页的文本,我希望能够获得所有带连字符的单词的列表。
\documentclass[a4paper,12pt,icelandic]{report}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{palatino,babel,setspace}
\hyphenation{Eyja-fjalla-jökull}
\hyphenation{Hall-orms-staðar-skógur}
\hyphenation{norður-ljós}
\begin{document}
text here about Eyjafjallajökull.
Text here about Hallormsstaðarskógur.
Text here about norðurljósin.
\end{document}
有数百个单词被错误地拆分。我想获取它拆分的单词列表,以便为它们定义新的连字符。代码中提到的单词只是一些示例。我并没有在论文中真正使用这些单词,而 babel 包可能会正确地拆分它们。
我有一篇论文,大约有 40,000 个字。我只想要一份 LaTeX 分解的单词列表。- 所以我可以将它们放在里面:
“\babelhyphenation[icelandic]{ 此处为单词列表 }
我自己定义正确的连字符。我可以直接向下滚动每一页并手动输入单词。但我只是想节省一些时间。如果可能的话。
我对查看每个单词目前是如何定义的没有兴趣。
答案1
如果我添加\usepackage[icelandic]{babel}
,我会得到这三个单词的以下连字点:
Eyja-fjalla-jök-ull
Hall-orms-stað-ar-skóg-ur
norð-ur-ljós
如果你觉得这些单词的附加连字符点不好,你可以向字典中添加例外情况:
\documentclass[a4paper,12pt]{report}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[icelandic]{babel}
\babelhyphenation[icelandic]{
Eyja-fjalla-jökull
Hall-orms-staðar-skógur
norður-ljós
}
\begin{document}
\parbox{0pt}{\hspace{0pt}Eyjafjallajökull
Hallormsstaðarskógur
norðurljós}
\end{document}
只是\parbox
为了强制 TeX 在每个可能的断点处进行连字符连接。输出是
请注意,添加连字符例外北乌尔柳斯不影响北约辛,但仅限确切的单词。
如果您认为许多单词的断字不正确,您应该向连字模式的维护者(由 Mojca Miklavec 负责)提交错误报告。
答案2
如果您选择使用 LuaLaTeX,您可以使用该showhyphens
包(需要 LuaLaTeX)用一条细细的垂直红线显示 LaTeX 认为有效的每个连字符点。您无需查看文档的所有 100 多页;一般来说,只需检查前几页的连字符点就足够了。
% !TEX TS-program = lualatex
\documentclass[a4paper,12pt]{article}
\usepackage{polyglossia}
\setdefaultlanguage{icelandic}
\usepackage{fontspec,showhyphens}
\setmainfont{TeX Gyre Pagella} % choose a font that has all characters of Icelandic alphabet
\begin{document}
Eyjafjallajökull
Hallormsstaðarskógur
norðurljósin
%% now provide an explicit hyphenation exception list
\hyphenation{Eyja-fjalla-jökull Hall-orms-staðar-skógur norður-ljósin}
\bigskip % repeat the same words
Eyjafjallajökull
Hallormsstaðarskógur
norðurljósin
\end{document}
答案3
正如@egreg在评论中指出的那样,\usepackage[icelandic]{babel}
应该给出正确的连字模式。您可以使用testhyphens
包来检查这一点。
\documentclass[a4paper,12pt]{report}
\usepackage[icelandic]{babel}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{testhyphens}
\begin{document}
\begin{checkhyphens}
Eyjafjallajökull
Hallormsstaðarskógur
norðurljósin
\end{checkhyphens}
\end{document}