我尝试在 Debian Linux 6.0 中对以 utf8 编码的俄语文本进行连字,但所有尝试都失败了。
我在互联网上搜索表明,连字符至少应该可以通过 babel 与其他编码(cp855、cp866、cp866av、cp866mav、cp866nav、cp866tat、cp1251、koi8-r、koi8-u、koi8-ru、iso88595、maccyr)配合使用。
为了解决这个问题,我们阅读了大量资料并进行了大量的尝试,但迄今为止还没有成功。
UTF-8 已经存在很长一段时间了,我猜之前有人已经遇到过这个问题。
是否有已知的解决方案来解决 utf8 编码的俄语/西里尔文的连字问题?
PDF 文件使用下面的命令进行编译(一些警告“Overfull \hbox”、“Underfull \hbox”)
work$ xelatex book.tex
下面是用于演示问题的 tex 代码小片段。英文的第一个和最后一个段落显示了应该使用连字符的“边界”。
注意:ruhyphen 是系统上安装的 texlive-lang-cyrillic 的一部分。
\documentclass[a4paper,twoside,titlepage,openright,10pt]{book}
\pagestyle{headings}
\XeTeXinputencoding ”bytes”
\usepackage[T2A,T2B,T2C]{fontenc}
\usepackage{ucs}
\usepackage[utf8]{inputenc}
\usepackage[english,russian]{babel}
\title{УНИКАЛЬНАЯ ЖЕНЩИНА \\ Проницательность и мудрость для достижения полноты жизни}
\author{Эдвин Луис Коул и Нэнси Корбетт Коул}
\begin{document}
\maketitle
"We will implement prudent and responsible macroeconomic policies to ensure mutually reinforcing effect of growth and to maintain economic and financial stability in the region, and prevent negative spillover effect." \\
Многие женщины начинают поиск истинного <Я> и оказываются обманутыми и разочарованными, пытаясь стать похожими на образец современной женщины. Приспосабливаясь внешне, но сопротивляясь внутренне, они однажды обнаруживают, что глубоко в душе они не являются тем, чем случайно оказались.
Некоторые женщины научились искать и получать розы, обеды и драгоценности и все же не ощущают стабильности, безопасности, удовлетворения от проявления своей индивидуальности и настоящей любви, чего они в действительности желают.
Множество женщин вверили свою жизнь мужчинам, желая жить жизнью своих мужей или любовников, но это ведет лишь к тому, что они разочаровываются в мужчинах, а в итоге и в самих себе.
Многие, очень многие жены отчаянно хотят, чтобы их мужья изменялись, становились зрелыми, брали ответственность на себя и были такими мужчинами, какими они сотворены быть. Они осознают слишком поздно, что подлинно свободна только та замужняя женщина, муж которой <достиг максимума>. \\
"Global growth is too weak, risks remain tilted to the downside, global trade is weakening and the economic outlook suggests growth is likely to be slower and less balanced than desired," the group said in a prepared statement.
\end{document}
系统:
Debian GNU/Linux 6.0
work$ xelatex --version
XeTeX 3.1415926-2.2-0.9995.2 (TeX Live 2009/Debian)
kpathsea version 5.0.0
Copyright 2009 SIL International and Jonathan Kew.
There is NO warranty. Redistribution of this software is
covered by the terms of both the XeTeX copyright and
the Lesser GNU General Public License.
For more information about these matters, see the file
named COPYING and the XeTeX source.
Primary author of XeTeX: Jonathan Kew.
Compiled with ICU version 3.8.1 [with modifications for XeTeX]
Compiled with zlib version 1.2.3.4; using 1.2.3.4
Compiled with FreeType2 version 2.4.2; using 2.4.2
Compiled with fontconfig version 2.8.0; using 2.8.0
Compiled with libpng version 1.2.44; using 1.2.44
Compiled with poppler version 0.12.4
work$ dpkg -l | grep cyrill
ii console-cyrillic 0.9-16 Better Cyrillic support for Linux console
ii t1-cyrillic 4.13 A basic set of free PostScript fonts
ii texlive-lang-cyrillic 2009-3 TeX Live: Cyrillic
ii xfonts-cyrillic 1:1.0.1 Cyrillic fonts for X
work$ dpkg -l | grep latex
ii latex-beamer 3.07-2 LaTeX class to produce presentations
ii latex-xcolor 2.11-1 Easy driver-independent TeX class for color
ii preview-latex-style 11.85-1 extraction of elements from LaTeX documents as graphics
ii texlive-latex-base 2009-11+squeeze1 TeX Live: Basic LaTeX packages
ii texlive-latex-base-doc 2009-11+squeeze1 TeX Live: Documentation files for texlive-latex-base
ii texlive-latex-extra 2009-10 TeX Live: LaTeX supplementary packages
ii texlive-latex-extra-doc 2009-10 TeX Live: Documentation files for texlive-latex-extra
ii texlive-latex-recommended 2009-11+squeeze1 TeX Live: LaTeX recommended packages
ii texlive-latex-recommended-doc 2009-11+squeeze1 TeX Live: Documentation files for texlive-latex-recommended
答案1
您不应该以这种方式使用 XeLaTeX,因为它需要 Unicode 输入。无论如何,正确的连字并不取决于输入编码,而是取决于输出编码。
我假设你的文件是 UTF-8 编码的,否则会出现很多问题。这是一个工作版本,至少适用于 TeX Live 2013(Ubuntu 12.04 之前附带的 2009 版本确实过时了)。请注意,仅适用于俄语T2A
应加载俄语版本,但仅有的ifpdflatex
被使用。因此我加载ifxetex
包来区分这两个引擎。
您也可以babel
输入“非 XeLaTeX”代码并调用polyglossia
XeLaTeX。
\documentclass[a4paper,twoside,titlepage,openright,10pt]{book}
\usepackage{ifxetex}
\ifxetex
\usepackage{fontspec}
\defaultfontfeatures{Ligatures=TeX}
\setmainfont{CMU Serif}
\setsansfont{CMU Sans Serif}
\else
\usepackage[T1,T2A]{fontenc}
\usepackage[utf8]{inputenc}
\fi
\usepackage[english,russian]{babel}
\title{УНИКАЛЬНАЯ ЖЕНЩИНА \\ Проницательность и мудрость для достижения полноты жизни}
\author{Эдвин Луис Коул и Нэнси Корбетт Коул}
\begin{document}
\maketitle
\begin{otherlanguage*}{english}
``We will implement prudent and responsible macroeconomic policies to ensure mutually reinforcing effect of growth and to maintain economic and financial stability in the region, and prevent negative spillover effect.''
\end{otherlanguage*}
Многие женщины начинают поиск истинного <<Я>> и оказываются обманутыми и разочарованными, пытаясь стать похожими на образец современной женщины. Приспосабливаясь внешне, но сопротивляясь внутренне, они однажды обнаруживают, что глубоко в душе они не являются тем, чем случайно оказались.
Некоторые женщины научились искать и получать розы, обеды и драгоценности и все же не ощущают стабильности, безопасности, удовлетворения от проявления своей индивидуальности и настоящей любви, чего они в действительности желают.
Множество женщин вверили свою жизнь мужчинам, желая жить жизнью своих мужей или любовников, но это ведет лишь к тому, что они разочаровываются в мужчинах, а в итоге и в самих себе.
Многие, очень многие жены отчаянно хотят, чтобы их мужья изменялись, становились зрелыми, брали ответственность на себя и были такими мужчинами, какими они сотворены быть. Они осознают слишком поздно, что подлинно свободна только та замужняя женщина, муж которой <<достиг максимума>>.
\begin{otherlanguage*}{english}
``Global growth is too weak, risks remain tilted to the downside, global trade is weakening and the economic outlook suggests growth is likely to be slower and less balanced than desired," the group said in a prepared statement.''
\end{otherlanguage*}
\end{document}
pdflatex
我可以用或编译它xelatex
,下面我展示了结果。你可以看到它们非常相似。请注意,为了获得英语连字,你应该将文本括在环境中otherlanguage*
。