如何将印度语言 .tex 文件转换为 epub 并输出整洁的输出

如何将印度语言 .tex 文件转换为 epub 并输出整洁的输出

我正在尝试将使用 XeLaTeX 准备的一本马拉雅拉姆语书籍转换为 epub 文件。我尝试使用 Calibre,但得到的文件在马拉雅拉姆语文本方面存在很多问题。然后我尝试使用 pandoc,它给出了一个基本整洁的输出,但在字符方面存在一些问题,并且一些方程式显示为 tex 命令本身。我发现的另一个问题是,在使用 pandoc 编译时,我在图形中使用的短标题选项被视为错误。然后我不得不将它们从图形环境中删除。

而且我不想要适合我的平板电脑或手机的 pdf 文件,因为 pdf 的行为与 epub 不同。因此,更改大小或页面尺寸根本不是解决方案。这根本不是我想要的。

预先感谢您的任何帮助。

答案1

您没有提供任何测试文件,所以我将仅使用在互联网上找到的一些示例:

\documentclass{article}
\usepackage{fontspec}
\setmainfont{Rachana}[Script=Malayalam]
\newfontfamily\malayalamfont{Rachana}[Script=Malayalam]
\usepackage{polyglossia}
\setdefaultlanguage{malayalam}
\usepackage{amsmath}
\begin{document}

\title{സ്വർണം}
\author{മലയാളം വിക്കിപീഡിയ}
\maketitle

\tableofcontents

\section{സ്വർണം}

മൃദുവും തിളക്കമുള്ളതുമായ മഞ്ഞലോഹമാണ് സ്വർണം. വിലയേറിയ ലോഹമായ സ്വർണം, നാണയമായും, ആഭരണങ്ങളുടെ രൂപത്തിലും നൂറ്റാണ്ടുകളായി മനുഷ്യൻ ഉപയോഗിച്ചു പോരുന്നു. 
ചെറിയ കഷണങ്ങളും തരികളുമായി സ്വതന്ത്രാവസ്ഥയിൽത്തന്നെ പ്രകൃതിയിൽ ഈ ലോഹം കണ്ടുവരുന്നു. ലോഹങ്ങളിൽ വച്ച് ഏറ്റവും നന്നായി രൂപഭേദം വരുത്താവുന്ന ലോഹമാണിത്.
\footnote{http://www.webelements.com/webelements/elements/text/Au/key.html "Key properties of gold" (in ഇംഗ്ലീഷ്). ശേഖരിച്ചത് 2007-06-18.}

\section{ഗുണങ്ങൾ}
സ്വർണത്തിന്റെ അണുസംഖ്യ 79-ഉം പ്രതീകം Au എന്നുമാണ്. ഔറം എന്ന ലത്തീൻ വാക്കിൽ നിന്നാണ് Au എന്ന പ്രതീകം ഉണ്ടായത്.
ഏറ്റവും നന്നായി രൂപഭേദം വരുത്താൻ സാധിക്കുന്ന ലോഹമാണ് സ്വർണ്ണം. ഒരു ഗ്രാം സ്വർണ്ണം അടിച്ചു പരത്തി ഒരു ചതുരശ്രമീറ്റർ വിസ്തീർണ്ണമുള്ള ഒരു തകിടാക്കി മാറ്റാൻ സാധിക്കും. 
അതായത് 0.000013 സെന്റീമീറ്റർ വരെ ഇതിന്റെ കനം കുറക്കാൻ കഴിയും. അതു പോലെ വെറും 29 ഗ്രാം സ്വർണ്ണം ഉപയോഗിച്ച് 100 കിലോ മീറ്റർ നീളമുള്ള കമ്പിയുണ്ടാക്കാനും സാധിക്കും. 

\section{ചരിത്രം}
ചരിത്രാതീത കാലം മുതൽക്കേ അറിയപ്പെട്ടിരുന്ന അമൂല്യലോഹമാണ്‌ സ്വർണ്ണം. ഒരുപക്ഷേ മനുഷ്യൻ ആദ്യമായി ഉപയോഗിച്ച ലോഹവും ഇതുതന്നെയായിരിക്കണം.
ബി.സി.ഇ. 2600 ലെ ഈജിപ്ഷ്യൻ ഹീറോഗ്ലിഫിക്സ് ലിഖിതങ്ങളിൽ ഈജിപ്തിൽ സ്വർണ്ണം സുലഭമായിരുന്നെന്ന് പരാമർശിക്കുന്നുണ്ട്.
ചരിത്രം പരിശോധിച്ചാൽ ഈജിപ്തും നുബിയയുമാണ്‌ ലോകത്തിൽ ഏറ്റവുമധികം സ്വർണ്ണം ഉല്പ്പാദിപ്പിച്ചിരുന്ന മേഖലകൾ. ബൈബിളിലെ പഴയ നിയമത്തിൽ സ്വർണ്ണത്തെപ്പറ്റി പലവട്ടം പരാമർശിക്കുന്നുണ്ട്.



ദുവും തിളക്കമുള്ളതുമായ മഞ്ഞലോഹമാണ് സ്വർണം. വിലയേറിയ ലോഹമായ സ്വർണം, നാണയമായും, ആഭരണങ്ങളുടെ രൂപത്തിലും നൂറ്റാണ്ടുകളായി മനുഷ്യൻ ഉപയോഗിച്ചു പോരുന്നു. 
ചെറിയ കഷണങ്ങളും തരികളുമായി സ്വതന്ത്രാവസ്ഥയിൽത്തന്നെ പ്രകൃതിയിൽ ഈ ലോഹം കണ്ടുവരുന്നു. ലോഹങ്ങളിൽ വച്ച് ഏറ്റവും നന്നായി രൂപഭേദം വരുത്താവുന്ന ലോഹമാണിത്.



\begin{equation} \label{eq1}
  \begin{split}
    A & = \frac{\pi r^2}{2} \\
     & = \frac{1}{2} \pi r^2
  \end{split}
\end{equation}


\end{document}

它只是一些使用Fontspec和的基本文档Polyglossia。您可以使用以下方式编译它:

tex4ebook -l filename.tex

此命令将生成 Epub 2 文件,使用 LuaLaTeX 进行编译。TeX Live 中包含的 版本tex4ebook不支持XeTeX,因此我们需要改用 LuaTeX。

此文件存在一些问题,最明显的是错误的标题页:

在此处输入图片描述

我们可能还想使用封面图片和一些自定义 CSS 文件。为此,需要配置文件。将以下代码保存为myconfig.cfg

\Preamble{xhtml}
\def\blockelement#1{\ifvmode\IgnorePar\fi\EndP\HCode{#1}}
\Configure{thanks author date and}
{\blockelement{<div class="thanks">}}
{\blockelement{</div>}}
{\blockelement{<div class="author">}\NoFonts}
{\EndNoFonts\blockelement{</div>}}
{\blockelement{<div class="date">}\NoFonts}
{\EndNoFonts\blockelement{</div>}}
{\blockelement{<br class="and" />}}
{\blockelement{<br />}}

\Configure{@HEAD}{\HCode{<link rel="stylesheet" type="text/css" href="mystyle.css" />}}
\special{t4ht+@File: mystyle.css}

\CoverMetadata{mycover.png}
\begin{document}
\EndPreamble

处理\Configure{thanks author date and}错误的标题页。\CoverMetadata{mycover.png}添加封面图像并\Configure{@HEAD}{\HCode{<link rel="stylesheet" type="text/css" href="mystyle.css" />}}包含自定义 CSS 文件。\special{t4ht+@File: mystyle.css}需要将其包含在 Epub 文件中。

您可以使用配置文件编译文档

 tex4ebook -lc myconfig.cfg filename.tex

另一个问题是数学。Epub 2 并不是很好的科学文档格式,数学只能以位图形式包含。它可能看起来不太好。

最好使用更新的 Epub 3 版本。它支持 MathMl,看起来应该比位图图像更好。问题是 Epub 阅读系统对 MathMl 的支持并不好。无论如何,你可以试试:

 tex4ebook -lc myconfig.cfg -f epub3 filename.tex mathml

如果 MathMl 不适合您,可以使用 SVG 图像,它看起来比位图更好:

 tex4ebook -lc myconfig.cfg -f epub3 filename.tex svg

这是 Calibre 中的结果:

在此处输入图片描述 在此处输入图片描述

相关内容