将含有非英文字符的 (xe)latex 转换为 html

将含有非英文字符的 (xe)latex 转换为 html

我有一个确切的问题这个帖子。我检查了那里的答案,找到了一个可能的答案这里。很遗憾我在linux,无法使用bat文件。

粘贴的是我的latex文件,可以很好地编译xelatex

\documentclass[dvipdfmx]{article}
\usepackage{fontspec}
\usepackage[pass,paperwidth=4in,paperheight=4in]{geometry}
%
%\font\serif="FreeSerif:script=beng"
\font\serifbb="SolaimanLipi:script=beng" at 16pt%
\font\deffont="Lohit-Bengali:script=beng" at 14pt%
%
\author{\serifbb {শক্তি চট্টোপাধ্যায়}}%
\title{\serifbb {যখন বৃষ্টি নামলো}}%
\date{}

\begin{document}
\deffont %Default font used for the document
\maketitle
\noindent
\begin{center}বুকের মধ্যে বৃষ্টি নামে নৌকা টলোমলো\\
কূল ছেড়ে আজ অকূলে যাই এমনও সম্বল\\
নেই নিকটে - হয়ত ছিল বৃষ্টি আসার আগে\\
চলচ্ছক্তিহীন হয়েছি, তাই কি মনে জাগে\\
পোড়োবাড়ির স্মৃতি? আমার স্বপ্নে মেশা দিন\\
চলচ্ছক্তিহীন হয়েছি, চলচ্ছক্তিহীন।
‌\vspace{.5in}\\
বৃষ্টি নামলো যখন আমি উঠোন-পানে একা,\\
দৌড়ে গিয়ে ভেবেছিলাম তোমার পাব দেখা।\\
হয়ত মেঘে-বৃষ্টিতে বা শিউলিগাছের তলে\\
আজানুকেশ ভিজিয়ে নিচ্ছো আকাশ-ছেঁচা জলে\\
কিন্তু তুমি নেই বাহিরে – অন্তরে মেঘ করে,\\
ভারি ব্যাপক বৃষ্টি আমার বুকের মধ্যে ঝরে!\end{center}
\end{document}

使用 xelatex,其工作正常:

$ xelatex jbn.tex
...
*geometry* driver: auto-detecting
*geometry* detected driver: xetex
[1] (./jbn.aux) )
Output written on jbn.pdf (1 page).
Transcript written on jbn.log.

我尝试使用 htxelatex:

$htxelatex trial.tex html
...
(/usr/share/texlive/texmf-dist/tex/generic/tex4ht/html4-math.4ht)) (./jbn.aux)
(/usr/share/texlive/texmf-dist/tex/latex/tipa/t3cmr.fd)

! LaTeX Error: Command `\acute' already defined in `'.

See the LaTeX manual or LaTeX Companion for explanation.
Type  H <return>  for immediate help.
 ...                                              

l.13 \begin{document}

? 

然后开始打印很多东西,最后得到:

 [-S<image-script>]
   [-s<css-file-ext>]   default: -s4cs; multiple entries allowed
   [-t<tfm-font-dir>]
   [-u10]               base 10 for unicode characters
   [-utf8]              utf-8 encoding for unicode characters
   [-v<idv version>]    replacement for the given dvi version
   [-xs]           ms-dos file names for automatically generated gifs
/usr/bin/t4ht: fork: retry: No child processes
/usr/bin/t4ht: fork: retry: No child processes
/usr/bin/t4ht: fork: retry: No child processes
/usr/bin/t4ht: fork: retry: No child processes
/usr/bin/t4ht: fork: Resource temporarily unavailable

我可以得到一些帮助吗?

编辑 朋友们,

我已经解决了! LaTeX Error: Command ``\acute' already defined in'。问题,方法是\usepackage[no-math]{fontspec}

但是,仍然有无子进程错误,而且 html 的主体基本上是空的: html 输出:

<html > 
<head><title>  </title> 
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"> 
<meta name="generator" content="TeX4ht (http://www.cse.ohio-state.edu/~gurari/TeX4ht/)"> 
<meta name="originator" content="TeX4ht (http://www.cse.ohio-state.edu/~gurari/TeX4ht/)"> 
<!-- html --> 
<meta name="src" content="jbn.tex"> 
<meta name="date" content="2013-09-23 18:48:00"> 
<link rel="stylesheet" type="text/css" href="jbn.css"> 
</head><body 
>
   <div class="maketitle">



<h2 class="titleHead">  </h2>
<div class="author" > </div>
<br />
<div class="date" ></div>
   </div>
<div class="center" 
>
<!--l. 17--><p class="noindent" >
<!--l. 17--><p class="noindent" >     <br />
      <br />
       <br />
     <br />
     <br />
   <br />
     <br />
     <br />
    <br />
    <br />
       <br />
      </div>

</body></html> 

Make4ht出现错误:

~/Downloads/make4ht/make4ht -u -c config -x jbn.tex 
/home/rudra/Downloads/make4ht/make4ht:11: module 'make4ht-lib' not found:
    no field package.preload['make4ht-lib']
    [kpse lua searcher] file not found: 'make4ht-lib'
    [kpse C searcher] file not found: 'make4ht-lib'

**第二条评论之后**

我已按照您的指示添加了路径,此链接

 $kpsewhich -var-value TEXMFHOME
/home/rudra/texmf
$ echo $PATH
/home/rudra/texmf/scripts/lua/make4ht:

但我仍然收到同样的错误:

$ make4ht -u -c config.cfg jbn.tex
tex4ht.c (2012-07-25-19:36 kpathsea)
tex4ht 
--- error --- improper command line
tex4ht [-f<path-separator-ch>]in-file[.dvi]
   [-.<ext>]            replacement to default file extension name .dvi
   [-c<tag name>]       choose named segment in env file
   [-e<env-file>]
   [-f<path-separator-ch>]        remove path from the file name
   [-F<ch-code>]        replacement for missing font characters; 0--255; default 0
   [-g<bitmap-file-ext>]
   [-h(e|f|F|g|s|v|V)]  trace: e-errors/warnings, f-htf, F-htf search
                            g-groups, s-specials, v-env, V-env search
   [-i<htf-font-dir>]
   [-l<bookkeeping-file>]
   [-P(*|<filter>)]     permission for system calls: *-always, filter
   [-S<image-script>]
   [-s<css-file-ext>]   default: -s4cs; multiple entries allowed
   [-t<tfm-font-dir>]
   [-u10]               base 10 for unicode characters
   [-utf8]              utf-8 encoding for unicode characters
   [-v<idv version>]    replacement for the given dvi version
   [-xs]           ms-dos file names for automatically generated gifs
/usr/bin/t4ht: fork: retry: No child processes
/usr/bin/t4ht: fork: retry: No child processes
/usr/bin/t4ht: fork: retry: No child processes
/usr/bin/t4ht: fork: retry: No child processes
/usr/bin/t4ht: fork: Resource temporarily unavailable
Parse LG
parse_lg process file: jbn.html
outdir: 
parse_lg process file: jbn.css
outdir: 
parse_lg process file: jbn.tmp
tmp file

答案1

您可以尝试实验性的 fontspec支持 tex4ht. 还有一些文档。我刚刚添加了对孟加拉语的支持。

对源文件进行一些修改:

\documentclass[dvipdfmx]{article}
\usepackage{fontspec}
\usepackage[pass,paperwidth=4in,paperheight=4in]{geometry}
%
%\font\serif="FreeSerif:script=beng"
%\font\serifbb="SolaimanLipi:script=beng" at 16pt%
%\font\deffont="Lohit-Bengali:script=beng" at 14pt%
\newfontfamily\serifbb[Script=Bengali]{SolaimanLipi}
\newfontfamily\deffont[Script=Bengali]{Lohit-Bengali}

\author{\serifbb {শক্তি চট্টোপাধ্যায়}}%
\title{\serifbb {যখন বৃষ্টি নামলো}}%
\date{}

\begin{document}
\deffont %Default font used for the document
\maketitle
\noindent
\begin{center}বুকের মধ্যে বৃষ্টি নামে নৌকা টলোমলো\\
কূল ছেড়ে আজ অকূলে যাই এমনও সম্বল\\
নেই নিকটে - হয়ত ছিল বৃষ্টি আসার আগে\\
চলচ্ছক্তিহীন হয়েছি, তাই কি মনে জাগে\\
পোড়োবাড়ির স্মৃতি? আমার স্বপ্নে মেশা দিন\\
চলচ্ছক্তিহীন হয়েছি, চলচ্ছক্তিহীন।\vspace{.5in}\\
বৃষ্টি নামলো যখন আমি উঠোন-পানে একা,\\
দৌড়ে গিয়ে ভেবেছিলাম তোমার পাব দেখা\\
হয়ত মেঘে-বৃষ্টিতে বা শিউলিগাছের তলে\\
আজানুকেশ ভিজিয়ে নিচ্ছো আকাশ-ছেঁচা জলে\\
কিন্তু তুমি নেই বাহিরে – অন্তরে মেঘ করে,\\
ভারি ব্যাপক বৃষ্টি আমার বুকের মধ্যে ঝরে!\end{center}
\end{document}

(您必须使用\newfontfamily而不是\font\serifbb)。

对于某些调整,使用自定义配置文件config.cfg

\Preamble{xhtml, NoFonts}
\renewcommand\vspace[1]{
\HCode{<div class="vspace"></div>}
}
\Css{.vspace{height:.5em;}}
\Css{img[src*=ec-lmr]{display:none;}}
\begin{document}
\EndPreamble

\vspace命令配置和css声明,用于隐藏一些神秘生成的不需要的图像tex4ht(我说过这是实验性的包!)

不幸的是,我无法用传统ht(xe|lua)latex脚本得到正确的结果,所以我使用了制作4小时

make4ht -u -c config -x trial.tex

-u将输出文件设置为 utf-8,-c用于配置文件包含,-x用于 xelatex

结果:

在此处输入图片描述

相关内容