如何使用 pdflatex 在 Latex 中打印 HTML 实体

如何使用 pdflatex 在 Latex 中打印 HTML 实体

我有一串包含 devnagri 字体字符的 HTML 实体。示例 HTML 实体字符串为:

<h1>&#2311;&#2344;&#2346;&#2369;&#2335; &#2360;&#2366;&#2343;&#2344;&#2375; &#2321;&#2344;&#2354;&#2366;&#2311;&#2344; &#2357;&#2366;&#2346;&#2352;&#2370;&#2344; &#2346;&#2361;&#2366;</h1> <p><span>&#2310;&#2346;&#2339; &#2344;&#2367;&#2357;&#2337;&#2354;&#2375;&#2354;&#2381;&zwj;&#2351;&#2366; &#2349;&#2366;&#2359;&#2375;&#2350;&#2343;&#2381;&zwj;&#2351;&#2375; &#2335;&#2366;&#2311;&#2346; &#2325;&#2352;&#2339;&#2375; &#2360;&#2379;&#2346;&#2375; &#2348;&#2344;&#2357;&#2340;&#2366;&#2340;</span></p>

我正在寻找 LATEX 包,它将有助于使用 pdflatex 打印与 HTML 实体相对应的字符。[下面提到了打印 unicode 的示例代码,以显示我已经使用的包列表。有没有类似的方法来打印 HTML 实体]

\documentclass[addpoints,answers,10pt]{exam}
\usepackage{multicol}
\usepackage[T1]{fontenc}
\usepackage{graphicx}
\usepackage{tabularx}
\usepackage{nonfloat}
\usepackage{caption}
\usepackage{amsmath,amssymb}
\usepackage{lmodern}
\usepackage{textcomp}
\usepackage[utf8x]{inputenc}
\usepackage{ifpdf}
\begin{document}
\begin{multicols}{2}
\begin{questions}
\question[4]
\unichar{"00E4}
\end{questions}
\end{multicols}
\end{document}

答案1

xetex:部分答案

如果您将问题中的 html 保存到temp.htmlWeb 浏览器中查看,则可以剪切并粘贴扩展了字符引用的文本。然后很容易添加一些 TeX 标记。(我选择了 Windows 应用程序“wordpad”选择的字体来显示这些字符,任何其他已安装的字体也可以使用)

\documentclass{article}
\usepackage{fontspec}
\setmainfont{Aparajita}
\begin{document}

\section*{इनपुट साधने ऑनलाइन वापरून पहा}

आपण निवडलेल्‍या भाषेमध्‍ये टाइप करणे सोपे बनवतात

\end{document}

使用 xelatex 处理后得到以下结果。抱歉,我不知道这是否是正确的文本。

在此处输入图片描述


PDFTeX:部分答案

部分答案,这会将 html 字符引用转换为\unichar调用,但我不知道你实际需要排版什么包和字体,所以我得到了

? ! Undefined control sequence.
<inserted text> ...tdevanagarii \textdevanagarina 

但也许你可以以此作为开始

\documentclass[addpoints,answers,10pt]{exam}
\usepackage{multicol}
\usepackage[T1]{fontenc}
\usepackage{graphicx}
\usepackage{tabularx}
\usepackage{nonfloat}
\usepackage{caption}
\usepackage{amsmath,amssymb}
\usepackage{lmodern}
\usepackage{textcomp}
\usepackage[combine]{ucs}
\usepackage[utf8x]{inputenc}
\usepackage{ifpdf}
\def\zz{\begingroup\catcode`\&\active`\catcode`\#12 \xzz}
\def\xzz#1{#1\endgroup}

\begingroup\lccode`\~`\&\lccode`\+`\#\lowercase{\endgroup\def~#1#2;{\unichar{"#2}}}
\begin{document}


\zz{\textbf{&#2311;&#2344;&#2346;&#2369;&#2335; &#2360;&#2366;&#2343;&#2344;&#2375; &#2321;&#2344;&#2354;&#2366;&#2311;&#2344; &#2357;&#2366;&#2346;&#2352;&#2370;&#2344; &#2346;&#2361;&#2366;}}

\zz{&#2310;&#2346;&#2339; &#2344;&#2367;&#2357;&#2337;&#2354;&#2375;&#2354;&#2381;&zwj;&#2351;&#2366; &#2349;&#2366;&#2359;&#2375;&#2350;&#2343;&#2381;&zwj;&#2351;&#2375; &#2335;&#2366;&#2311;&#2346; &#2325;&#2352;&#2339;&#2375; &#2360;&#2379;&#2346;&#2375; &#2348;&#2344;&#2357;&#2340;&#2366;&#2340;}

\end{document}

相关内容