在代码中保留连字符布局 - 使其从 PDF 中消失

在代码中保留连字符布局 - 使其从 PDF 中消失

我有一个 OCRed 文档需要排版。但是,出于验证目的,我想在代码中保留原始布局,但让连字符从编译后的文档中消失。有办法实现这一点吗?我尝试插入可选连字符 ( \-),但换行符仍然会添加不必要的空格。

就像是:

(Aus Pesth, den 11. August.) Die in einigen Zeitblättern
spärlich zerstreuten Nachrichtenüber die Israeliten in Ungarn rüh-
ren allesammt von ununterrichteten Berichterstattern her, welche
ihre Unbekanntschaft mit den bestehenden Verhältnissen fast mit
jedem Worte verrathen. Authentische Nachrichten hierüber dürf-
ten Ihnen nicht unwillkommen sein. Die erste Erwähnung ver-
dient wohl die hiesige, 1467 Familien zählende Gemeinde, nächst
Brody und Prag die größte im Kaiserstaate.

但文件中仍有鲁伦、杜尔夫滕维尔迪恩特没有连字符或空格。

答案1

你可以-通过\sourcehyph以下方式替换你的 OCR 源:

\let\sourcehyph\-

作为字母的控制名称,它将意味着以下行尾被吸收并且不会在文档中留下空格,并且将确保该点仍然是一个可以重新连字符的合法断点。

使用

\-%

也可以使用,但对我来说看起来不太清楚,如果你不小心重新换行,你可能会发现自己注释掉了你不想丢失的文本。

相关内容