我有一个 OCRed 文档需要排版。但是,出于验证目的,我想在代码中保留原始布局,但让连字符从编译后的文档中消失。有办法实现这一点吗?我尝试插入可选连字符 ( \-
),但换行符仍然会添加不必要的空格。
就像是:
(Aus Pesth, den 11. August.) Die in einigen Zeitblättern
spärlich zerstreuten Nachrichtenüber die Israeliten in Ungarn rüh-
ren allesammt von ununterrichteten Berichterstattern her, welche
ihre Unbekanntschaft mit den bestehenden Verhältnissen fast mit
jedem Worte verrathen. Authentische Nachrichten hierüber dürf-
ten Ihnen nicht unwillkommen sein. Die erste Erwähnung ver-
dient wohl die hiesige, 1467 Familien zählende Gemeinde, nächst
Brody und Prag die größte im Kaiserstaate.
但文件中仍有鲁伦、杜尔夫滕和维尔迪恩特没有连字符或空格。
答案1
你可以-
通过\sourcehyph
以下方式替换你的 OCR 源:
\let\sourcehyph\-
作为字母的控制名称,它将意味着以下行尾被吸收并且不会在文档中留下空格,并且将确保该点仍然是一个可以重新连字符的合法断点。
使用
\-%
也可以使用,但对我来说看起来不太清楚,如果你不小心重新换行,你可能会发现自己注释掉了你不想丢失的文本。