text-processors

我的方法
text-processors

我的方法

我想将文本文件的内容拆分成音节(或者我只是想用连字符连接它;我不想涉及像这样的科学/语言上正确的细节:https://tex.stackexchange.com/questions/133859/using-tex-to-split-words-into-syllables)。 所以如果我有这样的文字 音节分割算法 我希望它被分解为 音节分割算法 现在,我知道 (la)tex 能够以某种方式使用命令来执行此\showhyphens{syllable breaking algorithm}操作,该命令会在 tex 日志中给出其结果。但是,我想批量处理此...

Admin

迭代查找所有以 X 开头的行,并移至下一行以 Y 开头的行上方
text-processors

迭代查找所有以 X 开头的行,并移至下一行以 Y 开头的行上方

我有一个这样的文件: Lorem ipsum dolor sit amet. Consectetur adipiscing elit. MATCH1 Quis autem vel! Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. MATCH1 Eum iure reprehenderit? MATCH2 Qui in ea voluptate Ut enim ad minim veniam. Quis nostrud exercitation TARGET Sed ut ...

Admin

给定 3 个文本文件,如何从每个文件中找到唯一的行
text-processors

给定 3 个文本文件,如何从每个文件中找到唯一的行

我有 3 个文本文件,每个文件都有一些唯一的 ID,我想在每个文本文件中只保留唯一的 ID。假设有 3 个文件 (A、B 和 C)。如果 A 和 B 中都出现了“abc”的 ID,则需要从两个文件中删除它。 文件已排序,大小不超过 1MB,ID 为字母数字字符。而且每个文件中都没有重复项。 有没有办法只使用 Linux 或 Mac 中的命令行工具来做到这一点?我最初想写一个代码,但想先问一下。谢谢! ...

Admin

使用 Excel 解析格式不一致的文本数据
text-processors

使用 Excel 解析格式不一致的文本数据

我在解析电子表格中的文本时遇到了困难。我的电子表格中有数百条记录,这些记录与以下示例类似(这些记录都在一个单元格中): 7431340 03 POOLS E TECHNOLOGIES INC 90 NEW ENGLAND DRIVE 16 0.00 6,900 7,060 我需要将下面的每一个解析到单独的单元格中: [7431340] [03 POOLS E TECHNOLOGIES INC] [90 NEW ENGLAND DRIVE] [7,060] 或者在 Excel 表中显示 我遇到的问题是每条记录的数据不一致。更多示例: 717...

Admin

识别前导行空格 - Shell 脚本
text-processors

识别前导行空格 - Shell 脚本

我有一个如下所示的示例文件。其中有前导空格。有没有办法使用 shell 脚本检测它们并打印包含空格的确切行号? test space at back test space at front TAB at end TAB at front ...

Admin

如何删除多个文件中第三行后的文本
text-processors

如何删除多个文件中第三行后的文本

我正在寻找一种方法,以便可以删除文本文件中特定行之后的行。 例如,一个文件包含 5 行。我想删除第三行之后的行。请参见 1号线 2号线 3号线 xxxxxx xxxxxx1 这里,我想保留前 3 行(第 1 行、第 2 行、第 3 行)并删除剩余的 2 行(xxxxxx、xxxxxx1)并自动保存该文本文件。我想对多个文本文件执行此操作。想删除文件夹内每个文本文件中第 3 行之后的每一行。 有什么方法可以使用 notepad++ 来实现吗?提前致谢 ...

Admin

使用一个文本文件作为其他带有表单的文本文件的修改版“模板”
text-processors

使用一个文本文件作为其他带有表单的文本文件的修改版“模板”

(为了更清楚起见,重新措辞问题。) 假设我有 1000 个文本文件。每个文件都是文本形式,具有固定的字段描述和标题,但数据不同。例如,文件 1: The Foo Factory Date: 2015-10-02 Order Details ------------------------- Order ID: [ 1 ] Amount: [ 1 ] Order Price: [ 12.34 ] Have a nice day. 和文件 2: The Foo Fact...

Admin

用于输出 UTF-8 编码文件中前 n 个字符的 Unix 工具
text-processors

用于输出 UTF-8 编码文件中前 n 个字符的 Unix 工具

我想打印前 1000 个人物在 UTF-8 编码的文件中。我知道头工具可以打印文件的前 n 个字节,但它可能会在中间剪切一个字符,因此最后会得到乱码输出。 我可以编写一个 awk 程序来执行此操作,但是否还有其他更简单的方法? 附言:我觉得不合理的是头和尾巴不支持字符编码(LANG 环境变量),而其他工具如切,厕所,sed和awk都支持字符编码。 ...

Admin

如何用另一个文本文件替换标记之间的文本文件部分?
text-processors

如何用另一个文本文件替换标记之间的文本文件部分?

假设我有一个这样的文本文件: # custom content section a b ### BEGIN GENERATED CONTENT c d ### END GENERATED CONTENT 我想用GENERATED CONTENT另一个文件的内容替换标签之间的部分。 做到这一点最简单的方法是什么? ...

Admin

仅对文件进行部分行的 grep
text-processors

仅对文件进行部分行的 grep

我有一个 rtf 文件,我正在像这样使用 grep grep "Order Number" 'Extract Text Output.rtf' 结果是这样的 \b\fs28 \cf2 Fab Order Number : FAB00772450\ 我希望结果只是 FAB00772450 我知道如果我使用 -o 它只会返回单词“订单号”,但这对我没有帮助 ...

Admin

如何在 bash 的 `cut` 中将多个空格(例如:制表符)设置为分隔符
text-processors

如何在 bash 的 `cut` 中将多个空格(例如:制表符)设置为分隔符

我想从 mpstat 输出中检索 CPU 使用率/空闲百分比。cut可以使用 bash 来检索此类详细信息,但我不知道分隔符应该是什么。 [idlecool@archbitch proc]$ mpstat | grep "all" | cut -d '$x' -f11 $x 应该是什么以便我可以跳过空格并选择与 %idle 相对应的值? mpstat 的输出: [idlecool@archbitch proc]$ mpstat Linux 2.6.36-ARCH (archbitch) 01/14/11 _i686_ (2 CP...

Admin

文本格式化工具
text-processors

文本格式化工具

我以文本格式做笔记,例如: ## 待办事项列表 1. 这样做 2. 这样做 ## 某物 ### 任何事物 1. 这样做 2. 这样做 有没有工具可以把这些文本转换成 HTML 或 LaTeX 格式?我发现狮身人面像,因为它用于 Python 代码格式化。如果有一个用于更通用的文本格式化的工具就太好了。 ...

Admin

为什么使用破折号字符这么难?
text-processors

为什么使用破折号字符这么难?

在 Word、记事本甚至 Google Docs 中输入文本时,我想使用破折号符号。请注意,该符号用于对话框中。 所有键盘都没有破折号符号(Alt+0151),所以大多数人使用连字符(数字键盘上的减号)。 注意区别: 连字符符号:- 破折号符号:— 当使用对话框编写书籍或其他文本时,缺少破折号会特别痛苦......恕我直言,破折号不是特殊字符,而是(非常)常见的字符! 这里有作家经历过这种情况吗?怎么可能没有人注意到这个缺失/问题?你是如何解决这个问题的? ...

Admin