清理包含各种 CR 和 LF 换行符的文本文件

Question 1

如果正确的 CR+LF 位于 Memo 字段周围的单引号之外，则以下后视应该可以匹配要删除的 CR+LF：

(?<!')\r\n

正则表达式可视化

原始答案：

您可以在文本文件上运行正则表达式吗？

\r\n?|\n

用您想要的换行符替换每个匹配项，例如\r\n。

Answer

如果正确的 CR+LF 位于 Memo 字段周围的单引号之外，则以下后视应该可以匹配要删除的 CR+LF：

(?<!')\r\n

正则表达式可视化

原始答案：

您可以在文本文件上运行正则表达式吗？

\r\n?|\n

用您想要的换行符替换每个匹配项，例如\r\n。

Question 2

根据您想要保留的内容（CR-LF 或 LF），您可以使用unix2dos/dos2unix样式实用程序可以将导入的文件从 CR-LF 转换并清理为 LF 或反之亦然，以使其始终保持一致。

如果你使用的是 Unix/Linux 平台，那么你应该可以使用 dos2unix 和 unix2dos 命令。
如果你使用的是 Windows 并且没有赛格威（或同等的），你可以尝试托弗罗多斯。

Answer

根据您想要保留的内容（CR-LF 或 LF），您可以使用unix2dos/dos2unix样式实用程序可以将导入的文件从 CR-LF 转换并清理为 LF 或反之亦然，以使其始终保持一致。

如果你使用的是 Unix/Linux 平台，那么你应该可以使用 dos2unix 和 unix2dos 命令。
如果你使用的是 Windows 并且没有赛格威（或同等的），你可以尝试托弗罗多斯。

Question 3

如果数据本身包含 CR LF，并且它们没有用某种限定符（例如“”）括起来，那么显然这些行将被分成多行。最好的办法是清理 Access 中的数据并再次导出。如果 CR LF 符合条件，那么您应该能够操作文件（我可能会使用 AWK）并用 \n 替换不合格的 CR LF。

为了更加精确，我需要了解更多有关数据的信息。

Answer

如果数据本身包含 CR LF，并且它们没有用某种限定符（例如“”）括起来，那么显然这些行将被分成多行。最好的办法是清理 Access 中的数据并再次导出。如果 CR LF 符合条件，那么您应该能够操作文件（我可能会使用 AWK）并用 \n 替换不合格的 CR LF。

为了更加精确，我需要了解更多有关数据的信息。

相关内容