情况:
我有一个大约 1.5GB 的文本文件,包含大约4000000
行。
我想导入这个Libreoffice calc
,但你知道你不能导入这个包含大量行数的巨型文件(我认为最多是 65000 行)。
无论如何,我需要的是一个简单的命令,可以将此文件拆分为更小的文件,每个文件的行数<65000 行。
答案1
您可以使用以下split
命令:
split -l N /path-to-file
在哪里否是文件中可以包含的最大行数。
此命令将文件分割成较小的文件,每个文件具有否行数。
使用man split
以获取更多信息。
答案2
如果您使用拆分并创建多个文件,您的下一个问题将是如何使用 Calc 来处理所有这些文件中的所有数据。这就是一个问题接一个问题。65000 行将是 62(!) 页。
您只是使用了错误的工具。使用 Libreoffice Base 或 MySQL 导入数据,然后使用 Libreoffice Calc 对该数据进行计算和/或操作。
关于限制,这取决于您使用的 Libreoffice 版本:
- 3.3.3 之前版本:限制为 65,536 行
- 3.3.3 及更高版本:1 048 576 行(1M)
如果您愿意,您可以使用 3.3.3+ 和 4 页来处理 4m 条记录,但如果这还不够的话,LibreOffice 的基本模块可以导入几乎没有行限制的记录。以下是如何做到这一点的介绍和这是一个带有导入文件的示例数据库. 在 Base 中操作数据简单又快捷。