我有大量的 MBOX 电子邮件文件,分为项目子文件夹(在 Linux 服务器/文件系统上,每个子文件夹都是一个项目名称)。
Public
|_Project1
| |_mbox_file_1
| |_mbox_file_2
|
|_Project2
| |_mbox_file_1
| |_mbox_file_2
|
|_Etc
我必须检查每个电子邮件标题(似乎标题部分以空行结尾)并将项目的电子邮件地址插入抄送字段。
如果没有 CC: 字段,我想我可以将 CC: 字段插入到第一行: CC:[电子邮件受保护] [mbox 文件的其余部分]
如果抄送:字段存在,我必须将其插入到最后一个地址之后。所以,我必须检测 CC:线和位置[电子邮件受保护]在现有的最后一个电子邮件地址之后。
CC: [email protected],
[email protected]
...
会成为:
CC: [email protected],
[email protected],
[email protected]
...
或者它可能是(也许更简单):
CC: [email protected],
[email protected],
[email protected]
...
在 Linux 上你会怎么做?有什么好的速度的想法吗? (有 1.5 TB 的电子邮件!)