1.我们需要一个聊天记录转换器

1.我们需要一个聊天记录转换器

我正在尝试制作一个编译文件,其中包含我发送的所有文本以及包含我姓名的所有回复......编写此脚本的最佳方法是什么?是否有类似的 pidgin 插件?我还希望能够单击要添加的行。例如,某人向另一个用户提供了非常有用且易于理解的指南,我想:“我明天会这样做。” 我不想标记并粘贴其中的每一行并跳过所有其他对话,而是希望能够单击“发送到我的个人日志”或类似操作。

它看起来很有用,对吧?而且我认为很多人都会用到它。所以,如果可能的话,请尽量提供一个全面的答案,或者一个我可以跟进的答案。

答案1

总结:滚动到这个答案的末尾,查看真正的 tl;dr。


哎,这样的功能还挺本地化的,恐怕没有吧。

但是,我可以让您更接近定制的聊天日志文件约三分之二的步子。

1.我们需要一个聊天记录转换器

不再对聊天记录进行有效的标准化在当今世界。

Pidgin 聊天日志以 libpurple 的 HTML 格式或传统的纯文本格式存储(警告:没有软件可以准确解释 TXT 格式,因为消息换行符与消息内的换行符没有区别)。

为了编写一个满足您的基本标准的程序:

  • 收集您发送的所有消息。
  • 收集所有包含您姓名的消息。

... 必须解释 Pidgin HTML 聊天记录,以便软件理解发送消息的人员和消息本身之间的区别。 这是第一步。

有一个正在进行的项目已经接近解释 Pidgin HTML 聊天日志:

Log2Log 聊天记录转换器

[Microsoft Windows 7 上的 Log2Log v1.0.0 屏幕截图]

Log2Log 可以做什么

今天,Log2Log v1.0.1 可以读取您拥有的所有 Pidgin HTML 聊天日志文件,并将它们转换为一个巨大的 JSON 数组,该数组是标准化的,并且分离了所有不同的信息位(时间、时区、发件人是谁、发件人的别名、消息内容等)。

哎呀,这可能是第一步的答案,对吧?

不幸的是没有。

Log2Log 不能做什么

Log2Log 的开发者(惊喜的是,是我!) 承认,Pidgin HTML 格式的许多功能尚未编码到软件中,因此 Log2Log 无法识别它们。从 Pidgin HTML 到 Log2Log 的 JSON 格式的转换过程之前尚未经过测试。

我想说 Log2Log 只完成了第 1 步的 2/3。:(

出色地...?

由于缺乏兴趣,Log2Log 的开发没有持续太久。从我做的一项快速调查来看,大多数人似乎根本不知道聊天记录是什么。

虽然这是作为答案写的,但我想问,读者,一个问题。

您会支持 Log2Log 聊天日志转换器项目吗? 如果是的话,你可以在以下位置找到我的联系信息我的超级用户资料

(请注意,我并不是想向超级用户发送促销广告。这确实是我们今天在软件聊天记录转换方面取得的进展。如果您不相信我,请在 Google 上搜索“聊天记录转换器”。)

2. 定制日志软件

是否有类似 pidgin 的插件?

哈哈,没有这样的事。>:(

甚至没有超出 Pidgin 的范围。我已经寻找了一年多了。

但问题并没有说明该软件必须已经存在。

编写脚本的最佳方法是什么?... 我还希望能够单击要添加的行。

OP 的描述看起来很像我自 2011 年 4 月 3 日起就开始计划的另一个项目。

Loguntu 聊天日志管理器

Loguntu 的计划已经经过多次修改和更新,但与这个问题相关的是,它的描述包括对其管理的每个聊天日志中每一行的全面操作。

为什么 Loguntu 不存在

首先,我没有足够的人力来实现这个功能。对于我一个人而言,这实在是太费劲了,甚至只是从聊天记录中选择个别台词这一部分。

其次,没人关心或想要这个。请记住,我发现大多数人甚至不知道聊天记录是什么。难怪没有人制作像 Loguntu 这样的东西。

Loguntu 是最后一步

Loguntu 的完整蓝图非常全面,它涵盖了这个问题所要求的所有内容,甚至更多。如果它存在就好了……

结论

总结: 我提供帮助以使该问题中描述的内容存在,但我想将其超出 Pidgin 的范围(并不一定意味着它不是从 Pidgin 开始)。

注意:仅仅使用 Pidgin 插件可能会有一些一开始看不到的缺点。本质上,它必须处理步骤 1 并执行步骤 2。当聊天记录很大时(比如我的 19.41 MiB,包含数千个 HTML 文件,只有一个联系人),当您尝试搜索它时,Pidgin 会冻结一两分钟以上(适用于硬盘驱动器,而不是固态驱动器)。这就是为什么我倾向于使用 Loguntu 这样的增量解决方案。

相关内容