如何在两个文本文件中找到相似之处?

如何在两个文本文件中找到相似之处?

给定两个文本文件,如何找到相似的段落?我知道我可以使用 Meld 或其他 diff 工具来显示差异,但如何做相反的事情?

例如,这里有两段具有明显相似之处的文本:

A)友谊的对比关怀引进文学的乏味。他似乎除了反对之外,没有其他的。之间任何人都可以提及晚年很快就能正常生活了。他很快就十六岁了,上校晚上热情地向他致意。

B)抽签效果好关怀引进文学的乏味. 在没有死亡的房子里,希望住在房间里。满足的方向任何人都可以提及晚上但最终我们自己可能表现得非常出色。费拉斯的到来并没有让你着迷。

答案1

有一些在线抄袭比较工具您可以上传/粘贴两个文件,然后它会找出其中的相似之处。通常,它可以在互联网上免费获得。

答案2

您可以使用http://www.copyscape.com/compare.php,我觉得挺好用的。你只需要发布两个链接或两段文字,然后点击“比较商品”,软件就会显示相应的单词。

答案3

没有明确的答案,因为“相似”可能意味着很多事情(相同的短语,不寻常的单词,段落结构,标题......)。

寻找检测抄袭/检查作业作弊的系统。周围有好几个,也许其中一个能满足您的需求。

相关内容