在哪里可以找到好的抄袭检查脚本?

在哪里可以找到好的抄袭检查脚本?

我正在为我的毕业项目写一篇论文,我知道无论我写什么,都会与网上、学术期刊和书籍中的内容有相似之处。幸运的是,对于大多数人来说,谷歌可以轻松根除其中的大部分内容,因此找到一个免费的抄袭检查脚本应该不会太难。

在谷歌上搜索了一番后,我找到了几个非常基本的检查器,但大多数都是“基本版”,需要花钱购买实际有效的脚本,或者根本没用。我发现一个似乎对小块数据很有效,但对大文件却一无所获。

我只想上传一个 Word 文档(如果没有可用的上传选项,则只需输入文本)并告诉我哪些内容似乎是抄袭的以及从哪里抄袭的。有谁知道有哪些好的抄袭检测工具可以免费下载或在线运行?

编辑:只是为了澄清我的需求,我想要一个可以获取 Word 文档并对其进行完整搜索的工具,以便它可以标记该文档与 Google 上的另一个文档匹配的任何实例。

答案1

我认为您无法通过脚本或免费应用程序找到真正的解决方案。想想您希望程序做什么:阅读文档并检查 - 什么?(其他人的已发表作品?这需要一个庞大的已发表作品数据库。风格差异超出某些统计规范?这需要风格的统计规范(可能基于与重要单词相关的词汇和句子长度计算 - 即过滤掉“and”、“or”、“to”、“for”等)。这些不是微不足道的要求,也不是您可以用几百行 |在此处插入您的脚本语言| 编写的东西。

许多学校使用Turnitin,许多学校使用 Google 搜索已出版的作品。出于显而易见的原因,这种方法是碰运气的。Turnitin 不是免费的,Google 的解决方案非常不完善,但这是我最常看到的两种解决方案。

答案2

弗吉尼亚大学提供了此工具: 复制查找.
源代码和可执行文件均可供下载。

此程序检查一组文档文件。它提取这些文档的文本部分,并在其中查找指定最小长度的短语中的匹配单词。当它发现两个文件在这些短语中共享足够多的单词时,copyfind 会生成 html 报告文件。这些报告包含文档文本,匹配的短语带有下划线。

copyfind 可以做什么:它可以查找包含大量文本的文档。结果可能表明一个文件是另一个文件的副本或部分副本,或者它们都是第三个文档的副本或部分副本。

copyfind 不能做什么:它无法搜索从任何外部来源复制的文本,除非您将该外部来源包含在提供给 copyfind 的文档中。它只能处理纯本地数据,无法搜索网络或互联网以查找匹配的文档。如果您怀疑某个外部来源已被复制,则必须创建包含该外部材料的本地文档,并将此文档包含在您提供给 copyfind 的文档集合中。

对于网络检查,您可以查看:
免费在线抄袭检测系统,抄袭检查器

答案3

这里有很多不错的建议,但普遍的共识是,没有工具可以满足我的要求。尽管如此,我还是决定继续使用剽窃检测工具。它的运行几乎完全符合我的要求,不过要获得一些更好的功能我需要付费。

该工具使用 Google API,可以非常好地查找复制的文本,并且我已经发现两个我写的短语与某些论文相似的实例。

正如其他人列出的一些其他很好的例子,我最终可能会编写自己的脚本来做我想做的事情,因为我有使用 Google API 的工作经验,而且看来这是目前最好的脚本,其中一些脚本和技术最适合他们自己的用途。

答案4

剽窃检测由 architshukla 在 github 上发布(主要)开源抄袭检测脚本(主要)用 Python 编写,据称使用了谷歌 API 来n 元语法检查文件。

我还没有测试过,但也许你可以看看。它适用于 Windows 和 Linux。

相关内容