如何将两个略有不同的数据集合并成一个可操作的文件

Question

我会使用模糊查找插件来实现这一点。它将读取两个表并返回最佳匹配项（或多个匹配项），以及置信度和相似度分数。

对于典型的数据集，您可以根据置信度得分设置高限和低限（例如，接受任何超过 0.9 的匹配，拒绝任何低于 0.5 的匹配），这样您就可以手动审查一组较小的匹配候选对象。

Answer 1

我会使用模糊查找插件来实现这一点。它将读取两个表并返回最佳匹配项（或多个匹配项），以及置信度和相似度分数。

对于典型的数据集，您可以根据置信度得分设置高限和低限（例如，接受任何超过 0.9 的匹配，拒绝任何低于 0.5 的匹配），这样您就可以手动审查一组较小的匹配候选对象。

相关内容