我有两张包含 5 列的数据表 - 姓名、电话号码、电子邮件地址、邮政编码和订购时间。两张表都有大约 10,000 行。我需要姓名、电话号码、电子邮件地址和邮政编码完全匹配,订购时间模糊匹配 - 因为两组数据的订购时间可能相差几秒到几分钟。我希望能够根据时间窗口协调两组数据的订单。
我为这两个数据集创建了两组表,并使用 5 个单独的匹配列运行模糊查找 - 其中 4 个与姓名、电话号码、电子邮件地址和邮政编码完全匹配,以及与订单时间默认模糊匹配。但是,当我运行模糊查找时,我在大约 300 行时收到内存超时错误。有人知道我该如何解决这个问题吗?我有一台 8GB 内存的机器,但我不确定增加内存是否能解决这个问题。
谢谢