目标:我需要找到一种方法来整合被保险人(即保单持有人)购买的多份家庭和汽车保险单,并将这些保单分配给该被保险人的单个客户帐户。
问题:我有超过 10 万条保单记录。投保人可以购买一份或多份保单,但每份保单目前都分配有一个唯一的客户帐号,即使这些保单属于同一个投保人。此外,由于信息输入数据库的方式,我无法仅根据投保人的姓名、地址或其他字段中的其他值对保单进行分组,而无需大量人工干预,因为对于同一个投保人,每个字段中输入的信息可能不同(例如,Smith, J 与 Smith, James 或 1000 E highland, Sac, CA 与 East Highland, Sacramento, CA)。
问题:是否有人知道一种工具/实用程序(希望是免费的)可用于查询记录并通过某种“模糊”算法将这 100k+ 保单记录分组为与给定被保险人相关的分组?