合并两个具有模糊/不精确键列的文件

合并两个具有模糊/不精确键列的文件

我有两个不同维度的电子表格。它们共用一个列,但并非所有名称都 100% 相似。具体来说,我正在合并来自美国各县的两个数据文件,一个包含经济数据,另一个包含投票数据

在一个文件中,我可能有“哈里斯县”,而另一个文件可能是“哈里斯”,它们都在公共列下。在 Excel 或 R 中,匹配文件的最佳方法是什么(尽管我对 R 不太熟悉)。我以为 VLOOKUP 可以解决这个问题,但我无法让它工作。

County  Total Vote  C   O   E   R   Margin  %Margin Clinton Obama   Edwards Richardson  Other       Clinton Obama   Edwards Richardson  Other
Harris  12,525  1   2   3   4   41  0.33%   37.31%  36.98%  18.85%  4.31%   2.55%   4,673   4,632       2,361   540 319

STATEFP10   COUNTYFP10  census track    county  state   economic variable
48  201 Census Tract 2225.01     Harris County   Texas  5
48  201 Census Tract 4214.01     Harris County   Texas  6

关键列的顺序并非 100% 都不同,所以我不能只进行查找和替换。有什么好方法可以合并这些文件?包含投票信息的行和列要少得多。

答案1

Tom,最可靠的解决方案是使用 Fuzzy 插件。使用 Levenshtein 距离已经生成了许多其他 VBA 解决方案,但我建议您先尝试插件。

http://www.microsoft.com/en-us/download/details.aspx?id=15011

相关内容