我有两个不同维度的电子表格。它们共用一个列,但并非所有名称都 100% 相似。具体来说,我正在合并来自美国各县的两个数据文件,一个包含经济数据,另一个包含投票数据
在一个文件中,我可能有“哈里斯县”,而另一个文件可能是“哈里斯”,它们都在公共列下。在 Excel 或 R 中,匹配文件的最佳方法是什么(尽管我对 R 不太熟悉)。我以为 VLOOKUP 可以解决这个问题,但我无法让它工作。
County Total Vote C O E R Margin %Margin Clinton Obama Edwards Richardson Other Clinton Obama Edwards Richardson Other
Harris 12,525 1 2 3 4 41 0.33% 37.31% 36.98% 18.85% 4.31% 2.55% 4,673 4,632 2,361 540 319
STATEFP10 COUNTYFP10 census track county state economic variable
48 201 Census Tract 2225.01 Harris County Texas 5
48 201 Census Tract 4214.01 Harris County Texas 6
关键列的顺序并非 100% 都不同,所以我不能只进行查找和替换。有什么好方法可以合并这些文件?包含投票信息的行和列要少得多。
答案1
Tom,最可靠的解决方案是使用 Fuzzy 插件。使用 Levenshtein 距离已经生成了许多其他 VBA 解决方案,但我建议您先尝试插件。
http://www.microsoft.com/en-us/download/details.aspx?id=15011