我尝试多次将 Excel 中的列与单元格进行比较。这些列是从 PDF 中复制粘贴的(获取信息的唯一方法)。结果很糟糕,带有尾随空格,插入了一些完全随机的单元格(例如第 36 行和第 37 行)等。各列之间的格式不是很一致。
我一直在尝试使用不同的公式,例如 Vlookup 和 if(match),当我在测试 excel 文件上尝试这些公式时,它们会起作用。但它们总是无法处理这些数据,或者给出奇怪/错误的结果。我尝试删除尾随空格,但这并不能解决问题。
有人可以看一下这个文件吗?(https://skydrive.live.com/redir.aspx?resid=9B56C77E51128EBF!10357)
目标是查看 A 列(A2、A3、A4……)中的每个名称,看看它是否存在于 B:B 中,然后看看它是否存在于 C:C 中,然后告诉我。我实际上只需要分别在 B 列和 C 列中匹配的 A 列名称的数量。
如果由于格式不一致导致少数匹配操作失败,那也没关系。因为有大约 670 个项目,所以有一定比例的错误是正常的。我关心的是最终的统计结果。
谢谢!
(顺便说一句,我发布这些数据并没有侵犯任何人的隐私,这些数据所粘贴的 PDF 文件可以在网上免费获取,而且是法国大学的录取结果)
答案1
我认为您的问题在于不间断空格,即字符 160。
您可以使用以下方法删除不间断空格:
=SUBSTITUTE(A1,CHAR(160),"")
至少在前几个名字中,我发现了这个问题。
TRIM()
没有解决匹配问题,也没有CLEAN()
。我将一些有问题的单元格粘贴到文本编辑器中并查看代码。某些名称之间有两个空格,并且这两个符号不同。我使用以下公式对 进行操作找到了字符代码ABDELLI Cyrielle
:
=CODE(MID(A$3,9,1))
结果是“160”,您可以在 Excel 中使用 生成该结果CHAR(160)
。如果您对第 8 个字符使用上述公式,则会得出 32,这是正常空格的代码。