首先,我并不真正使用 Excel,但我被赋予了这项任务。
我们正在将两家商店(CRUNCH 和 FRESH)集成到我们的主系统中,每家商店都有自己的客户端格式。这三家商店共享许多客户端,但目标是将数据压缩到一行,并在必要的列中填充数据。
在示例数据集中,Apple Candy 是客户,有三个来自不同来源的条目。每行的客户名称格式不同,并且有第二个位置。HJ 列特定于其来源。
目标是压缩一个客户的所有数据并将其保存在一行中。因此,所有 Apple Candy 客户数据将限制在第 2 行,并且来自每个来源的客户编号将填充到第 2 行。如果地址不同,则可以添加第二个条目。理想的情况看起来像这个所需的数据集
真实数据集有 +9000 行和 45 列。完成此任务最简单、最快捷的方法是什么。
答案1
这看起来是 Power Query 的理想工作(数据功能区 > 获取和转换命令组)。将数据加载到 Power Query 编辑器中,然后按您需要的任何标准排序以使数据按连续顺序排列,然后从上面的行填充空白单元格(Power Quer 中有一个功能区命令),然后删除指定列有重复的行。
只需单击几下即可完成,无需编程或编写公式。
答案2
电子表格不是进行大量查询或整合来自多个来源的数据的理想工具。更好的工具是关系数据库,例如免费的MySQL和火鸟或商业工具,例如Oracle 数据库。
从长远来看,使用结构化查询语言 (SQL)创建表格,例如客户表格、联系人表格、销售表格(可能包含 Crunch 和 Fresh 的列)等,从这些电子表格导入数据,并更新和查询这些表格以供将来使用。
除非这只是一个学习 Excel 的教育任务,否则你会发现数据库是一个更好的工具。