在 MS Excel 中计算/确定哪种文件类型/产品被首先订购(复杂表)

在 MS Excel 中计算/确定哪种文件类型/产品被首先订购(复杂表)

我在 Windows 台式计算机上使用 MS Excel 2013。

我正在处理的原始工作表包含大约 200,000 行或 4,000,000 个单元格,内容是下载 .pdf 文件、订购平装版和/或随后购买特定产品的人员。

我想自己回答以下问题:

  1. 在下最终产品订单之前,先订购 .pdf 还是平装文件?按总数、按年、按月等。
  2. 有多少百分比的顾客首先订购了 PDF 文件,又有多少百分比的顾客首先订购了传单?

附加信息:

  • 有些人只订购了 PDF 文件
  • 其他人只订购了平装文件
  • 其他人则订购了 PDF 和平装文件。

这些订单是单独登记的,因为订单是在不同的时间和/或日期下达的。

我已经尝试了 Excel 中的许多筛选选项,但都不起作用。我已经按姓名和时间筛选了行,甚至在数据透视表中也筛选了行,但我无法得到答案:

大约 ... % 的时间里,PDF(或平装文件类型)被首先订购。

您可以查看示例工作表文件的示例这里(这个文件是我编造的,所以单元格中的所有内容都没有意义,真的:-)

是否可以按时间段进行过滤?例如按年/月/等等?这可以在数据透视表中实现吗,还是我应该寻找其他解决方案?

我就是无法得到我想要的结果(在下最终产品订单之前,先订购哪个?.pdf 还是平装文件?)。

有人可以帮忙吗?

哦...还有一个(第二个)问题...如何找出此工作表中有多少个重复的名称?(那么:有多少客户确实购买了一件或多件产品?这与订购产品的总量不同,因为其中一些客户订购了两件或更多件产品。在示例工作表中很容易计算,但在 200,000 行的文件中并不那么容易)。

答案1

我会使用 Power Query 插件来实现这一点。它具有许多数据转换功能,但您面临的挑战的关键步骤可能是:

  1. 根据您的表创建一个“基本”查询并添加一个索引列(供以后使用)。
  2. 创建一个引用第一个查询的“客户”查询并使用分组依据 - 按客户分组,显示最小索引列。
  3. 创建一个引用“基本”查询的查询,然后使用客户和索引(=最小索引)与“客户”查询合并 - 这可以向您显示每个客户的第一个订单是什么。

我希望这能帮助你开始。

相关内容