如何最好地管理 Excel 中不断增长的数据?

如何最好地管理 Excel 中不断增长的数据?

这不是关于 Excel 中的公式或功能的问题。我正在讨论如何正确/最好地管理 Excel 中“我必须”管理的不断增长的数据量(我为管理层制作 PIVOT 表/报告)。

数据:我记录了我们订购的出版物数量:费用、订购日期、订阅开始和结束时间、谁请求的、他们何时订购的、我何时订购的、明年是否会取消,等等,等等,等等。

困境:显然,我们重新订购了很多相同的出版物,因此,根据我管理数据的方式,我可能会在各处进行重复。

选项 1:那么,我是否在第 1 行中使用 ROW = 出版物名称,并在每个财政年度之后复制和粘贴每个财政年度的所有相关列,以准备新的财政年度信息?这将导致我转到 ZZ 列。

选项 2:或者,我是否使用 COLUMN = 每行只有一个出版物的财政年度信息,如果我们重新排序或取消出版物,我会在下面的一行中重新输入出版物名称并填写相应的列?这将导致出版物列表很长,直到第 10000 行,并且可能出现重复排序的出版物名称拼写错误。

想法:最好的方法是什么——从数据透视表最佳实践的角度思考,能够轻松地求和或计数、报告格式等。

任何最佳实践都值得赞赏。

答案1

如果您必须继续使用 Excel,则应以一种以后更易于迁移到关系数据库的方式组织数据。即使您现在无法看到迁移过程,但总有一天您将有时间、资源和管理支持来正确完成迁移,因此请让自己轻松一些。

在 Excel 中很难获得标准化数据,但请尽量接近。制作另一张包含出版物名称的表格,并在“出版物名称”字段中使用数据验证,以帮助防止拼写错误。

如果我在 RDBS 中执行此操作,我会有三个表:订单、出版物、人员。

人物:人物 ID,人物姓名 ...

出版物:PublicationID、PubName、...

订单:OrderID、OrderDate、PublicationID、RequestedBy(personid)、OrderedBy(personid) 等。

这可能不是你想要的,但你可以弄清楚什么适合你的数据。一旦你知道它在 RDBS 中的样子,就可以在 Excel 中设置它。例如,每一行都是一个订单,列是

订单日期、出版物名称、请求者、订购者等。

使用数据验证指向 PublicationName 和 RequestedBy 及 OrderedBy 的单独表。三年后,您可以为 Publications 和 People 表创建 ID 字段。然后使用公式将订单表中的名称替换为您想出的 ID。将整个混乱情况导入 RDBS,一切就绪了。

同时,在我看来,您的准规范化数据将非常适合制作数据透视表。

答案2

实际上,Excel 并不是管理大量数据的正确且有效的方式。在我所在的公司,一家杂志发行策划公司,人们习惯用 Excel 完成与您类似的任务,但随着时间的推移,Excel 变得不合适了,IT 决定将所有与 Excel 相关的流程/工作转移到在线数据库。整个流程(离开 Excel 并转移到在线数据库)作为一个项目来处理。现在一切都通过 Web 界面和 Oracle 数据库进行控制。人们登录在线帐户后管理数据,并且可以自动生成基于 Web 的报告。PL/SQL 也用于生成特殊报告。不久,您应该以某种方式开始离开 Excel 并转向数据库解决方案。这种变化似乎总是很难,但一旦您在 IT 的成功协调下以编程方式管理它们,您就会进入更高、更高效的水平。


编辑:在我看来,只要不超过 Excel 的最大限制,向哪个方向(向下或向右)填写数据都没有关系。Excel 2007 的工作表大小的最大限制是 1,048,576 行和 16,384 列。因此,您只需确保组织好公式并在正确的单元格中输入正确的数据即可。由于最大列限制为 16,384,因此在您的情况下最好向下填充。

相关内容