如果我有一个电子表格,其数据结构中类似的信息在多列中重复出现,如下所示:
TxID Date Merchant Item 1 Name Item 1 Value Item 2 Name Item 2 Value, etc...
0000001 1/1/2020 Macy's Jeans $50.00 Socks $10.00
将数据转换为在单个列中显示类似数据的过程名称是什么,并且根据需要在多行中重复信息:
TxID Date Merchant Item Name Item Value
0000001 1/1/2020 Macy's Jeans $50.00
0000001 1/1/2020 Macy's Socks $10.00
采用第二种格式的数据更容易处理,因为它可以保证特定信息位于一列中,例如,为了汇总所有袜子的销售额,我只需要检查单个商品名称和商品值列,而不是跨多列搜索。
我不记得这个过程叫什么,这使得很难找到如何有效地做到这一点的资源。我的第一个想法是这类似于数据库非规范化,但是这需要先对数据进行标准化,所以我不认为这是正确的术语。转置似乎也不正确,因为它似乎是指将所有数据从列重新排列到行,而不仅仅是一个子集。
这种数据处理有术语吗?