我有一个包含 3 列的数据集。
- 个人身份证号码
- 就业领域
- 在特定就业领域有数月的工作经验
我有大量重复信息,其中一个人在两个或多个就业领域都有经验。我想缩小我的数据集,以便没有个人 ID 有重复。标准是个人经验最丰富的就业领域。
我的数据集如下:
a b c
teacher ID99999 38
teachers assistant ID99999 6