斯坦福牧马人 (Stanford Wrangler) 非常理想,但是有限制,还有哪些其他选择?

斯坦福牧马人 (Stanford Wrangler) 非常理想,但是有限制,还有哪些其他选择?

Stanford Wrangle 工具非常棒,我用它解决了一个巨大的问题,但它限制我只能处理很小的文件。我的文件大约 500MB,它允许我处理不到 1MB 的数据,其余数据只是蜷缩在一个单元格中。在第 15 行之后(在几个文件上尝试过),它就停止了

http://vis.stanford.edu/wrangler/app/

我有 50k 条关注数据,1 条记录

Osnovni podaci
PREDUZETNIK
OLIVA
Registarski broj : 10000015
Matični broj : 02386135
Broj promjene : 1
Puni naziv : OLIVA
Šifra djelatnosti : 5610
Naziv djelatnosti : Djelatnosti restorana i pokretnih ugostiteljskih objekta
Adresa sjedišta : STOLIV BB
Mjesto sjedišta : KOTOR
Adresa prijema službene pošte : STOLIV BB
Mjesto prijema službene pošte : KOTOR
Datum registracije : 28.06.2002
Datum promjene : 28.06.2002
Status : Aktivan
Lica u društvu
Ime :   DEJAN
Prezime :    BAJO
JMBG :   2910971230014

使用函数 wrap at line 我得到了下表中的 CSV 表

Osnovni podaci,PREDUZETNIK,OLIVA,注册号码:10000015,主号码:02386135,日期:1,地址:OLIVA,地址:5610,注册地点:Dressa restorana and pokretnih ugostiteljskih objekta,服务地址:STOLIV BB,服务地点:KOTOR,注册日期:28.06.2002,日期: 28.06.2002,状态:活跃,许可和许可,日期:DEJAN,价格:BAJO,JMBG:2910971230014

还能怎样做?它转置并包装每条记录第一行的数据(“Osnovni podaci”)。

基本上,我正在使用在特定行换行的函数 transpose,但我不知道如何在 excel、r、python 或 sql 等其他工具中使用这个函数?我对它们很熟悉。

帮助?

相关内容