miller

如何使用 miller 创建新列并向其添加随机标识符
miller

如何使用 miller 创建新列并向其添加随机标识符

我想在我的csv文件中添加一列,其中包含随机创建的“案例编号”。案例编号的前 2 个字母必须是 AZ 中的任意大写字母。接下来是 5 个随机数。 输入: COMPANY,NAME,STREET,ZIP,CITY,IBAN Test Ltd,John,Big Ben 343,4343,London,UK2348020384 Test Ltd,Kate,Big Ben 343,4343,London,UK4389223892 Test Ltd,Jake,Big Ben 343,4343,London,UK3892898999 输出 COMPANY,NAME,S...

Admin

使用 miller 将小写字母转换为大写字母并将输出输出到新列
miller

使用 miller 将小写字母转换为大写字母并将输出输出到新列

我想将列复制NAME到列NAME-LOWERCASE。NAME-LOWERCASE应该只包含小写字母。除此以外,所有列中的大写字母均应保持不变NAME-LOWERCASE 输入 NAME,test PTC,N Agri,Y E-example,N ForYou,N Willy Nes,Y 输出 NAME,NAME-LOWERCASE,test PTC,ptc,N Agri,agri,Y E-example,E-example,N ForYou,foryou,N Willy Nes,willy nes,Y 我知道如何从另一列创建新列并重新排序 mlr -I...

Admin

强制 miller 将数据作为字符串读取并转换为 JSON
miller

强制 miller 将数据作为字符串读取并转换为 JSON

在接下来的MWE中 echo x="1e2" | mlr --ojson cat 我的目的是让 miller 生成一个包含该对象的单元素 JSON 数组 {"x": "1e2"} 实际返回的对象(在数组内)是 {"x": 1e2} 其中值被视为数字,我猜这是其解析的结果。我如何告诉 miller 生成 JSON 对象,其值是字符串而不是数字? (MWE 中“1e2”周围引号的基本原理正是为了强调这一意图。) ...

Admin

使用 CSV 解析器根据特定列对 CSV 行进行重复数据删除
miller

使用 CSV 解析器根据特定列对 CSV 行进行重复数据删除

我搜索了这个任务,发现了以下较旧的问题: 根据指定列从 CSV 中删除重复项 根据特定列识别 CSV 上的唯一记录 但我无法使用,awk因为我的数据是一个复杂的 CSV 文件,带有多个嵌套双引号。 假设我想对以下内容进行重复数据删除(简化情况): Ref,xxx,zzz ref1,"foo, bar, base",qux ref1,"foo, bar, base",bar ref2,aaa,bbb 在输出中我需要它如下: Ref,xxx,zzz ref1,"foo, bar, base",qux ref2,aaa,bbb 没有awk解决方案,只能使用...

Admin

使用 Miller 将空列添加到 CSV 文件
miller

使用 Miller 将空列添加到 CSV 文件

我有一个 CSV 文件,如下所示: 0 1 2 3 我想使用 Miller 将一个空列附加x到每一行,以便输出文件如下所示: 0,x 1, 2, 3, 我怎么做? ...

Admin

使用分隔符(逗号)将 CSV(一列)分成多列
miller

使用分隔符(逗号)将 CSV(一列)分成多列

我有一个 CSV,其中一列中有大约 50 个逗号分隔值,我想将它们分成单独的列。标题是第 1 行。这应该非常简单,我已经尝试了很多周围的方法awk,mlr但无法适应我所看到的任何内容,以便使用逗号作为分隔符将单个列分成多个列。 我的过程: 我曾经mlr将数百个 CSV 合并为一个 CSV: mlr --icsv cat *.csv > filename.txt mlr --ocsv unsparsify filename.txt > filename.csv 现在我有一个包含一列的 CSV;该...

Admin

使用 Miller 从 CSV URL 列中提取域
miller

使用 Miller 从 CSV URL 列中提取域

CSV 内容与此类似: Family,URL,IP,FirstSeen Pony,http://officeman.tk/images/admin.php,207.180.230.128,01-06-2019 Pony,http://learn.cloudience.com/ojekwaeng/yugo/admin.php,192.145.234.108,01-06-2019 Pony,http://vman23.com/ba24/admin.php,95.213.204.53,01-06-2019 我知道URL可以使用以下方式选择该列: mlr --mm...

Admin

我怎样才能(无痛地)在米勒的唱片中分割或反转“最后,第一”?
miller

我怎样才能(无痛地)在米勒的唱片中分割或反转“最后,第一”?

我有一个制表符分隔的文件,其中一列的格式为“姓氏,名字”。我想要做的是将记录分成两个单独的列,last、 和first、 usecut或其他一些动词那,并将结果输出为JSON。 我应该补充一点,我并没有与 JSON 结婚,而且我知道如何使用其他工具,例如jq,但如果能一步获得这种格式就太好了。 该动词的语法nest看起来需要记住很多坦率地说难以记忆的选项,所以我认为应该有一个简单的 DSL 操作来完成这项工作。也许事实并非如此? 这是我尝试过的。 (让我们忘记Firstname现在附加的额外空间,好吗?稍后我会使用striporssub或其他东西来摆脱...

Admin

从 Miller DSL 调用外部命令
miller

从 Miller DSL 调用外部命令

假设我有以下 CSV: $ cat test.csv id,domain 1,foo.com 2,bar.com 使用mlr put,我可以轻松地将任何函数映射到 CSV 中的字段,只要我可以在 Miller 中定义它DSL。因此,例如,将为每个记录mlr --csv put '$id = $id + 1'将 递增1。id 但是,如果我无法在 Miller DSL 中定义该函数(可能是因为它不是纯函数)怎么办?假设我想将 CSV 中的每个域映射到一个 IP 地址。我想做类似的事情mlr --csv put '$ip = shell("nslookup...

Admin

在 miller 的数据字段中输出标题标签
miller

在 miller 的数据字段中输出标题标签

给定文件.csv: a,b,c 1,2,3 怎么能mlr输出: a,b,c 1,2,c 使用标签名称$c 没有提前知道$c包含字母“C“? 注意:正确答案必须使用mlr才行。 ...

Admin