parsing

除第一个单词外，其他行完全相同，将第一个单词放入变量中

我有一个文件 (sudoers)，其中的行除了第一个单词外可以完全相同（不同的用户可以执行同一组命令）。我可以使用以下命令提取这样的行： # grep -v '^ *%' /etc/sudoers |egrep "$users_in_which_I_am_interested | sort|awk '{sub(/^[ \t]+/, "")};1' tom ALL = NOPASSWD:/usr/bin/pwdadm,/usr/bin/chsec,/usr/bin/chuser jim ALL = NOPASSWD:/usr/bin/pwdadm,/...

Admin 2024-12-11

parsing

如何使用 VLOOKUP 获取当前单元格的精确匹配

名称“Dodson”在 A5 上，查找来自 B5、表格 A16:B19、表格第二列中的值，但我正在寻找 VLOOKUP 的精确结果。我的公式是： =VLOOKUP($B5,$A$16:$B$19,2,FALSE) 学生： A B C ======================== Dodson Silver 400 Jones Gold 550 Clarke Titanium 700 Ranger Platinum 750 McKinley Platinum 750 Broadna...

Admin 2024-12-5

parsing

将 XXm、YYs 格式的持续时间转换为时间值

在 Microsot Excel 中，我有表示事件持续时间的字符串数据：期间 40 年代 5 分，40 秒 59 分 59 秒我需要将值转换为时间（在相邻列中），以便可以正确格式化和排序数据。例如：期间秒格式化 40 年代 40 00：00：40 5 分，40 秒 340 00：05：40 59 分 59 秒 3599 00：59：59 ...

Admin 2024-11-24

parsing

要求：

前言：如果可以的话，我愿意尽可能使用 VS Code（主要是因为它是跨平台的，并且是所有主要平台上唯一完全可定制/可破解的 GUI 编辑器）。不过，有一个问题反复打断了我的工作流程；虽然这只是一个干扰，但它对保持专注的影响是可以衡量的。在讨论这个问题之前，让我先描述一下…… 现状：我在设置中定义了仅使用 Tab 键来自动完成代码片段，并禁用使用 Enter 键完成。这是有意为之并且运行良好。对于基于缩进的语言，我启用了 tab-stop/tab-key-input 的接受和转换为（通过 linter/intellisense）给定的默认宽度。必要时...

Admin 2024-11-24

parsing

如何根据 Excel 中相邻单元格的键获取单元格的值？

输入：我有以下数据； C 德 1 1 美元 ABC 2 2美元 ABC 3 3 美元防御 4 4美元 ABC 我想在同一张表中创建另一个表，并C根据 Column 中的键向该表添加 Column 中的值D。输出： G H 1 ABC 7美元 2 防御 3 美元这里 $7 是对应 ABC 的值的总和，$3 是对应 DEF 的值的总和。所以我需要一些像"= Sum of values in Column C corresponding to Key in G1 found in Col...

Admin 2024-11-1

parsing

从批处理文件中带有空格的文件名中提取数据

我有一个批处理文件，它通过从文件名中抓取前 6 个字符并将其移动到包含提取字符的文件夹中来移动文件列表。我需要更进一步，将文件名中的年份提取到一个变量中。我遇到的问题是这些文件的命名约定包含空格。因此，当我运行当前的批处理文件时，它仅适用于前 6 个字符。我从这里建模：在批处理文件中根据文件名的前 5 个字符创建文件夹我现在使用的文件名如下： 123456 - 2020 Information.pdf 654321 - 2022 Documentation.pdf 111111 - 2019 Additional Docs.pdf 我想将年份（中...

Admin 2024-10-15

parsing

从理论上讲，是否有可能在不使用人工智能的情况下创建具有手动解析质量的日志解析器/分析器？

我正在尝试为我们的 tomcat 应用程序设置一个好的日志分析器。我能够使用 python regex 和 panda stats 功能创建一个基本的解析器和分析器。解析器主要解析时间戳、日志级别、线程类、线程名称和错误部分。但是错误部分并不统一，没有遵循特定的模式。即使忽略堆栈跟踪并仅解析主要错误部分，它仍然没有特定的模式，因为使用了来自不同供应商的插件，并且每个插件都遵循不同的规则来显示错误。可以做的一件事是手动广泛识别和分组错误并创建参考子解析规则文件。我们已经通过使用参考 xml（基于供应商提供的...

Admin 2024-10-6

parsing

如何复制与列表中的元素匹配的文件？

假设我有许多文件，其名称的形式为file#.tex 9，即file1.tex，，，file2.tex...，file100.tex）。我只需要复制那些编号#在另一个名为的文件中的文件chosen.txt，该文件的内容如下： 2 3 4 14 26 99 即，我只需要将上面列表中file#.txt编号的六个文件复制到不同的目录中。# ...

Admin 2024-9-11

parsing

在 VBA 中删除列中的空白处

我正在尝试解析两列数据，以便不再存在空格。我发现这段代码删除了尾随空格和前导空格，但没有删除其中包含的空格。我应该对这段代码进行哪些更改，以便删除所有空格 Sub Remove_Spaces() Dim rng As Range Set rng = Range("C:D") rng.Value = Application.Trim(rng) End Sub 谢谢 ...

Admin 2024-9-5

parsing

docx 文件来自 docx 的 XML 文件

我只是想知道是否有任何方法可以使用给定的 docx XML 文件生成 docx 文件。我已经能够执行反向过程，即在将它们压缩在一起时获取 docx 文件的 XML。在 python 中有什么方法可以完成这个过程吗？ ...

Admin 2024-8-24

parsing

如何解析极大（70+ GB）的 .txt 文件？

我有几个.txt文件，每个文件有 3000 多万行，并且有 20 到 40 个“列”（有些用逗号分隔，有些用空格分隔，所有 ASCII 行都用换行符分隔）。我不需要所有（甚至大多数）列，其中一些列有用填充的空空格NULL。我的目标是：删除我不需要的列按我认为合适的方式重新排列列（为了便于阅读）通过管道将输出传输到另一个 .txt 文件，其中各列以冒号分隔我刚刚对一个大型文本文件进行了此操作，将其拆分为约 40 个.txt文件，每个文件有 1,000,000 行，将它们逐个导入 Excel，然后使用 CONCATENATE，但这种方法对我的下一...

Admin 2024-8-22

parsing

“.sha256”文件格式是否在某处正式定义？应如何解析它？

我看到很多 FOSS 项目都有“.sha256”文件。它们看起来像这样： dsdfdfdsffdfsdfdsfdsfdsfdsfdsfds23r2ewrefdefdsfdsgfdsgffgfkgdfgg *meow.exe Asdfdfdsffdfsdfdsfdsfdsfdsfdsfds23r2ewrefdefdsfdsgfdsgffgfkgdfg3 cool_stuff.exe dsdfdfdsfDdfsdfdsfdsfdsfdsfdsfds23r2ewrefdefdsfdsgfdsgffg3kgdfgg even_more_stu...

Admin 2024-8-3

parsing

根据制表符或空格拆分列

A 列包含 3 列信息。数据可供人类阅读，但无法供机器阅读，我想对数据进行透视。有没有办法通过空格或制表符解析数据？在公式栏中，数据似乎是按制表符排列的。 ...

Admin 2024-7-14

parsing

解析命令提示符输出

wmic我正在使用语句通过 JavaScript 检索磁盘信息wmic logicaldisk get freespace,name,size,volumename，该语句会产生以下输出，但在单个字符串中。 "FreeSpace Name Size VolumeName " "560232755200 C: 999526756352 System " "999369699328 D: 999558213632 SSD " "1511570386944 E: ...

Admin 2024-7-10

parsing

如何在 Bash 中删除文本文件中重复对的两行？

我想删除文本文件中重复的两行。无法使用sort -u file或awk '!a[$0]++' file同时删除重复行来做到这一点。我必须以某种方式捕获已删除的行并运行sed以使用此列表，然后删除已删除的行（有没有办法获取此输出？）。重复行的模式是不可预测的。我正在寻找一种比编写完整的 bash 程序更短的方法。它似乎是一个有用的工具，应该有一种简单的方法来做到这一点。很容易删除其中一个重复项。我需要删除两个都找不到方法。解析过程中遇到。 ...

Admin 2024-7-8