parsing

从理论上讲,是否有可能在不使用人工智能的情况下创建具有手动解析质量的日志解析器/分析器?
parsing

从理论上讲,是否有可能在不使用人工智能的情况下创建具有手动解析质量的日志解析器/分析器?

我正在尝试为我们的 tomcat 应用程序设置一个好的日志分析器。我能够使用 python regex 和 panda stats 功能创建一个基本的解析器和分析器。 解析器主要解析时间戳、日志级别、线程类、线程名称和错误部分。 但是错误部分并不统一,没有遵循特定的模式。即使忽略堆栈跟踪并仅解析主要错误部分,它仍然没有特定的模式,因为使用了来自不同供应商的插件,并且每个插件都遵循不同的规则来显示错误。 可以做的一件事是手动广泛识别和分组错误并创建参考子解析规则文件。我们已经通过使用参考 xml(基于供应商提供的...

Admin

如何复制与列表中的元素匹配的文件?
parsing

如何复制与列表中的元素匹配的文件?

假设我有许多文件,其名称的形式为file#.tex 9,即file1.tex,,,file2.tex...,file100.tex)。我只需要复制那些编号#在另一个名为的文件中的文件chosen.txt,该文件的内容如下: 2 3 4 14 26 99 即,我只需要将上面列表中file#.txt编号的六个文件复制到不同的目录中。# ...

Admin

在 VBA 中删除列中的空白处
parsing

在 VBA 中删除列中的空白处

我正在尝试解析两列数据,以便不再存在空格。我发现这段代码删除了尾随空格和前导空格,但没有删除其中包含的空格。我应该对这段代码进行哪些更改,以便删除所有空格 Sub Remove_Spaces() Dim rng As Range Set rng = Range("C:D") rng.Value = Application.Trim(rng) End Sub 谢谢 ...

Admin

docx 文件来自 docx 的 XML 文件
parsing

docx 文件来自 docx 的 XML 文件

我只是想知道是否有任何方法可以使用给定的 docx XML 文件生成 docx 文件。我已经能够执行反向过程,即在将它们压缩在一起时获取 docx 文件的 XML。 在 python 中有什么方法可以完成这个过程吗? ...

Admin

如何解析极大(70+ GB)的 .txt 文件?
parsing

如何解析极大(70+ GB)的 .txt 文件?

我有几个.txt文件,每个文件有 3000 多万行,并且有 20 到 40 个“列”(有些用逗号分隔,有些用空格分隔,所有 ASCII 行都用换行符分隔)。我不需要所有(甚至大多数)列,其中一些列有用 填充的空空格NULL。 我的目标是: 删除我不需要的列 按我认为合适的方式重新排列列(为了便于阅读) 通过管道将输出传输到另一个 .txt 文件,其中各列以冒号分隔 我刚刚对一个大型文本文件进行了此操作,将其拆分为约 40 个.txt文件,每个文件有 1,000,000 行,将它们逐个导入 Excel,然后使用 CONCATENATE,但这种方法对我的下一...

Admin

“.sha256”文件格式是否在某处正式定义?应如何解析它?
parsing

“.sha256”文件格式是否在某处正式定义?应如何解析它?

我看到很多 FOSS 项目都有“.sha256”文件。它们看起来像这样: dsdfdfdsffdfsdfdsfdsfdsfdsfdsfds23r2ewrefdefdsfdsgfdsgffgfkgdfgg *meow.exe Asdfdfdsffdfsdfdsfdsfdsfdsfdsfds23r2ewrefdefdsfdsgfdsgffgfkgdfg3 cool_stuff.exe dsdfdfdsfDdfsdfdsfdsfdsfdsfdsfds23r2ewrefdefdsfdsgfdsgffg3kgdfgg even_more_stu...

Admin

根据制表符或空格拆分列
parsing

根据制表符或空格拆分列

A 列包含 3 列信息。数据可供人类阅读,但无法供机器阅读,我想对数据进行透视。有没有办法通过空格或制表符解析数据?在公式栏中,数据似乎是按制表符排列的。 ...

Admin

解析命令提示符输出
parsing

解析命令提示符输出

wmic我正在使用语句通过 JavaScript 检索磁盘信息wmic logicaldisk get freespace,name,size,volumename,该语句会产生以下输出,但在单个字符串中。 "FreeSpace Name Size VolumeName " "560232755200 C: 999526756352 System " "999369699328 D: 999558213632 SSD " "1511570386944 E: ...

Admin

如何在 Bash 中删除文本文件中重复对的两行?
parsing

如何在 Bash 中删除文本文件中重复对的两行?

我想删除文本文件中重复的两行。 无法使用sort -u file或awk '!a[$0]++' file同时删除重复行来做到这一点。 我必须以某种方式捕获已删除的行并运行sed以使用此列表,然后删除已删除的行(有没有办法获取此输出?)。重复行的模式是不可预测的。 我正在寻找一种比编写完整的 bash 程序更短的方法。它似乎是一个有用的工具,应该有一种简单的方法来做到这一点。 很容易删除其中一个重复项。我需要删除两个都找不到方法。解析过程中遇到。 ...

Admin

迭代查找(从列表中)父标签来替换子标签值
parsing

迭代查找(从列表中)父标签来替换子标签值

我有一个具有简单标签层次结构的 xml 文件,如下所示: <Parent Numbrt="X1"> <Namedchild>Yes</Namedchild> ....more children... <Parent Number="X2"> <Namedchild>Yes</Namedchild> ....more children... x10000 lines 我需要寻找根据其参数值和代替基于列表(可以是 csv 或其他)的带有 Z 的子标签值,...

Admin

xml 中的 html 链接错误
parsing

xml 中的 html 链接错误

我在 xml 中尝试这个: <a class='mybtn' href='https://www.youtube.com/embed/VIDEOID?autoplay=1&loop=1&playlist=VIDEOID'><i class='myclass'/></a> 但我收到此错误: 解析 XML 时出错,第 77 列:对实体“loop”的引用必须以“;”分隔符结尾。 第 77 列位于单词循环的末尾。 当我将其复制到浏览器时,它正常工作,错误在哪里?你能帮助我吗? ...

Admin

删除非标准文件名的文件列表
parsing

删除非标准文件名的文件列表

我最近不得不从坏的硬盘中拯救文件,现在正在清理这些乱七八糟的东西。目前,我正在使用重复清理程序删除任何在备份中有重复项的恢复文件。我正在比较内容,而不是文件名,因为文件名大多是由救援程序生成的。 不幸的是,我需要删除的一些文件的文件名包含各种字符,例如 %、@、; 和其他导致问题的内容。我的 dupechecker 在尝试删除文件时卡住了,几个小时都没有找到要删除的项目。 于是我导出了要删除的文件列表,然后使用 Powershell 删除它们。它删除了一些文件,但当遇到文件名中的破坏性字符时,它很快就失败了。 我的 Powershell 命令: Ge...

Admin

解析文本翻译
parsing

解析文本翻译

你好,我想把这个放到 Excel 列中 短语,翻译,%YES <tr> <td>Phrase in a language</td> <td>Translation</td> <td> <span id="Accuracy"> <a href="javascript:YES(#####);"><...

Admin

是否有可用的行业标准工具来解析 s3 文件并将其加载到数据库表中?
parsing

是否有可用的行业标准工具来解析 s3 文件并将其加载到数据库表中?

我在 s3 存储桶上有多种内容格式的文本文件。 最简单的格式具有如下 dhwon 分隔内容: Field1|field2|field3|field4 我想解析上述分隔文件并将内容加载到具有相同结构(field1、2 等)的数据库表中。 是否存在可用于进行这种解析的行业标准工具? Amazon DMS(数据库管理系统)能解决这个问题吗?因为 DMS 主页 (https://aws.amazon.com/dms/) 说: “借助 AWS Database Migration Service,您可以持续复制高可用性数据,并通过将数据流式传输到 Ama...

Admin

根据字符串条件过滤器使用 Jsonpath 进行 Json 解析
parsing

根据字符串条件过滤器使用 Jsonpath 进行 Json 解析

我对 Jsonpath 还很陌生,由于项目依赖性而被迫使用。 示例 JSON 如下所示 { "people": { "a": {"First":"James", "last": "d"}, "b": {"First":"Jacob", "last": "e"}, "c": {"First":"Jayden", "last": "f"}, "d": {"First":"different", "last" : "g"} } } 我打算获取第一个值以“J”开头的最后一...

Admin