datadog

DataDog APM 跟踪中的 DNS 查找过多
datadog

DataDog APM 跟踪中的 DNS 查找过多

我们通过在 NodeJS 微服务中包含 dd-trace 库来使用 Datadog 进行跟踪。 我们开始注意到跟踪中存在奇怪的 DNS 查找。这些查找显示服务 pod 所在的 Kubernetes 节点的 IP 地址。我们在服务代码中没有进行任何 DNS 查找。 我附上了包含 3 个 DNS 查找的屏幕截图: 包含 3 个 DNS 查询的图像 正如您在跟踪中看到的,除了 MySQL 之外,没有对其他服务的请求,但它具有不同的 IP 地址并且位于不同的实例上。 这些 DNS 查找是什么?对我来说这看起来不正常...可能是 dd-trace 库本身试图将当前主机...

Admin

Datadog 未从 Kubernetes 集群中的文件收集日志
datadog

Datadog 未从 Kubernetes 集群中的文件收集日志

我正在尝试在 AKS 集群上配置 Datadog 代理并从每个服务舱中的 /var/log/datadog/messages.log 文件位置读取日志。 它正在流式传输除文件日志之外的所有指标,在检查来自 Datadog 代理的日志后,它显示以下消息 2023-11-07 19:41:30 UTC | 核心 | 调试 |(getSource 中的 pkg/logs/internal/launchers/kubernetes/launcher.go:200)| 找到注释:[{“type”:“file”、“path”:“/var/log/datadog/mes...

Admin

无法从同一 ECS 集群中的其他服务将指标推送到 Datadog ECS 服务
datadog

无法从同一 ECS 集群中的其他服务将指标推送到 Datadog ECS 服务

我有一些服务(例如alpha,bravo和charlie,它们都是 Spring boot)在我的 ECS 集群中作为单独的服务运行。我还部署了一个运行 Datadog 代理的服务,dd-agent该服务以启用 AWS Service Discovery 命名。该服务dd-agent公开端口 8125 和 8126(标准端口)。我可以在服务配置中看到 DNS 端点是dd-agent.ns.com。 我已开始alpha使用 Datadog 跟踪代理,并将值作为中的http://dd-agent.ns.com:8126URL 。我可以看到跟踪代理已正确拾取了此值...

Admin

如何使用动态阈值对 Datadog 监视器进行 Terraform
datadog

如何使用动态阈值对 Datadog 监视器进行 Terraform

我正在尝试从 DataDog 提供商创建大量资源。我希望对每个资源进行尽可能少的定义。许多属性都有一些合理的默认值。我很难决定如何处理监控阈值,特别是有些可能是可选的。 resource "datadog_monitor" "monitor" { for_each = { faulty_deploy = { message = "A deployment failed." name = "Deployment Failure" query = "someLongQuery" ...

Admin

主机内应用程序(docker 容器)的 Datadog 自定义指标
datadog

主机内应用程序(docker 容器)的 Datadog 自定义指标

我的主机 CentOS 上有一个 datadog 代理。我有一个 nodeJS 应用程序,我想从中发送自定义指标。 从应用程序配置: var StatsD = require('hot-shots'); var dogstatsd = new StatsD({ port: 8125, globalTags: { env: process.env.NODE_ENV }, errorHandler: function (error) { console.log("Socket errors caught here: ", ...

Admin

如何使用 Datadog 仅收集容器日志而不收集主机和容器指标?
datadog

如何使用 Datadog 仅收集容器日志而不收集主机和容器指标?

我在官方网站上找不到答案,支持人员也无法给出答案。所以我向社区询问。 我想使用日志管理而不使用 Datadog 基础设施。 官方网站上有一个链接,但该链接不再可用,并且重定向到另一个页面无法回答该问题。https://docs.datadoghq.com/logs/faq/can-the-datadog-agent-be-used-to-send-only-logs/ 另外,我无法在互联网上找到该页面的副本。 我的代理配置: agent: image: datadog/agent:7.25.0 environment: - DD_...

Admin

如何监控datadog-agent的证书过期?
datadog

如何监控datadog-agent的证书过期?

我有一个 nginx-pod,它将流量重定向到 Kubernetes 服务并将相关证书存储在其卷内。我想监控这些证书 - 主要是它们的到期情况。 我发现 Datadog 中有一个 TLS 集成(我们在集群中使用 Datadog):https://docs.datadoghq.com/integrations/tls/?tab=host。 他们提供了示例文件,可以在这里找到:https://github.com/DataDog/integrations-core/blob/master/tls/datadog_checks/tls/data/conf.yaml...

Admin

是否可以使用 Terraform 在 AWS EKS 集群上部署 Datadog 代理
datadog

是否可以使用 Terraform 在 AWS EKS 集群上部署 Datadog 代理

我想知道是否有人可以指导我如何在我的 AWS EKS 集群上以 pod 形式安装 Datadog 代理。我可以使用 kubectl 命令来完成我的要求。 但是在这里,我正在寻找一个可能的解决方案,以便通过 Terraform 脚本完成相同的工作,或者是否有人可以建议任何其他自动化方式在我的 eks 集群上部署 Datadog 代理。 ...

Admin

datadog、metric 和最后一个值
datadog

datadog、metric 和最后一个值

考虑到我在 datadog 中有这种 json 结构: "parameter": { "name":"mybeautifulvar", "value":"my_beautiful_string_value" } 这是每天一次的常规值提取,我搜索以显示此变量的最后一个值,但我不知道如何做到这一点。 我所能做的就是在查询值图形 索引:主服务:myservice@parameter.name:mybeautifulvar count_unique:@parameter.value 我怎样才能获得最后一个值而不是唯一计数? ...

Admin

无法访问 datadog trace-agent 端口
datadog

无法访问 datadog trace-agent 端口

我目前正在 Google Kubernetes Engine 上运行 Ruby on Rails 应用程序并部署了 datadog,但在连接跟踪代理时遇到问题。 有任何想法吗? E, [2020-07-22T01:13:54.773686 #6] ERROR -- ddtrace: [ddtrace] (/usr/local/bundle/gems/ddtrace-0.37.0/lib/ddtrace/transport/http/client.rb:35:in `rescue in send_request') Internal error during ...

Admin

是否可以使用 Terraform 在 AWS 上安装 Datadog?
datadog

是否可以使用 Terraform 在 AWS 上安装 Datadog?

我看到这篇文章详细介绍了如何使用 Ansible 在 AWS 上安装 Datadog: https://www.datadoghq.com/blog/install-datadog-with-ansible-dynamic-inventories/ 但我使用 Terraform 在 AWS 上安装 Datadog 最接近的方法是这样的: https://docs.datadoghq.com/agent/ Datadog 提供商文档页面展示了如何使用 Terraform 进行 Datadog 监控。但它没有讨论如何使用 Terraform 在 AWS ...

Admin

datadog python 数据导出
datadog

datadog python 数据导出

我希望能够从 Datadog 导出原始数据。其想法是为了支持从 Datadog UI 上游捕获的指标的更高级别的分析。 指标查询 API 仅允许根据无法明确设置的箱查询重新聚合的数据。它不允许访问原始数据,也不允许明确定义聚合的术语。 Datadog 中的日志选项似乎没有通过 API 完全支持(或者文档有限) 我对从 DataDog 到另一个数据客户端的任何上游集成选项感兴趣 ...

Admin

如何通过 Datadog 中的回复代码发出警报?
datadog

如何通过 Datadog 中的回复代码发出警报?

需要帮助。我想在网站出现 401 502 等错误时发出警报。服务器上有一个代理,它会在 datadog 中发送不同的部分。有这样的模块 http_check,并且它有这样的功能。 http_response_status_code - A string or Python regular expression for an HTTP status code. This check will report DOWN for any status code that does not match. This defaults to 1xx, 2xx and 3...

Admin

使用 DataDog 为 EC2 实例设置健康检查
datadog

使用 DataDog 为 EC2 实例设置健康检查

我有一个现有的 AWS 基础设施,它与 DataDog 集成,负责监控各种指标,例如 SQS 队列、ELB 等。 我想为一些网站和 API 设置健康检查。据我所知,可以通过 AWS ELB 健康检查来实现。但是,我想模拟最终用户体验,以便请求从外部世界发送并通过 ELB 传输到应用程序。此外,目前并非所有应用程序都具有 ELB。我决定使用 DataDog 的 HTTP 检查。问题是,我是否应该有一个单独的 EC2 实例来安装代理?我当然不想将代理安装在与网站相同的机器上并对其进行 ping,因为这样会错过各种网络问题。 我也考虑过由 DataDog 监控...

Admin