Logstash S3 输入插件重新扫描所有存储桶对象

Question

这似乎是该插件的默认行为，因此必须使用插件功能进行管理。

基本上，您必须设置插件以备份然后删除带有相同存储桶前缀的对象。这样，Logstash 将在下一个间隔后轮询存储桶时跳过对象。

示例配置：

s3 {
   bucket => "s3-access-logs-eu-west-1"
   type => "s3-access"
   prefix => "2016-"
   region => "eu-west-1"
   sincedb_path => "/tmp/last-s3-file-s3-access-logs-eu-west-1"
   backup_add_prefix => "logstash-"
   backup_to_bucket => "s3-access-logs-eu-west-1"
   interval => 120
   delete => true
 }

此配置将每 120 秒扫描一次存储桶，查找以以下名称开头的对象：

2016-

它将处理这些对象，然后将它们备份到具有前缀的同一存储桶中

logstash-

然后删除它们。

这意味着在下一个轮询间隔内将找不到它们。

2 个重要说明：

您不能单独使用 backup_add_prefix（文档建议您可以）。您只能将此参数与 backup_to_bucket 结合使用
确保您用于与 S3 交互的 IAM 帐户/角色对您正在使用的存储桶具有写入权限（其他 Logstash 无法删除/重命名对象）。

Answer 1

这似乎是该插件的默认行为，因此必须使用插件功能进行管理。

基本上，您必须设置插件以备份然后删除带有相同存储桶前缀的对象。这样，Logstash 将在下一个间隔后轮询存储桶时跳过对象。

示例配置：

s3 {
   bucket => "s3-access-logs-eu-west-1"
   type => "s3-access"
   prefix => "2016-"
   region => "eu-west-1"
   sincedb_path => "/tmp/last-s3-file-s3-access-logs-eu-west-1"
   backup_add_prefix => "logstash-"
   backup_to_bucket => "s3-access-logs-eu-west-1"
   interval => 120
   delete => true
 }

此配置将每 120 秒扫描一次存储桶，查找以以下名称开头的对象：

2016-

它将处理这些对象，然后将它们备份到具有前缀的同一存储桶中

logstash-

然后删除它们。

这意味着在下一个轮询间隔内将找不到它们。

2 个重要说明：

您不能单独使用 backup_add_prefix（文档建议您可以）。您只能将此参数与 backup_to_bucket 结合使用
确保您用于与 S3 交互的 IAM 帐户/角色对您正在使用的存储桶具有写入权限（其他 Logstash 无法删除/重命名对象）。

Logstash S3 输入插件重新扫描所有存储桶对象

答案1

相关内容