将 Cloud Dataflow 工作器修复至 Pub/Sub 主题

将 Cloud Dataflow 工作器修复至 Pub/Sub 主题

我正在考虑将我的一些后端移至 google cloud pub/sub 和 cloud dataflow 架构来处理流处理。我的主要需求之一是确保消息按顺序到达订阅者,我想知道是否可以将每个数据流工作者固定到他们订阅的主题,这样他们就不会丢失正在处理的消息顺序。

答案1

您无法将特定的工作器固定到特定的主题上。Dataflow 的目的是自动对负载进行分区、分配和并行处理,而不是让工作器针对不同的负载执行任务。

但是,您可以使用固定窗口按键分组进而种类元素出来了。虽然工人不能固定到特定的主题,但这并不意味着你不能进行分组和排序,这样你就可以对每个主题进行排序。你还可以使用侧面输入如果您需要在处理每个元素时注入额外的数据。

我还建议查看以下文档PubSub 的消息排序

相关内容