在数据堆栈中寻找调度程序需要哪些服务器规格?

在数据堆栈中寻找调度程序需要哪些服务器规格?

我正在为一家小公司构建数据堆栈:选择让 UNIX 服务器作为“调度程序”运行。此调度程序的目标只是从不同的应用程序中提取数据并将其发送回云数据仓库。预计在不久的将来也会有相反的流程。

具体来说,服务器将仅托管 Airflow 并运行 Python 和 Bash 脚本。该服务器很可能还会托管其他仅供内部使用的 Flasks 应用程序(数据、监控等)。在这种情况下,公司的流量确实“很小”:我们说的不是大数据。

现在我必须选择主机和硬件规格,我有点困惑,我应该寻找什么,我应该考虑什么判别因素?是否有任何必须具备的选项/功能,或者我应该不惜一切代价避免的选项/功能?

谢谢 !

相关内容