是否有人跟踪各个云提供商(AWS、Azure、GCP 等)的实例启动时间的性能?
显然这将取决于很多因素,例如实例类型、实例可用性、操作系统、“可用性”的定义等,因此矩阵和四分位数会很棒(例如,在 eu-west-1 的 AWS 上运行 amazon linux 的 m1-small 中有 98% 在 34 秒内可用)。
我问这个问题的原因是:我的工作量是间歇性的,但当需要时,延迟(即启动时间)很重要。出于成本原因,我更希望实例在不使用时不运行。
不幸的是,lambda/web 函数等对我来说不起作用(尽管我会使用它们来启动实例)。
答案1
不,在操作上没有任何用处。我发现最严格的跨云研究是 2012 年在弗吉尼亚大学进行的。云端虚拟机启动时间性能研究(多伊)很久以前,在 GCP 作为 IaaS 产品存在之前,Azure 还被称为 Windows Azure!
来自单一提供商的轶事博客比多云更常见。同样,已经过时了,据我所知没有人持续维护这一点。但有时你可以找到一堆数据点,例如:理解和分析 GCE 冷启动时间
使用云区域中的启动映像自行对实例类型进行计时。ssh 可能需要一到两分钟,加减几秒钟。
如果要以超过 120 秒的速度增加容量,则需要在需要之前启动实例。也许可以通过实例扩展组自动启动。这就是低延迟的代价。