一个长期运行的分布式计算任务,其调度器Pod因为节点故障或OOM而崩溃,所有计算状态瞬间蒸发。这是在生产环境中使用原生Dask时,我们不得不面对的严峻现实。Dask的中心化调度器(Scheduler)本身是一个单点故障(SPOF),尽管容器
2023-10-27