https://www.reddit.com/r/kubernetes/comments/1husfza/whats_the_largest_kubernetes_cluster_youre/
同样的问题在这再发一遍,之前在 reddit 上还收到了不少反馈
对国内的情况来说,更想了解下像 deepseek 、其他 AI 训练平台,更倾向于 单个大集群还是多个小集群?
感觉单个大集群更简单一点,但是可能会触发相关的性能瓶颈,而使用多集群就涉及到跨集群的训练。
同样的问题在这再发一遍,之前在 reddit 上还收到了不少反馈
对国内的情况来说,更想了解下像 deepseek 、其他 AI 训练平台,更倾向于 单个大集群还是多个小集群?
感觉单个大集群更简单一点,但是可能会触发相关的性能瓶颈,而使用多集群就涉及到跨集群的训练。