演讲摘要:算力调度系统(业内也称为:作业调度系统)是HPC重要核心基础软件,在业内被称为“算力指挥官”。它通过高效地管理和调度计算资源,能够显著提高HPC集群的计算效率,从而加速科学研究和技术开发的进程,在各种核心应用领域发挥着至关重要的作用。本报告主要介绍北京华恒盛世科技有限公司自主研发的、用C代码构建的HPC算力调度系统QUICKPOOL,它有着与IBM LSF、Slurm同样丰富的调度策略,且拥有五项核心技术:异构多CPU调度,异构多GPU调度,异构多“调度系统”调度,异地多中心统一调度,绿色计算调度(实现精准节电)。同时QUICKPOOL与Kubernetes无缝集成,实现“双调度”之间的动态感知,形成了能同时支撑“科学计算&AI计算”的一体化“算力调度底座”,打破“算力烟囱”。目前,“QUICKPOOL算力调度系统”已在开放原子开源基金会成立独立根社区,为全球算力调度领域的使用者提供了一条中国开源技术路线。
讲者简介:苏斌,北京华恒盛世科技有限公司董事长兼总经理,高级工程师、高级软件架构师、高级系统分析师。曾任职于国际顶尖IT企业,在算力领域拥有20年以上的工作经验,并于2018年创办北京华恒盛世科技有限公司,持续致力于HPC算力调度领域的技术研究和创新。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn