郑纬民 中国工程院院士

报告题目:分布式技术在大模型训练和推理中的应用

演讲摘要:人工智能被广泛应用到很多重要领域,人工智能进入大模型时代,大模型的“预训练-微调”成为人工智能最新范式,基础模型支持众多领域任务。大模型生命周期包括数据获取,数据预处理,模型训练和模型推理。分布式处理技术存在于大模型生命周期的每一环节。报告详细介绍每个环节所采用的分布式处理技术。

讲者简介:清华大学计算机系教授,中国工程院院士。长期从事高性能计算机体系结构、并行算法和系统研究。提出可扩展的存储系统结构及轻量并行的扩展机制,发展了存储系统扩展性理论与方法。在国内率先研制并成功应用集群架构高性能计算机。在国产神威太湖之光上研制的极大规模天气预报应用获得ACM Gordon Bell奖。曾获国家科技进步一等奖1项、二等奖2项、国家技术发明二等奖1 项,何梁何利科技进步奖,获得首届中国存储终身成就奖。