随着新型闪存和NVM存储介质、支持CXL和RDMA协议的硬件、以及可计算存储和DPU等硬件的出现和发展,存储系统的设计面临着前所未有的挑战。存储系统设计需要挖掘下层硬件的特性,以便更好地服务上层应用。如何更好地综合网存算硬件资源,设计硬件友好的网存算融合系统软件,挖掘硬件的最大潜能,是本论坛要深入研讨的,欢迎大家感兴趣的多多关注和参与研讨。
毛波
厦门大学
厦门大学信息学院教授、博士生导师,中国计算机学会CCF杰出会员,CCF信息存储专委会、体系结构和分布式计算与系统专委会委员,CCF信息存储专委会“走进企业”工作组组长。主要研究方向为计算机存储系统及应用,包括新型非易失内存、闪存存储、重复数据删除、键值存储、智能存储系统等,承担国家重点研发课题和国家自然科学基金项目,与华为/阿里/海康威视/OPPO等建立了产学研合作项目,在国际著名会议和期刊上发表论文60多篇,包括FAST、HPCA、ISCA、ATC、ICS、ICDCS、IPDPS,MSST和IEEE/ACM会刊等,研究成果获DATE 2019最佳论文提名、2024年CCF科技进步二等奖等。
张杰
北京大学
北京大学计算机学院助理教授、博士生导师、特聘研究员,入选国家高层次人才计划海外青年项目,获得英特尔中国学术英才计划荣誉学者、ACM SIGCSE新星奖。长期从事存储系统和专用处理器的研究和设计,致力于从计算机体系结构层面出发,解决大数据和人工智能时代对于高性能存储系统的需求,突破冯诺依曼体系结构下数据迁移的瓶颈以及内存墙的限制。在国际会议及期刊上发表50余篇论文,包括计算机体系结构与系统顶级会议OSDI、SOSP、ISCA、HPCA、MICRO、ASPLOS、FAST、ATC、EuroSys 20余篇。
舒继武
清华大学
CCF会士,清华大学长聘教授,闽江学院院长,IEEE Fellow、长江学者特聘教授和国家杰出青年基金获得者。主要研究领域为信息存储系统、智能存储、并行分布式系统等,相关论文发表在包括FAST、SOSP、OSDI、ATC、EuroSys、MICRO、ISCA、ASPLOS、SC、SIGMOD等国际学术会议和ACM TOS、IEEE TC/TPDS等权威期刊上百余篇,获NVMSA’2014、FAST’2023最佳论文奖、SIGMOD’2023研究亮点奖、MSST’2015和SRDS’2015的最佳论文提名奖等;承担过国家重点研发、国家重大专项、863、973、自然科学基金等项目或课题;获国家科技进步二等奖和国家技术发明二等奖各1次、获华为首届“奥林帕斯”奖、2022年世界超算存储500强(IO500)10节点元数据性能排行榜第一、2023/2024年IO500总榜单全球第一等。
报告题目:网存算融合的高性能存储系统设计与思考
报告摘要:在后摩尔时代,存储系统面临来自上层应用和下层存储技术的双重压力。一方面,新兴应用(如大模型)迫切需要高性能存储的支持,以充分释放算力;另一方面,内存级存储技术(如持久性内存、CXL内存等)可提供千万级别的IOPS。在此背景下,传统以CPU为中心的存储系统产生了严重的CPU性能瓶颈问题。近年来,计算型SSD、智能网卡、可编程交换机等异构硬件技术快速发展,为网存算融合提供了硬件支持,可极大缓解存储系统的CPU压力并减少数据移动。本报告首先介绍网存算融合技术对存储系统设计带来的机遇与挑战,然后介绍本团队围绕网存算融合高性能存储系统的一些初步探索,包括基于在网协同的分布式存储协议、可计算存储I/O栈等,最后对相关发展趋势进行总结思考,并给出一些需要工业界和学术界共同解决的开放问题。
李东升
国防科技大学
博士,国防科技大学计算机学院教授、并行与分布计算全国重点实验室副主任。国家杰出青年基金、首批国家优秀青年基金、全国优秀博士学位论文获得者,入选教育部新世纪优秀人才计划。兼任中国计算机学会体系结构专委会副主任、大数据专委会委员等职。主要从事并行与分布式计算、高性能数据中心、数据智能处理等方面研究工作,在《中国科学》、IEEE/ACM Transactions等学术期刊和会议上发表学术论文100 余篇,主持研制的系统在国家重要领域得到应用。获国家科技进步二等奖、军事科技进步一等奖、湖南省自然科学一等奖、湖南省教学成果特等奖、中国青年科技奖、国务院政府特殊津贴等。
报告题目:大规模智能模型并行训练:挑战与探索
报告摘要:近年来,大型智能模型训练的样本数据量大、参数多,给模型并行训练技术提出了迫切需求。报告首先分析大规模智能模型并行训练面临的一系列技术挑战,如模型训练计算/存储/通信关系复杂(并行难)、分布式训练参数通信频繁密集(通信墙)、大型模型训练存储访问开销大(内存墙)等;然后对大规模智能模型并行训练的并行任务划分技术、通信调度优化方法、内存优化等技术开展探讨。
何水兵
浙江大学
浙江大学计算机学院研究员,博士生导师,之江实验室副主任和浙江省大数据智能计算重点实验室副主任。CCF第十三届全国会员代表、CCF杰出会员、CCF信息存储专委和体系结构专委常委。主要研究方向为信息存储、智能计算、计算机体系结构等。主持或参与国家自然科学基金、国家重点研发、科技创新2030、教育部重点、浙江省重大、企业合作项目等20余项。发表论文近100篇,包括ASPLOS、MICRO、HPCA、EuroSys、SC、ATC、TOCS、TC、TPDS和TOS等CCF A类论文30多篇。担任国际会议NAS 2024程序委员会主席、ChinaSys 2024大会主席。担任CCF A类国际期刊IEEE TC、IEEE TPDS编委以及CCF THPC编辑。获2024年中国计算机系统大会ChinaSys最佳poster奖、2023年全国信息存储大会最受欢迎优博论文奖、2020年TPDS优秀编辑奖,2008年SPEED workshop最佳论文奖等。
报告题目:面向新型硬件的存储系统设计与探索
报告摘要:随着硬件技术的快速发展,存储系统设计面临着全新的挑战与机遇。特别是对于非易失性存储器(NVM)和现代NVMe SSD,传统的存储模型和数据处理方式已经难以充分利用这些硬件的优势。例如,NVM的独特硬件特征需要针对性的软件设计;同时,传统的块存储方案也难以高效利用现代NVMe SSD硬件的带宽。本报告将介绍我们在新型硬件环境下优化存储系统设计的一些探索和成果,包括高性能索引和大规模图存储等方向的优化,并展望未来在新型硬件环境下,存储系统设计的优化方向。
陈全
上海交通大学
博士,上海交通大学计算机系教授,计算机系副主任。长期从事计算机体系结构、云原生计算相关的研究。主持国家优青、国家自然科学基金重点项目,并在ASPLOS,OSDI,ATC,SC,TC,TPDS,TACO等领域内著名国际会议和期刊上发表学术论文一百余篇。曾获中创软件人才奖、CCF青年科技奖、阿里青橙奖等。目前担任国家自然科学基金委主办期刊Fundamental Research青年编委,SCI期刊Parallel Computing、JCST、FCS编委及青年编委。研究成果曾获2023年CCF技术发明一等奖(排名第1)及国家技术发明二等奖。
报告题目:面向内存池的数据卸载及服务器无感计算系统设计
报告摘要:内存池可以显著提高本地内存的使用效率。然而现有工作通常依赖于静态的内存配置,无法感知内存卸载对应用实时性能的影响,导致内存利用率不理想或者造成应用性能损失。我们提出了一个QoS感知的内存卸载框架,通过感知性能变化和节点实时带宽,合理卸载冷/热内存,保证更好的内存利用率。同时面向服务器无感计算(Serverless Computing)特定场景,提出一种面向内存池化结构的服务器无感计算系统,自动识别服务器无感计算中不同阶段、实现数据到远端内存池的高效卸载,利用面向Keep-alive阶段的半预热机制来降低响应延迟。相关技术可显著提高算力的使用效率。
吴文斐
北京大学
2015年博士毕业于威斯康星大学麦迪逊分校,现为北京大学计算机学院助理教授和研究员。吴博士长期从事计算机网络和分布式系统的研究,发表50余篇高水平学术论文,包括SIGCOMM、NSDI、ASPLOS、KDD、INFOCOM等CCF A类会议文章。吴博士近年来在“在网计算”方向进行了深入研究,研发的基于在网计算的分布式训练系统获得2021年NSDI最佳论文、基于在网计算的分布式数据分析系统获得2023年ASPLOS杰出论文奖。
报告题目:基于在网计算的分布式系统加速方法
报告摘要:近年来大模型训练等计算密集任务需求强烈,而建设的大规模算力集群面临着规模、扩展性、性能等方面的挑战。在网计算是扩展和加速分布式系统的一种有效方法;在网计算通过将应用的计算功能卸载到网络设备,可以有效压缩网络流量、减少响应时延、提升计算速度和并行度,进而提升系统整体的效率。本讲座将分享基于在网计算的分布式系统的加速方法的研究,包括构建在网计算协议、管理在网计算作业等,这些成果发表在NSDI、ASPLOS、INFOCOM等会议。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn