在 AI 时代的计算机系统革新中,闪存化是实现强存力的核心基础,也是发展高算力、高智力的关键支撑。本论坛邀请了闪存技术和 AI 系统领域的杰出研究者、以及洞察市场趋势的存储产品和技术专家,从技术、应用、市场等多个角度共同探讨闪存存储技术在 AI 时代的前沿研究和未来发展趋势,以期揭示潜在的机遇和挑战。最后,讲者们将与听众围绕论坛主题展开即兴问答与讨论。
周游
华中科技大学
周游(博士)华中科技大学计算机学院副研究员,长期从事闪存介质、固态盘存储设备及系统方向的研究,致力于解决大数据对高性能低成本存储系统的迫切需求。主持国家自然科学基金青年项目、多项阿里巴巴和华为等企业前沿技术合项目,在ASPLOS、FAST、EuroSys、DAC、SC、TC、TOS、TCAO、TCAD等国际学术会议和期刊上发表论文20余篇。
吕涛
深圳大普微电子
吕涛(博士)现任深圳大普微电子公司预研总监,负责大普微首款、国内迄今唯一的商用PCIe 5.0可计算固态盘的研发,主导存储控制器芯片硬件压缩引擎的设计与开发。研究兴趣涵盖存储与内存设备、文件系统、高性能计算、云计算及数据编码压缩等领域。研究成果发表在SC、DAC、IPDPS、TPDS和INFOCOM等旗舰会议和期刊上,其浮点数据压缩研究曾获IPDPS'18最佳论文提名。此外,他设计的ADT-FSE压缩算法(SC'23)已成功集成进全球知名的时间序列数据库TDEngine。
张杰
北京大学
张杰(博士)北京大学计算机学院助理教授、博士生导师、特聘研究员,入选国家高层次人才计划海外青年项目,获得英特尔中国学术英才计划荣誉学者、ACM SIGCSE新星奖。长期从事存储系统和专用处理器的研究和设计,致力于从计算机体系结构层面出发,解决大数据和人工智能时代对于高性能存储系统的需求,突破冯诺依曼体系结构下数据迁移的瓶颈以及内存墙的限制。在国际会议及期刊上发表了50余篇论文,包括计算机体系结构与系统顶级会议ISCA、OSDI、HPCA、 MICRO、ASPLOS、FAST、DAC、EuroSys等。
报告题目:近数据计算的研究进展
报告摘要:随着大数据时代的到来,人工智能、图计算、大数据等新型应用对服务器集群的存力和算力提出了更高的要求。然而,传统的冯诺依曼体系结构及配套的系统软件存在数据迁移开销大的天然劣势,无法满足新型应用的实际需求。当今的内存和存储系统正经历了重大的技术转变。基于这种技术的提升,研究人员需要重新思考和设计现有的系统组织和硬件架构。本次报告主要是从近数据计算的角度解析存算一体的架构设计,我们将分享我们在近数据计算领域的研究进展。
梁胜文
中国科学院计算技术研究所
梁胜文(博士)中国科学院计算技术研究所副研究员。主要研究方向包括近数据计算、计算存储器、向量检索以及图算法硬件加速等。主持和承担了国家自然科学基金青年项目、博士后面上项目等多项国家级科研项目。在体系结构与系统领域顶级会议和期刊如USENIX ATC、IEEE TC以及DAC等发表相关论文20余篇。获得2020年CVPR国际低功耗视觉挑战赛FPGA赛道全球第三名。代表性论文被IEEE TC选为2021年9月“Featured Paper of the Month”以及2021年度最佳论文。
报告题目:面向大模型及其应用的领域专用存储设计
报告摘要:随着大模型技术的发展与应用的拓展,不仅对算力提出了要求,对存力的需求也在不断攀升。然而,现有基于内存的解决方案因其有限的存储容量难以匹配满足大模型的需求,亟需定制化扩容策略。同时,基于非易失性存储的扩容方案,由于存储芯片只负责数据存储,无法提供足够的计算能力,导致运行效率低。此外,大模型计算过程中细粒度的数据访问与非易失性存储大粒度的数据访问模式之间的鸿沟,制约了数据访问效率的提升。为此,本报告将探讨面向大模型及其应用的领域专用存储设计,围绕架构设计、数据访问、定制纠错等方面展开讨论,旨在为大模型及其应用提供具有大存储容量、低响应延迟以及高效数据访问的计算平台。最后,本报告还将展望领域专用存储技术的未来发展趋势,以期为相关领域的研究提供宝贵的参考和启示。
翁昀
思得(Solidigm)亚太区应用工程部总监
翁昀(总监)现任思得(Solidigm)亚太区应用工程部总监,负责亚太区企业级SSD的客户技术支持。翁昀于2010年加入英特尔闪存事业部从事企业级SSD的客户支持工作至今,积累了10余年的客户和SSD应用经验。先后参与SATA SSD的早期方案开发,NVMe/8639接口的行业推广和设计,以及多个重点客户的企业级SSD与方案的适配和开发工作。
报告题目:QLC 助力AI存储基础架构建设
报告摘要:当前AI浪潮下,存力作为不可缺少的部分正受到越来越多的关注。存力的挑战集中体现在性能(尤其是带宽)、功耗和体积上。QLC凭借其强大的性能和充裕的单盘容量可以帮助计算集群用更小的体积实现更大的效能。本次报告将从Solidigm的视角,围绕颗粒技术、产品和业界趋势三个方面,探讨QLC颗粒对未来存储的影响。SLDM作为QLC的行业领导者,期待为AI存储贡献更多助力。
李乔
厦门大学
李乔(博士)厦门大学副教授,研究方向为存储系统与计算机体系结构,在国际会议和期刊上发表论文60余篇,其中包括CCF推荐A类论文28篇,涵盖计算机体系结构与存储系统顶级会议ASPLOS、MICRO、FAST和HPCA,权威期刊IEEE TC、ACM TOS和TCAD等。以第一作者或通讯作者身份,在存储领域重要会议中获得ACM HotStorage 2021最佳论文奖、IEEE NVMSA 2023最佳论文奖、IEEE ASP-DAC 2024最佳论文提名奖、2024年ACM Europe Award,以及2019年“阿里云-中国计算机学会存储委员会”优秀论文奖。
报告题目:新一代高密度闪存中无效编程问题探讨
报告摘要:随着海量数据对计算机存储密度与容量的需求持续增加,三星、美光和长江存储等近两年相继推出200层3D堆叠闪存芯片,并采用4比特每存储元的QLC(Quad-Level Cell)技术。由于制程工艺的限制,3D QLC采用一种全新的编程方式,即基于字线(Wordline)粒度(4个物理页同时编程)的两步编程(粗略编程和精细编程)方式。在3D QLC的两步编程方式中,存在对无效数据页的编程,将其定义为无效编程问题。本报告针对该问题,介绍如何利用无效页的存在实现有效页的高效编程,在不改变闪存芯片硬件的前提下,最小化由无效编程产生的能耗和性能损耗,并提升有效页的可靠性。首先介绍一种对有效数据进行重新组织编程的方案,避免对无效数据的精细编程操作,缩短编程的时间,提升写入性能。其次,提出非编程方案,利用Wordline中存在的无效页,改变精细编程步骤中的数据,提升有效页的可靠性。最后,基于最新的混合SSD,设计SLC(Single-Level Cell)和QLC区域之间的动态数据管理和自适应数据分配策略,减少无效编程的发生。基于真实芯片和模拟器的评估表明,所提出的策略对3D QLC可靠性、性能和能耗均有较大的提升。
左鹏飞
华为云 AI 存储首席架构师
左鹏飞(博士)华为云 AI 存储首席架构师,于 2019年博士毕业于华中科技大学,主要研究方向为 AI 系统、内存和存储系统。在 SOSP、OSDI、FAST、ASPLOS、 MICRO、USENIX ATC 等国际会议和期刊上发表论文 40 余篇。 获得 2020 年 ACM中国优秀博士论文奖(每年全中国仅两名),FAST'2023 最佳论文奖,华为创新与技术突破奖,华为云 2023 年度最佳发明奖。
报告题目:智算数据中心中的分离式内存基础设施
报告摘要:云计算基础设施正在从“以通用计算为核心”向“以智能算力为核心”转变。在这种新型云计算基础设施中,数据的“算力”和“存力”是相辅相成的。尽管云数据中心在智能算力方面取得了显著提升,但是在存力方面的不足已成为制约其效率的关键瓶颈。数据中心存力问题主要表现在三大方面:持久化存储性能不足、DRAM 利用率低、以及 HBM 内存墙问题。为解决这些存力问题,华为云提出并构建了“分离式内存层”,将传统的“计算-存储”分离的两层云架构升级为“计算-内存-存储”分离的三层云架构。这种新型的三层云架构能有效解决上述存力痛点,从而具有高资源弹性、高资源利用率和高性能等优势。本报告将系统性地介绍我们在华为云构建分离式内存基础设施的一系列关键技术,包括分离式内存池化技术uKaron (ATC'22)/FORD(FAST'22)/FUSEE (FAST'23)/Aceso (SOSP'24)、分离式内存索引技术RACE (ATC'21)/ROLEX(FAST'23)/SMART(OSDI'23)/CHIME(SOSP'24)、分离式内存服务技术Anole(SOSP'23)/AttentionStore(ATC'24)等。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn