存储系统在经过块存储和对象存储的发展之后,因为大模型的出现,正在经历面向向量的数据管理与存储新模式。什么样的向量适合用于存储系统?使用向量可以解决存储中的什么问题?结合向量的存储系统都有哪些成功的案例?存储系统与向量相结合的未来路在何方?《当存储遇上向量》将邀请来自学术界和工业界的多位资深专家从算法与应用角度对以上问题一一解答,同时,从向量在存储、数据库和芯片中的使用和科研经历向大家分享自己的工作与感悟,共同探讨存储与向量相结合的前景与未来。
宋井宽
同济大学
宋井宽,同济大学计算机学院教授,研究方向是多媒体理解与检索、计算机视觉和人工智能,在重要会议和期刊发表论文近100篇,谷歌学术引用1600余次。2016年获模式识别国际会议ICPR最佳论文奖,2017年获信息检索顶级会议SIGIR最佳论文提名奖,2020年获得AMiner AI 2000“多媒体最具影响力学者”提名。宋井宽教授曾主持多项科研项目(如自然科学基金)。与微软研究院、京东、华为、腾讯研究院等多个一流企业研究机构长期保持紧密的合作关系。
刘渝
华中科技大学
刘渝,华中科技大学计算机学院副研究员,工学博士、博士后,主要从事AI for Storage研究,包括:智能存储、大数据、暗数据、相似性hash、系统运维等具体应用。在国际顶级会议和期刊上发表论文40余篇。获得湖北省技术发明一等奖(2024);中国电子协会技术发明奖二等奖(2022);主持国家自然科学基金1项、湖北省自然科学基金1项、华为研发项目4项;作为技术骨干参与国家自然科学基金重点项目1项。获得互联网+大学生创新创业国赛金奖两次;获得“中国软件杯”一等奖一次。
刘渝
华中科技大学
刘渝,华中科技大学计算机学院副研究员,工学博士、博士后,主要从事AI for Storage研究,包括:智能存储、大数据、暗数据、相似性hash、系统运维等具体应用。在国际顶级会议和期刊上发表论文40余篇。获得湖北省技术发明一等奖(2024);中国电子协会技术发明奖二等奖(2022);主持国家自然科学基金1项、湖北省自然科学基金1项、华为研发项目4项;作为技术骨干参与国家自然科学基金重点项目1项。获得互联网+大学生创新创业国赛金奖两次;获得“中国软件杯”一等奖一次。
报告题目:基于文件系统的内容向量与存储系统设计
报告摘要:从文件系统中读取数据,由于缺乏基于数据内容的判断,会导致大量的读取与实际目标不符,造成带宽浪费。基于文件系统进行内容元数据的生成与组织,使得文件系统具备基于数据内容初步筛选数据的能力,在支撑AI应用时,以更短的时间提供更准确的数据是十分必要的。报告将基于讲者2020年DAC会议上的研究,讲解实现这一功能的内容筛选存储系统的设计。
张书豪
华中科技大学
华中科技大学教授。博士毕业于新加坡国立大学,师从何炳胜教授,曾任职于新加坡南洋理工大学和新加坡科技设计大学,担任长聘制助理教授,并在柏林工业大学从事博士后研究。研究方向集中于高性能流数据系统的优化与应用,主持10余项新加坡国家和企业项目(累计经费超160万新币),以及中国国家高层次青年人才项目。相关成果发表于SIGMOD、VLDB、ICDE、NIPS、SC、TKDE、VLDBJ、Nature Communication等30余篇顶级期刊和会议。
报告题目:面向连续动态数据摄取的近似向量检索研究
报告摘要:随着大模型的兴起,其难以实时更新的局限性日益受到关注。检索增强大模型(RAG)被广泛视为一种有效的解决方案。然而,现有的RAG系统严重依赖于静态的近似向量检索,尽管在理论上取得不错的效果,但在进一步实现高效增量更新、及高性能扩展等方面仍然存在极大局限性。本报告将介绍课题组近期在这一问题上的一些探索和发现,包括一个我们设计并开源的针对连续动态数据摄取情况的全新Benchmark:https://github.com/intellistream/CANDY-Benchmark
陈仁海
天津大学
陈仁海,天津大学计算机科学系副教授,硕士生导师,作为项目的主要负责人和参与人参与过内陆和香港地区的多项重大研究项目,包括科技部863计划、国家基金委自然科学基金、香港创新及科技基金(ITF)、香港和德国联合科研基金等。在MICRO、DAC、IEEE Transactions on Computers、IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems 等领域内顶级的国际会议与期刊发表论文30余篇。主要从事计算机存储,大规模图计算,智能算法硬件加速领域的研究
报告题目:大规模向量检索对存储挑战和业界思考
报告摘要:大规模向量检索技术在处理海量数据时面临着显著的存储挑战。随着数据量的激增,传统的存储解决方案往往难以满足高效检索和快速访问的需求。业界对此的思考主要集中在如何优化存储架构、提高数据压缩率以及实现更高效的索引机制。一些解决方案包括采用分布式存储系统来分散数据负载,使用近似最近邻搜索(ANN)算法来减少计算复杂度,以及开发更先进的数据编码和压缩技术来减少存储空间的需求。此外,硬件加速技术,如GPU和TPU,也被用来提高向量检索的性能。业界还在探索利用机器学习模型来预测和优化数据访问模式,以进一步降低延迟和提高吞吐量。这些思考和解决方案的目的是为了在保证检索准确性的同时,实现成本效益和可扩展性。
王颖
中国科学院计算技术研究所
王颖,中国科学院计算技术研究所研究员,主要研究超大规模集成电路设计、电子设计自动化、计算机体系结构,解决传统技术所面临的 "内存墙 "和 "功耗墙 "的扩展瓶颈。曾发表重要国际期刊和会议论文60余篇,专利授十余项。曾担IEEE Coolchips,GLVLSI,ATS等国际会议program committee menber,ISCA,DAC,HPCA,IEEE Trans. on CAD, TC, TVLSI, VLSI integration, ACM TODAES, ACM JETC 等会议期刊审稿人。2022年获得IEEE/ACM DAC 40岁以下创新奖、中国计算机学会技术发明一等奖以及中国计算机学会青年科学家奖。
报告题目:近数据计算与存算一体:从KB到P级数据处理
报告摘要:存算一体与近数据计算在AI时代成为被寄予厚望的新型体系结构以应对存储墙与带宽强问题,无论是基于新型非易失器件的存算一体,基于sram与dram近存计算,还是基于flash的近数据计算系统都已在学术界与工业界成为研究热点,本报告将介绍差异化应用场景下不同存算或近数据计算架构方案的优势以及融合机遇,并着重讨论大模型时代下不同存算架构如何利用异构计算与先进集成技术应对系统存储与互联资源的爆炸式增长。
宋井宽
电子科技大学
宋井宽,电子科技大学计算机科学与工程学院教授,研究方向是多媒体理解与检索、计算机视觉和人工智能,在重要会议和期刊发表论文近100篇,谷歌学术引用1600余次。2016年获模式识别国际会议ICPR最佳论文奖,2017年获信息检索顶级会议SIGIR最佳论文提名奖,2020年获得AMiner AI 2000“多媒体最具影响力学者”提名。宋井宽教授曾主持多项科研项目(如自然科学基金)。与微软研究院、京东、华为、腾讯研究院等多个一流企业研究机构长期保持紧密的合作关系。
报告题目:多媒体紧致表征与分析
报告摘要:在当今的大数据时代,多媒体系统已成为了至关重要的基础设施。随着AIGC技术取得显著突破,多媒体数据在数以亿万级地不断产生着。如此庞大的数据规模使得多媒体系统在进行任何数据处理时,都将产生巨大的资源消耗。因此,研究者尝试通过多媒体紧致表征来解决上述困境。这一技术将原始数据压缩为简短的二值化编码,通过硬件加速方法,上述处理的空间和时间复杂度都得到了显著下降。由于种种优势,它已在很多场景中得到应用,并得到了长期关注。本次报告将围绕这一方法的两种主要技术:哈希和量化,对多媒体紧致表征中的经典算法和最新进展进行简要介绍。紧接着,还将介绍多媒体紧致表征在三种场景中的应用,包括快速检索、视觉压缩和模型压缩等。在上述场景中,本报告根据不同任务设计,介绍针对紧致表征“如何保留关键信息”、“如何实现离散优化”两类核心问题。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn