随着AIGC技术的蓬勃发展,其生成的数据量呈爆炸式增长,这使得大规模数据管理面临着新的形势。以ChatGPT等为代表的AIGC应用在运行过程中,从数据的采集、训练到内容输出,每一个环节都涉及海量数据,这对数据管理系统从存储架构、处理速度到安全防护等方面都提出了巨大需求和复杂挑战。为应对这些问题,AIGC的模型优化、各类创新的数据管理技术和优化策略如雨后春笋般涌现。本论坛围绕“AIGC与大规模数据管理”主题展开深入探讨,挖掘新型AIGC应用场景下的数据管理模式、先进的存算一体化架构以及专门针对大规模数据的优化方案等多个技术维度的发展趋势和前沿进展,推动跨领域合作和创新融合。论坛邀请在该领域取得突出成果的知名学者和领军企业的技术专家进行经验分享,共同推动AIGC与大规模数据管理领域向前发展。
林倞
中山大学
林倞,中山大学二级教授、鹏城实验室具身智能研究所所长、国家杰出青年基金获得者、Fellow of IEEE/IAPR/IET,曾任商汤科技首席研发总监/研究院执行院长。长期从事多模态人工智能、机器学习等领域的应用基础研究,作为首席科学家/项目负责人,承担国家2030科技创新重大项目;曾带领商汤科技研发团队搭建大规模AI基础设施,开拓新兴行业。在国际顶级学术期刊和会议发表论文300余篇,论文被引用近3.5万次(谷歌学术统计),多次入选全球高被引学者榜单;获权威期刊Pattern Recognition年度最佳论文奖,多媒体计算旗舰会议ICME最佳论文钻石奖,计算机视觉旗舰会议ICCV最佳论文奖提名;获中国图像图形学会科学技术一等奖、吴文俊人工智能自然科学奖,省级自然科学一等奖;指导博士生获得CCF优秀博士论文奖、ACM China优秀博士论文奖及CAAI优秀博士论文奖。
李冠彬
中山大学
李冠彬,中山大学计算机学院教授,博士生导师,国家优秀青年基金获得者。主要研究领域为跨模态视觉感知、理解与生成。 迄今为止累计发表CCF A类/中科院一区论文 150 余篇,Google Scholar 引用超过 13000次。曾获得吴文俊人工智能优秀青年奖、ACM 中国新星提名奖、中国图象图形学学会科学技术一等奖、ICCV2019 最佳论文提名奖、ICMR2021 最佳海报论文奖等荣誉、入选CVPR2024最佳论文候选。主持了包括国自然优青、面上、青年、广东省杰青、 CCF-腾讯犀牛鸟科研基金、华为Mindspore学术基金、美团北斗科研合作基金等 10 多项科研项目。担任CSIG青工委副秘书长、CCF YOCSEF广州主席、广州计算机学会副秘书长、VALSE执行副主席等。担任CVPR、ECCV、AAAI等顶级会议领域主席(AC)或高级程序委员。担任The Visual Computer编委,获得8项CVPR、NeurIPS、ACM MM等国际顶级会议竞赛冠军。
张敏灵
东南大学
张敏灵,东南大学计算机科学与工程学院教授。主要研究领域为机器学习、数据挖掘。现任中国人工智能学会机器学习专委会副主任、江苏省人工智能学会副理事长等,《中国科学:信息科学》、《IEEE Trans. PAMI》、《ACM Trans. IST》、《Frontiers of Computer Science》、《Machine Intelligence Research》等期刊编委。应邀担任ACML、PAKDD指导委员会委员,PRICAI/CCF-ICAI/CCFAI等国内外学术会议程序主席,以及AAAI/IJCAI/ICML/KDD等国际会议领域主席或资深程序委员60余次。曾获CCF - IEEE CS青年科学家奖(2016)、国家杰出青年科学基金(2022)等。
报告题目:Delving into the Calibratability of Deep Neural Networks
报告摘要:Reliable predictive models should be accurate when they are confident about their predictions and indicate high uncertainty when they are likely to be inaccurate. However, modern DNNs trained with cross-entropy (CE) loss, despite being highly accurate, have been recently found to predict poorly calibrated probabilities, unlike traditional models trained with the same objective. In recent years, many approaches have been proposed to improve DNNs’ calibration performance while maintain their accuracy. Differing from prior researches, our recent studies focus on the calibratability, which refers to the extent to which a model can be calibrated during the post-calibration phase. Our studies show a disparity between models’ calibration performance and their calibratability. Specifically, we found that despite models trained with existing calibration methods are better calibrated, they suffer from not being as calibratable as regularly trained models, namely, it is harder to further calibrate these models with post-hoc calibration approaches. Taking Label Smoothing and Mixup as two illustrative cases, our recent work highlights some surprising phenomena concerning calibrability and offers potential avenues for this issue.
刘新旺
国防科技大学
刘新旺,国防科技大学计算机学院教授,博士生导师。刘新旺,国防科技大学计算机学院教授,国家自然科学基金杰出青年基金、优秀青年基金获得者。主要研究兴趣包括机器学习、数据挖掘等。近五年以第一或通讯作者在CCF A类顶刊和顶会上发表论文80余篇,包括IEEE TPAMI论文10篇,含3篇独立作者。ESI高被引论文12篇。谷歌学术引用一万四千余次,入选2022-2023年度全球2%顶尖科学家榜单。担任IEEE TNNLS、IEEE TCYB、Information Fusion等期刊AE及ICML、NeurIPS等顶会的资深程序委员/领域主席。部分研究成果曾两次获得湖南省自然科学一等奖(2/6、6/6)。
报告题目:聚类分析的理论方法及应用
报告摘要:针对聚类分析中数据特征的多样性、非完整性及弱可学习性等挑战,本次报告将介绍课题组在多视图聚类的融合机理、非完整多视图聚类、深度聚类等方面取得了系列性创新成果:建立了如何充分利用不同类型特征来改进聚类性能的新理论、提出了面向聚类填充来应对非完整多视图聚类的新方法、探索了从原始数据中学习特征来最优地服务于聚类的新应用。拟开展持续聚类分析以应对数据的动态变化。
宋井宽
宋井宽,国家“青年特聘专家”,基金委杰青项目获得者。主要研究方向为多媒体理解。在多媒体、计算机视觉、人工智能等领域的重要会议和期刊发表论文180余篇,谷歌学术引用15000余次。担任国际SCI期刊IEEE TMM、ACM TOMM等编委,担任多个期刊的评审和多个国际顶级会议(MM'18-'22, IJCAI'18)的领域主席。主持自然科学基金委重点、科技部重点研发课题等多项国家级项目。
报告题目:跨模态全维度视觉信号生成
报告摘要:本组专注于跨模态全维度视觉信号生成,即通过跨模态信息源输入(如文本、音频等)生成全维度的包含图像、视频和三维模型三方面的视觉信号,实现多模态信息的转换与融合。在图像生成方面,我们通过增强跨模态信号的监督强度与对抗训练的稳定性,在故事可视化和多模态控制图像生成等应用场景中实现了显著的视觉效果,远超同期成果。在视频生成方面,我们聚焦于视频生成大模型推理成本高、动作信息学习效率低、音视频对齐生成等核心问题,取得了推理通用加速策略、视频模型动作增强插件、音视频同步输出的电影制作模型及特效制作模型等成果。在三维模型生成方面,针对现有模型需逐个微调的应用瓶颈,我们发布了一个通用的文本生成三维模型大模型,并构建了相关数据集和基准评测。总体而言,本组的工作在生成模型的理论研究上取得了创新进展,在跨模态视觉信号生成的实际应用上实现了重要拓展,并在数据集开源及基准评测构建方面做出了积极贡献,为相关领域的研究与应用提供了有力支持。
邱锡鹏
复旦大学
邱锡鹏,复旦大学计算机学院教授,主要研究方向为大语言模型,主持研发了多个高影响力的大模型MOSS、SpeecGPT、AnyGPT、InternLM等,发表CCF-A/B类论文100余篇,引用2万余次;多次入选“爱思唯尔中国高被引学者”,获钱伟长中文信息处理科学技术奖一等奖(第一完成人)、上海市计算机学会教学成果奖一等奖(第一完成人)等奖励;获中国科协青年人才托举工程、国家优青等项目;入选中国教师发展基金会“高校计算机专业优秀教师奖励计划”;著作《神经网络与深度学习》被上百家高校作为教材。
报告题目:多模态大模型AnyGPT
报告摘要:从GPT-4开始,一系列多模态大模型都采用“多模态输入+文本输出”的范式,而缺少任意模态输出的能力。本报告介绍一种以语言为中心的统一多模态框架AnyGPT,它具有内生的跨模态能力,既能接受跨模态输入,也能跨模态输出。AnyGPT将所有模态都转换为离散符号序列,这样每个模态都是一个新的语言,从而让大语言模型实现了模态之间的知识对齐和融合,并实现任意模态组合的输入输出。最近,OpenAI的GPT-4o也展示了任意模态大模型技术方向的广阔前景。
李冠彬
中山大学
李冠彬,中山大学计算机学院教授,博士生导师,国家优秀青年基金获得者。主要研究领域为跨模态视觉感知、理解与生成。 迄今为止累计发表CCF A类/中科院一区论文 150 余篇,Google Scholar 引用超过 13000次。曾获得吴文俊人工智能优秀青年奖、ACM 中国新星提名奖、中国图象图形学学会科学技术一等奖、ICCV2019 最佳论文提名奖、ICMR2021 最佳海报论文奖等荣誉、入选CVPR2024最佳论文候选。主持了包括国自然优青、面上、青年、广东省杰青、 CCF-腾讯犀牛鸟科研基金、华为Mindspore学术基金、美团北斗科研合作基金等 10 多项科研项目。担任CSIG青工委副秘书长、CCF YOCSEF广州主席、广州计算机学会副秘书长、VALSE执行副主席等。担任CVPR、ECCV、AAAI等顶级会议领域主席(AC)或高级程序委员。担任The Visual Computer编委,获得8项CVPR、NeurIPS、ACM MM等国际顶级会议竞赛冠军。
报告题目:多模式条件驱动的视觉内容生成与编辑
报告摘要:近年来,以扩散生成模型为代表的生成式 AI 模型能力日新月异,展现出令人瞩目的效果。在视觉内容生成及编辑领域,更符合用户意图及更具可控性的跨模态生成方法受到了学术界及产业界的广泛关注。已有的跨模态视觉生成方法在图像生成质量、美学感染力、跨模态结构及语义对齐、跨帧及多视角一致性等方面仍然存在诸多挑战。本次报告将围绕多模式条件驱动的可控视觉内容生成与编辑问题,介绍研究组从感知反馈学习、视频自监督一致性约束、蒸馏采样一致性、隐式参数对齐等角度实现用户意图一致的图像生成、视频虚拟试穿、图文提示引导的3D场景编辑以及多模式控制的数字人生成等方面的研究成果及相关应用。