2018年三大图灵奖得主Geoffrey Hinton,Yann LeCun和Yoshua Bengio在《Nature》上联合发表的文章《Deep Learning》中指出:“人和动物的学习很大程度上是无监督的,从长远来看,我们预计无监督学习将变得更加重要”。 作为无监督数据处理的典型方法,聚类分析因其将复杂数据化繁为简、化无序为有序的强大能力而具有重要的理论研究和应用价值。本论坛邀请了五位聚类分析领域的杰出学者,对该领域的前沿研究成果和技术进展进行分享。
论坛主持人:唐厂,中国地质大学(武汉)计算机学院
主持人简介:唐厂,中国地质大学(武汉)计算机学院教授,博士生导师。入选2019年湖北省“楚天学子”和武汉市青年科技朝阳计划。主要研究方向为机器学习与模式识别。发表高水平论文100多篇,其中ESI高被引论文9篇,ESI热点论文1篇,谷歌学术引用5200余次,获授权中国发明专利10余项。CCF-NCTCS和CCF-AI执行委员。受邀担任Neural Networks和CAAI Transactions on Intelligence Technology等期刊编委,国际会议ICDIP 2022/2023程序主席。获2023年度湖北省自然科学三等奖(序1)和ACAIT 2021最佳论文奖。研究成果落地于亚马逊、京东健康等企业。
报告1:聚类分析的理论方法及应用
报告人简介:刘新旺,国防科技大学计算机学院教授,博士生导师。国家杰青、 优青获得者。主要研究兴趣包括机器学习、数据挖掘等。近五年以第一或通讯作者在CCF A类顶刊和顶会上发表论文80余篇,包括IEEE TPAMI论文10篇,含3篇独立作者。ESI高被引论文12篇。谷歌学术引用一万四千余次,入选2022年度全球2%顶尖科学家榜单。担任IEEE TNNLS、IEEE TCYB、Information Fusion等期刊AE及ICML、NeurIPS等顶会的资深程序委员/领域主席。部分研究成果曾两次获得湖南省自然科学一等奖(2/6、6/6)。
报告摘要:针对聚类分析中数据特征的多样性、非完整性及弱可学习性等挑战,本次报告将介绍课题组在多视图聚类的融合机理、非完整多视图聚类、深度聚类等方面取得了系列性创新成果:建立了如何充分利用不同类型特征来改进聚类性能的新理论、提出了面向聚类填充来应对非完整多视图聚类的新方法、探索了从原始数据中学习特征来最优地服务于聚类的新应用。拟开展持续聚类分析以应对数据的动态变化。
报告2:Multimodal Fusion on Low-quality Data
报告人简介:张长青,天津大学智能与计算学部教授/博士生导师、人工智能学院副院长,国家“万人计划”青年拔尖人才,其主要研究方向为机器学习/计算机视觉/智能医疗。2017-2018年在北卡罗莱纳大学教堂山分校(UNC)担任研究员。在Nature Communications/TPAMI/ICML等顶级期刊和国际会议上发表论文50余篇,多篇论文入选ICML/CVPR/NeurIPS口头报告或亮点论文。研究成果获得中国图象图形学学会自然科学奖一等奖、ICME最佳论文等奖励,入选百度发布的全球高潜力AI华人青年学者榜单、斯坦福大学发布的全球Top 2%顶尖科学家榜单、爱思唯尔“中国高被引学者”。受邀为IEEE TPAMI、CVPR、ICCV、NeurIPS、ICML、ICLR等国际期刊及会议审稿。
报告摘要:多模态信息融合在科学发现、医疗诊断、机器人等领域具有广泛和重要应用。不同模态数据蕴含的信息具有互补性、冗余性、动态性、不平衡、不完整等诸多复杂关联和不确定性,其对多模态数据融合的效果产生了深刻的影响。本报告将从统一的视角对低质量多模态数据进行刻画,并介绍面向低质量多模态数据的融合理论、方法和应用。
报告3:数据关系引导的监督信息增强与聚类分析
报告人简介:白亮,山西大学智能信息处理研究所所长,教授,博士生导师,国家优秀青年基金获得者。主要研究方向为机器学习与聚类分析,相关研究成果发表在AI、IEEE TPAMI、IEEE TKDE、DMKD、ICML、KDD、AAAI等国际重要学术期刊和会议,主持了科技部新一代人工智能重大项目课题、国家自然科学基金优青、面上等项目,获得了包括中国人工智能学会优秀博士论文奖、山西省科学技术奖(自然科学类)一等奖等奖励。
报告摘要:聚类分析是一种极具代表性的无监督机器学习方法,由于其不需要标注信息,在众多应用领域获得了广泛关注。然而,无监督性也给聚类的有效性带来了巨大的挑战,聚类分析结果往往与用户的期望具有很大的距离。如何缩小这一差距已成为聚类分析的重要研究课题。为此,本报告将重点汇报数据关系引导的监督信息增强与聚类建模,探索如何挖掘和利用数据的关联性去监督聚类过程。
报告4:视图与标签部分缺失下的不完备多视图学习
报告人简介: 文杰,哈尔滨工业大学(深圳)青拔副教授,博士生导师,IEEE/CCF高级会员,深圳市视觉目标检测与判识重点实验室副主任。2019年获评“中国博士后创新人才支持计划”。主持国基面上、国基青年、广东省青年提升、广东省青年基金、深圳市基础研究面上等十多个项目。研究多视图学习,在NIPS、CVPR、TCYB等期刊和会议上发表论文百余篇,获AAAI优秀论文奖。是TPAMI、NIPS、ICML、ICLR、CVPR等国际期刊和会议审稿人,担任会议ICML和ACM MM领域主席。
报告摘要:不完备多视图学习是近年来机器学习与人工智能领域的研究热点,在医疗、金融、互联网等存在海量多视图数据的领域具有重要的应用价值。实际应用中“部分视图不可见/缺失”和“部分训练数据标签缺失”是多视图数据两类典型的不完备形式,给多视图学习模型设计与应用带来了一定的挑战。本报告将以聚类和多标签分类两个典型的机器学习与模式分类任务为例,汇报团队在“不完备多视图学习”及“面向不完备多视图数据的缺失信息复原”等方面的相关研究工作与进展,探讨该方向还存在的一些待解决的关键问题。
报告5:大规模多视图数据分析:表征、对齐和融合
报告人简介: 王思为,军事科学院助理研究员。主要研究方向为大规模多模态数据分析、多模态大模型Agent等,第一/通讯作者发表 CCF-A 类论文10余篇,谷歌学术引用2400余次,4篇ESI高被引论文。担任CCF-A类会议NeurIPS、AAAI、ACMMM领域主席,主持/参与科技委项目、军科项目、国家自然科学基金面上项目6项。
报告摘要: 当前,多视图数据广泛地应用在机器学习、数据挖掘等多源信息融合相关领域。然而,现有研究面向大规模数据场景下仍存在一些问题:1.如何设计更高效的多视图数据表征、对齐和融合算法来应对大规模数据挑战;2.如何设计算法来应对大规模缺失数据挑战;3.如何研究大规模多视图数据对齐、融合的相关理论。本报告拟介绍报告人最近几年在大规模多视图数据分析的探索,阐述大规模多视图条件下表征、对齐、融合以及和缺失处理工作,最后将简要展望相关方向思考。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn