机器学习模型在封闭环境中可以获得较好的性能。但在现实应用中,通常面临训练数据和测试数据分布不一致、标记数据有限且质量低下,导致机器学习模型拓展到开放环境时其性能和稳定性变差,为此基于知识迁移和适应的机器学习范式被提出。开放场景下的知识迁移与适应前沿论坛将深入探讨开放场景下的迁移学习、领域适应等研究方向的最新进展。本次论坛邀请了国内相关研究领域的杰出学者,他们将带来前沿的研究成果和技术进展分享。
论坛主持人:田青
主持人简介:田青,南京信息工程大学软件学院教授,博士生导师。入选江苏省“青蓝工程”等人才计划。从事机器学习研究,特别关注领域适应方向。近年以第一或通讯作者在IEEE/ACM Transactions、软件学报等发表论文50余篇。主持国家自然科学基金面上项目和青年项目、江苏省自然科学基金面上项目和青年项目等项目多项。曾获得江苏省高校科学技术研究成果奖、江苏省优秀博士学位论文、IAPR ICPR Best Scientific Paper Award等会议论文奖。指导学生获得江苏省计算机学会优秀硕士学位论文奖、江苏省人工智能学会优秀硕士学位论文提名奖、江苏省优秀本科毕业(设计)论文二等奖(2项)。担任中国计算机学会人工智能与模式识别专委会执行委员、中国人工智能学会机器学习专委会委员。
报告1:开放场景下的分布外检测方法研究
报告人简介:尹义龙,山东大学特聘教授、二级教授、博士生导师。IET Fellow、教育部新世纪优秀人才、泰山学者特聘专家、山东省杰青、CCF杰出会员。在AI、TPAMI、TIP、TKDE、TIFS、TMM等国际期刊和ICML、NeurIPS、AAAI、IJCAI、CVPR、MM等国际会议发表论文近百篇。所发表论文迄今累计谷歌学术引用10000+、单篇最高引用600+,H指数为47。主持国家自然科学基金重点项目、国家重点研发专项计划课题、山东省自然科学重大基础研究计划等课题。获山东省科技进步二等奖3项(第一完成人)。山东省优秀研究生导师,山东大学优秀研究生导师。山东省人工智能学会创始理事长,山东省人工智能高校实验室创始主任,中国计算机学会人工智能与模式识别专委会秘书长,中国人工智能学会机器学习专委会常委。
报告摘要:典型机器学习模型在满足独立同分布假设的静态封闭环境中具有相对完备的理论保证和较好的泛化性能。但在现实应用中,机器学习模型通常面临训练集和测试集数据类别分布不一致、用于训练的标记数据有限、受损、受隐私保护等数据条件变化,拓展到开放任务环境中鲁棒性差等问题。基于上述背景,本报告文针对合成的分布外监督信号不可靠、用于训练的分布内标记数据有限、用于训练的分布内标记数据受损、用于训练的分布内标记数据受隐私保护等多种复合型开放场景,汇报团队在分布外检测方法研究上的探索与进展。
报告2:视觉自适应表征学习的几何原理与模型
报告人简介:任传贤,中山大学教授、博导,数学学院副院长,科学计算与计算机应用系主任,中国数学会计算数学分会常务理事,广东省(广州)工业与应用数学学会副理事长兼秘书长,中国计算机学会计算机视觉专委会副秘书长。长期关注高维、异质视觉数据的特征表达与学习算法,在多尺度判别分析、知识迁移、深度自适应表征学习等方面开展了系统的研究。主持和参加多项国家自然科学基金项目,在国际重要学术期刊IEEE TPAMI, TIP, TNNLS, TMI, TCYB以及重要学术会议CVPR、AAAI等发表论文五十余篇,曾获2015年度教育部自然科学研究优秀成果二等奖和2022年度中国图象图形学学会自然科学二等奖。
报告摘要:随着人工智能技术和信息技术的快速发展,视觉数据呈现出多源、高维、大规模的特点,普遍伴随着严重的概率分布偏差问题,这引发了对于变化环境下模型的知识迁移与自适应学习需求。得益于数学理论基础与几何直观解释方面的优良性质,最优传输理论与谱方法在自适应学习领域已经得到广泛关注并取得初步成功。本次报告将聚焦于相关方法在实际复杂场景中的局限性(如局部结构刻画、标签空间异构等难题),汇报复杂分布偏差场景下的几何原理、模型及其在视觉自适应表征学习上的应用。
报告3:开放世界的视觉感知
报告人简介:张磊,重庆大学微电子与通信工程学院教授,博士生导师,弘深优秀学者,“生物感知与多模态智能信息处理”重庆市重点实验室主任,主要研究视觉感知与理解、深度域适配理论、视觉-语言大模型高效迁移。承担国家重点研发计划、国家自然科学基金、重庆市杰出青年科学基金、华为公司/中电科集团落地项目等20余项,在IEEE TPAMI、IJCV、CVPR、ICCV等期刊和会议上发表论文100余篇,ESI高被引论文10篇。以第一完成人先后获吴文俊人工智能自然科学奖、吴文俊人工智能优秀青年奖、重庆市自然科学奖、重庆市青年科技奖、华为公司火花奖等6项。入选国家万人计划青年拔尖人才项目、全球前2%顶尖科学家榜单、重庆市高层次人才计划。
报告摘要:在实际应用中,由于数据不确定性、环境不可控性以及算法模型的分布依赖性,深度学习算法的适应性和安全性依然较差,众多人工智能基础模型与算法难以满足开放、动态、复杂环境下的感知与应用。本报告将从迁移学习、领域泛化的视角,围绕视觉基础模型在目标检测、检索等方面的应用,分享团队在开放世界下的视觉感知研究进展。
报告4:视觉迁移学习与应用
报告人简介:李文,电子科技大学教授,博士生导师。2015年获新加坡南洋理工大学博士,其后在瑞士苏黎世联邦理工学院计算机视觉实验室从事研究工作,2019年入选国家海外高层次人才计划。主要研究方向为计算机视觉与迁移学习,专注于开放场景下的视觉模型泛化性难题,提出多个有影响力的跨领域的目标检测、语义分割等计算机视觉算法模型,在T-PAMI、IJCV、CVPR、ICCV、ECCV等在内的领域重要国际期刊和国际会议论文70余篇,Google Scholar的总引用次数9500余次。担任领域内重要学术期刊和国际会议审稿人或程序委员会委员、CVPR 2024、ACM MM 2024、AAAI 2023、AAAI 2021、WACV 2024、WACV 2023领域主席、ACM Computing Surveys编委(Associate Editor)等。带领团队荣获国内外多项人工智能竞赛奖项,并承担国家自然基金、四川省重点研发计划等项目。
报告摘要:近年来,以深度学习为代表的数据驱动的机器学习方法在计算机视觉任务中取得令人瞩目的成功,但同时也存在数据依赖的现象。在实际开放场景下的视觉应用中,常面临数据覆盖不足、场景动态变化等挑战,深度学习模型表现不佳、泛化性不足。在本报告中,我将结合计算机视觉的任务来讨论泛化性问题以及解决泛化性问题的主要思路,分享当前迁移学习在解决计算机视觉任务泛化性问题的一些案例。
报告5:资源受限的高效迁移学习
报告人简介:李晶晶,电子科技大学“校百人计划”教授,博导,人社部“博新计划”博士后。博士学位论文获得2018年ACM成都优秀博士论文奖和2018年中国电子学会优秀博士论文奖。主要研究方向为机器学习,多媒体和推荐系统,特别是欠标注场景下的机器学习。目前已在TPAMI,TIP,TOIS,TKDE,MM和CVPR等JCR一区期刊及CCF A类会议上发表长文八十余篇,获得授权专利十余项。先后荣获得吴文俊人工智能优秀青年奖,ACM SIGAI中国新星奖,吴文俊人工智能自然科学二等奖,四川省科技进步一等奖,山东省自然科学二等奖。研究成果入选中国百篇最具影响国际学术论文,CCF-腾讯犀牛鸟基金优秀项目,华为难题挑战奖励,CCF A类会议最佳论文提名奖等。
报告摘要:迁移学习大幅减轻了深度学习模型数据获取和标注的成本,成倍提升了深度模型的泛化能力和适用性。为了不断攻克更复杂的问题、提升已有算法的表现,深度学习模型正变得越来越庞大复杂,其动辄数十上百亿的参数量对现有的模型迁移技术提出了极高的要求。为了让更多前沿的大模型能被迁移应用于可穿戴、军事、医疗等计算和数据资源受限的特种环境中,高效迁移学习算法成为了新的研究热点和必须解决的技术难题。本报告将分享课题组近年来在高效迁移学习方面的探索。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn