论坛主席
主持人简介:张正,哈尔滨工业大学(深圳)副教授,博士生导师,广东省青年珠江学者,深圳市优青基金获得者,校首批青年拔尖人才,深圳市视觉目标检测与判识重点实验室副主任,全球前2%顶尖科学家,IEEE/CCF高级会员。曾在中国科学院自动化所模式识别国家重点实验室访问研究,香港理工大学任助理研究员,并在澳大利亚昆士兰大学任博士后研究员。从事高效能多媒体内容理解的研究,出版中英文学术专著/编著 5 部,发表 IEEE/ACM 汇刊和 CCF A 类会议论文 100 余篇,谷歌引用 8000 余次,获得 3 项国际会议论文奖,ESI 高被引论文 13 篇,热点论文3 篇,申请/授权中美专利 10 余项。主持国家级和省部级自然科学基金、深圳市科技创新优秀人才培养计划、深圳市技术攻关重点基金、深圳市科技创新基金及企业横向等科研项目10余项。受邀担任IEEE T-AC、IEEE J-BHI 、Information Fusion等权威期刊编委,以组织委员会成员成功举办了多个 CCF 推荐的国际会议,受邀担任 ICML、NeurIPS、CVPR、ACM MM 等 CCF A 类顶级学术会议的领域主席。
主持人简介:朱翔昱,中国科学院自动化研究所副研究员,从事生物特征识别相关基础理论研究与应用。国际模式识别协会(IAPR)青年学者奖(YBIA)获得者。发表文章的Google Scholar总引用次数为8800余次。获得三次国际竞赛冠军以及四项最佳论文及提名奖。入选IEEE Senior Member、中国科学院青年创新促进会、北京科协青年人才托举工程、百度学术全球华人AI青年学者榜单(全球25人),受到腾讯犀牛鸟基金支持。获2021中国电子学会科技进步二等奖、中国图象图形学学会优秀博士论文提名奖,提出的人脸三维建模方法在阿里数字人生、淘宝直播、天猫数字藏品等APP上线。
报告1:深度多视图学习与聚类应用
报告人简介:朱晓峰,国家级人才,电子科技大学教授、博士生导师。长期从事大数据预处理和健康大数据计算机辅助诊断等专业领域的研究工作。主持国家科技部重点研发项目和国家自然基金项目等国家级科研项目。发表英文学术论文200多篇,连续多年入选“爱思唯尔中国高被引科学家”和“科睿唯安全球高被引学者”,曾获四川省高等教育教学成果一等奖和广西自然科学一等奖等省部级奖项。
报告摘要:多视图数据指的是具有多个配对特征的数据,其在多模态、多媒体、工业互联网、医学分析等众多应用领域中广泛存在。深度多视图学习旨在设计深度神经网络为多视图数据学习更好的表征,是进行下游任务的基础。报告将以深度多视图表征学习中的可解释性、数据异构性、噪声鲁棒性、数据不完整性为关注点,探讨其在无监督聚类分析等实际问题中的解决思路。
报告2:面向工业决策智能的图机器学习
报告人简介:王杰,现任中国科学技术大学教授,博士生导师,少年班学院副院长,“脑启发智能感知与认知”教育部重点实验室副主任,国家创新人才计划青年特聘专家,国家优青,IEEE Senior Member,CCF杰出会员,曾任美国密歇根大学研究助理教授。王杰教授长期从事人工智能、机器学习等相关领域的研究,主要研究方向包括图机器学习、AI4Science(如AI4EDA、AI4OR等)、大模型等。在机器学习国际顶级期刊及会议(如IEEE TPAMI、JMLR、NeurIPS、ICML 和 ICLR 等)发表文章近百篇。曾获 SIGKDD 2014 Best Student Paper Award,代表性工作进入由美国科学院院士撰写的 统计稀疏学习教材。担任IEEE TPAMI编委,以及NeurIPS、ICML、SIGKDD等CCF-A类人工智能国际顶级会议领域主席或(资深)程序委员20余次。
报告摘要:人工智能与机器学习技术被广泛应用于优化和增强各种工业场景中决策过程的质量与效率。面向工业决策智能的图机器学习通过图结构化建模工业系统对象,并借助大模型、强化学习等技术,可以更有效地处理大规模、动态变化的工业数据和决策环境。本报告将重点介绍图机器学习技术在芯片设计、运筹优化等工业决策智能领域的应用及面临的挑战,以及我们在相关方向的前沿探索。
报告3:视频数据增强与恢复
报告人简介:张盛平,哈尔滨工业大学长聘教授、青年科学家工作室学术带头人,鹏城国家实验室访问教授。美国布朗大学博士后、香港浸会大学博士后、美国加州大学伯克利分校访问学者。入选国家级青年人才计划、山东省泰山学者青年专家、哈尔滨工业大学青年拔尖人才计划(副教授、教授)、人社部香江学者人才计划。主要研究方向为计算机视觉和机器学习等。主持国家自然科学基金4项、华为公司项目10余项。研究成果获黑龙江省自然科学二等奖(2019年、2015年)、军队科学技术进步二等奖(2017年)、河南省科技进步二等奖(2023年)。发表学术论文80余篇(包括PNAS、IEEE T-PAMI、IJCV、ICML、CVPR、ICCV和SIGGRAPH等)。
报告摘要:传统可见光相机在低光照等极端复杂场景下,会出现亮度过暗等问题。现有方法在处理亮度退化时,易产生伪影和时序不一致现象。此外,在高速运动场景下,传统RGB相机难以消除运动模糊。为解决这些问题,本报告汇报我们提出的基于频域扩散与时空注意力的低光照视频增强方法,利用频域特性与自然图像生成先验,结合时空联合注意力机制,捕获视频帧内与帧间的长距离依赖,有效缓解伪影,实现亮度与清晰度的同步增强。此外,我们提出了基于时空隐式表达的事件运动去模糊方法,利用事件相机的高时间分辨率和高动态特性,通过尺度感知的时空特征聚合策略,融合不同时空尺度的事件数据,处理高速运动场景的运动模糊,显著提升重建视频的清晰度,实现高速、高动态视频数据的恢复和重建。
报告4:面向智能视频分析的特征表征方法
报告人简介:高常鑫,华中科技大学教授、多谱信息智能处理技术全国重点实验室副主任,兼任中国图象图形学学会成像探测与感知专委会副秘书长、中国人工智能学会模式识别专委会副秘书长。研究领域为计算机视觉、图像/视频智能理解、语义分割、行为识别,及其在视频监控等领域的应用。近年来发表IEEE TPAMI、IJCV、IEEE TIP、CVPR、ICCV、ECCV等高水平期刊会议论文40余篇。先后主持湖北省杰出青年基金项目、国家自然科学基金面上项目、装备预研项目、科技部重点研发子课题等项目。获湖北省科技进步一等奖二等奖各1项,指导学生获国际学术竞赛冠军6项。
报告摘要:视频人体行为和身份分析技术在视频监控、人机交互、娱乐产业等多个领域具有广泛的应用前景。然而,由于多场景泛化、多任务泛化、高效训练等复杂的应用需求,智能视频分析技术从上游预训练到下游应用仍面临着诸多挑战。本报告针对智能视频分析任务,从人体行为分析和人员身份分析两个方面进行介绍,包括视频/人员自监督通用特征预训练,以及基于预训练模型的行为识别、行为检测、时序行为检测、行人重识别方法,最后,对智能视频分析的一些发展方向及新问题进行总结和讨论。
报告5:多模态异常检测新策略:跨越数据、模态与场景的挑战
报告人简介:郑锋,南方科技大学副教授(研究员),国自然优秀青年基金获得者,于英国谢菲尔德大学获得博士学位。研究兴趣包括计算机视觉、跨媒体计算与具身智能。在国际顶级杂志和会议上发表100余篇学术论文, 其中,CCF推荐A类会议和IEEE Transactions杂志共99篇。指导学生在包括CVPR ActivityNet, CVPR LOVEU, ACM MM PIC等多个国际重要竞赛中多次取得了第一或第二名的好成绩。是IET Image Processing杂志副编辑,是ACM MM 2020/2021, NeurIPS 2023领域主席,ICME2021/IJCB2021本地主席,PRCV2022组委会主席,在多个国际顶级人工智能会议包括CVPR, AAAI, IJCAI, NeuIPS, ICML, ICLR, KDD, ICCV担任委员会成员。主持相关科研项目10余项,包括科技部重点研发课题、国自然面上、优青,横向合作项目包括中兴通讯、中科院国家空间中心,联想研究院,腾讯数平、优图实验室等。
报告摘要:本讲座将深入探究异常检测领域的最新进展,特别是针对工业数据稀缺性、多模态数据的多样性和复杂场景下的挑战。首先介绍了一种基于图神经网络(GNN)的旋转不变特征的少样本异常检测算法,该算法显著降低了误判率,提高了检测效率。接着,探讨了多模态异常检测,通过结合RGB、2D深度信息和3D点云数据,提出了一种无需预训练模型即可快速推理的RGBD异常检测网络,以及一个精度显著提高的点云异常检测数据集和算法。此外,针对带噪学习和持续学习等复杂场景,我们提出了细粒度去噪算法和基于样本分布估计的异常检测方法,分别在错误率和多任务准确率上取得了显著改进。这些研究成果不仅推动了异常检测技术的理论发展,也为实际工业应用提供了有效的解决方案。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn