VisDrone2024无人机视觉挑战赛立足于大规模无人机视觉数据平台,致力于推动无人机视觉算法的研究与应用,通过集聚专家、学者和各参赛队伍共同推进无人机视觉数据的挖掘分析、技术创新和实际应用,助力无人机“低空经济”的蓬勃发展。
论坛主席
主席简介:朱鹏飞,天津大学教授,博士生导师,国家优青。主要研究方向是智能无人系统协同进化,已在IEEE TPAMI和IJCV等CCF A类和IEEE汇刊发表论文60余篇。获吴文俊人工智能优秀青年奖、黑龙江省自然科学一等奖、天津市科技进步二等奖等奖励。主持科技创新2030—“新一代人工智能”重大项目10余项。构建了大规模无人机视觉开放数据平台VisDrone,包含超过2000万图像/视频帧和2000万目标标注,并在ECCV和ICCV组织五届竞赛和研讨会。
主席简介:张鼎文,西北工业大学自动化学院教授、博导,国家优秀青年科学基金获得者、科睿唯安“全球高被引科学家”,2015赴美国卡耐基梅隆大学进行为期2年的访问研究,致力于建立面向开放环境下、具备动态学习能力的新一代计算机视觉学习框架。迄今为止,作为第一作者/通讯作者在领域内国际重要期刊及会议发表学术论文60余篇,其中包含T-PAMI, IJCV, IEEE SPM, T-IP, CVPR, ICCV, Science China: Information Science等,曾入选中国博士后创新人才计划、AI 华人青年学者榜单, 获吴文俊人工智能优秀青年奖、2021 IEEE TCSVT最佳论文奖、中国图象图形学学会优秀博士论文奖等奖励。担任中国图象图形学学会青年工作委员会副秘书长、中国图象图形学学会优博俱乐部副主席,任IEEE TMM、TCSVT、PR等刊物(客座)编辑。
论坛主持人
主持人简介:姚鑫杰,天津大学博士,主要研究方向是智能无人系统协同进化,并注重探索研究成果在智能无人系统领域的应用,已在ICML,IJCV,IEEE TMM和IEEE TCYB等国际重要会议及期刊发表论文7篇,谷歌学术引用180余次,申请软件著作权10项。在ICCV、ECCV、PRCV等国内外重要会议上协助组织VisDrone竞赛和研讨会,协助组织世界智能大会、VALSE、CCF-CV视界无限等学术活动,担任NeurIPS,IEEE TNNLS等国际重要会议及期刊审稿人。获得CCF-A类会议CVPR竞赛CLVision Challenge 2023第二名,获得2021年研究生国家奖学金。
报告1:深度学习中的通用多任务学习:建模、方法、及应用
报告人简介:夏桂松,武汉大学弘毅特聘教授,国家杰出青年基金获得者,现任武汉大学计算机学院副院长、国家多媒体软件工程技术研究中心副主任。长期从事计算机视觉、智能无人系统、遥感智能信息处理等研究,主持国家自然科学基金杰青、优青、联合重点、重大研究计划等纵向研究项目20余项,系列成果发表业内知名期刊/会议论文150余篇,出版专著2部,谷歌学术引用2万余次,并在国家重要工程和知名企业相关业务场景中成功应用。获得湖北省自然科学二等奖(1项)、测绘科技进步一等奖(3项)、IEEE GRSS最有影响力论文奖、中国图象图形学会优秀博士论文指导教师等荣誉。应邀兼任2个SCI一区期刊编委、中国图象图形学学会遥感图像专业委员会副主任。
报告摘要:现实世界中大部分问题实质上为复杂的系统问题,涉及到多个任务的协作。例如,在自动驾驶中,为了在最少人工干预的情况下实现更好的效果,自动驾驶系统需要同时完成识别和标记车道线、检测和分割场景中的所有实例,以及估计这些实例与当前交通工具的距离和运动轨迹等。因此,为解决产业界中的实际问题,同时学习多个不同任务尤为重要。深度多任务学习是指利用深度学习技术,同时解决多个任务的学习问题。本次分享聚焦于通过机器学习方法自适应建模并自动学习任务间的相关性,提出了多任务神经网络降维、深度多任务架构搜索、深度辅助任务学习、可微多任务分组等一系列算法,实现了与输入任务无关的通用多任务学习,提升了复杂多任务系统中各输入任务的效果。
报告2:高性能视觉目标跟踪方法探索
报告人简介:王栋, 大连理工大学信息与通信工程学院, 教授、博导。迄今在本领域顶级会议(CVPR/ICCV)及期刊(TPAMI/IJCV)发表论文50余篇, 谷歌学术引用1万2千余次。获得国际视觉目标跟踪竞赛VOT冠军(10次)、CCF、教育部及辽宁省自然科学二等奖、CVPR2020论文获奖提名等学术奖励。研究工作获得国家自然科学基金优秀青年科学基金、区域联合重点项目等资助
报告摘要:复杂现实环境中的各种场景变化和平台限制对跟踪算法提出了以“高精度、多模态、易迁移、低成本”为导向的高性能要求。为此,团队近年来从针对深度特征融合、多模态信息挖掘及嵌入式平台部署需求等方面开展研究,分别提出了系列Transformer跟踪模型、轻量化跟踪模型及多模态统一跟踪模型,显著提升精度的同时降低参数量和计算量,提升了复杂环境下跟踪算法性能。
报告3:基于模型集成的无人机目标检测方法
报告人简介:伍瀚,国防科技大学电子科学学院CEMEE国家重点实验室2023级博士研究生。2023年于杭州电子科技大学获得电子信息硕士学位。在国内外学术刊物发表论文十余篇,包括IEEE Transactions on Circuits and Systems for Video Technology、IEEE Transactions on Multimedia和IEEE Geoscience and Remote Sensing Letters等国际知名期刊,申请发明专利3项,并任Neural Computing and Applications和计算机科学等国内外主流期刊审稿人。研究方向为基于多视角和多模态无人机视频的多目标跟踪技术。
报告摘要:近年来,基于无人机的视觉技术在航空巡检等领域的应用越来越受到人们的关注。尽管通用计算机视觉算法取得了很大的进步,但这些算法在无人机平台上通常不是最优的。因此,开发和评估无人机视觉数据的新视觉算法成为基于无人机的应用中的关键问题。针对这些问题,我们依托VisDrone2024无人机视觉挑战赛目标检测赛道,提出了一种基于模型集成的无人机目标检测算法。通过采取多模型和多尺度推理的策略,我们的方法在多个场景下显著提升了模型的准确性和稳健性,并取得了赛道冠军。该研究成果可以进一步推广到无人机图像智能解译相关任务,加速低空经济的发展,保障国家的民生安全。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn