作为人工智能领域的关键驱动力,智能感知与计算技术在多个子领域中发挥着至关重要的作用,其发展速度和创新能力已成为学术界和工业界关注的热点。本次论坛荣幸邀请到了在遥感、视觉、优化算法、跨媒体生成以及自动驾驶等智能感知与计算领域的杰出学者和行业专家,他们将带来各自领域的最前沿研究成果和技术进展的分享。
论坛主持人
主持人简介:刘安安,天津大学教授,天津大学图像所所长,从事跨媒体计算和人工智能研究。入选IET Fellow、爱思唯尔高被引学者等。围绕跨媒体生成、全媒体传播、主流媒体推荐,作为负责人承担国家自然科学基金联合重点、国家重点研发计划课题等;以第一完成人获天津市科技进步特等奖;发表IEEE/ACM汇刊、CCF-A类期刊和会议长文百余篇,ESI热点和高被引论文10余篇;论文被评为IEEE Journal of Biomedical and Health Informatics特色论文,获中国多媒体大会最佳论文奖。担任IEEE TCSVT/TMI/TAC、ACM TOMM副编辑,连续5年担任CCF-A类国际会议ACM Multimedia领域主席。
主持人简介:王岚君,天津大学新媒体与传播学院研究员,博士生导师。加入天津大学前,她曾任IBM中国研究院高级主任研究员、华为云技术专家。她曾作为华为云模型可信负责人,参与建立了业界首个可实施的人工智能云服务安全标准,该成果载入2021年华为公司企业年报。此外,她已发表高水平论文40余篇,拥有授权专利20余项。她的主要研究方向为:可信人工智能。
报告1:高光谱遥感深度分类方法
报告人简介:郑钰辉,教授、博导,国家级青年人才,江苏省杰出青年基金获得者。现为中国认知科学学会认知与类脑计算专委会委员、中国图象图形学学会青工委委员、江苏省军工学会学术工委会副主任、JSAI智能感知技术与应用专委会副主任兼秘书长。围绕社会与空间视觉感知计算,主持国家自然科学基金委联合基金重点项目、国际(地区)交流与合作项目、面上等国家级课题。已在IEEE-TIP、IJCAI、AAAI、ACM-MM等人工智能、计算机视觉领域国际权威期刊与会议上发表学术论文百篇以上。获2023年度江苏省高等学校科学技术研究成果奖一等奖、2022年度江苏省科学技术奖二等奖。
报告摘要:作为一种获取地球表面物质信息的技术,高光谱遥感通过记录特定波长范围内的电磁辐射能量获得图像数据。报告简要介绍高光谱成像原理及应用场景,并针对高光谱成像数据的特点如数据退化、空间分辨率低、光谱维度高、数据量大;提出系列深度分类方法,如提出轻量化空谱特征标记化Transformer分类方法,降低模型复杂度且提高了模型在小样本下的鲁棒性;提出记忆增强的空谱Transformer分类方法,缓解模型潜在的深度衰减效应,实现充足的空谱信息混合;提出CNN和Transformer结合的高光谱图像和Lidar图像融合分类方法,有效解决单一光谱数据对“异物同谱”分类难问题;提出多尺度3D-2D混合卷积和无注意力Transformer结合的高光谱图像和Lidar图像轻量化融合分类方法,有效拓展提取特征尺度并降低了网络参数量。
报告2:网络环境下分布式可信可扩展的智能优化方法
报告人简介:陈伟能,华南理工大学计算机科学与工程学院教授,博士生导师、副院长。主要研究方向是群体智能、进化计算及其应用,已发表国际期刊和国际会议论文200余篇,其中IEEE Transactions长文70余篇;牵头主持国家科技创新2030——“新一代人工智能”重大项目,国家自然科学基金企业创新联合基金重点支持项目、国家重点研发计划国际合作交流项目、国家自然科学基金-英国皇家学会牛顿基金项目等,任大数据与计算智能粤港联合创新平台负责人。2016年获国家优秀青年科学基金资助,2015年获广东省杰出青年科学基金资助;2018年获霍英东青年教师奖。现任IEEE广州分会副主席、IEEE SMC广州分支主席、中国计算机学会协同计算专业委员会常务委员、人工智能与模式识别专业委员会委员、任国际期刊IEEE Transactions on Neural Networks and Learning Systems及Complex & Intelligent Systems副编辑。
报告摘要:群体智能是新一代人工智能发展的重要方向,进化计算和群智能优化是群体智能研究的重要分支。随着物联网、边云计算等技术的快速发展,万物互联,出现了大量复杂的分布式计算和优化问题。一方面,进化计算和群智能优化方法内在的并行分布式特性与分布式计算平台相互契合,有望为求解复杂的分布式优化问题带来新的途径;另一方面,网络环境下分布式的数据存储和优化决策机制也对进化计算和群智能等智能优化方法带来新挑战。为此,本报告将介绍网络环境下分布式可信可扩展的智能优化方法。针对网络分布式环境下智能优化的目标冲突问题,介绍面向全局一致性的分布式协同智能优化方法;针对网络分布式环境下的数据驱动联邦智能优化问题,介绍边-云协同的代理模型驱动智能优化算法;针对网络分布式环境下智能优化的数据隐私与保护问题,介绍分布式进化计算的隐私保护框架BOOM。通过上述机制,构建可扩展、可信的分布式智能优化方法体系。
报告3:可控媒体生成
报告人简介:武宇,武汉大学计算机学院教授,主持国家自然科学基金优秀青年(海外)基金、科技部科技创新2030重大项目课题、国自然面上基金等项目。博士毕业于悉尼科技大学,后于普林斯顿大学任博士后研究员,研究方向为多模态学习、理解与生成。在CVPR、ICCV、TPAMI等CCF-A类会议发表论文40余篇,累计Google学术引用4000余次。曾获2024年AAAI学术新星奖、2020年谷歌博士奖,近五年累计获得7次CVPR国际学术竞赛的冠军。担任CVPR、NeurIPS、ICCV领域主席,CVPR 2023大会主要组织者、大会Workshop主席。
报告摘要:多媒体学习是深度学习领域前沿课题之一,其目标是对视觉、文本、音频等多种模态信息进行关联、感知、理解与生成。本次分享将从扩散模型的基础理论模型出发,介绍多媒体生成式模型的发展脉络,重点讲述一系列基于扩散模型的跨模态内容生成工作,包括基于对比学习的细粒度跨模态生成、图像编辑、视觉文本多重条件下的定制化图像生成等。
报告4:无人驾驶场景下智能感知与决策算法研究
报告人简介:李长升,北京理工大学计算机学院教授,博士生导师,国家基金委优秀青年基金获得者。2013年于中科院自动化所取得工学博士学位。在加入北京理工大学之前,先后在IBM研究院,阿里巴巴达摩院,以及电子科技大学计算机科学与工程学院工作。主要研究方向包括机器学习、数据挖掘、计算机视觉等。在CCF A/IEEE汇刊等国际顶级会议及期刊上发表学术论文90余篇。其中,以第一作者发表CCF A/IEEE汇刊17篇。先后主持国家自然科学基金优秀青年科学基金、国家重点研发计划课题等项目10余项;参与国家自然科学基金重点项目、173国防基础加强重点项目、装发装备技术基础等。授权中国、美国、日本等国内外发明专利50余件。现担任多个国际顶级期刊和会议的审稿人、程序委员会委员、高级委员、领域主席等。
报告摘要:随着时代的进步和科技的快速发展,自动驾驶技术正深刻地塑造未来的交通系统和出行方式。在自动驾驶研究中,动态障碍物多模态轨迹预测和自车决策规划成为关键的技术挑战,直接影响了自动驾驶系统的性能、安全性和可靠性。面对复杂的多模态环境,包括静态要素(例如车道线、交通标识和信号灯)以及动态障碍物(如其他车辆、行人和自行车),自动驾驶汽车必须综合考虑各个动静态因素,考虑它们之间的相互影响,以准确预测周围动态障碍物的未来运动轨迹。通过对预测结果进行综合分析,自动驾驶系统可以做出可靠且安全的决策和规划,这对于实现高效、安全的自动驾驶系统至关重要。本报告主要介绍我们在多模态轨迹预测和自车规划的研究进展,主要包括瞬时轨迹预测、规划模型压缩等。
报告5:神经架构搜索(NAS)的最新发展与挑战
报告人简介:常晓军,中国科学技术大学讲席教授,国家高层次人才,澳大利亚研究理事会青年研究奖获得者。主要从事多模态学习、计算机视觉和绿色人工智能及其在社会公益方面的应用。主持包括澳大利亚研究理事会科研基金、企业联合基金(Linkage Program)等国家级项目十余项。相关科研成果发表在T-PAMI、TIP等国际顶级期刊和CCF A类会议上150多篇,论文的Google Scholar引用次数15000余次,其中21篇入选ESI高被引/热点论文。2019年至2023年连续入选科睿唯安高被引学者。担任IEEE TCSVT、IEEE TNNLS、ACM TOMM等国际顶级期刊的副主编和CCF A类会议的领域主席(Area Chair)。
报告摘要:本报告深入探讨了神经架构搜索(NAS)的最新发展与挑战,重点展示了自动化搜索优化神经网络架构的重要性。NAS通过自动学习有效的网络结构,避免了手动设计的复杂性和局限性,对视觉任务尤为关键。报告回顾了早期NAS的方法,如进化算法、随机搜索及贝叶斯优化,并介绍了近年来通过强化学习和基于梯度的权重共享技术所取得的进展,显著提高了搜索的效率和性能。此外,报告还讨论了NAS面临的诸多挑战,包括高昂的计算成本和复杂的搜索空间设计,并着重分析了如何有效融合CNN与变换器架构的混合架构搜索,以实现更高效、准确的网络设计。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn