大规模数据处理技术与人工智能技术的快速演进,使得越来越多的数据密集型应用应运而生。本论坛邀请多位专家围绕科学领域的数据密集型应用所面临的挑战、当前取得的进展,以及未来的发展趋势进行分享与交流。
薛巍
清华大学
薛巍,清华大学计算机科学与技术系教授,高性能计算研究所所长,青海大学计算机技术与应用学院院长,国家超级计算无锡中心总工程师,中国计算机学会高级会员和信息存储技术专委会委员,IEEE 和ACM会员。主要研究领域为大规模科学计算、量化不确定性分析、科学智能。曾获教育部科学技术进步奖一等奖,中国电子学会电子信息科学技术奖一等奖,“清华大学-浪潮集团计算地球科学青年人才奖”和ACM“戈登·贝尔”奖。
宋振亚
自然资源部第一海洋研究所
宋振亚,自然资源部第一海洋研究所,博导,物理海洋学博士,研究员,学术期刊Ocean Modelling执行编辑、Scientific Data编委,中国海洋学会海气相互作用专业委员会秘书长。一直从事地球系统模式研发与应用、高性能计算以及人工智能应用等方面的工作。发展了两代包含海浪的地球系统模式FIO-ESM,探索了海浪在气候系统中的作用及机制;提出了AI4ClimateModeling的6个途径,并尝试了AI在快速智能预报、降尺度、结果订正等方面的应用;开展了海洋数值模式基于国产处理器的高效并行算法和地球系统模式的负载均衡算法等研究。先后主持NSFC优青、杰青、重点基金等项目,发表学术论文70余篇,引用3000余次。
报告题目:海洋与气候精准模拟对计算与存储的挑战
报告摘要:海洋和以海洋为纽带的多圈层耦合模式是定量描述海洋与气候系统的数值模型,是海洋与气候变化研究和预测的核心工具,也是实现联合国“海洋十年”七大愿景之一“可预测的海洋”的关键。高分辨率、多物理过程耦合是当前模式发展与应用的重要趋势,这对高性能计算、存储以及人工智能的应用提出了更高的需求。本报告将从海洋与气候的发展历史、现状、趋势,并结合自然资源部第一海洋所模式体系发展,探讨海洋与气候精准模拟对计算与存储的挑战及可能的解决方案。
付昊桓
清华大学
付昊桓,清华大学教授。多年来致力于高性能计算与地学的交叉研究,发表高性能及地学领域论文百余篇。其中,千万核可扩展的大气模拟(2016)、地震模拟(2017)以及量子电路模拟(2021)等工作三次获得国际高性能计算应用领域最高奖“戈登•贝尔”奖,大幅提升了模型对极端自然灾害现象以及大规模随机量子电路的精细模拟能力。
报告题目:面向大规模对地观测数据的融合、压缩与多模态学习方法研究
报告摘要:自上世纪七十年代Landsat卫星开始运转以来,中外各项卫星观测计划为地球观测积累了海量多源数据,也为地球系统变化、生态环境保护、城市可持续发展等重大问题的研究提供了丰富的数据支撑。但与数据种类及数量的飞速增长相比较,数据处理的软件技术发展相对滞后,无法有效将多源、多时空尺度、长时序、大范围的观测数据,有效聚拢到一个特定问题的解决场景中来。本报告将从数据的融合、压缩以及多模态学习等不同层面,探讨深度学习方法,以及多模态大模型等方法所能带来的研究潜力,使得海量多源数据成为各领域科学家触手可及、且敏捷易用的数据资源,并尝试在此基础上,实现上述模型与新型国产超算系统的紧密融合,以高可扩展的人工智能算法,实现对地球系统变化等复杂过程的理解和建模。
龚春叶
国家超级计算天津中心
龚春叶,副研究员,国家超级计算天津中心副主任,长期从事超级计算和智能计算研究,负责天河超算并行应用软件研制。获湖南省科技进步一等奖和电子学会二等奖各1项,获授权专利30余项,发表高质量论文40余篇,荣立个人三等功1次。带领团队突破大规模图计算等关键技术,荣登湖南省十大科技新闻榜首。在提升国产高性能计算机应用生态、推动我国高性能计算技术发展等方面发挥了重要作用。
报告题目:天河新一代应用及存储需求
报告摘要:随着科学技术的快速发展,大规模、复杂科学计算问题日益突出,对计算资源和计算方法提出了更高的要求。作为我国自主研发的新一代超级计算机,天河系列超算系统在性能和应用领域都取得了显著的突破。本报告围绕天河新一代在日常业务应用、大规模并行应用、AI for Science、存储等相关领域的研究进展及需求,探索后摩尔时代应用生态建设。
于策
天津大学
于策,天津大学教授/博导,智能与计算学部副主任,国家天文科学数据中心技术研发创新中心主任,CCF高性能计算专业委员会执行委员,天津市天文学会副理事长。主要研究方向为高性能计算、天文信息技术、大数据与云计算,科研成果获得天津市科技进步一等奖1项、二等奖3项。
报告题目:多源异构天文观测数据的存储与处理
报告摘要:天文观测数据是天文学研究最重要数据来源,但每台天文观测设备只能获取有限电磁波段的数据信息,为了深入研究天体的特性以及时变物理过程需要从各个波段的观测结果中进行综合分析,海量多波段天文数据的存储访问效率是制约科学产出的关键因素。本报告将结合不同类型天文观测数据的特点以及天文学研究的需要,探讨AI时代的天文观测数据所面临的存储与处理技术挑战。
薛巍
清华大学
薛巍,清华大学计算机科学与技术系教授,高性能计算研究所所长,青海大学计算机技术与应用学院院长,国家超级计算无锡中心总工程师,中国计算机学会高级会员和信息存储技术专委会委员,IEEE 和ACM会员。主要研究领域为大规模科学计算、量化不确定性分析、科学智能。曾获教育部科学技术进步奖一等奖,中国电子学会电子信息科学技术奖一等奖,“清华大学-浪潮集团计算地球科学青年人才奖”和ACM“戈登·贝尔”奖。
报告题目:HPC+AI气象资料同化技术创新
报告摘要:气象预报是富有挑战的科学与工程应用。资料同化是气象预报的关键技术之一。近年来,人工智能使能的气象预报发展迅速,为应对传统气象预报技术中的高计算成本问题提供了新的解决思路。为人工智能气象模型加入资料同化的能力是实现端到端预报的重要步骤。本报告介绍了我们在融合人工智能和科学计算实现高效的气象资料同化上的最新工作。该工作基于气象人工智能模型,设计了人工智能模型嵌入的四维变分资料同化算法和高性能集合资料同化框架,在达到传统资料同化精度的同时,相比传统集合同化方法取得了数量级的性能提升,是建立端到端人工智能气象预报方法的一种有效尝试。