2024年11月7日上午10:00,中国科学院青藏高原研究所的李新教授在京师大厦9911会议室做了题目为“增强地球系统科学研究中人工智能的可解释性:数据同化和强化学习的结合”的报告。
李新,博士,中国科学院青藏高原研究所研究员,副所长,国家青藏高原科学数据中心主任,中国科学院大学岗位教授,国家杰出青年科学基金获得者,中国地理学会会士。1992年毕业于南京大学,1998年在中国科学院获博士学位。主要以遥感和数据同化为手段,以寒旱区流域为研究单元,开展数据-模型-观测综合集成研究。设计并组织完成黑河遥感试验,发展了定量遥感尺度转换和真实性检验方法,实现了遥感和生态水文研究的深度结合;开展陆面数据同化新方向研究,发展了非线性滤波算法和代表性误差估算方法,建立了高分辨率多源遥感陆面数据同化系统。论著被引用29,000多次,h-index 82,是科睿唯安交叉领域高被引学者,入选爱思唯尔等高被引榜。历任世界气候研究计划/全球能水交换计划科学指导委员会委员、全球水未来研究计划科学指导委员会委员、中国地理学会信息地理专业委员会主任、中国冰冻圈科学学会遥感与信息专业委员会主任;任Science Bulletin,《中国科学 地球科学》等期刊的编委;《遥感学报》和《地理科学》副主编。
人工智能在地球系统科学研究中的应用日益广泛,推动了天气和水文预报等领域的革新,如神经元一般环流模型和盘古大模型等突破性进展。然而,地学人工智能面临的可解释性不足问题制约了其进一步发展。本文提出,通过结合数据同化和强化学习这两种核心方法,可以有效增强地学人工智能的可解释性。数据同化是地球系统科学中的经典方法论,通过将动力模型与多源观测数据相结合,提高了系统状态的准确估计。无论是源自Kalman滤波的非线性贝叶斯滤波同化方法,还是变分同化方法,其方程都明确展现了理论与数据的协调统一。另一方面,强化学习的核心--Bellman方程,天然适用于模拟人与环境的交互,通过价值函数实现自适应学习和优化,成为地球系统管理和自然资源管理的关键工具。本文在综述这两类方法最新进展的基础上,尝试提出了一种结合数据同化和强化学习的新方法,旨在显著提升地学人工智能的可解释性。这种结合能更好地应用于地球系统状态的估计、预报和决策支持。我们通过一个经典的“公地悲剧”(个人行为理性,但集体行为却导致公共的自然资源过度使用而枯竭)示例,展示了这一结合的具体应用。该示例基于Markov决策过程的动力框架,利用Bellman方程为数学理论,以多主体深度强化学习为算法,并通过数据同化增强预报和决策能力,从而给出多主体博弈情况下公共资源治理的优化策略。这一方法不仅适用于解决“公地悲剧”问题,还可扩展到流域水资源管理、全球气候变化应对等地球系统科学的核心问题。通过融合数据同化和强化学习的优势,我们为地球系统模拟和决策提供了一个既具有高度可解释性,又能有效处理复杂系统的新框架。
供稿:樊京芳
编辑:郝林青
审核:李 辉