探索发现 · 交大智慧

上海交大王新兵、甘小莺团队在数据驱动的地学知识发现交叉研究方面取得重要进展

近日,上海交通大学电子信息与电气工程学院电子工程系王新兵、甘小莺教授团队联合上海交通大学海洋学院开展交叉合作研究,提出了一种稀疏海洋观测数据驱动的深度图学习模型OxyGenerator,首次基于观测数据对1920年至2023年全球百年海域溶解氧数据进行准确重建,为分析复杂氧循环及气候调节提供了有力的数据支持,是人工智能与海洋学交叉融合的积极尝试。相关成果以“OxyGenerator: Reconstructing Global Ocean Deoxygenation Over a Century with Deep Learning”(基于深度学习重建全球百年海洋脱氧过程)为题发表在中国计算机学会A类会议国际机器学习大会(International Conference on Machine Learning, ICML)上。

图1.png

研究背景

海洋溶解氧是维持海洋生态系统功能的关键因子。然而,随着全球变暖和人类活动影响加剧,近年来海洋呈现脱氧趋势,日渐窒息的海洋对渔业发展、气候调节等多方面造成严重后果。为了全面深入理解海洋脱氧,从有效数据中发掘氧循环及其变化规律,2017年Schmidtko等研究者于《Nature》发文《Decline in global oceanic oxygen content during the past five decades》,首次采用空间插值方法实现了1960年以来全球海洋溶解氧数据的重建与定量分析。然而,对于评估工业革命以来长期人类活动的具体影响,重建近五十年溶解氧记录远远不够。高度稀疏的历史观测和精度受限的空间插值方法成为解决问题的重要瓶颈。

创新成果

研究团队汇聚了自1900年以来包括科考船航次调查数据、Argo浮标观测数据、深海潜标实时观测等海洋溶解氧相关数据共计60亿条(存储数据量约2TB),并进行了统一质控。考虑到海洋水体的不规则边缘,以及高度稀疏观测数据的非均匀特征,通过图建模思想建立了四维时空图网络,充分考虑了地理学中的空间相关性、高价值观测样本,实现了观测数据与缺失数据间的跨时空信息传递。

图2.png

World Ocean Database 2018、CLIVAR and Carbon Hydrographic Database、Argo、Global Ocean Data Analysis Project version2.2022、Geotraces IDP等五个主要公开溶解氧数据库的观测数据量,海洋观测数据缺失率超过90%

鉴于海洋溶解氧的浓度变化同时受到了海洋物理与生化变量的影响,首先采用多层感知机对多要素数据的进行非线性特征提取,并通过双向长短期记忆网络进行溶解氧观测值的时序变化特征挖掘。其次,由于全球海洋在不同历史时期和区域呈现异质时空关联,受到海洋学分区思想的启发,提出了自适应可变分区的图消息传递机制(Zoning-Varying Message-Passing),通过超网络参数生成算法,对不同分区的图消息进行仿射变换,实现可变分区的图信息传递。最后,海洋学领域知识的融合有助于校准神经网络的不确定性。本研究将海洋中氮、磷、氧的理想平衡比例关系(Redfield Ratio),设计了化学知识嵌入的梯度正则化方法,尽可能消除重建结果中的信号异常。

图3.png

OxyGenerator海洋脱氧重建框架

经与观测变量的多折交叉验证,与专家主导的三组CMIP6数值模式结果对比,本研究提出的OxyGenerator在四个重建性能评估指标上都取得了最佳表现,MAPE减小了38.77%,大大降低在开阔海域的重建误差。在观测数据充足的西太平洋、受特殊环境条件影响的黑海等区域,OxyGenerator表现尤为突出,模型性能在百年间保持稳定。同时,结果很好地重建了历史时期厄尔尼诺/拉尼娜等特殊气候事件对溶解氧分布的扰动,也准确体现了温盐环流等大时间尺度水体运动特征。

图4.png

1920年至2023年大洋最小含氧带(Oxygen minimum zone,OMZ)重建结果,其中黄色等值线表示溶解氧最小值低于30µmol/kg的最小含氧带范围

重建数据表明过去百年间溶解氧最小值低于30µmol/kg的最小含氧带(OMZ30)快速扩张,2023年较1920年面积扩大三倍有余。这一发现对于理解OMZ长期变化具有重要意义,有助于未来更好地进行海洋监测与保护。未来,团队将继续推进深入合作数据驱动的地学科学发现研究,积极发展先进技术赋能科学智能(AI for Science)领域研究。

论文信息

图5.png

从左到右:依次为卢彬,赵泽,甘小莺,王新兵,张经,周成虎

上海交通大学电子信息与电气工程学院电子工程系博士研究生卢彬为论文第一作者,硕士研究生赵泽为论文第二作者,甘小莺教授为通讯作者,电子工程系王新兵教授,海洋学院张经院士、周磊教授、周韫韬副教授,中科院地理所周成虎院士等对研究工作进行了深入指导和探讨。该工作得到国家自然科学基金、国家重点研发计划等项目资助。

论文链接http://arxiv.org/abs/2405.07233

电子信息与电气工程学院
电子信息与电气工程学院