亮点成果

大数据助力地球系统科学步入数字孪生

发布时间:2023-05-25

地球大数据的爆炸式增长不仅推动着地球系统科学向数据密集型范式(Data-intensive paradigm)转变,也为破译和解析复杂的地球系统奠定了基础。如何从海量、多源、异构、泛在的地球大数据中汲取所需的信息和知识,实现数据-信息-知识-决策链条的贯通,亟需更加行之有效的解决方案。

近日,在中国科学院战略性先导科技专项“地球大数据科学工程”项目的支持下,实验室李新研究员、冯敏研究员与专项首席—可持续发展大数据国际研究中心郭华东院士,联合中国科学院西北生态环境资源研究院冉有华研究员、苏阳博士、刘丰副研究员、黄春林研究员,武汉大学沈焕锋教授,中国科学院空天信息创新研究院肖青研究员,以及实验室苏建宾博士和原世伟博士,在《Nature Reviews Earth & Environment》上以“Big Data in Earth System Science and Progress Towards a Digital Twin”为题系统地总结了大数据在地球系统科学领域的进展和挑战。文章分析了遥感、原位观测和实验分析、社会感知、模拟和再分析四类地球大数据的特征,提出了能够将自然-社会大数据纳入地球系统模型的大数据同化方法框架,探讨了通过深度学习、物理知会的机器学习、因果推断、深度强化学习解决地球系统科学中高维数、复杂性和非线性难题的关键。以上大数据分析方法弥补了传统方法在可预测性、可迁移性、可解释性和决策支持方面的不足,为推动智能化数字孪生地球(Digital Twin of Earth)建设提供了先进的解决方案(图1)。

图1. 地球大数据推动数字孪生地球发展

文章认为,大数据同化(Big Data Assimilation)是融合地球大数据和地球系统模型的重要方法。大数据同化可以利用先进计算资源,实现机器学习与数据同化方法的共生集成,完成超高分辨率地球系统模型和多源地球观测(如遥感、台站、社会感知等)的相互融合,实现地球系统在洲际乃至全球时空尺度和物理意义上的一致表达,进而为数字孪生地球提供驱动引擎(图2)。

同时,文章从数据密集型地球系统科学的角度,分析了四种前沿大数据分析方法:深度学习、物理知会的机器学习、因果推理和深度强化学习的具体应用场景和方案,指出:科学大数据分析方法将助力数据驱动新地学的发展,其中,深度学习在解决地球系统高维度、复杂的非线性问题中表现出前所未有的潜力;深度学习与物理知会的机器学习和因果推理相结合,可以增强在地球系统科学研究中的可迁移性、可解释性和可预测性;深度学习与强化学习和多智能体建模相结合,则能够为解决复杂的决策问题提供有效方法(图3)。

图2. 大数据同化方法与应用

最后,文章指出,数字孪生地球的建设需要全面的包容性,需要深时、深地、深空的全面数据支撑。随着地球步入“人类世”时代,数字孪生地球的实现需要自然系统“硬”数据与社会系统“软”数据的无缝集成,从而捕捉自然系统和社会系统的复杂交互,而科学、开放、共享的大数据科学环境和基础设施建设则正是数字孪生地球的关键保障。实现数字孪生地球将是一个漫长而艰难的旅程,更加广泛的跨学科合作和更加开放的科学环境将有助于克服这些挑战,推动实现面向地球系统科学的人工智能工具(AI for Earth System Science)(图4)

图3. 机器学习方法助力数字孪生地球建设

上述研究工作获得中国科学院战略性先导科技专项“地球大数据科学工程”项目(XDA19070104)和国家自然科学基金项目(41988101和42171140)联合资助。

图4. 地球系统科学的机遇与挑战

论文链接:https://www.nature.com/articles/s43017-023-00409-w



附件: