翻译 Deep learning for multi-year ENSO forecasts
转载自知乎:乘风沧海
基于深度学习的厄尔尼诺预测方法
作者简介:Yoo-Geun Ham(韩国全南国立大学海洋学系教授),Jeong-Hwan Kim(韩国全南国立大学海洋学系博士), Jing-Jia Luo(罗京佳,南京信息工程大学大气科学学院教授)。
厄尔尼诺/南方涛动(ENSO)的变化与一系列广泛的区域极端气候和生态系统影响有关。因此,稳健的、长期领先的预测对于管理政策响应是有价值的。但是,尽管经过了几十年的努力,在超过一年的前置时间预测ENSO事件仍然存在问题。在这里,我们展示了一个统计预测模型,该模型采用了一种深度学习的方法,能够对长达一年半的前置时间做出熟练的ENSO预测。为了规避有限的观测数据,我们首先利用转移学习训练卷积神经网络(CNN)进行历史模拟,然后在1871年到1973年间进行再分析。在1984年至2017年的验证期内,CNN模型的Nino3.4指数的全季相关技巧远高于目前最先进的动态预测系统。CNN模型在预测海面温度的详细地带性分布方面也较好,克服了动态预测模型的不足。热点图分析表明,CNN模型使用物理上合理的前兆来预测ENSO事件。因此,CNN模型是预测ENSO事件和分析其相关复杂机制的强大工具。
预测大规模气候变化及其对全球社会和环境系统的影响的能力在很大程度上取决于ENSO预测的质量4。虽然ENSO预报使用的大气-海洋耦合模型5、6一般优于目前的统计模型1,但最先进的动态预报系统仍然不能对ENSO的提前期超过一年的情况提供有技巧的预报。因此,ENSO事件的多年预测仍然是一个重大挑战。
然而,ENSO中振荡元素的存在,与缓慢变化的海洋变化及其与大气的耦合有关,表明多年预测是可能的。有趣的是,在几次拉尼娜现象中赤道太平洋的异常现象持续了好几年。赤道高频风的可预测性较差,但赤道风中的缓慢变化成分加上底层海表温度(SST)在一定程度上是可预测的。赤道太平洋以外的海温异常可导致ENSO事件,其时滞超过一年。这些研究表明,ENSO预测仍有改进的空间,尽管目前的方法可能不适合于此。
随着大数据时代的到来,通过在大数据集中发现复杂的结构,深度学习对许多领域产生了巨大的影响13。特别是,cnns在处理具有空间结构的多维阵列数据方面取得了突出的成果(例如,用于识别彩色图像中的对象)14,15方面取得了突出的成果。因此,cnns可以用来揭示三维预测场与预测指数之间的联系。这里我们使用基于cnn的统计模型来预测enso指数。
图1 ENSO预测中使用的CNN模型结构。CNN模型由一个输入层(预测器)、三个卷积层、两个最大池(MP)层、一个全连接(FC)层和一个输出层(预测值)组成。输入层的变量对应于对SST(单位°C)和海洋热含量异常(HC,单位°C)的异常图从时间τ−2个月至时间τ(几个月内),范围在0°-360°E和55°S-60°N。从τ+ 1月至τ+ 23个月,其中连续三个月的平均 Nino3.4指数作为输出层的变量。红色方框和线条分别表示卷积滤波器filter和卷积过程;蓝色框和线分别表示最大池化窗口和最大池化过程。M表示特征图的数量,N表示FC层神经元的数量,在本研究中分别设置为30和50。全球地图是在Matplotlib31中生成的。每一层地图的x维和y维在地图旁边表示为(6、12、18、24、36、72)。
图2 CNN模型中的ENSO(厄尔尼诺)(预报)相关系数。在CNN模型(红色)、SINTEX-F动态预测系统(蓝色)和北美多模型集成(NMME)项目(其他颜色)中,三个月移动平均Nino3.4指数的全季相关技能/系数作为预测领先月份的函数。验证期为1984年至2017年。根据bootstrap方法,CNN、CanCM4和SINTEX-F的线条周围的阴影表示95%置信区间。b, c是指在CNN模型(b)和SINTEX-F动态预测系统(c)中针对每个日历月的Nino3.4指数的相关技能/系数。剖面线/加影线强调相关系数超过0.5的预测(结果)。
我们的CNN模型使用海温和热含量(海面300 m的垂直平均海洋温度)异常图(0°–360°E,55°S–60°N,连续三个月)作为预测因子,并使用NiNO3.4指数(170°–120°W,5°S–5°N以上的区域平均海温异常)作为预测值,可以提前两年进行预测(图1,方法)。
将深度学习应用于气候预报的最大局限性之一是,观察期太短,无法实现适当的训练。对全球海洋温度分布的观测始于1871[16]年。这意味着,对于每个日历月,样本数量少于150个。为了大大增加训练数据的个数,我们利用参与耦合模型互比较项目phase5 (CMIP5)的气候模型输出,其中ENSO在一定程度上进行了真实模拟(扩展数据表1)。从1871年到1973年的再分析数据也用于训练CNN 模型。验证预测指数的时期从1984年到2017年(扩展数据表2)。我们在训练期的最后一年和验证期的最早一年之间留出了10年的空白,以消除训练期的海洋记忆对验证期ENSO的可能影响。
我们运用迁移学习技术,利用CMIP5输出和训练期间的再分析数据,对CNN进行最优训练。该技术使用从具有大量样本的类似任务中获得的知识来执行目标任务。在本研究中,首先使用CMIP5输出值对CNN模型进行训练,然后使用训练后的权值作为初始权值,通过再分析(数据)构建最终的CNN模型。CNN的系统误差,也反映出CMIP5样本数据的系统误差,在第二次训练后使用再分析数据(对CNN的系统误差)进行了修正。
图2a显示了1984年至2017年三个月移动平均nino3.4指数的全季节相关系数。cnn模型中nino3.4指数的预报系数在提前期超过6个月时系统地优于所有最新的动态预报系统。cnn模型是前六个预测月具有最佳预测系数的两个模型之一。cnn模型中nino3.4指数的全季相关系数在长达17个月的时间内高于0.5,而在领先的动态预报系统sintex-f5中,nino3.4指数在17个月的时间内只高于0.37。我们的结论是,cnn模型提供了一个提前1.5年的ENSO事件的巧妙预测:这一结果是使用任何(其他)最先进的预测系统都不可能得到的结果。与以前的统计方法(扩展数据图1和扩展数据表3)相比,除了深度学习算法的优越性外,CNN模型中的技能改进还归因于大量CMIP5样本和迁移学习技术在一定程度上的成功应用(扩展数据图2)。
CNN模型的(预测)能力几乎不太受到训练数据集变化的影响 (补充图1)。CNN模型甚至成功地预测了一些CMIP5模型中模拟的ENSO指数(补充图),这些模型捕捉到了真实的ENSO动态(变化)(补充图2-4)。通过改变训练和验证数据集产生的(预测)能力的不确定性很小,表明cnn可以提供精妙的实时预测。
CNN模型还显示,与SINTEX-F相比,(CNN模型的)几乎所有目标季节的NiNO3.4指数的相关系数更高(图2b、c1)。
图3 CNN模型对于ENSO预报的物理解释。a,使用cnn模型(红色)和sintex-f模型(蓝色)预测18个月的djf季节nino3.4指数的时间序列。观察到的NiNO3.4指数也显示出来(黑色)。b,用于预测1997/98年厄尔尼诺事件期间DJF季节的1996年MJJ季节的热力图(阴影)和SST或热含量异常(等高线;虚线表示SST或HC(热含量)异常的负值,实线表示SST或HC异常的正值)。热含量异常(单位°C)显示在热带太平洋(黑框内),而海温异常(单位°C)显示在热带太平洋以外。只有在1984年至2017年期间,基于学生t检验(使用热图的标准差)的95%以上的置信水平的值才会有阴影覆盖。全球地图在matplotlib[31]中生成。
相关技术的改进对于预测北半球春季和秋季之间的季节尤其有效。例如,针对5月-6月-7月(MJJ)季节的预测具有超过0.5的相关系数,在SINTEX-F中只能领先4个月,而在CNN中最多领先11个月。这减少了cnn在目标季节之间预测能力的差距,并且我们得出结论,我们的结论是,CNN模型受春季可预测性障碍的影响较小。
12月至1月至2月(DJF)季节18个月超前预报的NiNO3.4指数表明,CNN模型正确预测了ENSO振幅(图3A)。为了了解cnn模型如何能够成功地预测如此长的提前期的nino3.4指数,我们为1997/98年厄尔尼诺事件的18个月提前期预测制作了一个热力图20(图3b)。热力图量化了每个网格点上的预测因子对预测结果的贡献;热图中的正(负)值表示特定区域上预测因子对正(负)NiNO3.4(方法)的预测。1997/98年DJF季节预报因子的热图(1996年MJJ季节的异常)表明,热带西太平洋21、印度洋11和亚热带大西洋12(图3b中的红色阴影)的异常是1997/98年厄尔尼诺成功预报的主要因素。
热力图所突出的海洋信号可以在物理联系的基础上诱发1997/98年的厄尔尼诺现象。热带西太平洋南部的正热含量异常表示厄尔尼诺持续发展的再加热(持续热)含量21。印度洋西南部的负海温异常导致了1996年北方秋季11年印度洋的负偶极子(IOD)(扩展数据图3A和4B)。负IOD导致整个印度洋在随后的季节出现负SST异常(扩展数据图3b和4d),触发赤道西太平洋上空的西风,从而在一年后引发厄尔尼诺事件22。此外,在1996年MJJ季节,北亚热带大西洋上空的负海温异常通过激发中纬度太平洋的变化12(扩展数据图12)对1997/98年厄尔尼诺事件作出了贡献。(扩展数据图3c、d和4a)。
除ENSO振幅外,根据厄尔尼诺海温异常的详细纬向分布(可以分为):中太平洋型(CP型)和东太平洋型(EP型)厄尔尼诺23,厄尔尼诺事件的全球影响差异很大。因此,根据海温异常的纬向位置,成功地预报厄尔尼诺的类型,对提高全球气候预报质量至关重要。为此,我们建立了一个额外的cnn模型来预测厄尔尼诺的类型。在这个模型中,预测值对应于三个厄尔尼诺类别24的发生率:CP类型、EP类型和两者的混合。以三类概率最高的类别作为最终预测。我们注意到,再分析数据没有用于训练用于预测厄尔尼诺类型的cnn模型,因为在再分析训练期间的厄尔尼诺事件是已知的单一类型23。因此,我们训练cnn模型,仅使用CMIP5模型的输出来预测厄尔尼诺的类型,而不使用迁移学习技术。
图4 用于预测厄尔尼诺种类的CNN预测系统。a,1984-2017年验证期内,使用CNN模型和SINTEX-F模型以及NMME项目中的模型,对DJF季节期间厄尔尼诺类型(EP类型、CP类型或混合类型)的12个月超前预报的命中率。本文还给出了命中率的多模型均值(MMM)。灰色阴影表示随机预测的95%置信区间。b-e,NDJ季节的sst和925-hpa风矢量异常,在厄尔尼诺事件期间,面积平均热力图值最大的是EP型厄尔尼诺。F-I,也是对于B-E,但是是CP型厄尔尼诺。每个海洋盆地方框上方的数字表示为绘制每个盆地的异常和为每种类型的厄尔尼诺事件选择的厄尔尼诺年。只有当某一海盆的面积平均热图值超过所有海盆厄尔尼诺事件的一个标准差时,异常才可见(详情见扩展数据图5)。全局地图在matplotlib中生成。
为了提前12个月预测厄尔尼诺事件的类型,我们进行了一系列的回报实验,在验证期间(1984-2017年),CNN模型的命中率为66.7%(图4a和扩展数据表4)。95%置信区间随机预测的命中率在12.5%~62.5%之间,cnn的命中率66.7%显著优于p值0.016。相比之下,没有一个动态预测模型在统计上表现出比随机预测更好的预测技巧,这意味着cnn模型克服了最先进预测模型25的长期弱点。这将表明,基于深度学习的模型可以具有极大精度地预测厄尔尼诺事件的空间复杂度。
除了预测ENSO的强度和类型外,cnn模型还允许我们识别哪些sst信号导致EP型或CP型厄尔尼诺事件。为此,我们计算了五个海洋盆地的面积平均热力图值(扩展数据图5)。然后,我们选择了两个 对每个海洋盆地具有最大热力图值的 情况,这可以被认为是最有利于EP型或CP型厄尔尼诺事件发展的模式。
尽管有些模式是在混合型厄尔尼诺发生的年份中选择的,但现有的文献和其他分析表明,所选择的模式可以导致ep型或cp型厄尔尼诺。对于ep型厄尔尼诺,在目标季节前一年选取的热含量异常可诱发正的IOD,即厄尔尼诺成熟阶段前一个时期[27](图4e)。对于cp型厄尔尼诺,北大西洋上空的海温变冷(图4f, g)。cp型厄尔尼诺的前兆在南太平洋和印度洋没有报道之前,额外的分析表明,所确定的前兆可以导致cp型厄尔尼诺事件(扩展数据图6)。这表明CNN可以是一个强大的工具来揭示复杂的ENSO机制。然而,未来的研究需要/有必要在样本量有限的情况下,探索CNN模型揭示的统计关系的物理机制。
CNN相对于以往模型的优势源于它采用了卷积的方法成功的提取了输入变量的特征。CNN识别出可以用来编码各种不同形状的基本形状,因此对转化和变形表现出部分不变性。因此,在CNN中,前兆信号可以适当地影响预测,即使详细的空间分布已由典型的前兆偏移或变形。此外,卷积过程允许CNN模型使用相对较少的气候样本进行适当的训练。
深度学习在预测许多地球系统成分方面取得了进展,但它在气候预测方面的应用迄今还很少。深度学习的成功应用,通过转移学习和热力图分析来预测和理解这里报道的气候现象,可以促进工程和地球科学之间的跨学科研究。
在线内容
任何方法、附加参考文献、自然研究报告摘要、源数据、扩展数据、补充信息、致谢、同行评审信息;作者贡献和竞争利益的细节;数据状态和代码可用性可在https://doi.org/10.1038/s41586-019-1559-7获得。
收到日期:2018年11月20日;接受日期:2019年7月10日;网上出版日期:2019年9月18日。
发布于 2020-07-09 14:48