作者:Jason Hickey
参与:郭元晨、Jamin
谷歌研究员提出利用机器学习方法预测未来短韶光内的景象。此方法虽然处于早期发展阶段,但效果已经优于传统模型。
(图片来自网络侵删)景象总是会或轻或重地影响人们的日常生活,而景象预报的准确性会极大影响人们应对景象的办法。景象预报可以奉告人们是否应该选取一条不同的上班路线、是否该当重新安排周末野餐的操持、是否由于一场风暴的来袭而撤离住所。但对付局部风暴或是雷暴等以每小时为韶光尺度蜕变的景象事宜,做出准确的预测是极具寻衅性的。在论文《Machine Learning for Precipitation Nowcasting from Radar Images》中,研究职员在降水短时预测问题上提出了基于机器学习模型的新研究,该模型紧张是对未来短韶光内的景象进行高度局部化的「非物理」预测。机器学习一个很显著的上风在于如果供应已经演习好的模型,那么推断过程的打算本钱会很小。这使得在输入数据后的预测险些是实时的,并且结果具有原始高分辨率。这种聚焦于 0-6 小时短时降水预测方法可以在总延迟仅为 5-10 分钟的情形下天生 1km 分辨率的预测结果,这个中还包括了数据采集的延迟。该方法虽然还处于早期发展阶段,但已经优于传统模型。超越传统景象预报方法天下各地的气候机构都有大量的监控举动步伐,例如,多普勒雷达可以实时丈量降水量;气候卫星可以供应多光谱成像;地面气候站可以直接丈量风速、风向和降水量等。下图比较了美国大陆表示降水的假彩色雷达成像以及地球同步卫星所供应的云层成像,以阐释多来源景象信息的主要性。降水的存在和云的存在干系,但又不完备干系,以是纯挚从卫星遥感图像中推断降水情形是很有寻衅性的。
上图:图像显示了地球同步卫星不雅观测到的云的位置。下图:图像显示了多普勒雷达不雅观测站不雅观测到的降水位置。不幸的是,这些丈量手段并非在环球范围内都适用。例如,雷达数据大多来源于地面不雅观测站,而这在海洋上常日不可行。此外,丈量的覆盖范围因地理位置而异,有些地方纵然具有良好的卫星覆盖率,雷达覆盖率也可能很小。即便如此,有如此海量的不雅观测数据,同时数据还有繁多的种类,以至于景象预测系统很难将它们全部纳入个中。在美国,由美国海洋与大气管理局 (https://www.noaa.gov/)(NOAA)网络的遥感数据规模增长速率已经达到了每天 100TB。NOAA 将这些数据供应给运行在超级打算机上的景象预测引擎,以供应未来 1-10 天的环球气候预测。这些引擎在过去的半个世纪中不断发展,它们基于数值方法,可以直接仿照物理过程,包括大气动力学和大量效应,如热辐射,植被、湖泊、海洋效应等等。然而,打算资源的可用性在多个层面限定了基于数值的景象预报方法的能力。例如,打算力的需求将空间分辨率限定在约 5km 的范围内,这不敷以用来剖析市区和农田内的景象模式。数值方法还须要数个小时来运行。如果 6 小时才能完成一次预测的打算,那么每天只能进行 3-4 次预测,导致每次预测基于的是 6 小时前的旧数据,这会限定对付当前正在发生情形的理解。比较之下,短时预测对付交通路线选择和疏散操持等即时决策场景来说比较适用。雷达到雷达的预测作为系统可以天生预测类型的一个范例事例,研究者考虑一个雷达到雷达的预测问题:给定过去一小时的雷达图序列,预测从现在开始 N 小时内的雷达图,个中 N 一样平常为 0-6 小时之间。由于雷达数据已经被转换成了图像,可以将这种预测视为一个打算机视觉问题,从输入图像序列去推测气候的演化。在这样短的韶光尺度下,演化紧张由两种物理过程掌握:平流导致云的运动,对流导致云的形成,两者都受局部地形和地理条件的影响。
上排(从左到右):前三张图展示了当前韶光之前 60 分钟、30 分钟以及 0 分钟(即须要进行预测的韶光点)的雷达图。最右图展示了当前韶光之后 60 分钟的雷达图,也便是短时预测的真实值。下左图:对上排前三张图运用光流(OF)算法得到的矢量场(作为比较)。光流法是在 20 世纪 40 年代发展起来的一种打算机视觉方法,常用于预测短期景象变革。下右图:由光流方法进行预测的结果示例。可以把稳到,它很好地追踪了图中左下角降水的运动,但没能考虑风暴强度的衰减。研究者利用的是一种数据驱动的无物理方法,这意味着神经网络仅仅从演习样本中学习如何拟合大气的物理变革,而没有引入任何关于大气如何事情的先验知识。将景象预测问题视为一个图像到图像的转换问题,并且利用目前图像剖析中最前辈的卷积神经网络(CNNs)技能来办理。CNNs 常日由线性的层序列构成,个中每层都是将某些输入图像转换成新的输出图像的一组操作。常日,卷积神经网络层除了会利用一组卷积核对图像进行卷积操作外,还会改变图像的通道数和整体分辨率。这些卷积核本身是小图像(对付我们来说的小图像,常日 3x3 或 5x5)。卷积核给 CNN 供应了大部分的威力,并且带来了边缘检测、识别故意义的图案等操作。U-Net 是一种特殊有效的 CNN。U-Net 首先是一组被排列成编码阶段的层序列,个中逐层降落输入图像的分辨率;接着是解码阶段,在该阶段,编码器天生的图像的低维表示被扩展回更高的分辨率。下图展示了特定的 U-Net 构造中的所有层。
(A)U-Net 的整体构造。蓝色方框对应着根本 CNN 层;粉色方框对应下采样层;绿色方框对应上采样层。实线表示层间输入连接关系;虚线表示超过了编码和解码阶段的长跳跃连接;点线表示各个层中的短跳跃连接。(B)根本层中的操作。(C)上采样层中的操作。U-Net 的输入是一张图像,过去一小时的不雅观测序列中每张多光谱卫星图像都霸占个中一个通道。例如,如果过去一小时采集了 10 张卫星图像,每张多光谱图像都成像于 10 个不同的波长,那么模型的输入将是一张由 100 个通道组成的图像。对付雷达图到雷达图的预测,输入是由过去一小时内 30 张雷达不雅观测组成的序列,相隔 2 分钟一张;输出包含从现在开始 N 小时后的预测结果。对付美国的初步事情中,研究者利用美国大陆 2017-2019 年的历史不雅观测数据进行网络的演习。数据以四周为周期进行分割,每个周期的前三周作为演习数据,第四周用于效果评估。结果研究者将结果与三个广泛利用的模型进行了比较。首先,是 NOAA 的高分辨率快速刷新 (HRRR)数值预测方法。HRRR 包含了对付许多不同景象量的预测,这里研究者将结果与 1 小时地面累积总降水量预测进行比较,由于这是质量最高的 1 小时降水量预测指标。第二个是基于光流(OF)的算法,该方法试图通过一系列图像追踪移动的物体。这是一个常被用于景象预测的方法,纵然它作出了一个显然不成立的假设——一个较大区域内的总降水量在预测韶光段内是恒定不变的。第三个,所谓的持续性模型,这是一个平凡的模型,它假设某个地点未来也会像当前时候一样在以同样的程度降水,即降水的模式并不会改变。这可能看上去是一种过度简化的模型,但鉴于景象预测的困难程度,这也是一种常见的做法。
对大约一天韶光内所做预测的可视化。左图:1 小时 HRRR 在每小时开始时所作的预测,该方法局限在于 HRRR 供应预测的间隔。中图:真实情形,即想要预测的情形。右图:研究者模型所做出的预测。可以每两分钟进行一次预测(这里展示了每 15 分钟的结果),预测区域的分辨率约为 HRRR 方法的 10 倍。可以把稳到此方法捕捉到了风暴整体的运动和形态。研究者利用准确率-召回率(PR)图像来进行模型的比较。由于可以直接获取到模型分类器的结果,因此供应了完全的 PR 曲线(下图中的蓝线)。然而,研究者不能直接获取 HRRR 的模型,并且持续性模型和基于光流的模型都没有在准确率和召回率间进行折中权衡的能力,因此这些模型只能由单点来表示。可以看到,研究者神经网络预测方法的质量高于其他三个模型(由于蓝线在其他模型表示的点之上)。值得把稳的是,当预测范围达到 5-6 小时的时候,HRRR 模型的结果开始超过当下的结果。
准确率-召回率(PR)曲线 (https://en.wikipedia.org/wiki/Precision_and_recall) 将方法的结果(蓝线)和以下三个方法进行比较:基于光流(OF)的方法、持续性模型、HRRR 的 1 小时预测。由于无法直接获取到它们的分类器,因此无法供应完全的 PR 曲线。左图:对付小雨的预测结果。右图:对付中雨的预测结果。基于机器学习方法的一大上风在于预测结果是实时有效的,这意味着预测可以基于实时的新数据,而 HRRR 会受到 1-3 小时打算延迟的影响。这使得基于打算机视觉的方法可以为超短时预测供应更好的结果。比较之下 HRRR 利用的数值模型可以供应更长期的预测,这一部分是由于它利用了完全的 3D 物理模型——云的形成很难从 2D 图像中不雅观察到,以是基于机器学习的方法更难学习到对流的过程。将两个别系相结合——利用机器学习模型用于快速的预测,利用 HRRR 进行长期预测——可以在整体上产生更好的结果,这是一个未来事情可以关注的重点。研究者也在考虑将机器学习直接用于 3D 不雅观测数据。无论如何,即时预测都是实时方案、赞助决策和改进生活的关键工具。原文链接:https://ai.googleblog.com/2020/01/using-machine-learning-to-nowcast.html