近日,中国科学院空天信息创新研究院(空天院)研究员曾江源研究团队在全球尺度遥感土壤水分产品时空填补方法对比与验证方面取得新进展。
微波遥感是大尺度土壤水分监测的有效手段。然而,受卫星轨道约束和一些干扰因素的影响,导致微波土壤水分产品存在数据缺失问题。以往研究大多采用单一手段在特定的区域尺度上,对土壤水分产品进行填补,缺少对全球尺度不同填补方法优劣的全面比较与验证以及对填补精度影响因素的调查与分析。
对此,空天院研究人员就传统偏差校正方法与机器学习方法在填补全球尺度SMAP土壤水分产品缺失数据的有效性、全球实测数据验证填补后的土壤水分相较于原始SMAP数据的准确性、环境变量对土壤水分数据填补精度的影响三个方面展开研究,以发展适用不同场景的填补方法,并为利用环境变量提升基于机器学习如随机森林(RF)方法填补后的SMAP产品精度提供依据。
研究团队基于2016-2019年的SMAP产品与经过比较挑选后的时空无缝的再分析产品ERA5,首先比较四种常用机器学习方法;之后,在仅使用ERA5数据下,分析机器学习中表现最优的RF方法与五种传统偏差校正方法在全球范围内填补SMAP土壤水分产品的有效性。
在验证阶段,填补后的SMAP数据与原始SMAP数据(假设这些格网SMAP无值进行填补)均方根误差(RMSE,如图1)显示:最大最小校正、CDF匹配、线性重缩、一元一次和一元二次线性方程以及RF方法的全球填补精度分布图精度由低逐渐变高,但空间分布情况相似。此外发现RF方法在训练阶段精度明显优于其他方法,但验证阶段精度下降明显,需进一步提升其在验证阶段的精度。
图1 验证阶段(2018-2019年)基于ERA5利用不同方法填补SMAP土壤水分数据相对于原始SMAP数据的RMSE全球分布图:(a)一元一次线性回归,(b)一元二次线性回归,(c)线性重缩,(d)最大最小校正,(e) CDF匹配,(f) RF方法。
为了进一步提高RF方法在验证阶段的精度和稳定性,研究团队基于RF方法并结合12种与土壤水分密切相关的辅助数据,进行多源信息的融合,以此提升机器学习方法的预测能力和泛化性能。结果表明,加入辅助数据后填补的土壤水分结果误差降低,与原始值的相关性得到了显著提高,明显提升RF方法的填补效果(表1)。
表1 基于RF方法在验证阶段对比加入辅助数据前后的填补数据与原始SMAP数据的精度表
为探索不同填补方法在空间分布上的差异,研究团队基于六种方法填补后的SMAP土壤水分数据相对于原始SMAP数据在验证阶段的RMSE和R指标,进一步分析方法中的最低RMSE和最高R指标(如图2)。
在仅使用ERA5数据的情况下,训练阶段表现最好的填补方法是RF,其误差最小且与原始值的相关性最高,但在验证阶段的精度下降比较明显,表现最差的是最大最小校正以及CDF匹配方法。以2018年6月1日和9月1日为例,使用RF方法进行SMAP土壤水分填补前后的全球分布(如图3),结果显示SMAP缺值区域已被成功填补,全球的土壤水分空间分布合理,进一步证明该方法的有效性。
图2 验证阶段(2018-2019年)基于ERA5数据利用不同方法填补SMAP土壤水分数据相对于原始SMAP数据的最低RMSE(左图)和最高R(右图)的全球分布图。ULR、UQR、LR、MMC、CDF和RF分别表示一元一次线性回归、一元二次线性回归、线性重缩、最大最小校正、CDF匹配和RF。
图3 基于表现最佳的RF方法分别填补2018年6月1日(第一列)和2018年9月1日(第二列)两天的缺值前后SMAP数据(m3m-3)在全球的分布情况:(a)和(b)为填补前结果,(c)和(d)为填补后结果。
为了检验加入辅助数据的RF方法在填补SMAP数据上的准确性,研究团队利用覆盖全球不同地表状况的1071个站点的实测数据对填补结果进行验证(如表2)。
结果表明,得益于研究发展的填补方法的有效性,填补后的SMAP数据在整体精度上甚至优于原始SMAP数据,具有更低的ubRMSE和RMSE,以及更高的R值。此外,尽管ERA5表现出更高的R值,但填补后SMAP数据相比ERA5具有更高的绝对精度,可以很好地补充ERA5,从而更好地服务于各类应用。
表2 基于实测数据评估2018至2019年期间原始SMAP、填补缺值后的SMAP(使用包含辅助数据的RF方法)以及ERA5土壤水分数据的误差指标。
另外,为进一步了解RF方法填补SMAP结果精度的主要影响因素,研究团队分析了9种不同的环境变量,包括NDVI、土壤质地(砂土、壤土和粘土含量)、气候类型、地表类型及其异质性、DEM及其异质性的SMAP填补精度变化(如图4)。
结果显示,在环境变量中,不同的NDVI、地表类型及其异质性和气候类型对填补精度的影响较大,且随着植被覆盖度、土壤水分(对应气候类型从干到湿)和地表类型异质性增加,填补精度会有所下降。砂土含量越高RMSE越低,粘土含量对填补精度的影响较小,但在含量较高时精度有所下降,壤土对填补精度的影响较小。当DEM较低时,RMSE达到最大值,并随着DEM的增加而减小;SDE对填补精度的影响较小。
图4 加入辅助数据的RF方法填补精度受环境因素的影响结果:(a) NDVI,(b) 地表类型异质性,(c) 气候类型,(d) 砂土,(e) 壤土,(f) 粘土,(g) DEM,(h) 地表类型,(i) 高程异质性。红色圆形代表RMSE的平均值,误差棒代表RMSE值的标准偏差。
上述研究成果“Global-scale gap filling of satellite soil moisture products: methods and validation”发表于水文学领域权威期刊《Journal of Hydrology》(中国科学院一区)。空天院硕士生张春林为第一作者,研究员曾江源为通讯作者。研究工作得到国家自然科学优秀青年科学基金、中国科学院青年创新促进会优秀会员等项目资助。
论文链接:https://www.sciencedirect.com/science/article/pii/S0022169425001003
动态新闻