Nature Scientific Reports: Оценка географической обобщающей способности моделей глубокого обучения к даунскейлингу данных об осадках
Модели земной системы являются основным инструментом для прогнозирования последствий изменения климата. Однако запуск этих моделей с достаточным разрешением для оценки рисков на локальном уровне нецелесообразен с вычислительной точки зрения. Модели сверхвысокого разрешения на основе глубокого обучения предлагают перспективное решение для даунскейлинга результатов моделей земной системы до более высокого разрешения путём обучения на данных. Тем не менее, из-за региональных различий в климатических процессах эти модели обычно нуждаются в переобучении для каждой географической области, что требует высокоточных данных наблюдений, которые неравномерно доступны по всему миру. Это подчёркивает необходимость оценки того, насколько хорошо эти модели обобщают данные в разных географических регионах. Для решения этой проблемы авторы представляют RainShift, набор данных и эталон для оценки детализации данных в условиях географических изменений распределения. Они оценивают современные подходы к даунскейлингу, включая GAN и диффузионные модели, с точки зрения обобщения данных в условиях их дефицита между Глобальным Севером и Глобальным Югом. Полученные результаты показывают существенное снижение производительности в регионах, выходящих за пределы области распространения, в зависимости от модели и географического района. Хотя расширение области обучения, как правило, улучшает обобщение, этого недостаточно для преодоления сдвигов между географически различными регионами. Было показано, что устранение этих сдвигов, например, посредством адаптации области, может улучшить пространственное обобщение. Эта работа расширяет глобальную применимость методов даунскейлинга и представляет собой шаг к сокращению неравенства в доступе к климатической информации высокого разрешения.