Nature Scientific Reports: Ограничение подхода к машинному обучению с суперразрешением для даунскейлинга количества осадков
Изучается потенциал моделей машинного обучения сверхвысокого разрешения для даунскейлинга количества осадков со 100 до 12,5 км в часовом масштабе с использованием данных конформно-кубической атмосферной модели (Conformal Cubic Atmospheric Model, CCAM) над Австралией. Были рассмотрены два подхода: идеальный подход, при котором модель машинного обучения обучается на входных данных с огрублённым высоким разрешением (т.е. данные CCAM с разрешением 12,5 км, огрублённые до разрешения 100 км), и несовершенный подход, при котором в качестве входных данных используются исходные данные с низким разрешением (т.е. использование CCAM с разрешением 100 км), и в обоих случаях в качестве целевых данных используются данные с высоким разрешением (т.е. расчёты CCAM с разрешением 12,5 км). В идеальном случае модель машинного обучения (MLPerfect) точно воспроизводит климатологию с высоким разрешением и экстремальные явления. Однако модель MLPerfect с данными CCAM 100 км в качестве входных данных (т. е. в несовершенной обстановке) занижает величину выходных данных и вносит пространственные несоответствия, в то время как модель MLImperfect фиксирует структуры с высоким разрешением, но занижает экстремальные значения. Это говорит о том, что подход с использованием модели MLPerfect сверхвысокого разрешения не подходит для даунскейлинга количества осадков из-за пространственных несоответствий между грубыми и высокоразрешёнными модельными реализациями. Кроме того, авторы ввели основанную на чувствительности диагностику, выходящую за рамки стандартных методов оценки, чтобы понять поведение модели и выявить структурные проблемы. Эта диагностика показывает, что обе модели нелинейно увеличивают входные данные об осадках, не создавая ложных пространственных связей. Однако модель MLImperfect выводит данные об осадках в высокогорных регионах независимо от входных данных, что подчёркивает структурную проблему модели MLImperfect. В этом исследовании рассматриваются проблемы использования моделей машинного обучения сверхвысокого разрешения для даунскейлинга количества осадков, предлагается несколько полезных диагностических методов для оценки моделей машинного обучения сверхвысокого разрешения и их физического реализма, а также предлагаются идеи для изучения с целью улучшения даунскейлинга количества осадков на основе машинного обучения.