Новости партнеров

Environmental Research Letters: Модели машинного обучения неточно предсказывают текущий и будущий баланс углерода в высоких широтах 

 

Цикл углерода в высоких широтах является ключевой обратной связью с глобальной климатической системой, однако из-за её сложности и ограниченности данных в настоящее время существуют разногласия по поводу того, является ли регион источником или поглотителем углерода. Последние достижения в области анализа «больших данных» и рост вычислительной мощности активизировали использование алгоритмов машинного обучения для повышения точности измерений экосистемных процессов на местах и, в некоторых случаях, для прогнозирования отклика этих процессов на изменение климата. Однако из-за ограниченности данных прогнозы этих процессов с помощью моделей машинного обучения почти никогда не подтверждаются независимыми наборами данных. Чтобы лучше понять и охарактеризовать ограничения этих методов, авторы разработали подход для независимой оценки масштабирования и прогнозирования машинного обучения. Они имитируют усилия по масштабированию и прогнозированию на основе данных, применяя алгоритмы машинного обучения к различным подмножествам ячеек сетки региональной модели процесса, а затем тестируют эффективность машинного обучения, используя оставшиеся ячейки сетки. В этом исследовании смоделированы потоки C и данные об окружающей среде на Аляске с использованием ecosys, модели наземной экосистемы с богатым набором учитываемых процессов, а затем применены алгоритмы машинного обучения с ускоренным регрессионным деревом для обучения конфигураций данных, отражающих и расширяющих доступность существующих данных вихревой ковариации AmeriFLUX. Сначала авторы показывают, что модель машинного обучения, использующая выходные данные ecosys с доступных в настоящее время сайтов AmeriFLUX на Аляске, неправильно предсказывает, что Аляска в настоящее время является суммарным источником углерода. Увеличенный пространственный охват обучающего набора данных улучшает прогнозы машинного обучения, уменьшая погрешность вдвое при использовании 240 смоделированных участков вместо 15. Однако даже эта более точная модель машинного обучения неправильно предсказывает потоки углерода на Аляске при изменении климата в XXI веке из-за изменений содержания в атмосфере CO2, выбрасываемого мусора и состава растительности, влияющих на потоки углерода, которые нельзя вывести из обучающих данных. Эти результаты дают ключевое представление о будущих усилиях по масштабированию потока углерода и раскрывают потенциал неточного масштабирования машинного обучения и прогнозирования динамики углеродного цикла в высоких широтах.

 

Ссылка: https://www.researchgate.net/publication/366415307_Machine_learning_models_inaccurately_predict_current_and_future_high-latitude_C_balances

Печать