Климатический центр Росгидромета

Новости партнеров

Biogeosciences: Объяснимое машинное обучение для моделирования суммарного обмена экосистем в бореальных лесах

 

Растёт интерес к применению методов машинного обучения для прогнозирования суммарного обмена экосистем (СОЭ) на основе информации о местоположении и климатических переменных. Авторы применили четыре модели машинного обучения (кубист, случайный лес, усреднённые нейронные сети и линейную регрессию) для прогнозирования СОЭ экосистем бореальных лесов на основе климатических и ландшафтных переменных. Были использованы наборы данных с двух станций в финском бореальном лесу (южный участок Хюютиля и северный участок Вярриё) и смоделирован СОЭ в течение пикового сезона роста и в течение всего года. Для Хюютиля все нелинейные модели продемонстрировали схожие результаты с R2 = 0,88 для пикового сезона роста и R2 = 0,90 для всего года. Для Värriö нелинейные модели дали R2 = 0,73–0,76 для пикового сезона роста, тогда как случайный лес и кубист с R2 = 0,74 были несколько лучше, чем усреднённые нейронные сети с R2 = 0,70 для всего года. Используя объяснимые методы искусственного интеллекта, авторы показали, что наиболее важными входными переменными в пиковый сезон являются фотосинтетически активная радиация, диффузная радиация и дефицит давления пара (или температура воздуха), тогда как в годовом масштабе дефицит давления пара (или температура воздуха) заменяется температурой почвы. Когда наборы данных с обеих станций были смешаны, содержание влаги в почве, единственная переменная, явно отличающаяся между наборами данных Hyytiälä и Värriö, оказалось одной из наиболее важных переменных, но её важность уменьшилась, когда были добавлены входные переменные, маркирующие участки. Кроме того, был проведён анализ зависимости СОЭ от входных переменных с учётом существующего теоретического понимания драйверов СОЭ. Показано, что даже если статистические оценки некоторых моделей могут быть очень хорошими, к результатам следует относиться с осторожностью, особенно при их применении к масштабированию. В настройке модели с несколькими взаимозависимыми переменными, повсеместно присутствующими в атмосферных измерениях, некоторые модели демонстрируют сильные противоположные зависимости от этих переменных. Такое поведение может иметь неблагоприятные последствия, если модели применяются к наборам данных в будущих климатических условиях. Эти результаты подчёркивают важность объяснимых методов искусственного интеллекта для интерпретации результатов моделей машинного обучения, особенно когда в качестве входных данных модели используется набор, содержащий взаимозависимые переменные.

 

Ссылка: https://bg.copernicus.org/articles/22/257/2025/

Печать