Климатический центр Росгидромета

Новости партнеров

EOS: Подъём машинного обучения

Августовский выпуск посвящён тому, как обрабатывается, анализируется и чётко представляется огромный объём информации, собранной сегодня учёными.

1

О проблеме данных. «Проблема данных» - это неправильное название: при существующем количестве способов сбора такого объёма данных современная наука сталкивается не с одной проблемой, а с несколькими. Где хранить все данные, - только первая из них. Затем что с этой информацией делать? Имея больше информации, чем могла бы тщательно проанализировать группа специалистов в каком-либо отдельном исследовательском проекте, учёные обращаются к машинам, способным сделать это за них.

«Я впервые столкнулся с нейронными сетями в 1980-х годах», - сказал Кирк Мартинес (Kirk Martinez), научный консультант EOS в секции информатики Геофизического союза США (AGU) и профессор Университета Саутгемптона, Великобритания. «Нейронные сети были «биологически вдохновлённым» инструментом создания алгоритмов, которые можно было бы обучить реагировать на определённые входные данные. С тех пор он превратился в часть машинного обучения, каким мы его знаем сегодня».

Исследования изменения климата являются одним из самых ясных мест, где машинное обучение будет иметь решающее значение. «В настоящее время менее 5% доступных данных наблюдений за окружающей средой используется в численных моделях земных систем», - пишут Эми Макговерн и коллеги (Amy McGovern at al.) в “Weathering Environmental Change Through Advances in Artificial Intelligence (AI)”. Последние нововведения в области методов искусственного интеллекта позволят исследователям использовать больше этих данных, но для реализации всего потенциала потребуется междисциплинарное сотрудничество для создания надлежащей инфраструктуры.

Что тогда? Жители Великих равнин США уже получают прогнозы погоды AI, дающие уведомление за 36 часов до града, пишут McGovern et al. AI наносит на карту экологические области в океане, а вскоре он сможет даже расшифровать инопланетные атмосферы, если учёные смогут преодолеть «проклятие размерности».

По словам Мартинеса, машинное обучение станет важной частью анализа данных в науках о Земле и космосе. «Это даёт нам возможность классифицировать изображения и сигналы, с которыми мы бились бы раньше», но мы также должны понимать его ограничения.

Открытия с помощью машинного обучения могут обойтись учёным дорогой ценой. Степень обработки, необходимая для этих алгоритмов, требует огромных затрат энергии, как следствие специалистам необходимы всё более мощные суперкомпьютеры. В статье «Моделирование системы Земли должно стать более энергоэффективным» Ричард Лофт (Richard Loft. Earth System Modeling Must Become More Energy Efficient) пишет об иронии создания значительного углеродного следа в построении климатических моделей, которые говорят нам, что сжигание всего этого углерода влияет на климат. Вместо этого он призывает учёных подавать пример, предлагая несколько способов обдумать - и снизить - энергетические потребности этих систем.

Что касается анализа и интерпретации данных, не пропустите материал Стефани Зеллер и Дэвида Роджерса «Визуализация науки: как цвет определяет то, что мы видим» (Stephanie Zeller and David Rogers “Visualizing Science: How Color Determines What We See”). Они пишут: «Самый эффективный кодировщик визуализации - цвет - остается недостаточно изученным», но здесь они предлагают мастерское представление многих соображений, связанных с передачей данных. Само собой разумеется, изображения, иллюстрирующие их статью, являются чрезвычайно увлекательными.

Есть надежда, что вам понравится этот выпуск, касающийся данных и машинного обучения, и что он заставит задуматься о том, как можно использовать его или улучшить его применение в своей работе.

Ссылка: https://eos.org/agu-news/the-rise-of-machine-learning

Печать