Nature Scientific Data: CRA5 — высокоточный сжатый набор данных реанализа атмосферных параметров для исследований погоды и климата
Набор данных реанализа ERA5, разработанный Европейским центром среднесрочных прогнозов погоды (European Centre for Medium-Range Weather Forecasts, ECMWF), предоставляет высокоточные почасовые глобальные данные о климате и погоде с 1950 года по настоящее время. Однако его огромный объём создаёт существенные проблемы с хранением и распространением. Для решения этой проблемы представлена CRA5 — сильно сжатая версия ERA5, созданная с помощью нейронной сети Aeolus. CRA5 уменьшает несжатый набор данных float32 объёмом 400 ТБ до всего 0,85 ТБ, достигая коэффициента сжатия 470×. Примечательно, что он обеспечивает более чем в 100 раз более высокое сжатие, чем файлы GRIB без потерь из хранилища климатических данных Copernicus (Climate Data Store, CDS). Обширные эксперименты подтверждают его численную точность: CRA5 поддерживает согласованную климатологию и сопоставимую спектральную плотность мощности, обеспечивая среднюю абсолютную ошибку всего 0,17 К для температуры на 37 вертикальных уровнях. Кроме того, он точно восстанавливает экстремальные погодные явления и крупномасштабные климатологические закономерности. Значительно снижая инфраструктурные барьеры, CRA5 ускоряет доступ к данным и способствует более широкому сотрудничеству в крупномасштабных атмосферных исследованиях.