Nature Scientific Data: Caravan – глобальный набор данных с большими выборками для гидрологии
Высококачественные наборы данных необходимы для поддержки гидрологической науки и моделирования. Несколько наборов данных CAMELS (атрибутов водосбора и метеорология для исследований с большой выборкой) существуют для конкретных стран или регионов, однако эти наборы данных не стандартизированы, что затрудняет глобальные исследования. В этом документе представлен набор данных под названием Caravan (серия CAMELS), который стандартизирует и объединяет семь существующих наборов гидрологических данных с большой выборкой. Caravan включает данные о метеорологическом воздействии, данные о речных стоках и статические атрибуты (например, геофизические, социологические, климатологические) для 6830 водосборов. Что наиболее важно, Caravan представляет собой как набор данных, так и программное обеспечение с открытым исходным кодом, позволяющее членам гидрологического сообщества расширять набор данных на новые местоположения, извлекая данные о воздействии и атрибуты водосбора в облаке. Цель заключается в том, чтобы Caravan демократизировал создание и использование глобально стандартизированных наборов гидрологических данных с большой выборкой. Caravan — это действительно глобальный ресурс сообщества с открытым исходным кодом.