Nature Scientific Data: Набор согласованных глобальных метаданных мониторинга качества воздуха
В этом исследовании восполняется пробел в отчётности по метаданным мониторинга качества воздуха путём создания классификатора для типов станций мониторинга качества воздуха и характеристик территорий. В нём используются данные о землепользовании сверхвысокого разрешения, дополненные демографической и сеточной информацией. Были применены передовые методы машинного обучения, включая свёрточные нейронные сети и трансформеры. С помощью специального подхода к обучению авторы доработали предварительно обученные модели на 7000 изображениях и разметили более 8000 дополнительных мониторов, в результате чего получили надёжную модель для классификации станций мониторинга качества воздуха по характеристикам территории (городская, сельская) и типу источника (фоновый, нефоновый). В результате получился глобальный гармонизированный набор данных государственных станций мониторинга качества воздуха по содержанию твёрдых частиц, содержащий около 15000 мониторов из 106 стран. Для каждой станции набор данных предоставляет идентификатор, географические координаты, страну, характеристики территории, тип источника и статус классификации. Этот набор данных позволяет проводить глобальные исследования осуществимости и региональный анализ условий, приводящих к воздействию загрязняющих веществ. Благодаря единообразной классификации станций мониторинга, также можно проводить содержательные сравнения вклада различных секторов в воздействие загрязняющих веществ в разных странах, регионах и типах станций, что способствует проведению сравнительных исследований и оценок воздействия на здоровье.