Швейцарские ученые создали модель, которая дает прогнозы развития коронавируса в 209 странах. Платформа стала мировым эталоном.
Распространение Covid-19 в мире на 07.01.2021 / renkulab.shinyapps.io
Антуан Флао, директор Института глобального здоровья при университете Женевы (UNIGE) начал собирать данные о распространении Covid-19 в конце января 2020 года: «Я начал писать в Твиттере прогнозы по Covid-19 каждый день. Вначале это касалось от 15 до 20 стран. В феврале рост случаев заболевания в Италии, Иране и Южной Корее резко возрос. Именно тогда со мной связалась коллега из Федеральной политехнической школы Лозанны (EPFL) Кристин Чойрат. Она предложила автоматизировать то, что я делал и распространить информацию по всему миру».
Так родился швейцарский веб-сайт COVID-19 Daily Epidemic Forecasting, который предсказывает эволюцию коронавируса на международном уровне. Но когда пандемия охватила уже 200 стран: «Тогда и начались проблемы с оценкой данных», – говорит эпидемиолог.
Сложности с обработкой данных
Для работы над проектом в феврале 2020 года был сформирована группа из десяти ученых из Федеральных политехнических школ Лозанны и Цюриха (EPFL / EPFZ), Института глобального здравоохранения при Университете Женевы (UNIGE) и Швейцарского центра данных о науке (Swiss Data Science Center).
Пять аналитиков данных работали полный рабочий день, чтобы изучить все математические модели семидневного прогнозирования и найти лучший вариант. Изначально применялась модель «время удвоения», которая хорошо работает для экспоненциального роста, но очень быстро этот способ оказался неудовлетворительным. Время расчета было долгим. Решение было найдено в кантоне Тичино: «Мы смогли использовать суперкомпьютер в Лугано. Он самый большой в Европе. На обработку наших данных ушло всего одиннадцать часов, что сделало результаты очень надежными», – говорит один из разработчиков проекта.
Множество данных
В настоящее время аналитическая платформа предлагает семидневные прогнозы количества ежедневных случаев заболевания и смертей, а также скорости воспроизводства вируса. Карта мира под названием «карта рисков» была интегрирована в июне 2020 года, чтобы выделить страны, наиболее пострадавшие от Covid-19. На данный момент сайт обновляется только каждые две недели, поэтому три члена группы анализа данных продолжают ежедневно публиковать информацию в Твиттере.
«Наш сайт посещают все больше и больше людей и организаций по всему миру, из США, Канады, Европы… , – говорил эпидемиолог, – в Швейцарии сайт тоже начинает получать признание. Некоторые кантональные врачи неофициально запрашивали у нас информацию, а в августе власти Невшатель и Вале обратились к нам с просьбой делать отчеты по кантонам».
Эти прогнозы представляют интерес не только для правительств или органов здравоохранения. Они также ценны для многих компаний, деятельность которых зависит от международных потоков, как, например, для крупных судоходных компаний.
Если тестовые данные были доступны и превышали 10’000 на 1 млн. населения, то проверялось среднее количество семидневных прогнозов для новых случаев на 100 тыс. населения после обновленной даты.
Зелёный: если число было ниже 4,29
Оранжевый: если число было выше 4,29 и кривая эпидемии нисходящая (с R-eff <= 0,90)
Красный: если число было выше 4,29, а кривая эпидемии поднимается или выходит на плато (с R-eff> 0,90)
О Надёжности прогнозов
Скоро на сайте должны появиться данные о вакцинациях. Команда также хотела бы иметь возможность изучать варианты вируса и интегрировать данные о поведении людей для уточнения прогнозов. «Но баз данных по этой информации нет. Следовательно, необходимо провести огромное количество исследований», – сетует Антуан Флао, – эти улучшения позволят нам достичь конечной цели: прогнозировать в долгосрочной перспективе. Задача состоит в том, чтобы иметь возможность планировать за пределами семи дней. Это было бы действительно полезно. Предвидение будущего позволит нам лучше управлять ситуацией. Граждане также хотели бы знать, смогут ли они уехать в отпуск и строить планы на будущее».
Что касается надёжности прогнозов, то трудно определить допустимую погрешность. «Мы можем сказать, что модель достаточно надежна, – считает Антуан Флао, – но следующим шагом будет сравнение фактических данных с прогнозами. Это долгосрочная работа, за которую мы возьмемся, как только ситуация стабилизируется».
Текст: Михаил Гусаров //SA
Источник.
|