📊 Исследование заболеваемости COVID-19 в Беларуси по данным из опроса для пациентов

📊 Исследование заболеваемости COVID-19 в Беларуси по данным из опроса для пациентов

📢 Рупар COVIDa

📃 Оглавление:

Введение
Цель исследования

Основная часть

Технические детали анализа

Выводы

Сравнение с данными МЗ РБ
👁‍🗨 Просмотреть интерактивные графики

Введение

23 ноября 2020 г. мы, команда «Рупар COVIDa», запустили свой первый опрос для пациентов, в котором жителям Беларуси предлагается ответить на несколько вопросов о заболевании коронавирусом.

Несколько месяцев мы собирали данные и продолжаем это делать сейчас. Мы делились с вами промежуточными отчетами опросов, когда активность населения была высокой.
Параллельно мы занимались анализом поступающих от Вас данных и сейчас хотим представить результаты исследования.


🎯 Цель исследования

Основная цель приведенных графиков – продемонстрировать временную динамику заболеваемости.

Полученные нами данные представлены в условных единицах и не могут быть пересчитаны в абсолютные значения заболеваемости по стране. Это связано с большей заинтересованностью в прохождении опроса у людей, болеющих ковидом, по сравнению со здоровыми людьми.

С целью дальнейшего сбора информации о динамике эпидемии (в том числе – для своевременного информирования о начале третьей волны в случае ее возникновения) нами были запущены боты в Telegram и Viber.
Предлагаем всем желающим пройти опрос удобным для Вас способом.


📈 Основная часть

Для исследования были взяты данные о случаях заражения вирусом SARS-CoV-2, полученные с конца ноября 2020 г. по конец января 2021 г.

Опрошенные делятся на три категории:

  • здоров
  • имеет подтвержденный диагноз «ковид»
    (пользователями прилагался подтверждающий документ)
  • предположительно болеет ковидом без подтвержденного диагноза


График 1. Диагностированные случаи

График отражает динамику заболеваемости среди опрошенных людей в зависимости от даты прохождения опроса.
Закрашенная область вокруг графика – 95%-й доверительный интервал.

На Графике 1 приведена временная динамика доли опрошенных, имеющих подтвержденный диагноз, в зависимости от даты прохождения опроса.

95% опрошенных проходили опрос в течение двух недель с момента постановки диагноза, 75% опрошенных – в течение одной недели.

С целью более наглядного представления исходная динамика была сглажена с двухнедельным временным окном (т. е. каждая точка на графике характеризует данные, полученные за неделю до и за неделю после соответствующей даты).


График 2. Подтвержденные и неподтвержденные случаи

График отражает динамику заболеваемости среди опрошенных людей в зависимости от даты прохождения опроса.
Закрашенная область вокруг графика – 95%-й доверительный интервал.

На Графике 2 аналогичным образом изображена динамика доли опрошенных с подтвержденным, либо предполагаемым диагнозом.

Закрашенная область вокруг графиков обозначает 95-процентный доверительный интервал: при той же эпидемиологической картине и тех же условиях сбора данных, но на другой гипотетической выборке опрошенных, полученная кривая будет лежать внутри данной области с вероятностью 95%.

Расширение доверительного интервала в правой части связано с постепенным снижением популярности опроса со временем.


⚙️ Технические детали анализа

По имеющимся данным делался проход скользящим окном длиной в 2 недели, с шагом в 1 день. Для каждого окна проводился описанный ниже анализ.

Для оценки средней заболеваемости в данном двухнедельном окне и построения соответствующих доверительных интервалов применялся метод бутстрэпинга.

Из всех записей, относящихся к данному окну, случайным образом генерировалось 1000 суррогатных выборок (с повторами);
размер каждой выборки был равен исходному количеству записей.
Для каждой суррогатной выборки проводилась описанная ниже процедура.

Для каждого дня и для каждой из шести областей Беларуси вычислялась доля опрошенных (по данной суррогатной выборке), болеющих ковидом (заболеваемость).

Проводилось два независимых анализа:

  1. анализ с учетом только официально подтвержденных диагнозов
  2. анализ с учетом официально подтвержденных и предполагаемых (на основе симптомов) диагнозов.

Значения заболеваемости усреднялись по дням, для каждого региона в отдельности. Затем полученные значения суммировались по регионам с весами, пропорциональными населению соответствующих регионов. Результатом являлось значение заболеваемости для данной суррогатной выборки.

В результате обработки 1000 суррогатных выборок формировалось суррогатное распределение значений заболеваемости.

В качестве оценки заболеваемости (среди опрошенных людей) для данного двухнедельного окна принималась медиана полученного суррогатного распределения.

В качестве границ доверительного интервала принимались двусторонние квантили уровня 0.05 суррогатного распределения.

Главное предположение, при котором полученная нами динамика отражает реальное развитие эпидемии, заключается в том, что уровни заинтересованности болеющих и здоровых людей в прохождении опроса находятся в постоянном соотношении на протяжении всего времени исследования.


📑 Выводы

На графиках видно, что с конца ноября заболеваемость медленно увеличивалась как по данным с подтвержденным диагнозом, так и по общим данным (подтвержденные и предполагаемые случаи заражения).

Пик заболеваемости приходится на конец декабря 2020 года и начало января 2021 года.

В течение января наблюдается заметное снижение заболеваемости.

По этим данным мы можем сделать вывод, что вторая волна идет на спад, но динамика спада сравнительно медленная (заболеваемость на конец января примерно на 20% меньше декабрьской).

Поэтому меры предосторожности соблюдать необходимо и сейчас.


📉 Сравнение с данными МЗ РБ

График 3. Данные МЗ РБ по новым случаям заболевания

Источник данных: официальный телеграм канал Минздрава

По данным Минздрава сложно судить, достигла ли вторая волна пика в исследуемый период времени и идет ли она на спад.

Но если расширить диапазон на период с августа прошлого года по текущий момент, то можно увидеть что вторая волна идет на спад, а пик заболеваемости пришелся на вторую половину декабря - начало января (что отображается ниже на Графике 4).


График 4. Данные МЗ РБ по новым случаям заболевания с августа 2020 года по текущий момент

Источник данных: официальный телеграм канал Минздрава

При сравнении нашего графика с данными Минздрава, можно сделать вывод, что собранные нами данные (за временной период, лежащий в пределах красной области), приходятся на плато заболевания и начало спада волны.

На графике период, в котором подводилось наше исследование выделен красной зоной, а красные точки обозначают даты начала и конца исследования.

При сравнении графиков нужно учитывать потенциально разные задержки по поступлению данных.
Наши данные имеют задержку от получения человеком соответствующего диагноза до даты прохождения им опроса.
Данные Минздрава - от обнаружения диагноза до попадания этих результатов в отдел, который занимается изучением статистики и предоставляет данные населению. 



💻 Сайт: covid.speakerby.info

📺 Channel: @covidspeakerby

👤 Info Bot: @covidspeakerby_info_bot

✉️ email: covidspeakerby@gmail.com

👉 Instagram: @covid.speakerby

👉 Twitter: @covidspeakerby

👉 Facebook: @speakerby

👉 ВК: @covidspeakerby

👉 ОК: @covidspeakerby

Report Page