Abstract
Со времени первого подозреваемого случая коронавирусной болезни-2019 (COVID-19) 1 декабря 2019 года в Ухане, провинция Хубэй, Китай, до 10 февраля 2020 года в Китае было зарегистрировано 40 235 подтвержденных случаев и 909 случаев смерти, вызывая страх на местном и международном уровне. Здесь, на основе общедоступных эпидемиологических данных по Хубэй, Китай, с 11 января по 10 февраля 2020 года, мы приводим оценки основных эпидемиологических параметров. В частности, мы даем оценку коэффициентов летальности и выздоровления, а также их 90% доверительных интервалов по мере развития вспышки. На основе модели «восприимчиво-инфекционно-выздоровевший» (SIDR) мы приводим оценки основного числа размножения ( R 0 ) и суточной смертности от инфекции и скорость восстановления. Калибруя параметры модели SIRD по представленным данным, мы также пытаемся предсказать развитие вспышки в эпицентре на три недели вперед, то есть до 29 февраля. Как число инфицированных, особенно лиц с бессимптомным или легким течением Предполагается, что он намного превышает официальные цифры, которые можно рассматривать только как подмножество фактических чисел зараженных и выздоровевших в общей популяции. Мы повторили расчеты по второму сценарию, который учитывает в двадцать раз больше число подтвержденных случаев заражения и число выздоровлений в сорок раз больше, а количество смертей не изменилось. На основании представленных данных ожидаемое значение R 0 , рассчитанное с учетом периода с 11 января по 18 января с использованием официального подсчета подтвержденных случаев, составило было установлено, что оно составляет .64,6, в то время как вычисленное по второму сценарию было установлено, что оно составляет .23.2. Таким образом, на основе моделирования SIRD оценочное среднее значение R 0 оказалось равным 2,6 на основе подтвержденных случаев и 2 на основании второго сценария. Наш прогноз предупреждает о разворачивающейся в настоящее время вспышке в Китае. Основываясь на официальном подсчете подтвержденных случаев, моделирование предполагает, что к 29 февраля совокупное число инфицированных может достичь 180 000 (с нижней границей 45 000). Что касается количества смертей, то моделирование прогнозирует, что на основе до Согласно опубликованным 10 февраля данным, число погибших может превысить 2700 (как нижняя граница) к 29 февраля. Наш анализ также показывает значительное снижение коэффициента смертности от заболеваемости с 26 января, которому могут способствовать различные факторы, такие как строгий контроль меры, принятые в Хубэй, Китай (например, карантин и госпитализация инфицированных лиц), но в основном из-за того, что фактическое совокупное число инфицированных и выздоровевших в популяции, скорее всего, намного выше, чем сообщенные. Таким образом, в сценарии, где мы взяли в двадцать раз подтвержденное число зараженных и в сорок раз подтвержденное количество выздоровевших, коэффициент летальности в общей популяции составляет около 0,15%. Важно отметить, что на основе этого сценария моделирование предполагает замедление вспышки в Хубэй в конце февраля.
Образец цитирования: Анастасопулу К., Руссо Л., Цакрис А., Сиеттос С. (2020) Анализ данных, моделирование и прогнозирование вспышки COVID-19. ЗАНИМАЕТСЯ ОДИН 15 (3): e0230405. https://doi.org/10.1371/journal.pone.0230405
Редактор: Срикумар Отумпангат, Центр по контролю и профилактике заболеваний, США
Получено: 11 февраля 2020 г .; Принято: 1 марта 2020 г .; Опубликовано: 31 марта 2020 г.
Авторское право: © 2020 Anastassopoulou et al. Это статья открытого доступа, распространяемая в соответствии с условиями лицензии на атрибуцию Creative Commons , которая разрешает неограниченное использование, распространение и Воспроизведение на любом носителе, при условии указания оригинального автора и источника.
Доступность данных: Данные, использованные в этом документе, были получены из https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6 . В таблице S1 мы приводим данные, которые мы использовали для этого исследования, то есть совокупные подтвержденные случаи выздоровления инфицированных и смертельных случаев с 11 января по 10 февраля.
Финансирование: Авторы не получили конкретного финансирования для этой работы.
Конкурирующие интересы: Авторы заявили, что нет конкурирующих интересов существуют.
Введение
Вспышка «пневмонии неизвестная этиология »в Ухане, провинция Хубэй, Китай, в начале декабря 2019 года разразилась эпидемией, которая опустошает Китай и угрожает достичь пандемического состояния [ 1 ]. Возбудитель вскоре оказался новым бета-коронавирусом, связанным с вирусом ближневосточного респираторного синдрома (MERS-CoV) и вирусом тяжелого острого респираторного синдрома (SARS-CoV). Новая болезнь коронавируса SARS-CoV-2 была названа «COVID-19» Всемирной организацией здравоохранения (ВОЗ), и 30 января директор ВОЗ объявил, что вспышка COVID-19 представляет собой чрезвычайную ситуацию в области общественного здравоохранения, имеющую международное значение. -Генеральный [ 2 ]. Несмотря на то, что 23 января был заблокирован Ухань и приостановлен весь общественный транспорт, полеты и поезда, в общей сложности 40 235 подтвержденных случаев, в том числе 6484 (16,1%) с тяжелыми заболеваниями, и 909 случаев смерти (2,2%) были зарегистрированы в Китае. Национальная комиссия здравоохранения до 10 февраля 2020 года; в то же время за пределами Китая было зарегистрировано 319 случаев и одна смерть в 24 странах [ 3 ].
Происхождение COVID-19 еще не определено хотя предварительные расследования наводят на мысль о зоонозе, возможно, о летучей мыши, происхождения [ 4 , 5 ]. Подобно SARS-CoV и MERS-CoV, новый вирус передается от человека человеку главным образом через дыхательные капли, вызывая такие симптомы, как лихорадка, кашель и одышка после периода, который, как считается, составляет от 2 до 14 дней после заражения, согласно Центрам по контролю и профилактике заболеваний (CDC) [ 1 , 6 , 7 ]. Предварительные данные предполагают, что пожилые мужчины с сопутствующими заболеваниями могут подвергаться более высокому риску тяжелой болезни из-за COVID-19 [ 6 , 8 , 9 ]. Тем не менее, точные вирусологические и эпидемиологические характеристики, включая трансмиссивность и смертность, этого третьего зоонозного коронавируса человека до сих пор неизвестны.
Использование последовательных интервалов (SI) двух других хорошо известные коронавирусные заболевания, MERS и SARS, как приближения к истинно неизвестному SI, Zhao et al. оценили среднее базовое число воспроизведения ( R 0 ) SARS-CoV-2 в диапазоне от 2,24 (95% ДИ: 1,96-2,55) до 3,58 (95% ДИ: 2.89-4.39) на ранней стадии вспышки [ 10 ]. Очень похожие оценки, 2,2 (95% ДИ: 1,4-3,9), были получены для R 0 на ранних стадиях эпидемии с помощью Imai et al. 2,6 (95% ДИ: 1,5-3,5) [ 11 ], а также Ли и др., Который также сообщил удвоение размера каждые 7,4 дня [ 1 ]. Ву и соавт. оценил R 0 в 2,68 (95% ДИ: 2,47–2,86) с удвоением времени каждые 6,4 дня (95% ДИ: 5,8–7,1) и эпидемия росла в геометрической прогрессии во многих крупных китайских городах с отставанием от вспышки в Ухане около 1–2 недель [ 12 ].
Среди такого важного продолжающегося кризиса общественного здравоохранения, который также имеет серьезные экономические последствия мы вернулись к математическому моделированию, которое может пролить свет на важные эпидемиологические параметры, определяющие судьбу эпидемии [ 13 ]. Здесь мы представляем результаты анализа временных рядов эпидемиологических данных, доступных в открытом доступе [ 14 - 16 ] (ВОЗ, CDC, ECDC, NHC и DXY) с 11 января по 10 февраля 2020 г. и попытайтесь сделать трехнедельный прогноз динамики распространения эпидемии коронавируса в эпицентре материкового Китая.
Методология
Наш анализ был основан на общедоступные данные о новых подтвержденных ежедневных случаях, зарегистрированных в провинции Хубэй с 11 января по 10 февраля [ 14 - 16 ]. На основании опубликованных данных мы попытались оценить средние значения основных эпидемиологических параметров, то есть основного числа размножения R 0 , летальности () and case recovery () отношения, а также их 90% доверительные интервалы. Однако, как предполагает [ 17 ], число инфекционных и, следовательно, число выздоровевших людей, вероятно, будет значительно выше. Таким образом, во втором сценарии мы также получили результаты, взяв в двадцать раз больше зарегистрированных случаев для инфекционных и в сорок раз больше для выздоровевших, сохранив при этом число смертей, которое с большей вероятностью будет ближе к настоящий номер. Кроме того, путем калибровки параметров модели SIRD в соответствии с представленными данными мы также предоставляем предварительные прогнозы до 29 февраля.
Основной номер воспроизведения ( R 0 ) является одним из ключевых значений, которые могут предсказать, распространится ли инфекционное заболевание в популяции или вымернет. R 0 представляет собой среднее число вторичных случаев, возникающих в результате введения одного случая заболевания в полностью восприимчивой группе населения в течение периода заражения. На основании представленных данных о подтвержденных случаях мы приводим оценки R 0 с 16 по 20 января, чтобы максимально удовлетворить гипотезу S ≈ N , что является необходимым условием для вычисления R 0 .
Мы также предоставляем оценки летальности() and case recovery ()соотношения за весь период с использованием скользящего окна в один день с 11 января по 16 января для получения самых первых оценок.
Кроме того, мы откалибровали параметры модели SIRD для соответствовать сообщенным данным. Сначала мы дадим приблизительную оценку выздоровления ( β ) и показателей смертности ( γ ) модели SIRD с использованием первого периода вспышки. Затем оценка степени заражения α выполняется путем «обтекания» симулятора SIRD алгоритмом оптимизации для соответствия отчетным данным с 11 января по 10 февраля. Мы начали симуляцию с одним зараженным человеком 16 ноября, которая была предложена в качестве даты начала эпидемии, и запустили модель SIR до 10 февраля. Ниже мы опишем аналитически наш подход.
Давайте начнем с обозначения S ( t ), I ( t ), R ( t ), D ( t ), число восприимчивых, зараженных, выздоровевших и умерших соответственно в момент времени t в популяции с размером N . Для нашего анализа мы предполагаем, что общая численность населения остается постоянной. На основании демографических данных для провинции Хубэй N = 59 м . Таким образом, дискретная модель SIRD гласит: (1) (2) (3) (4)
Вышеуказанная система определяется в дискретные моменты времени t = 1, 2,…, с соответствующим начальным условием в самом начале эпидемии: S (0) = N - 1, I (0) = 1, R (0) = D (0) = 0. Здесь β и γ обозначают «эффективный / очевидный» коэффициент восстановления и смертности в день. Обратите внимание, что эти параметры не соответствуют фактическим показателям ежедневного выздоровления и смертности, так как новые случаи выздоровления и смерти происходят от зараженных случаев несколько дней назад. Тем не менее, можно попытаться дать некоторые грубые оценки «эффективных / очевидных» значений этих эпидемиологических параметров на основе зарегистрированных подтвержденных случаев, используя допущение и подход, описанные в следующем разделе.
Оценка основного числа воспроизведения по модели SIRD
Давайте сначала начнем с оценки из R 0 . Первоначально, когда начинается распространение эпидемии, все население считается уязвимым, т.е. S ≈ N . Исходя из этого предположения, по формулам ( 2 ), ( 3 ) и ( 4 ), основной номер воспроизведения можно оценить с помощью параметров модели SIRD следующим образом: (5)
Let us denote with ΔI(t) = I(t) − I(t − 1), ΔR(t) = R(t) − R(t − 1), ΔD(t) = D(t) − D(t − 1), новые зарегистрированные случаи заражения, выздоровления и смерти в момент t , с C Δ I ( t ), C Δ R ( t ), C Δ D ( т ) совокупное количество подтвержденных случаев за время t . Таким образом: (6) where, X = I, R, D.
Обозначим также через Δ X ( t ) = [Δ X (1), Δ X (2), ⋯, Δ X ( t )] T the Вектор столбца t × 1, содержащий все новые сообщения о случаях до t и C Δ X ( t ) = [ C Δ X (1), C Δ X (2), ⋯, C Δ X ( t )] T , вектор столбца t × 1, содержащий соответствующие кумулятивные числа до времени t . На основе уравнений ( 2 ), ( 3 ) и ( 4 ), можно получить грубую оценку параметров R 0 , β и γ следующим образом.
Начиная с оценки R 0 , отметим, что, поскольку население провинции Хубэй составляет 59 млн. Человек, можно разумно предположить, что для любых практических средств, по крайней мере на начало вспышки, S ≈ N . Делая это предположение, можно затем представить приблизительное значение ожидаемого значения R 0 , используя уравнения ( 5 ), ( 2 ), ( 3 ) и ( 4 ). В частности, подставляя в уравнение (2) термины βI ( t - 1) и γI ( t - 1) с Δ R ( t ) = R ( t ) - R ( t - 1) из уравнения (3) a> и Δ D ( t ) = D ( t ) - D em > ( t - 1) из уравнения (4) и перенесение их в левую часть Уравнение (2) , мы получаем: (7)
Adding Eqs (3) and (4), we get: (8)
Наконец, предполагая, что для любых практических средств в начале распространения это S ( t - 1) ≈ N и деление Уравнение (7) от Eq (8) we get: (9)
Обратите внимание, что можно напрямую использовать Eq (9) для вычисления R 0 с регрессией, без сначала нужно вычислить другие параметры, т.е. β , γ и α .
На этом этапе регрессия может быть сделано либо с использованием различий как таковых, либо с помощью соответствующих кумулятивных функций (вместо разностей для вычисления R 0 с использованием (9) ). Действительно, это легко доказать, суммируя обе части уравнений ( 7 ) и ( 8 ) со временем, а затем разделив их, мы получим следующее эквивалентное выражение для расчетаR0. (10)
Здесь мы использовали уравнение (10) для оценки R 0 для уменьшения включенного шума в отличиях. Обратите внимание, что приведенное выше выражение является действительным приближением только в начале распространения заболевания.
Таким образом, исходя из вышеизложенного, грубая оценка R 0 и соответствующих ей доверительных интервалов может быть обеспечена путем решения задачи линейной регрессии с использованием задачи наименьших квадратов в виде: (11)
Оценка летальности и коэффициентов выздоровления за период с 11 января по 10 февраля
Здесь мы обозначаем как случай смерти и коэффициенты восстановления дела. Для расчета коэффициента летальности было предложено несколько подходов (см., Например, формулу, используемую Национальной комиссией здравоохранения (NHC) Китайской Народной Республики [ 18 ] для оценки коэффициента смертности для COVID-19, а также обсуждения в [ 19 а>]). Здесь мы принимаем тот, который используется также НХК, который определяет коэффициент смертности как долю от общего числа случаев заражения, умирающих от этой болезни.
Таким образом, грубую оценку коэффициентов летальности и выздоровления за исследуемый период можно рассчитать, используя сообщенные совокупные инфицированные, выздоровевшие и умершие, путем решения задачи линейной регрессии, которая для коэффициента летальности читается как: (12)
Accordingly, in an analogy to the above, the case recovery ratio reads: (13)
Поскольку представленные данные представляют собой лишь подмножество фактического числа зараженных и вылеченных случаев, включая бессимптомные и / или легкие, мы повторили приведенные выше расчеты, учитывая, что число зараженных в двадцать раз больше, а число выздоровевших - в сорок раз. численность населения, оставляя число погибших таким же, учитывая, что их каталогизация близка к фактическому количеству смертей вследствие COVID-19.
Оценка «эффективных» параметров модели SIRD
Здесь мы отмечаем, что новые случаи выздоровления и смерти в каждый момент времени, когда t появляются с задержкой по отношению к фактическому числу зараженных случаев. Эта задержка обычно неизвестна, но оценка может быть дана клиническими исследованиями. Тем не менее, можно также попытаться дать грубую оценку этих параметров на основе только сообщенных данных, учитывая первый период вспышки и, в частности, период с 11 января по 16 января, когда появляется число зараженных случаев. быть постоянным. Таким образом, на основе уравнений ( 3 ) и ( 4 ) и выше Предполагается, что «эффективный» коэффициент восстановления в день β и «эффективный» коэффициент смертности в день γ рассчитывались путем решения задач наименьших квадратов (см. уравнения ( 2 ) и (4): (14) and (15)
Как уже отмечалось, эти значения не соответствуют фактическим показателям смертности и выздоровления за день, поскольку они требуют точного знания соответствующих временных задержек. Предоставив оценку вышеупомянутых «эффективных» приблизительных значений параметров β и γ , аппроксимацию «эффективной» частоты заражения α , который не смещен в предположении S = N , может быть получен с помощью симулятора SIRD. В частности, в модели SIRD значения параметров β и γ были установлены равными тем, которые были найдены с использованием представленных данных, решая соответствующие задачи наименьших квадратов, задаваемые уравнениями ( 14 ) и ( 15 ). В качестве начальных условий мы установили одного зараженного 16 ноября и запустили симулятор до последней даты, для которой имеются доступные данные (здесь до 10 февраля). Затем было найдено «оптимальное» значение коэффициента заражения α , которое соответствует отчетным данным, путем «обтекания» симулятора SIRD алгоритмом оптимизации (например, нелинейным решателем наименьших квадратов) для решения проблемы: (16) where где C Δ X SIRD ( t ), ( X = I , R , D ) - это совокупные случаи, возникающие в результате симулятора SIRD в момент времени t em >; w 1 , w 2 , w 3 соответствуют скалярам, служащим в общем случае в качестве весов для соответствующих функций. Для решения указанной выше задачи оптимизации мы использовали функцию «lsqnonlin» из matlab [ 20 ] с использованием алгоритма Левенберга-Марквард .
Results
Как уже говорилось, мы получили результаты с использованием двух разных сценариев (см. В методологии). Для каждого сценария мы сначала представляем результаты для основного числа воспроизведения, а также коэффициенты летальности и восстановления случаев, полученные путем решения задачи наименьших квадратов с использованием скользящего окна с однодневным шагом. Для их расчета мы использовали первые шесть дней, то есть с 11 по 16 января, чтобы получить самые первые оценки. Затем мы приступили к расчетам, добавив один день в скользящее окно, как описано в методологии, до 10 февраля. Мы также сообщаем о соответствующих 90% доверительных интервалах вместо более стандартных 95% из-за небольшого размера данных. Для каждого окна мы также сообщаем соответствующие коэффициенты определения ( R 2 ), представляющие долю дисперсии в зависимой переменной, которая предсказуема из независимых переменных, и среднеквадратическое значение ошибки (RMSE). Оценка R 0 основывалась на данных до 20 января, чтобы максимально удовлетворить гипотезу, лежащую в основе ее вычисления с помощью Уравнение (9) .
Затем, как описано выше, мы предоставляем приблизительные оценки «эффективные» показатели ежедневного восстановления и смертности модели SIRD, основанные на представленных данных, путем решения соответствующих задач наименьших квадратов. Затем была получена оценка степени заражения α путем «обертывания» симулятора SIRD алгоритмом оптимизации, как описано в предыдущем разделе. Наконец, мы предоставляем предварительные прогнозы развития вспышки на основе обоих сценариев до конца февраля..
Сценарий I: Результаты, полученные с использованием точных чисел зарегистрированных подтвержденных случаев
Рис. 1 показывает оценку R 0 для периода с 16 января по 20 января. Используя первые шесть дней с 11-го по январь, результаты - 4,80 80 (90% ДИ: 3,36-6,67); используя данные до 17 января, приводит к 4,60 ((90% ДИ: 3,56-5,65); используя данные до 18 января, результаты ∼ 5,14 (90% ДИ: 4,25–6,03); используя данные до 19 января, результаты ∼ 6,09 (90% ДИ: 5,02-7,16); и используя данные до 20 января, результаты ∼ 7,09 (90% ДИ: 5,84-8,35).
Сплошная линия соответствует среднему значению и пунктирным линиям для нижнего и верхнего 90% доверительных интервалов.
На Рис. 2 показаны приблизительные значения летальности. () and case recovery () отношения за период с 16 января по 10 февраля. Доверительные интервалы также изображены пунктирными линиями. Обратите внимание, что большой разброс в оценочных значениях and следует отнести к небольшому размеру данных и неопределенности данных. Это также отражается в соответствующих доверительных интервалах. По мере того, как учитывается больше данных, этот разброс значительно уменьшается. Таким образом, используя все имеющиеся данные за период с 11 января по 10 февраля, можно рассчитать величину коэффициента летальности. ∼ 2,94% (90% ДИ: 2,9% -3%) и коэффициент восстановления случая 0,05 (ДИ 90%: 0,046-0,055). Интересно отметить, что по мере того, как доступных данных становится все больше, оценочный коэффициент выздоровления значительно возрастает с 31 января (см. Рис. 2).
Сплошные линии соответствуют средним значениям и пунктирные линии для нижнего и верхнего 90% доверительных интервалов.
In Figs 3, 4 and 5, мы показываем коэффициенты определения ( R 2 ) и корень среднеквадратичных ошибок ( RMSE ) для , and , respectively.
Расчетные приблизительные значения «эффективной» суточной смертности и коэффициентов выздоровления для модели SIRD составили γ ∼ 0,01 и β ≤0,064 (что соответствует периоду восстановления ∼ 15 г). Обратите внимание, что из-за чрезвычайно малого числа используемых данных доверительные интервалы не учитываются. Вместо этого для наших расчетов мы рассмотрели интервалы в 20% вокруг ожидаемых решений методом наименьших квадратов. Следовательно, для γ мы взяли интервал (0,008 и 0,012), а для β мы взяли интервал между (0,05 и 0,077), соответствующий периодам восстановления от 13 до 20 дней. Как описано в методологии, мы также использовали симулятор SIRD для оценки «эффективной» степени заражения α путем оптимизации с помощью w 1 sub > = 1, w 2 = 2, w 3 = 2. Таким образом, мы выполнили моделирование, установив β = 0,064 и γ = 0,01, и в качестве начальных условий один зараженный, выздоровевший ноль и ноль погибших 16 ноября 2019 года, и работал до 10 февраля. Оптимальное по отношению к зарегистрированным подтвержденным случаям с 11 января по 10 февраля значение показателя инфицирования ( α ) составило 0,191 (ДИ 90%: 0,19-0,192). Это соответствует среднему значению основного числа воспроизведения . Обратите внимание, что это значение ниже по сравнению со значением, которое было оценено с использованием исключительно сообщенных данных.
Наконец, используя производные значения По параметрам α , β , γ мы проводили симуляции до конца февраля. Результаты моделирования приведены на рис. 6 , 7 и 8 . Сплошные линии изображают эволюцию, при использовании ожидаемых (средних) оценок, а пунктирные линии иллюстрируют соответствующие нижнюю и верхнюю границы, рассчитанные в пределах доверительных интервалов оценочных параметров..
Точки соответствуют количеству подтвержденных случаев с 16 января по 10 февраля. Первоначальной датой моделирования было 16 ноября с одним зараженным, ноль выздоровел и ноль смертей. Сплошные линии соответствуют динамике, полученной с использованием предполагаемых ожидаемых значений эпидемиологических параметров α = 0,191, β = 0,064 d −1 , γ = 0,01; пунктирные линии соответствуют нижней и верхней границам, полученным в результате моделирования на границах доверительных интервалов параметров.
Точки соответствуют количеству подтвержденных случаев с 16 января по 10 февраля. Первоначальной датой моделирования было 16 ноября с одним зараженным, ноль выздоровел и ноль смертей. Сплошные линии соответствуют динамике, полученной с использованием предполагаемых ожидаемых значений эпидемиологических параметров α = 0,191, β = 0,064 d −1 , γ = 0,01; пунктирные линии соответствуют нижней и верхней границам, полученным путем моделирования на границах доверительных интервалов параметров.
Точки соответствуют количеству подтвержденных случаев с 16 января по 10 февраля. Первоначальной датой моделирования было 16 ноября с одним зараженным, ноль выздоровел и ноль смертей. Сплошные линии соответствуют динамике, полученной с использованием предполагаемых ожидаемых значений эпидемиологических параметров α = 0,191, β = 0,064 d −1 , γ = 0,01; пунктирные линии соответствуют нижней и верхней границам, полученным в результате моделирования на границах доверительных интервалов параметров.
Как показано на рисунках 6 и 7 предполагают, что прогноз вспышки в конце февраля по модели SIRD характеризуется высокой неопределенностью. В частности, моделирование приводит к ожидаемому количеству 180 000 инфицированных случаев, но с большим разбросом: нижняя граница составляет 45 000 инфицированных случаев, а верхняя граница составляет 760 000 случаев. Аналогично для выздоровевшей популяции моделирование приводит к ожидаемому количеству в 60 000 фунтов стерлингов, в то время как нижняя и верхняя границы составляют соответственно 22 000 фунтов стерлингов и 170 000 фунтов стерлингов. Наконец, что касается смертей, в результате моделирования среднее число составляет 9000 фунтов стерлингов, нижняя и верхняя границы - 2700 фунтов стерлингов и 34000 фунтов стерлингов соответственно.
Таким образом, ожидаемые тенденции Моделирование предполагает, что уровень смертности ниже, чем предполагаемый с текущими данными, и, таким образом, ожидается, что число погибших будет значительно меньше по сравнению с ожидаемыми тенденциями прогнозов.
После пересмотра этого документа число погибших на 22 февраля составило 2344, в то время как прогнозируемое число прогнозов составило 4300 фунтов стерлингов с нижней границей 1300 фунтов стерлингов. Что касается числа зараженных и выздоровевших к 20 февраля, совокупное число подтвержденных зарегистрированных случаев было 64 084 инфицированными и 15 299 вылеченными, в то время как ожидаемые тенденции прогнозов составляли 83 000 фунтов стерлингов для инфицированных и 28 000 фунтов стерлингов для выздоровевших случаев. Следовательно, основываясь на этой оценке, развитие эпидемии было в рамках нашего прогноза.
Сценарий II. Результаты, полученные на основании взятия в двадцать раз числа зараженных и в сорок раз числа выздоровевших по сравнению с подтвержденными случаями
Для наших иллюстраций мы предположили, что число зараженных в двадцать раз превышает число подтвержденных зараженных и в сорок раз превышает число подтвержденных выздоровевших людей. Исходя из этого сценария, Рис. 9 показывает оценку R 0 для периода 16 января - 20 января. Использование первых шести дней с 11 января по 16 января, результаты в 3,2 (90% ДИ: 2,4-4,0); используя данные до 17 января, результаты в 3,1 (90% ДИ: 2,5-3,7); используя данные до 18 января, результаты в 3,4 (90% ДИ: 2,9-3,9); используя данные до 19 января, результаты в 3,9 (90% ДИ: 3,3-4,5) и использование данных до 20 января, результаты в 4,5 (90% ДИ: 3,8-5,3).
Интересно отметить, что приведенная выше оценка R 0 достаточно близка к той, о которой сообщалось в других исследованиях (обзор см. Во введении).
Рис. 10 показывает приблизительные значения летальности() and case recovery (отношения за период с 16 января по 10 февраля. Доверительные интервалы также изображены пунктирными линиями. Обратите внимание, что большой разброс в оценочных значениях and следует отнести к небольшому размеру данных и неопределенности данных. Это также отражается в соответствующих доверительных интервалах. По мере того, как учитывается больше данных, этот разброс значительно уменьшается. Таким образом, используя все (масштабированные) данные за период с 11 января по 10 февраля, оценивается значение коэффициента летальности теперь падает до 0,147% (90% ДИ: 0,144% -0,15%), в то время как коэффициент восстановления случая составляет is 0,1 (90% ДИ: 0,091-0,11). Интересно также отметить, что по мере того, как доступных данных становится больше, оценочный коэффициент восстановления случаев несколько увеличивается (см. Рис. 10 ), в то время как коэффициент летальности ( в общей численности населения), по-видимому, стабилизируется на уровне 0,15%.
Сплошные линии соответствуют средним значениям и пунктирным линиям для нижнего и верхнего 90% доверительных интервалов.
In Figs 11, 12 and 13,мы показываем коэффициенты детерминации ( R 2 ) и корень среднеквадратических ошибок ( RMSE ) для , and , respectively.
Рассчитанные значения «эффективной» суточной смертности и коэффициентов выздоровления для модели SIRD составили γ ∼ 0,0005 и β ∼0,16 d -1 (соответствует периоду восстановления of 6 дней). Обратите внимание, что из-за чрезвычайно малого числа используемых данных доверительные интервалы не учитываются. Вместо этого для расчета соответствующих нижних и верхних границ в наших моделях мы взяли интервалы 20% вокруг ожидаемых решений наименьших квадратов. Следовательно, для γ мы взяли интервал (0,0004 и 0,0006), а для β мы взяли интервал между (0,13 и 0,19), соответствующий интервалу периодов восстановления. от 5 до 8 дней.
Опять же, мы использовали симулятор SIRD обеспечить оценку уровня заражения с помощью параметра оптимизации w 1 = 1, w 2 = 400, w 3 = 1, чтобы сбалансировать остаточные количества смертей с масштабированным числом зараженных и выздоровевших. Таким образом, чтобы найти оптимальную скорость передачи инфекции, мы использовали моделирование SIRD с β = 0,16 d -1 и γ = 0,0005, и в качестве начальных условий один зараженный, вылеченный ноль, ноль смертей 16 ноября 2019 года и действующий до 10 февраля.
Оптимальный по отношению к сообщенные подтвержденные случаи с 11 января по 10 февраля, значение инфицированного ( α ) было найдено равным 0,319 (90% ДИ: 0,318-0,32). Это соответствует среднему значению основного числа воспроизведения .
Наконец, используя производные значения параметров α , β , γ , мы запустили симулятор SIRD до конца февраля. Результаты моделирования приведены на рис. 14, 15 и 16 . Сплошные линии изображают эволюцию, при использовании ожидаемых (средних) оценок, а пунктирные линии иллюстрируют соответствующие нижнюю и верхнюю границы, рассчитанные в пределах доверительных интервалов оценочных параметров.
Точки соответствуют количеству подтвержденных случаев с 16 января по 10 февраля. Первоначальной датой моделирования было 16 ноября с одним зараженным, ноль выздоровел и ноль смертей. Сплошные линии соответствуют динамике, полученной с использованием предполагаемых ожидаемых значений эпидемиологических параметров α = 0,319, β = 0,16 d −1 , γ = 0,0005; пунктирные линии соответствуют нижней и верхней границам, полученным путем моделирования на границах доверительных интервалов параметров.
Точки соответствуют количеству подтвержденных случаев с 16 января по 10 февраля. Первоначальной датой моделирования было 16 ноября с одним зараженным, ноль выздоровел и ноль смертей. Сплошные линии соответствуют динамике, полученной с использованием предполагаемых ожидаемых значений эпидемиологических параметров α = 0,319, β = 0,16 d −1 , γ = 0,0005; пунктирные линии соответствуют нижней и верхней границам, полученным в результате моделирования на границах доверительных интервалов параметров.
Точки соответствуют количеству подтвержденных случаев с 16 ноября по 10 февраля , Первоначальной датой моделирования было 16 ноября с нулевым числом зараженных, нулевым выздоровлением и нулевым смертельным исходом. Сплошные линии соответствуют динамике, полученной с использованием предполагаемых ожидаемых значений эпидемиологических параметров α = 0,319, β = 0,16 d −1 , γ = 0,0005; пунктирные линии соответствуют нижней и верхней границам, полученным в результате моделирования на границах доверительных интервалов параметров.
Опять как на рис. 15 и 16 предполагают, что прогноз вспышки в конце февраля с помощью модели SIRD характеризуется высокой неопределенностью. В частности, в сценарии II к 29 февраля моделирование приводит к ожидаемому фактическому количеству зараженных случаев m8 млн. (Что соответствует %13% от общей численности населения) с нижней границей в 20720,000 и верхней границей в m37м случаев , Аналогичным образом, для выздоровевшей популяции моделирование приводит к ожидаемому фактическому количеству приблизительно 4,5 млн. Фунтов стерлингов (что соответствует 8% от общей численности населения), тогда как нижняя и верхняя границы составляют соответственно 430 000 и 23 млн. Фунтов стерлингов. Наконец, что касается смертельных случаев, в результате моделирования по этому сценарию среднее число составляет 14 000 фунтов стерлингов, а нижняя и верхняя границы составляют 900 фунтов стерлингов и 100 000 фунтов стерлингов.
Важно, что в этом сценарии результаты моделирования, показанные на Рис. 14 , свидетельствуют о снижении уровня вспышки в конце февраля. Таблица 1 суммирует приведенные выше результаты для обоих сценариев.
Мы отмечаем, что результаты, полученные в сценарии II, по-видимому, предсказывают замедление вспышки в Хубэй после конца февраля.
Обсуждение
Мы предложили методологию для оценка основных эпидемиологических параметров, а также моделирование и прогнозирование распространения эпидемии COVID-19 в Хубэй, Китай, с использованием общедоступных данных с 11 января 2020 года по 10 февраля 2020 года.
К моменту принятия нашей статьи, согласно по официальным данным, опубликованным 29 февраля, совокупное число подтвержденных случаев заражения в Хубэй составило 67 000 фунтов стерлингов, число выздоровевших - 31 300 фунтов стерлингов, а число погибших - 28 800 фунтов стерлингов. Эти цифры находятся в пределах нижних границ и ожидаемых тенденций наших прогнозов от 10 февраля, которые основаны на сценарии I. Важно, предполагая 20-кратное масштабирование подтвержденного совокупного числа зараженных случаев и 40-кратное масштабирование По подтвержденному количеству выздоровевших в общей численности населения, прогнозы показывают снижение вспышки в Хубэй в конце февраля. Исходя из этого сценария, показатель летальности в общей популяции составляет порядка 0,15%.
На данный момент мы должны отметить, что наш подход к моделированию SIRD не приняли во внимание многие факторы, которые играют важную роль в динамике заболевания, такие как влияние инкубационного периода на динамику передачи, гетерогенная контактная сеть передачи, влияние мер, уже принятых для борьбы с эпидемией, характеристики населения (например, влияние возраста, людей, у которых уже были проблемы со здоровьем). Также оценка параметров модели основана на предположении, учитывающем только первый период, в котором были подтверждены и зарегистрированы первые случаи. Следует отметить, что COVID-19, который, как считается, в основном передается от человека человеку через дыхательные капельки и фомиты, не исключая возможности фекально-орального пути [ 21 ] распространялся, по крайней мере, более чем на полтора месяца до наложенного запрета и карантина в Ухане 23 января, заразив таким образом неизвестное количество людей. Число бессимптомных и легких случаев с субклиническими проявлениями, которые, вероятно, не были представлены больницам для лечения, может быть значительным; эти случаи, которые, возможно, представляют основную часть инфекций COVID-19, остаются нераспознанными, особенно в сезон гриппа [ 22 ] , Это весьма вероятное грубое недостаточное выявление и занижение данных о легких или бессимптомных случаях неизбежно выбрасывает из контекста расчеты тяжелых заболеваний и показатели смертности, искажая эпидемиологическую реальность.
Еще один важный фактор, который следует учитывать, относится к диагностические критерии, используемые для определения статуса инфекции и подтверждения случаев. Положительный тест ПЦР должен был считаться подтвержденным случаем китайской программы диагностики и лечения новой коронавирусной пневмонии на ранней стадии вспышки [ 14 ]. Однако чувствительность тестирования нуклеиновых кислот на этот новый вирусный патоген может составлять только 30-50%, что часто приводит к ложным негативам, особенно на ранних стадиях заболевания. Чтобы усложнить ситуацию, руководство изменилось в недавно выпущенном четвертом издании программы 6 февраля, чтобы позволить диагноз, основанный на клинических проявлениях, но только в провинции Хубэй [ 14 ].
Быстро развивающаяся эпидемия, похоже, подавляющая даже для высокоэффективная китайская логистика, которая в рекордные сроки построила две новые больницы для лечения инфицированных пациентов. Поддерживающий уход с экстракорпоральной мембранной оксигенацией (ЭКМО) в отделениях интенсивной терапии (ОИТ) имеет решающее значение для тяжелых респираторных заболеваний. Крупномасштабные возможности для такого уровня медицинской помощи в провинции Хубэй, или в других странах мира в этом отношении, среди этой чрезвычайной ситуации в области общественного здравоохранения могут оказаться особенно сложными. Мы надеемся, что результаты нашего анализа внесут вклад в выяснение критических аспектов этой вспышки, чтобы как можно скорее локализовать новый коронавирус и смягчить его воздействие на региональном, материковом и международном уровнях.
Заключение
В цифровом и глобализированном мире На сегодняшний день новые данные и информация о новом коронавирусе и развитии вспышки становятся доступными беспрецедентными темпами. Тем не менее, важные вопросы остаются без ответа, и точные ответы для прогнозирования динамики вспышки просто не могут быть получены на данном этапе. Мы категорически подчеркиваем неопределенность имеющихся официальных данных, в частности, касающихся истинного базового числа инфицированных (случаев), которые могут привести к неоднозначным результатам и неточным прогнозам на порядки, как также указывали другие исследователи. [1, 17, 22].
Вспомогательная информация
S1 Таблица. Сообщается о совокупном количестве случаев заболевания в регионе Хубэй, Китай, за период с 11 января по 10 февраля.
https://doi.org/10.1371/journal.pone.0230405.s001
(PDF)
Ссылки
- 1.
Ли Кью, Гуан Х, У Пи и др. Динамика ранней передачи в Ухане, Китай, новой пневмонии, инфицированной коронавирусом; 2020. Доступно по адресу: https://doi.org/10.1088%2F0951-7715%2F16%2F2%2F308 .
- 2.
Organization WH. Заявление ВОЗ в отношении группы случаев пневмонии в Ухане, Китай; 2020. Доступно по адресу: https://www.who.int/china/news/detail/09-01-2020-who-statement-regarding-cluster-of-pneumonia-cases-in-wuhan-china .
- 3.
Organization WH. Новый коронавирус (2019-нКоВ). Ситуационный отчет 21. Женева, Швейцария: Всемирная организация здравоохранения; 2020; 2020. Доступно по адресу: https: / /www.who.int/docs/default-source/coronaviruse/situation-reports/20200210-sitrep-21-ncov.pdf?sfvrsn=947679ef_2 .
- 4. Лу Р, Чжао Х, Ли Дж, Ниу П, Ян Б, Ву Х и др. Геномная характеристика и эпидемиология нового коронавируса 2019 года: значение для происхождения вируса и связывания рецептора. Ланцет. 2020.
- 5. Чжоу П., Ян XL, Ван XG, Ху Б., Чжан Л., Чжан В. и др. Вспышка пневмонии, связанная с новым коронавирусом вероятного происхождения летучих мышей. Природа. 2020.
- 6. Чен Н, Чжоу М, Донг Х, Цюй Дж, Гун Ф, Хань Й и др. Эпидемиологические и клинические характеристики 99 случаев новой коронавирусной пневмонии 2019 года в Ухане, Китай: описательное исследование. Ланцет. 2020.
- 7. Патель А, Джерниган Д., Команда реагирования CDC nCoV. Первоначальные ответные меры общественного здравоохранения и временное клиническое руководство для новой вспышки коронавируса в 2019 г. - США, 31 декабря 2019 г. - 4 февраля 2020 г. MMWR Morb Mortal Wkly Rep. 2020.
- 8. Хунаг С, Ван Й, Ли Х и др. Клинические особенности пациентов, инфицированных новым коронавирусом 2019 года в Ухане, Китай. Lancet. 2020.
- 9. Ван Д, Ху Б, Ху С, Чжу Ф, Лю Х, Чжан Дж и др. Клинические характеристики 138 госпитализированных пациентов с новой коронавирусной пневмонией 2019 года в Ухане, Китай. JAMA. 2020.
- 10. Чжао С., Лин Q, Ран Дж, Муса С.С., Ян Дж, Ван В. и др. Предварительная оценка основного числа размножения нового коронавируса (2019-нКоВ) в Китае с 2019 по 2020 год: анализ данных на ранней стадии вспышки. Int J Infect Dis. 2020.
- 11. Imai N, Cori A, Dorigatti I, et al. Отчет 3: Передача 2019-нКоВ. Int J Infect Dis. 2019.
- 12. У JT, Leung K, Leung GM. Прогнозирование и прогнозирование потенциального внутреннего и международного распространения вспышки 2019-нКоВ в Ухане, Китай: модельное исследование. Ланцет. 2020.
- 13. Сиеттос С.И., Руссо Л. Математическое моделирование динамики инфекционных заболеваний. Вирулентности. 2013; 4 (4): 295-306. pmid: 23552814
- 14.
Центр безопасности здоровья Джона Хопкинса. Ежедневные новости о появлении нового коронавируса от Центра здравоохранения Джона Хопкинса. 9 февраля 2020 г .; 2020. Доступно по адресу: https: // hub.jhu.edu/2020/01/23/coronavirus-outbreak-mapping-tool-649-em1-art1-dtd-health/ .
- 15.
Центр безопасности здравоохранения имени Джона Хопкинса. Глобальные случаи коронавируса COVID-19 Джонс Хопкинс CSSE; 2020. Доступно: index.html # / bda7594740fd40299423467b48e9ecf6 .
- 16. Dong E, Du H, Gardner L. Интерактивная веб-панель для отслеживания COVID-19 в режиме реального времени. Инфекционные заболевания ланцета. 2020; https://doi.org/10.1016/S1473-3099(20)30120-1 . pmid: 32087114
- 17. Ву П, Хао Х, Лау ЭХИ, Вонг Дж., Леунг К.С., Ву Дж. Т. и др. Предварительная оценка в реальном времени эпидемиологических характеристик новых коронавирусных инфекций в Ухане, Китай, по состоянию на 22 января 2020 года. Евро наблюдение. 2020; 25 (3). pmid: 31992388
- 18.
NHC. Пресс-конференция NHS, 4 февраля 2020 г. - Национальная комиссия здравоохранения (НХК) Китайской Народной Республики; 2020.
- 19. Ghani AC, Donnelly CA, Cox DR, Griffin JT, Fraser C, Lam TH, et al. Методы оценки коэффициента летальности для нового, появляющегося инфекционного заболевания. Американский журнал эпидемиологии. 2005; 162 (5): 479-486. pmid: 16076827
- 20.
MATLAB R2018b; 2018.
- 21.
Гейл Дж. Коронавирус может передаваться по фекально-оральному маршруту, сообщает Синьхуа ; 2020. Доступно по адресу: https : //www.bloomberg.com/news/articles/2020-02-02/coronavirus-may-transmit-along-fecal-oral-route-xinhua-reports .
- 22. Баттегай М, Куель Р., Чудин-Саттер С., Хирш Х.Х., Видмер А.Ф., Нехер Р.А.. Коронавирус 2019 года (2019-нКоВ): оценка уровня летальности - слово предостережения. Швейцарский медицинский еженедельник. 2020.