Вирусная филодинамика — это изучение того, как эпидемиологические , иммунологические и эволюционные процессы действуют и потенциально взаимодействуют, формируя вирусные филогении . [1] С тех пор как этот термин был введен в 2004 году, исследования вирусной филодинамики были сосредоточены на динамике передачи в попытке пролить свет на то, как эта динамика влияет на вирусную генетическую изменчивость. Динамику передачи можно рассматривать на уровне клеток внутри инфицированного хозяина, отдельных хозяев внутри популяции или целых популяций хозяев.
Многие вирусы, особенно РНК-вирусы , быстро накапливают генетическую изменчивость из-за короткого времени генерации и высокой скорости мутаций . Таким образом, закономерности вирусной генетической изменчивости в значительной степени зависят от того, как быстро происходит передача и какими субъектами она передается друг другу. На закономерности вирусной генетической изменчивости также будет влиять отбор , действующий на вирусные фенотипы. Хотя вирусы могут различаться по многим фенотипам, филодинамические исследования до настоящего времени, как правило, были сосредоточены на ограниченном числе вирусных фенотипов. К ним относятся фенотипы вирулентности, фенотипы, связанные с вирусной трансмиссивностью, фенотипы клеточного или тканевого тропизма и антигенные фенотипы, которые могут способствовать уходу от иммунитета хозяина . Из-за влияния, которое динамика передачи и отбор могут оказывать на вирусную генетическую изменчивость, вирусные филогении могут поэтому использоваться для исследования важных эпидемиологических, иммунологических и эволюционных процессов, таких как эпидемическое распространение , [2] пространственно-временная динамика, включая динамику метапопуляции , [3] зоонозная передача , тканевой тропизм , [4] и антигенный дрейф . [5] Количественное исследование этих процессов посредством рассмотрения вирусных филогений является центральной целью вирусной филодинамики.
Вводя термин «филодинамика» , Гренфелл и соавторы [1] постулировали, что вирусные филогении «... определяются комбинацией иммунного отбора, изменений в размере вирусной популяции и пространственной динамики». Их исследование продемонстрировало три особенности вирусных филогений, которые могут служить практическими правилами для определения важных эпидемиологических, иммунологических и эволюционных процессов, влияющих на закономерности вирусной генетической изменчивости.
Хотя эти три филогенетических признака являются полезными эмпирическими правилами для идентификации эпидемиологических, иммунологических и эволюционных процессов, которые могут влиять на вирусную генетическую изменчивость, растет понимание того, что сопоставление между процессом и филогенетической моделью может быть много-к-одному. Например, хотя лестничные деревья могут отражать наличие направленного отбора, лестничные деревья могут также отражать последовательные генетические узкие места, которые могут возникать при быстром пространственном распространении, как в случае вируса бешенства. [7] Из-за этого много-к-одному сопоставления между процессом и филогенетической моделью исследования в области вирусной филодинамики стремились разработать и применить количественные методы для эффективного вывода процесса из реконструированных вирусных филогений (см. Методы). Рассмотрение других источников данных (например, моделей заболеваемости) может помочь в различении конкурирующих филодинамических гипотез. Объединение разнородных источников данных для филодинамического анализа остается серьезной проблемой в этой области и является активной областью исследований.
Филодинамические модели могут помочь в датировании эпидемий и пандемий. Быстрая скорость эволюции вирусов позволяет оценить модели молекулярных часов из генетических последовательностей, тем самым обеспечивая годовую скорость эволюции вируса. При скорости эволюции, измеренной в реальных единицах времени, можно вывести дату самого последнего общего предка (MRCA) для набора вирусных последовательностей. Возраст MRCA этих изолятов является нижней границей; общий предок всей популяции вируса должен был существовать раньше, чем MRCA образца вируса. В апреле 2009 года генетический анализ 11 последовательностей гриппа H1N1 свиного происхождения показал, что общий предок существовал 12 января 2009 года или ранее. [8] Это открытие помогло сделать раннюю оценку основного числа воспроизводства пандемии. Аналогичным образом, генетический анализ последовательностей, изолированных от индивидуума, может быть использован для определения времени инфицирования индивидуума. [9]
Филодинамические модели могут дать представление об эпидемиологических параметрах, которые трудно оценить с помощью традиционных средств наблюдения. Например, оценка на основе данных наблюдения требует тщательного контроля за изменением частоты сообщений и интенсивности наблюдения. Вывод демографической истории популяции вируса из генетических данных может помочь избежать этих трудностей и может предоставить отдельный путь для вывода . [2] Такие подходы использовались для оценки вируса гепатита С [10] и ВИЧ. [2] Кроме того, дифференциальную передачу между группами, будь то географическую, возрастную или связанную с риском, очень трудно оценить только на основе данных наблюдения. Филогеографические модели имеют возможность более непосредственного выявления этих в противном случае скрытых моделей передачи. [11] Филодинамические подходы картировали географическое перемещение вируса человеческого гриппа [3] и количественно оценили эпидемическое распространение вируса бешенства у североамериканских енотов. [12] [13] Однако нерепрезентативная выборка может исказить выводы как [14] , так и моделей миграции. [3] Филодинамические подходы также использовались для лучшего понимания динамики передачи вируса и распространения внутри инфицированных хозяев. Например, филодинамические исследования использовались для того, чтобы сделать вывод о скорости роста вируса внутри инфицированных хозяев и доказать наличие вирусной компартментализации при инфекции гепатита С. [4]
Филодинамические подходы также могут быть полезны для определения эффективности усилий по контролю вирусов, особенно для заболеваний с низкими показателями регистрации. Например, генетическое разнообразие вируса гепатита B на основе ДНК снизилось в Нидерландах в конце 1990-х годов после начала программы вакцинации. [15] Эта корреляция использовалась для доказательства того, что вакцинация эффективна в снижении распространенности инфекции, хотя возможны и альтернативные объяснения. [16]
Усилия по контролю вирусов также могут влиять на скорость, с которой эволюционируют популяции вирусов, тем самым влияя на филогенетические паттерны. Филодинамические подходы, которые количественно определяют, как эволюционные скорости меняются с течением времени, могут, таким образом, дать представление об эффективности стратегий контроля. Например, применение к последовательностям ВИЧ внутри инфицированных хозяев показало, что скорость вирусной замены снизилась практически до нуля после начала антиретровирусной лекарственной терапии. [17] Это снижение скорости замены было интерпретировано как эффективное прекращение репликации вируса после начала лечения и, как ожидается, приведет к снижению вирусной нагрузки. Это открытие особенно обнадеживает, поскольку более низкие скорости замены связаны с более медленным прогрессированием СПИДа у пациентов, не получавших лечения. [18]
Противовирусное лечение также создает селективное давление для эволюции лекарственной устойчивости в популяциях вирусов и, таким образом, может влиять на модели генетического разнообразия. Обычно существует компромисс между более быстрой репликацией восприимчивых штаммов при отсутствии противовирусного лечения и более быстрой репликацией резистентных штаммов при наличии противовирусных препаратов. [19] Таким образом, установление уровня противовирусного давления, необходимого для изменения эволюционных результатов, имеет важное значение для общественного здравоохранения. Филодинамические подходы использовались для изучения распространения устойчивости к осельтамивиру при гриппе A/H1N1. [20]
Чаще всего целью филодинамического анализа является вывод об эпидемиологических процессах из вирусных филогений. Таким образом, большинство филодинамических анализов начинаются с реконструкции филогенетического дерева. Генетические последовательности часто отбираются в нескольких временных точках, что позволяет оценить скорости замены и время MRCA с использованием модели молекулярных часов. [21] Для вирусов байесовские филогенетические методы популярны из-за возможности подгонять сложные демографические сценарии, интегрируя при этом филогенетическую неопределенность. [22] [23]
Традиционные эволюционные подходы напрямую используют методы вычислительной филогенетики и популяционной генетики для оценки гипотез отбора и популяционной структуры без прямого учета эпидемиологических моделей. Например,
Однако такие анализы не были разработаны с учетом эпидемиологических выводов, и может быть сложно экстраполировать стандартные статистические данные на желаемые эпидемиологические величины.
В попытке преодолеть разрыв между традиционными эволюционными подходами и эпидемиологическими моделями было разработано несколько аналитических методов, специально предназначенных для решения проблем, связанных с филодинамикой. Эти методы основаны на теории коалесценции , моделях рождения-смерти [24] и моделировании и используются для более прямого соотнесения эпидемиологических параметров с наблюдаемыми вирусными последовательностями.
Коалесценция — это математическая модель, описывающая происхождение выборки нерекомбинирующих копий генов. При моделировании процесса коалесценции время обычно считается текущим в обратном направлении от настоящего момента. В селективно нейтральной популяции постоянного размера и неперекрывающихся поколений ( модель Райта-Фишера ) ожидаемое время для выборки двух копий генов для объединения (т. е. нахождения общего предка) составляет поколений. В более общем смысле, время ожидания для двух членов выборки копий генов, чтобы поделиться общим предком, распределено экспоненциально , со скоростью
Этот временной интервал помечен , и в его конце остаются существующие родословные. Эти оставшиеся родословные будут объединяться со скоростью после интервалов . Этот процесс можно смоделировать , вычерчивая экспоненциальные случайные величины со скоростями до тех пор, пока не останется только одна родословная (MRCA выборки). При отсутствии отбора и структуры популяции топологию дерева можно смоделировать, выбрав две родословные равномерно случайным образом после каждого интервала объединения .
Ожидаемое время ожидания для нахождения MRCA образца представляет собой сумму ожидаемых значений междоузлий,
Два следствия:
Следовательно, TMRCA, рассчитанная на основе относительно небольшой выборки вирусных генетических последовательностей, является асимптотически несмещенной оценкой времени, в течение которого вирусная популяция была основана в популяции хозяина.
Например, Роббинс и др. [25] оценили TMRCA для 74 генетических последовательностей ВИЧ-1 подтипа B, собранных в Северной Америке, как 1968 год. Предполагая постоянную численность популяции, мы ожидаем, что время до 1968 года будет представлять собой TMRCA североамериканской популяции вируса.
Если размер популяции меняется со временем, скорость слияния также будет функцией времени. Доннелли и Таваре [26] вывели эту скорость для изменяющегося во времени размера популяции при условии постоянного уровня рождаемости:
Поскольку все топологии одинаково вероятны при нейтральном слиянии, эта модель будет иметь те же свойства, что и слияние постоянного размера при изменении масштаба временной переменной: .
На очень раннем этапе эпидемии популяция вируса может расти экспоненциально со скоростью , так что в единицах времени в прошлом популяция будет иметь размер . В этом случае скорость коалесценции становится
Эта скорость мала вблизи времени сбора образца ( ), поэтому внешние ветви (те, у которых нет потомков) генеалогии гена будут иметь тенденцию быть длинными относительно тех, которые находятся близко к корню дерева. Вот почему быстро растущие популяции дают деревья с длинными верхушечными ветвями.
Если скорость экспоненциального роста оценивается на основе генеалогии генов, ее можно объединить со знанием продолжительности инфекции или серийного интервала для конкретного патогена, чтобы оценить базовое репродуктивное число, . Эти два показателя могут быть связаны следующим уравнением: [27]
Например, одна из первых оценок была сделана для пандемического гриппа H1N1 в 2009 году с использованием коалесцентного анализа 11 последовательностей гемагглютинина в сочетании с предыдущими данными об инфекционном периоде гриппа. [8]
Эпидемии инфекционных заболеваний часто характеризуются крайне нелинейными и быстрыми изменениями числа инфицированных лиц и эффективной численности популяции вируса. В таких случаях рождаемость сильно варьируется, что может уменьшить соответствие между эффективной численностью популяции и распространенностью инфекции. [28] В области математической эпидемиологии было разработано множество математических моделей для описания нелинейных временных рядов распространенности инфекции и числа восприимчивых хозяев. Хорошо изученным примером является система дифференциальных уравнений «восприимчивый-инфицированный-выздоровевший» (SIR) , которая описывает доли восприимчивой, инфицированной и выздоровевшей популяции как функцию времени:
Здесь — это скорость передачи вируса восприимчивым хозяевам на душу населения, а — скорость, с которой инфицированные особи выздоравливают, после чего они больше не являются заразными. В этом случае частота новых случаев заражения в единицу времени составляет , что аналогично скорости рождаемости в классических моделях популяционной генетики. Общая формула для скорости слияния: [2]
Это отношение можно понимать как возникающее из вероятности того, что две линии, выбранные равномерно случайным образом, являются предковыми для выборки. Эта вероятность представляет собой отношение числа способов выбрать две линии без замены из набора линий и из набора всех инфекций: . Коалесцентные события будут происходить с этой вероятностью со скоростью, заданной функцией инцидентности .
Для простой модели SIR это дает
Это выражение похоже на скорость коалесценции Кингмана , но затухает из-за восприимчивой фракции .
На ранней стадии эпидемии , поэтому для модели SIR
Это имеет ту же математическую форму, что и скорость в объединении Кингмана, заменяя . Следовательно, оценки эффективной численности популяции, основанные на объединении Кингмана, будут пропорциональны распространенности инфекции в ранний период экспоненциального роста эпидемии. [28]
Когда болезнь больше не растет экспоненциально, а становится эндемичной, скорость слияния линий также может быть выведена для эпидемиологической модели, управляющей динамикой передачи болезни. Это можно сделать, расширив модель Райта-Фишера , чтобы учесть неравное распределение потомков. Если поколение Райта-Фишера занимает единицы времени, скорость слияния определяется как:
где эффективный размер популяции — это размер популяции, деленный на дисперсию распределения потомства . [29] Время генерации для эпидемиологической модели в равновесии задается продолжительностью инфекции, а размер популяции тесно связан с равновесным числом инфицированных особей. Чтобы вывести дисперсию в распределении потомства для данной эпидемиологической модели, можно представить, что инфицированные особи могут отличаться друг от друга по своей инфекционности, частоте контактов, продолжительности инфекции или другим характеристикам, связанным с их способностью передавать вирус, которым они инфицированы. Эти различия можно признать, предположив, что базовое репродуктивное число является случайной величиной, которая варьируется между особями в популяции и которая следует некоторому непрерывному распределению вероятностей. [30] Среднее значение и дисперсия этих индивидуальных базовых репродуктивных чисел и , соответственно, затем могут быть использованы для вычисления . Выражение, связывающее эти величины, имеет вид: [31]
Например, для модели SIR выше, модифицированной для включения рождений в популяцию и смертей вне популяции, размер популяции определяется равновесным числом инфицированных особей, . Среднее базовое репродуктивное число, усредненное по всем инфицированным особям, определяется как , при условии, что фоновый уровень смертности незначителен по сравнению со скоростью выздоровления . Дисперсия в базовых репродуктивных показателях особей определяется как , поскольку продолжительность времени, в течение которого особи остаются инфицированными в модели SIR, распределена экспоненциально. Дисперсия в распределении потомства , таким образом, равна 2. следовательно, становится и скорость слияния становится:
Эта скорость, полученная для модели SIR в состоянии равновесия, эквивалентна скорости коалесценции, заданной более общей формулой. [2] Скорости коалесценции могут быть аналогичным образом получены для эпидемиологических моделей с суперраспространителями или другими гетерогенностями передачи, для моделей с лицами, которые подвергаются воздействию, но еще не являются заразными, и для моделей с переменными периодами заражения, среди прочего. [31] Таким образом, при наличии некоторой эпидемиологической информации (такой как продолжительность заражения) и спецификации математической модели, вирусные филогении могут использоваться для оценки эпидемиологических параметров, которые в противном случае было бы трудно количественно оценить.
На самом базовом уровне наличие географической структуры популяции можно выявить, сравнив генетическое родство вирусных изолятов с географическим родством. Основной вопрос заключается в том, являются ли метки географических признаков более кластеризованными в филогении, чем ожидалось в простой неструктурированной модели. На этот вопрос можно ответить, подсчитав количество географических переходов в филогении с помощью экономии , максимального правдоподобия или байесовского вывода . Если структура популяции существует, то географических переходов в филогении будет меньше, чем ожидалось в панмиктической модели. [32] Эту гипотезу можно проверить, случайным образом перемешав метки признаков на концах филогении и подсчитав количество географических переходов, присутствующих в перемешанных данных. Повторно перемешав данные и рассчитав количество переходов, можно построить нулевое распределение и вычислить p -значение , сравнив наблюдаемое количество переходов с этим нулевым распределением. [32]
Помимо наличия или отсутствия структуры популяции, филодинамические методы могут использоваться для выведения скоростей перемещения вирусных линий между географическими локациями и реконструкции географических локаций предковых линий. Здесь географическое местоположение рассматривается как филогенетическое состояние признака, похожее по духу на «A», «T», «G», «C», так что географическое местоположение кодируется как модель замещения . Тот же самый филогенетический аппарат, который используется для выведения моделей эволюции ДНК, может, таким образом, использоваться для выведения матриц географического перехода. [33] Конечным результатом является скорость, измеряемая в годах или в терминах нуклеотидных замен на сайт, с которой линия из одного региона перемещается в другой регион в ходе филогенетического дерева. В географической сети передачи некоторые регионы могут смешиваться легче, а другие регионы могут быть более изолированными. Кроме того, некоторые соединения передачи могут быть асимметричными, так что скорость, с которой линии из региона «A» перемещаются в регион «B», может отличаться от скорости, с которой линии из «B» перемещаются в «A». При таком кодировании географического местоположения реконструкция предкового состояния может использоваться для выведения предковых географических местоположений конкретных узлов в филогении. [33] Эти типы подходов могут быть расширены путем замены других атрибутов на географические местоположения. Например, в приложении к вирусу бешенства Штрейкер и коллеги оценили скорость межвидовой передачи, рассматривая вид хозяина в качестве атрибута. [7]
Как обсуждалось выше, можно напрямую вывести параметры простых эпидемиологических моделей с раздельными характеристиками , таких как модели SIR, из данных последовательностей, рассматривая генеалогические закономерности. Кроме того, общие закономерности географического перемещения могут быть выведены из данных последовательностей, но эти выводы не включают в себя явную модель динамики передачи между инфицированными лицами. Для более сложных эпидемиологических моделей, таких как модели, включающие перекрестный иммунитет , возрастную структуру показателей контактов с хозяином, сезонность или множественные популяции хозяев с различными чертами жизненного цикла, часто невозможно аналитически предсказать генеалогические закономерности из эпидемиологических параметров. Таким образом, традиционный статистический аппарат вывода не будет работать с этими более сложными моделями, и в этом случае вместо этого обычно используют подход, основанный на прямом моделировании.
Модели на основе моделирования требуют спецификации модели передачи для процесса заражения между инфицированными хозяевами и восприимчивыми хозяевами и для процесса восстановления инфицированных хозяев. Модели на основе моделирования могут быть компартментальными , отслеживающими количество хозяев, инфицированных и выздоровевших от различных вирусных штаммов, [34] или индивидуальными , отслеживающими состояние инфекции и иммунную историю каждого хозяина в популяции. [5] [35] Как правило, компартментальные модели предлагают значительные преимущества с точки зрения скорости и использования памяти, но их может быть трудно реализовать для сложных эволюционных или эпидемиологических сценариев. Прямая имитационная модель может учитывать географическую структуру популяции или возрастную структуру путем модуляции скорости передачи между особями хозяев разных географических или возрастных классов. Кроме того, сезонность может быть включена, позволяя времени года влиять на скорость передачи ступенчатым или синусоидальным образом.
Для связи эпидемиологической модели с вирусными генеалогиями требуется, чтобы в симуляции существовало несколько вирусных штаммов с различными нуклеотидными или аминокислотными последовательностями, часто обозначаемыми для разных инфицированных классов. В этом случае мутация преобразует хозяина из одного инфицированного класса в другой инфицированный класс. В ходе симуляции вирусы мутируют и производятся последовательности, из которых можно построить и проанализировать филогении.
Для антигенно изменчивых вирусов становится важным смоделировать риск передачи от человека, инфицированного штаммом вируса «А», человеку, который ранее был инфицирован штаммами вируса «В», «С» и т. д. Уровень защиты от одного штамма вируса вторым штаммом известен как перекрестный иммунитет . Помимо риска заражения, перекрестный иммунитет может модулировать вероятность того, что хозяин станет заразным, и продолжительность, в течение которой хозяин остается заразным. [36] Часто предполагается, что степень перекрестного иммунитета между штаммами вируса связана с расстоянием их последовательностей .
В целом, при необходимости проведения симуляций, а не вычисления вероятностей, может быть сложно делать мелкомасштабные выводы об эпидемиологических параметрах, и вместо этого эта работа обычно фокусируется на более широких вопросах, проверяя, соответствуют ли общие генеалогические модели одной или другой эпидемиологической модели. Кроме того, методы, основанные на симуляциях, часто используются для проверки результатов выводов, предоставляя тестовые данные, где правильный ответ известен заранее. Поскольку вычисление вероятностей для генеалогических данных в сложных имитационных моделях оказалось сложным, альтернативный статистический подход, называемый приближенным байесовским вычислением (ABC), становится популярным при подгонке этих имитационных моделей к моделям генетической изменчивости после успешного применения этого подхода к бактериальным заболеваниям. [37] [38] [39] Это связано с тем, что ABC использует легко вычисляемые сводные статистики для аппроксимации вероятностей, а не сами вероятности.
Человеческий грипп — это острая респираторная инфекция, вызываемая в основном вирусами гриппа A и гриппа B. Вирусы гриппа A можно дополнительно классифицировать на подтипы, такие как A/H1N1 и A/H3N2 . Здесь подтипы обозначаются в соответствии с их генами гемагглютинина (H или HA) и нейраминидазы (N или NA), которые, как поверхностные белки, действуют как основные мишени для гуморального иммунного ответа . Вирусы гриппа циркулируют и среди других видов, в частности, как свиной грипп и птичий грипп . Благодаря реассортации генетические последовательности свиного и птичьего гриппа иногда попадают в человеческую популяцию. Если определенный гемагглютинин или нейраминидаза циркулируют за пределами человеческой популяции, то у людей не будет иммунитета к этому белку, и пандемия гриппа может последовать за событием смены хозяина , как это было в 1918, 1957, 1968 и 2009 годах. После внедрения в человеческую популяцию линия гриппа обычно сохраняется посредством антигенного дрейфа , в котором HA и NA постоянно накапливают мутации, позволяющие вирусам заражать хозяев, невосприимчивых к более ранним формам вируса. Эти линии гриппа показывают повторяющиеся сезонные эпидемии в умеренных регионах и менее периодическую передачу в тропиках. Как правило, при каждом пандемическом событии новая форма вируса вытесняет существующие линии. [35] Изучение вирусной филодинамики гриппа в первую очередь сосредоточено на постоянной циркуляции и эволюции эпидемического гриппа, а не на возникновении пандемии. Центральный интерес для изучения вирусной филодинамики представляет характерное филогенетическое дерево эпидемического гриппа A/H3N2, которое показывает одну преобладающую стволовую линию, которая сохраняется с течением времени, и боковые ветви, которые сохраняются всего 1–5 лет, прежде чем исчезнуть. [40]
Филодинамические методы дали представление об относительном селективном влиянии мутаций на различные сайты и различные гены в геноме вируса гриппа. Открытое расположение гемагглютинина (HA) предполагает, что должно существовать сильное селективное давление для эволюции на определенные сайты на HA, которые распознаются антителами в иммунной системе человека. Эти сайты называются сайтами эпитопов . Филогенетический анализ гриппа H3N2 показал, что предполагаемые сайты эпитопов белка HA развиваются примерно в 3,5 раза быстрее на стволе филогении, чем на боковых ветвях. [41] [42] Это говорит о том, что вирусы, обладающие мутациями на этих открытых сайтах, выигрывают от положительного отбора и с большей вероятностью, чем вирусы, не имеющие таких мутаций, захватывают популяцию гриппа. Наоборот, предполагаемые неэпитопные сайты белка HA развиваются примерно в два раза быстрее на боковых ветвях, чем на стволе филогении H3, [41] [42], указывая на то, что мутации в этих сайтах отбираются против, и вирусы, обладающие такими мутациями, с меньшей вероятностью захватят популяцию гриппа. Таким образом, анализ филогенетических моделей дает представление о базовых селективных силах. Похожий анализ, объединяющий сайты по генам, показывает, что в то время как и HA, и NA подвергаются существенному положительному отбору, внутренние гены показывают низкие показатели фиксации аминокислот относительно уровней полиморфизма , что предполагает отсутствие положительного отбора. [43]
Дальнейший анализ HA показал, что он имеет очень малый эффективный размер популяции относительно размера переписи популяции вируса, как и ожидалось для гена, подвергающегося сильному положительному отбору. [44] Однако в геноме гриппа наблюдается удивительно мало вариаций эффективного размера популяции; все гены имеют почти одинаково низкий уровень. [45] Это открытие предполагает, что реассортация между сегментами происходит достаточно медленно относительно действий положительного отбора, что генетический автостоп вызывает полезные мутации в HA и NA, уменьшая разнообразие в связанной нейтральной вариации в других сегментах генома.
Грипп A/H1N1 демонстрирует большую эффективную численность популяции и большее генетическое разнообразие, чем грипп H3N2, [45] предполагая, что H1N1 претерпевает меньшую адаптивную эволюцию, чем H3N2. Эта гипотеза подтверждается эмпирическими моделями антигенной эволюции; в межпандемический период между 1978 и 2009 годами ВОЗ рекомендовала девять обновлений вакцины для H1N1, в то время как для H3N2 в этот же период времени было рекомендовано 20 обновлений вакцины. [46] Кроме того, анализ моделей эволюции последовательностей на стволе и боковых ветвях предполагает, что H1N1 претерпевает существенно меньший положительный отбор, чем H3N2. [42] [43] Однако основная эволюционная или эпидемиологическая причина этого различия между H3N2 и H1N1 остается неясной.
Чрезвычайно быстрый оборот популяции гриппа означает, что скорость географического распространения линий гриппа также должна быть, в некоторой степени, быстрой. Данные наблюдения показывают четкую картину сильных сезонных эпидемий в умеренных регионах и менее периодических эпидемий в тропиках. [47] Географическое происхождение сезонных эпидемий в Северном и Южном полушариях было основным открытым вопросом в этой области. Однако умеренные эпидемии обычно возникают из глобального резервуара, а не возникают из генетического разнообразия предыдущего сезона. [45] [48] Эта и последующие работы предположили, что глобальная устойчивость популяции гриппа обусловлена вирусами, передаваемыми от эпидемии к эпидемии, при этом ни один отдельный регион в мире не демонстрирует постоянной устойчивости. [3] [49] Однако ведутся серьезные споры относительно конкретной конфигурации глобальной сети гриппа, при этом одна гипотеза предполагает наличие метапопуляции в Восточной и Юго-Восточной Азии, которая постоянно распространяет грипп по всему миру, [48] а другая гипотеза отстаивает более глобальную метапопуляцию, в которой умеренные линии часто возвращаются в тропики в конце сезонной эпидемии. [3] [49]
Все эти филогеографические исследования неизбежно страдают от ограничений в всемирной выборке вирусов гриппа. Например, относительная важность тропической Африки и Индии еще не раскрыта. Кроме того, филогеографические методы, используемые в этих исследованиях (см. раздел о филогеографических методах), делают выводы о предковых местоположениях и темпах миграции только на основе имеющихся образцов, а не на основе популяции, в которую эти образцы встроены. Из-за этого процедуры выборки, специфичные для исследования, вызывают беспокойство при экстраполяции на выводы на уровне популяции. Однако оценки темпов миграции, которые совместно основаны на эпидемиологических и эволюционных симуляциях, кажутся надежными в значительной степени недостаточной или избыточной выборки конкретного региона. [3] Для более полного решения этих вопросов требуется дальнейший методологический прогресс.
Подходы на основе прямого моделирования для решения вопроса о том, как иммунный отбор может формировать филогению белка гемагглютинина гриппа A/H3N2, активно разрабатывались специалистами по моделированию заболеваний с начала 2000-х годов. Эти подходы включают как компартментальные модели, так и модели на основе агентов . Одна из первых компартментальных моделей гриппа была разработана Гогом и Гренфеллом [34], которые смоделировали динамику многих штаммов с частичным перекрестным иммунитетом друг к другу. При параметризации большой продолжительности жизни хозяина и короткого инфекционного периода они обнаружили, что штаммы будут формировать самоорганизованные наборы, которые будут возникать и заменять друг друга. Хотя авторы не реконструировали филогению из своих смоделированных результатов, динамика, которую они обнаружили, соответствовала лестничной вирусной филогении, демонстрирующей низкое разнообразие штаммов и быструю смену линий.
В более поздней работе Фергюсона и коллег [35] был принят агентный подход для лучшего определения иммунологических и экологических детерминант эволюции гриппа. Авторы смоделировали гемагглютинин гриппа как четыре эпитопа, каждый из которых состоит из трех аминокислот. Они показали, что при наличии только штаммоспецифического иммунитета (с частичным перекрестным иммунитетом между штаммами на основе их аминокислотного сходства) филогения HA гриппа A/H3N2, как ожидается, будет демонстрировать «взрывное генетическое разнообразие», что не согласуется с эмпирическими данными. Это привело авторов к постулированию существования временного иммунитета, выходящего за рамки штамма: люди были невосприимчивы к повторному заражению любым другим штаммом гриппа в течение примерно шести месяцев после заражения. При таком предположении агентная модель могла воспроизвести лестничную филогению белка HA гриппа A/H3N2.
Работа Келле и коллег [5] пересмотрела динамику эволюции гриппа A/H3N2 после публикации статьи Смита и коллег [50] , в которой было показано, что антигенная эволюция вируса происходила прерывистым образом. Филодинамическая модель, разработанная Келле и соавторами, утверждала, что эта модель отражает картирование генотипа к фенотипу «многие к одному», с возможностью штаммов из антигенно различных кластеров гриппа, имеющих высокую степень генетического сходства. Благодаря включению этого картирования вирусного генотипа в вирусный фенотип (или антигенный кластер) в свою модель, авторы смогли воспроизвести лестничную филогению белка HA гриппа без обобщенного иммунитета, выходящего за рамки штамма. Воспроизведение лестничной филогении стало результатом прохождения вирусной популяции через повторяющиеся селективные зачистки. Эти зачистки были обусловлены коллективным иммунитетом и действовали, чтобы ограничить вирусное генетическое разнообразие.
Вместо моделирования генотипов вирусных штаммов, модель компартментальной имитации, разработанная Гёкайдином и коллегами [51], рассматривала эволюцию гриппа в масштабе антигенных кластеров (или фенотипов). Эта модель показала, что антигенное возникновение и замена могут происходить при определенных эпидемиологических условиях. Такая антигенная динамика будет соответствовать лестничной филогении гриппа, демонстрирующей низкое генетическое разнообразие и непрерывный оборот штаммов.
В недавней работе Бедфорд и коллеги [52] использовали модель на основе агентов, чтобы показать, что эволюция в евклидовом антигенном пространстве может объяснить филогенетическую картину HA гриппа A/H3N2, а также антигенные, эпидемиологические и географические модели вируса. Модель показала, что воспроизведение лестничной филогении гриппа критически зависит от скорости мутации вируса, а также от иммунологического расстояния, создаваемого каждой мутацией.
Хотя большинство исследований филодинамики гриппа были сосредоточены на сезонном гриппе A/H3N2 у людей, вирусы гриппа демонстрируют широкий спектр филогенетических моделей. Качественно схожий с филогенией белка гемагглютинина гриппа A/H3N2, грипп A/H1N1 демонстрирует лестничную филогению с относительно низким генетическим разнообразием в любой момент времени и быстрой сменой линий. [35] Однако филогения белка гемагглютинина гриппа B имеет две циркулирующие линии: линию Ямагата и линию Виктория. [53] Неясно, как динамика популяции гриппа B способствует этой эволюционной модели, хотя одна имитационная модель смогла воспроизвести эту филогенетическую модель с более длительными периодами инфицирования хозяина. [54]
Генетическая и антигенная изменчивость гриппа также присутствует среди разнообразного набора видов-хозяев. Влияние структуры популяции хозяина можно увидеть в эволюции лошадиного гриппа A/H3N8 : вместо одного ствола с короткими боковыми ветвями гемагглютинин гриппа A/H3N8 разделяется на две географически различные линии, представляющие американские и европейские вирусы. [55] [56] Считается, что эволюция этих двух линий произошла в результате карантинных мер. [55] Кроме того, предполагается, что иммунные реакции хозяина модулируют эволюционную динамику вируса. Известно, что свиной грипп A/H3N2 эволюционирует антигенно со скоростью, которая в шесть раз медленнее, чем у того же вируса, циркулирующего у людей, хотя скорости генетической эволюции этих вирусов схожи. [57] Предполагается, что грипп у водоплавающих птиц демонстрирует «эволюционный застой», [58] хотя недавние филогенетические исследования показывают, что скорость эволюционных изменений у этих хозяев аналогична скорости у других хозяев, включая людей. [59] В этих случаях считается, что короткая продолжительность жизни хозяина препятствует формированию иммунитета хозяина, необходимого для эффективного управления антигенным дрейфом.
Глобальное разнообразие ВИЧ-1 группы M сформировано его происхождением в Центральной Африке на рубеже 20-го века. Эпидемия претерпела взрывной рост в начале 20-го века с множественными излучениями из Центральной Африки. В то время как традиционные эпидемиологические данные надзора за ранним периодом эпидемического расширения практически отсутствуют, филодинамический анализ, основанный на современных данных о последовательностях, может быть использован для оценки начала эпидемии и оценки ранних темпов роста. Быстрый ранний рост ВИЧ-1 в Центральной Африке отражен в звездообразных филогениях вируса, при этом большинство событий слияния произошло в далеком прошлом. Множественные события-основатели привели к появлению отдельных подтипов ВИЧ-1 группы M , которые преобладают в разных частях мира. Подтип B наиболее распространен в Северной Америке и Западной Европе, в то время как подтипы A и C, на которые приходится более половины случаев заражения во всем мире, распространены в Африке. [60] Подтипы ВИЧ немного различаются по своей трансмиссивности, вирулентности, эффективности антиретровирусной терапии и патогенезу. [61]
Скорость экспоненциального роста ВИЧ в Центральной Африке в начале 20 века, предшествовавшего установлению современных подтипов, была оценена с использованием коалесцентных подходов. Несколько оценок, основанных на параметрических моделях экспоненциального роста, показаны в таблице 1 для разных периодов времени, групп риска и подтипов. Раннее распространение ВИЧ-1 также было охарактеризовано с использованием непараметрических («горизонтальных») оценок . [62]
Темпы роста | Группа | Подтип | Группа риска |
---|---|---|---|
0,17 [63] | М | NA | Центральная Африка |
0,27 [64] | М | С | Центральная Африка |
0,48 [65] -0,83 [25] | М | Б | Северная Америка/Европа/Австрия, СМИ |
0,068 [66] | О | NA | Камерун |
Ранний рост подтипа B в Северной Америке был довольно высоким, однако продолжительность экспоненциального роста была относительно короткой, с насыщением, произошедшим в середине и конце 1980-х годов. [2] На противоположном полюсе ВИЧ-1 группы O, относительно редкой группы, которая географически ограничена Камеруном и которая в основном распространяется гетеросексуальным путем, росла более медленными темпами, чем подтипы B и C.
Последовательности ВИЧ-1, отобранные в течение пяти десятилетий, использовались с филогенетическими методами смягченных молекулярных часов для оценки времени межвидового распространения вируса среди людей примерно в начале 20-го века. [67] Оценочный TMRCA для ВИЧ-1 совпадает с появлением первых густонаселенных крупных городов в Центральной Африке. Аналогичные методы использовались для оценки времени возникновения ВИЧ в разных частях мира. Происхождение подтипа B в Северной Америке оценивается в 1960-х годах, где он оставался незамеченным до эпидемии СПИДа в 1980-х годах. [25] Есть доказательства того, что предки современного подтипа B первоначально колонизировали Карибское море, прежде чем подверглись множественным радиациям в Северной и Южной Америке. [68] Подтип C возник примерно в то же время в Африке. [65]
В более коротких временных масштабах и более мелких географических масштабах филогении ВИЧ могут отражать эпидемиологическую динамику, связанную с рискованным поведением и сексуальными сетями . Очень плотная выборка вирусных последовательностей в городах за короткие периоды времени дала подробную картину моделей передачи ВИЧ в современных эпидемиях. Секвенирование вируса у недавно диагностированных пациентов в настоящее время является рутинной процедурой во многих странах для наблюдения за мутациями лекарственной устойчивости , что дало большие базы данных данных о последовательностях в этих областях. Есть доказательства того, что передача ВИЧ в гетерогенных сексуальных сетях оставляет след в филогениях ВИЧ, в частности, делая филогении более несбалансированными и концентрируя срастающиеся события на меньшинстве линий. [69]
Анализируя филогении, оцененные по последовательностям ВИЧ от мужчин, имеющих половые контакты с мужчинами в Лондоне, Соединенное Королевство, Льюис и др. обнаружили доказательства того, что передача высоко сконцентрирована в короткий период первичной ВИЧ-инфекции (PHI), который состоит примерно из первых 6 месяцев инфекционного периода. [70] В отдельном анализе Фольц и др. [71] обнаружили, что простая эпидемиологическая динамика объясняет филогенетическую кластеризацию вирусов, собранных у пациентов с PHI. Пациенты, которые были недавно инфицированы, с большей вероятностью содержали вирус, который филогенетически близок к образцам от других недавно инфицированных пациентов. Такая кластеризация согласуется с наблюдениями в моделированной эпидемиологической динамике, показывающей ранний период усиленной передачи во время PHI. Таким образом, эти результаты предоставили дополнительную поддержку выводам Льюиса и др. о том, что передача ВИЧ часто происходит от людей на ранней стадии их инфицирования.
Очищающий иммунный отбор доминирует над эволюцией ВИЧ внутри хозяев, но эволюция между хозяевами в значительной степени отделена от эволюции внутри хозяина. [72] Иммунный отбор относительно слабо влияет на филогении ВИЧ на уровне популяции по трем причинам. Во-первых, существует чрезвычайно узкое место в вирусном разнообразии во время половой передачи. [73] Во-вторых, передача, как правило, происходит на ранних стадиях инфекции, прежде чем иммунный отбор успеет сработать. [74] Наконец, репликативная приспособленность вирусного штамма (измеряемая в передачах на хозяина) в значительной степени является внешней по отношению к вирусологическим факторам, в большей степени зависящей от поведения в популяции хозяев. К ним относятся гетерогенное сексуальное поведение и поведение, связанное с употреблением наркотиков.
Сравнительный филогенетический анализ и эпидемическое моделирование дают некоторые доказательства того, что ВИЧ адаптируется на уровне популяции, чтобы максимизировать потенциал передачи между хозяевами. [75] Эта адаптация направлена на промежуточные уровни вирулентности , что уравновешивает продуктивную продолжительность жизни хозяина (время до СПИДа) с вероятностью передачи за акт. Полезным показателем вирулентности является заданная вирусная нагрузка (SPVL), которая коррелирует со временем до СПИДа. [76] SPVL — это квазиравновесный титр вирусных частиц в крови во время хронической инфекции . Для адаптации к промежуточной вирулентности необходимо, чтобы SPVL был наследуемым, и должен существовать компромисс между вирусной трансмиссивностью и продолжительностью жизни хозяина. Было показано, что SPVL коррелирует между донором и реципиентами ВИЧ в парах передачи, [77] тем самым предоставляя доказательства того, что SPVL, по крайней мере, частично наследуется. Вероятность передачи ВИЧ за половой акт положительно коррелирует с вирусной нагрузкой, [78] [79] тем самым предоставляя доказательства компромисса между заразностью и вирулентностью. Поэтому теоретически возможно, что ВИЧ эволюционирует, чтобы максимизировать свой потенциал передачи. Эпидемиологическое моделирование и сравнительные филогенетические исследования показали, что адаптация ВИЧ к оптимальному SPVL может ожидаться в течение 100–150 лет. [80] Эти результаты зависят от эмпирических оценок заразности ВИЧ и продолжительности жизни хозяев как функции SPVL.
До этого момента филодинамические подходы были сосредоточены почти полностью на РНК-вирусах, которые часто имеют скорость мутаций порядка 10−3–10−4 замен на сайт в год. [81] Это позволяет выборке из около 1000 оснований иметь мощность, чтобы дать достаточную степень уверенности в оценке базовой генеалогии, связывающей отобранные вирусы. Однако другие патогены могут иметь значительно более медленные скорости эволюции. ДНК - вирусы , такие как вирус простого герпеса , эволюционируют на порядки медленнее. [82] Эти вирусы имеют соразмерно большие геномы. Бактериальные патогены, такие как пневмококк и туберкулез, эволюционируют еще медленнее и имеют еще большие геномы. Фактически, существует очень общая отрицательная корреляция между размером генома и скоростью мутаций в наблюдаемых системах. [83] Из-за этого, схожие количества филогенетического сигнала, вероятно, будут получены в результате секвенирования полных геномов РНК-вирусов, ДНК-вирусов или бактерий. По мере совершенствования технологий секвенирования становится все более возможным проводить филодинамический анализ всего многообразия патогенных организмов.
Кроме того, усовершенствования в технологиях секвенирования позволят проводить детальное исследование эволюции внутри хозяина, поскольку при достаточных усилиях по секвенированию можно будет раскрыть все многообразие заражающего квазивида .
Эта статья была адаптирована из следующего источника по лицензии CC BY 4.0 (2013) (отчеты рецензентов): Erik M Volz; Katia Koelle; Trevor Bedford (21 марта 2013 г.). "Viral phylodynamics". PLOS Computational Biology . 9 (3): e1002947. doi : 10.1371/JOURNAL.PCBI.1002947 . ISSN 1553-734X. PMC 3605911. PMID 23555203. Wikidata Q21045423 .