Разработчик(и) |
|
---|---|
Стабильный релиз | 2.0 / 23 февраля 2011 г. ( 2011-02-23 ) |
Написано в | |
Доступно в | Английский |
Тип | Биоинформатический инструмент для прогнозирования структуры белка |
Лицензия | Creative Commons Attribution-2.0 |
Веб-сайт | www.sbg.bio.ic.ac.uk/phyre2 |
Phyre и Phyre2 ( Protein Homology/AnalogY Recognition Engine ; произносится как fire ) — это бесплатные веб-сервисы для прогнозирования структуры белка . [1] [2] [3] Phyre — один из самых популярных методов прогнозирования структуры белка, его цитировали более 1500 раз. [4] Как и другие методы удаленного распознавания гомологии (см. потоки белков ), он способен регулярно генерировать надежные модели белков, когда другие широко используемые методы, такие как PSI-BLAST, не могут этого сделать. Phyre2 был разработан для обеспечения удобного интерфейса для пользователей, неопытных в методах прогнозирования структуры белка. Его разработка финансируется Исследовательским советом по биотехнологии и биологическим наукам . [5]
Серверы Phyre и Phyre2 предсказывают трехмерную структуру белковой последовательности, используя принципы и методы моделирования гомологии . Поскольку структура белка более консервативна в эволюции, чем его аминокислотная последовательность, интересующая белковая последовательность (цель) может быть смоделирована с разумной точностью на очень отдаленно связанной последовательности известной структуры (шаблоне), при условии, что связь между целью и шаблоном может быть распознана посредством выравнивания последовательностей . В настоящее время наиболее мощные и точные методы обнаружения и выравнивания отдаленно связанных последовательностей основаны на профилях или скрытых марковских моделях (HMM). Эти профили/HMM фиксируют мутационную склонность каждой позиции в аминокислотной последовательности на основе наблюдаемых мутаций в родственных последовательностях и могут рассматриваться как «эволюционный отпечаток пальца» конкретного белка.
Обычно аминокислотные последовательности представительного набора всех известных трехмерных структур белков компилируются, и эти последовательности обрабатываются путем сканирования по большой базе данных последовательностей белков. Результатом является база данных профилей или HMM, по одному для каждой известной трехмерной структуры. Интересующая пользовательская последовательность аналогичным образом обрабатывается для формирования профиля/HMM. Затем этот профиль пользователя сканируется по базе данных профилей с использованием методов выравнивания профиль-профиль или HMM-HMM. Эти выравнивания также могут учитывать шаблоны предсказанных или известных элементов вторичной структуры и могут быть оценены с использованием различных статистических моделей. См. Прогнозирование структуры белка для получения дополнительной информации.
Первый сервер Phyre был выпущен в июне 2005 года и использовал алгоритм выравнивания профиль-профиль на основе матрицы оценок, специфичной для каждого белка . [6] Сервер Phyre2 был публично выпущен в феврале 2011 года в качестве замены оригинального сервера Phyre и предоставляет дополнительные функции по сравнению с Phyre, более продвинутый интерфейс, полностью обновленную библиотеку фолдов и использует пакет HH-suite (HHpred, HHsearch) для обнаружения гомологии, среди прочих улучшений.
После вставки аминокислотной последовательности белка в форму отправки Phyre или Phyre2 пользователь обычно ждет от 30 минут до нескольких часов (в зависимости от таких факторов, как длина последовательности, количество гомологичных последовательностей, частота и длина вставок и удалений) для завершения прогноза. Электронное письмо, содержащее сводную информацию и предсказанную структуру в формате PDB , отправляется пользователю вместе со ссылкой на веб-страницу с результатами. Экран результатов Phyre2 разделен на три основных раздела, описанных ниже.
Предоставленная пользователем последовательность белка сначала сканируется по большой базе данных последовательностей с помощью PSI-BLAST . Профиль, сгенерированный PSI-BLAST, затем обрабатывается программой прогнозирования вторичной структуры нейронной сети PsiPred [7] и предсказателем нарушений белка Disopred. [8] Предсказанное наличие альфа-спиралей, бета-цепей и неупорядоченных областей отображается графически вместе с цветовой шкалой достоверности.
Многие белки содержат несколько доменов белка . Phyre2 предоставляет таблицу совпадений шаблонов, закодированных цветом в зависимости от достоверности и указывающих область совпавшей пользовательской последовательности. Это может помочь в определении доменного состава белка.
Основная таблица результатов в Phyre2 предоставляет оценки достоверности, изображения и ссылки на трехмерные предсказанные модели и информацию, полученную либо из базы данных структурной классификации белков (SCOP), либо из банка данных белков (PDB) в зависимости от источника обнаруженного шаблона. Для каждого соответствия ссылка перенаправляет пользователя к подробному просмотру выравнивания между последовательностью пользователя и последовательностью известной трехмерной структуры.
Подробный вид выравнивания позволяет пользователю изучать отдельные выровненные остатки, совпадения между предсказанными и известными элементами вторичной структуры и возможность переключения информации относительно моделей сохранения последовательности и достоверности вторичной структуры. Кроме того, Jmol используется для обеспечения интерактивного 3D-просмотра модели белка.
Phyre2 использует библиотеку fold, которая обновляется еженедельно по мере решения новых структур. Она использует более современный интерфейс и предлагает дополнительные функции по сравнению с сервером Phyre, как описано ниже.
Функция пакетной обработки позволяет пользователям отправлять более одной последовательности в Phyre2, загружая файл последовательностей в формате FASTA . По умолчанию пользователи имеют ограничение в 100 последовательностей в пакете. Этот лимит можно увеличить, связавшись с администратором. Пакетные задания обрабатываются в фоновом режиме на свободных вычислительных мощностях по мере их появления. Таким образом, пакетные задания часто занимают больше времени, чем индивидуально отправленные задания, но это необходимо для справедливого распределения вычислительных ресурсов среди всех пользователей Phyre2.
Потоки один к одному позволяют вам загружать как последовательность, которую вы хотите смоделировать, так и шаблон, на основе которого ее моделировать. Иногда у пользователей есть последовательность белка, которую они хотят смоделировать на определенном шаблоне по своему выбору. Это может быть, например, недавно решенная структура, которой нет в базе данных Phyre2, или некоторая дополнительная биологическая информация, указывающая на то, что выбранный шаблон даст более точную модель, чем автоматически выбранные Phyre2.
Вместо того, чтобы предсказывать 3D-структуру последовательности белка, пользователи часто имеют решенную структуру и хотят определить, есть ли связанная структура в интересующем их геноме. В Phyre2 загруженная структура белка может быть преобразована в скрытую марковскую модель, а затем просканирована по набору геномов (более 20 геномов по состоянию на март 2011 года). Эта функция называется BackPhyre, чтобы указать, как Phyre2 используется в обратном направлении.
Иногда Phyre2 не может обнаружить никаких достоверных совпадений с известными структурами. Однако база данных библиотеки фолдов увеличивается примерно на 40-100 новых структур каждую неделю. Так что даже если на этой неделе не будет достойных шаблонов, они вполне могут появиться в ближайшие недели. Phyrealarm позволяет пользователям отправлять последовательность белка для автоматического сканирования с новыми записями, добавляемыми в библиотеку фолдов каждую неделю. Если обнаружено достоверное совпадение, пользователь автоматически уведомляется по электронной почте вместе с результатами поиска Phyre2. Пользователи также могут контролировать уровень покрытия выравниванием и достоверности в совпадении, необходимые для запуска оповещения по электронной почте.
Phyre2 связан с сервером 3DLigandSite [9] для прогнозирования сайтов связывания белков. 3DLigandSite был одним из самых эффективных серверов для прогнозирования сайтов связывания в Critical Assessment of Structure Prediction ( CASP ) в (CASP8 и CASP9). Надежные модели, созданные Phyre2 (уверенность >90%), автоматически отправляются в 3DLigandSite.
Программа memsat_svm [10] используется для прогнозирования наличия и топологии любых трансмембранных спиралей, присутствующих в последовательности белка пользователя.
Phyre2 позволяет пользователям выбирать «Интенсивное» моделирование на главном экране отправки. Этот режим:
Области применения Phyre и Phyre2 включают прогнозирование структуры белка, прогнозирование функций, прогнозирование доменов, прогнозирование границ доменов, эволюционную классификацию белков, управление направленным мутагенезом и решение проблем кристаллических структур белков путем молекулярной замены .
Существуют два связанных ресурса, которые используют прогнозы Phyre для структурного анализа миссенс-вариантов, обычно возникающих в результате однонуклеотидных полиморфизмов .
Phyre и Phyre2 являются преемниками системы прогнозирования структуры белка 3D-PSSM [14] , которая на сегодняшний день имеет более 1400 ссылок. [15] 3D-PSSM была спроектирована и разработана Лоуренсом Келли [16] и Бобом Маккаллумом [17] в Лаборатории биомолекулярного моделирования [18] в Cancer Research UK . Phyre и Phyre2 были разработаны Лоуренсом Келли в группе структурной биоинформатики [19] Имперского колледжа Лондона . Компоненты систем Phyre и Phyre2 были разработаны Бенджамином Джефферисом [20] , Алексом Гербертом [21] и Риккардо Беннетт-Ловси. [22] Исследования и разработка обоих серверов курировались Майклом Стернбергом .
Работа по разработке веб-сервера Phyre2 поддерживается грантом BBSRC на инструменты и ресурсы