Список программного обеспечения для выравнивания последовательностей

Этот список программного обеспечения для выравнивания последовательностей представляет собой подборку программных инструментов и веб-порталов, используемых в парном выравнивании последовательностей и множественном выравнивании последовательностей . См. программное обеспечение для структурного выравнивания для структурного выравнивания белков.

Только поиск в базе данных

ИмяОписаниеТип последовательности*АвторыГод
ВЗРЫВЛокальный поиск с быстрой эвристикой k-кортежа (базовый инструмент поиска локального выравнивания)ОбаАльтшул СФ , Гиш В , Миллер В , Майерс ЭВ , Липман ДЖ [1]1990
HPC-BLASTСовместимая с NCBI многоузловая и многоядерная оболочка BLAST. Распространяемая с последней версией BLAST, эта оболочка облегчает распараллеливание алгоритма на современных гибридных архитектурах со многими узлами и многими ядрами в каждом узле. [2]БелокБердишоу CE, Сойер S, Хортон MD, Брук RG, Рекапалли B2017
CS-БЛАСТКонтекстно-специфический BLAST, более чувствительный, чем BLAST, FASTA и SSEARCH. Итеративная версия CSI-BLAST, более чувствительная, чем PSI-BLASTБелокАнгермюллер К., Бигерт А., Зёдинг Дж. [3]2013
CUDASW++Алгоритм Смита-Уотермана с ускорением на GPU для нескольких общих хост-GPUБелокЛю И., Маскелл Д.Л. и Шмидт Б.2009/2010
АЛМАЗВыравниватель BLASTX и BLASTP на основе двойной индексацииБелокБухфинк Б., Кси К., Хасон Д.Х., Рейтер К., Дрост Х.Г. [4] [5]2015/2021
ФАСТЛокальный поиск с быстрой эвристикой k -кортежей, медленнее, но более чувствителен, чем BLASTОба
GGSEARCH, GLSEARCHГлобальное:Глобальное (GG), Глобальное:Локальное (GL) соответствие статистикеБелок
Геномный магПрограммное обеспечение для сверхбыстрого локального поиска мотивов последовательности ДНК и попарного выравнивания данных NGS (FASTA, FASTQ).ДНКХепперле Д (www.sequentix.de)2020
ДженоогльGenoogle использует методы индексации и параллельной обработки для поиска последовательностей ДНК и белков. Он разработан на Java и имеет открытый исходный код.ОбаАльбрехт Ф.2015
ХММЕРЛокальный и глобальный поиск с использованием скрытых марковских моделей профиля, более чувствительных, чем PSI-BLASTОбаДурбин Р. , Эдди С.Р. , Крог А. , Митчисон Дж. [6]1998
HH-люксПопарное сравнение профилей Скрытые марковские модели; очень чувствительныеБелокСёдинг Й [7] [8]2005/2012
Армия обороны ИзраиляОбратная частота документаОба
АдскийПрофиль SCFG поискРНКЭдди С.
КЛАСТВысокопроизводительный инструмент общего назначения для поиска сходства последовательностейОба2009/2014
ЛЯМБДАВысокопроизводительный локальный выравниватель, совместимый с BLAST, но гораздо более быстрый; поддерживает SAM/BAMБелокХаннес Хаусведелл, Йохен Зингер, Кнут Райнерт [9]2014
MMseqs2Программный пакет для поиска и кластеризации огромных наборов последовательностей. Похожая чувствительность к BLAST и PSI-BLAST, но на порядок быстрееБелокШтайнеггер М., Мирдита М., Гальес С., Сёдинг Дж. [10]2017
ИСПОЛЬЗОВАНИЕПОИСКАСверхбыстрый инструмент для анализа последовательностейОбаЭдгар, RC (2010). «Поиск и кластеризация на порядок быстрее, чем BLAST». Биоинформатика . 26 (19): 2460–2461. doi : 10.1093/bioinformatics/btq461 . PMID  20709691.публикация2010
ОСВАЛЬДOpenCL Smith-Waterman на ПЛИС Altera для больших баз данных белковБелокРуччи Э., Гарсиа К., Ботелла Дж., Де Джусти А., Найуф М., Прието-Матиас М. [11]2016
парасейлингБыстрый поиск Смита-Уотермана с использованием распараллеливания SIMDОбаЕжедневно J2015
PSI-ВЗРЫВИтеративный BLAST, ориентированный на определенную позицию, локальный поиск с матрицами оценок, ориентированными на определенную позицию , гораздо более чувствительный, чем BLASTБелокАльтшул С.Ф. , Мэдден Т.Л., Шеффер А.А., Чжан Дж., Чжан З., Миллер В. , Липман DJ [12]1997
PSI-ПоискОбъединение алгоритма поиска Смита-Уотермана со стратегией построения профиля PSI-BLAST для поиска отдаленно связанных последовательностей белков и предотвращения ошибок гомологичного чрезмерного удлинения.БелокЛи В., МакВильям Х., Гужон М., Коули А., Лопес Р., Пирсон В.Р. [13]2012
Отдых и ВоскрешениеRetrieve and Relate (R&R) — это высокопроизводительная и чувствительная поисковая система по нескольким базам данных, способная выполнять параллельный поиск по последовательностям ДНК, РНК и белков.Оба2019
ScalaBLASTВысокопараллельный масштабируемый BLASTОбаОемен и др. [14]2011
СекуилабСвязывание и профилирование данных выравнивания последовательностей из результатов NCBI-BLAST с основными серверами/сервисами анализа последовательностейНуклеотид, пептид2010
СЭМЛокальный и глобальный поиск с использованием скрытых марковских моделей профиля, более чувствительных, чем PSI-BLASTОбаКарплюс К , Крог А [15]1999
ПОИСКПоиск Смита-Уотермана, медленнее, но более чувствительный, чем FASTAОба
СВАФИПервый параллельный алгоритм, использующий новейший процессор Intel Xeon Phis для ускорения поиска в базе данных белков Смита-УотерманаБелокЛю Ю. и Шмидт Б.2014
SWAPHI-LSПервый параллельный алгоритм Смита-Уотермана, использующий кластеры Intel Xeon Phi для ускорения выравнивания длинных последовательностей ДНКДНКЛю И., Тран Т.Т., Лауэнрот Ф., Шмидт Б.2014
ПЛАВАТЬРеализация Смита-Уотермана для архитектур Intel Multicore и ManycoreБелокРуччи Э., Гарсиа К., Ботелла Дж., Де Джусти А., Найуф М. и Прието-Матиас М. [16]2015
SWIMM2.0Улучшенный алгоритм Смита-Уотермана на многоядерных и многоядерных архитектурах Intel на основе векторных расширений AVX-512БелокРуччи Э., Гарсия С., Ботелла Дж., Де Джусти А., Найуф М. и Прието-Матиас М. [17]2018
СВАЙПБыстрый поиск Смита-Уотермана с использованием распараллеливания SIMDОбаРогнес Т.2011

* Тип последовательности: белок или нуклеотид

Парное выравнивание

ИмяОписаниеТип последовательности*Тип выравнивания**АвторГод
АКАНАБыстрое эвристическое якорное парное выравниваниеОбаОбаХуан, Умбах, Ли2005
Выровняйте меняВыравнивания последовательностей мембранных белковБелокОбаМ. Стамм, К. Хафизов, Р. Старицбихлер, Л. Р. Форрест2013
ALLALIGNДля молекул ДНК, РНК и белка размером до 32 МБ выравнивает все последовательности размером K или больше. Схожие выравнивания группируются вместе для анализа. Автоматический фильтр повторяющихся последовательностей.ОбаМестныйЭ. Вахтель2017
Биопроводник Биостроки::парноеВыравниваниеДинамическое программированиеОбаОба + концы свободныП. Абойюн2008
BioPerl dpAlignДинамическое программированиеОбаОба + концы свободныЮМ Чан2003
БЛАСТЗ, ПОСЛЕДНИЙСопоставление с образцом с заданными параметрамиНуклеотидМестныйШварц и др. [18] [19]2004,2009
CUDAlignВыравнивание последовательности ДНК неограниченного размера в одном или нескольких графических процессорахНуклеотидЛокальный, Полуглобальный, ГлобальныйЭ. Сандес [20] [21] [22]2011-2015
DNADotВеб-инструмент для построения точечных диаграммНуклеотидГлобальныйР. Боуэн1998
ДОТЛЕТИнструмент для построения точечных диаграмм на основе JavaОбаГлобальныйМ. Паньи и Т. Джуниер1998
ПРАЗДНИКЛокальное расширение на основе апостериорной модели с описательной эволюциейНуклеотидМестныйАК Худек и ДГ Браун2010
Геномный компилятор Геномный компиляторСовмещайте файлы хроматограмм (.ab1, .scf) с последовательностью шаблонов, находите ошибки и мгновенно исправляйте их.НуклеотидМестныйКорпорация Геномного Компилятора2014
G-PASДинамическое программирование на базе GPU с возвратомОбаЛокальный, Полуглобальный, ГлобальныйВ. Фромберг, М. Кержинка и др.2011
GapMisВыравнивает ли парная последовательность с одним пробеломОбаПолуглобальныйК. Фрусиос, Т. Флури, К.С. Илиопулос, К. Парк, С.П. Писсис, Г. Тишлер2012
Геномный магПрограммное обеспечение для сверхбыстрого локального поиска мотивов последовательности ДНК и попарного выравнивания данных NGS (FASTA, FASTQ).ДНКЛокальный, Полуглобальный, ГлобальныйХепперле Д (www.sequentix.de)2020
GGSEARCH, GLSEARCHГлобальное:Глобальное (GG), Глобальное:Локальное (GL) соответствие статистикеБелокГлобальный в запросеУ. Пирсон2007
JAligner Реализация Смита-Уотермана с открытым исходным кодом на JavaОбаМестныйА. Мустафа2005
К*СинхронизацияВыравнивание последовательности белка к структуре, включающее вторичную структуру, структурную консервацию, профили последовательностей, полученные из структуры, и оценки консенсусного выравниванияБелокОбаД. Чивиан и Д. Бейкер [23]2003
LALIGNМножественное, неперекрывающееся, локальное сходство (тот же алгоритм, что и SIM)ОбаЛокальное неперекрывающеесяУ. Пирсон1991 (алгоритм)
Северо-западное выравниваниеСтандартный алгоритм динамического программирования Нидлмана-ВуншаБелокГлобальныйИ Чжан2012
сопоставительЛокальное выравнивание Уотермана-Эггерта (на основе LALIGN)ОбаМестныйИ. Лонгден (изменённый вариант У. Пирсона)1999
MCALIGN2явные модели эволюции инделейДНКГлобальныйДж. Ван и др.2006
MegAlign Pro (молекулярная биология Lasergene)Программное обеспечение для выравнивания последовательностей ДНК, РНК, белков или ДНК + белок с помощью алгоритмов парного и множественного выравнивания последовательностей, включая MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson и анализ Dotplot.ОбаОбаДНК-СТАР1993-2016
МУМмерна основе дерева суффиксовНуклеотидГлобальныйС. Курц и др.2004
иголкаДинамическое программирование Нидлмана-ВуншаОбаПолуглобальныйА. Блисби1999
Нгилалогарифмические и аффинные затраты на разрыв и явные модели эволюции инделейОбаГлобальныйР. Картрайт2007
СЗДинамическое программирование Нидлмана-ВуншаОбаГлобальныйACR Мартин1990-2015
парасейлингC/C++/Python/Java SIMD библиотека динамического программирования для SSE, AVX2ОбаГлобальный, без ограничений, локальныйДж. Дейли2015
ПутьСмит-Уотерман на графике обратной трансляции белка (обнаруживает сдвиги рамки считывания на уровне белка) БелокМестныйМ. Гырдеа и др. [24]2009
PatternHunterСопоставление с образцом с заданными параметрамиНуклеотидМестныйБ. Ма и др. [25] [26]2002–2004
ProbA (также propA)Стохастическая выборка функции распределения с помощью динамического программированияОбаГлобальныйУ. Мюкштейн2002
ПиМОЛКоманда «align» выравнивает последовательность и применяет ее к структуре.БелокГлобально (по выбору)WL ДеЛано2007
РЕПУТЕРна основе дерева суффиксовНуклеотидМестныйС. Курц и др.2001
САБЛЕТУЗВыравнивание с использованием прогнозируемых профилей связностиБелокГлобальныйФ. Тейхерт, Дж. Миннинг, У. Бастолла и М. Порту2009
СацумаПараллельные выравнивания синтении по всему геномуДНКМестныйМГ Грабхерр и др.2010
СЛЕДУЮЩИЙРазличное динамическое программированиеОбаЛокальный или глобальныйМ.С. Уотерман и П. Харди1996
SIM, GAP, NAP, LAPЛокальное сходство с различной обработкой зазоровОбаЛокальный или глобальныйX. Хуан и В. Миллер1990-6
СИМ-картаМестное сходствоОбаМестныйX. Хуан и В. Миллер1991
SPA: Суперпарное выравниваниеБыстрое попарное глобальное выравниваниеНуклеотидГлобальныйШэнь, Ян, Яо, Хван2002
ПОИСКЛокальное ( Смит-Уотерман ) соответствие статистикеБелокМестныйУ. Пирсон1981 (Алгоритм)
Студия последовательностиАпплет Java, демонстрирующий различные алгоритмы из [27]Общая последовательностьЛокальный и глобальныйА.Мескаускас1997 (справочник)
SWIFOLDУскорение Смита-Уотермана на ПЛИС Intel с OpenCL для длинных последовательностей ДНКНуклеотидМестныйЭ. Руччи [28] [29]2017-2018
Костюм СВИФТБыстрый поиск локального выравниванияДНКМестныйК. Расмуссен, [30] В. Герлах2005,2008
носилкиДинамическое программирование Нидлмана-Вунша с оптимизацией памятиОбаГлобальныйИ. Лонгден (изменённый вариант Г. Майерса и У. Миллера)1999
транслинейныйВыравнивает последовательности нуклеиновых кислот с учетом выравнивания белковНуклеотидNAГ. Уильямс (изменённый вариант Б. Пирсона)2002
ЮГЕНSmith-Watman с открытым исходным кодом для SSE/CUDA, поиск повторов на основе суффиксного массива и точечная диаграммаОбаОбаУниПро2010
водаДинамическое программирование Смита-УотерманаОбаМестныйА. Блисби1999
соответствие словпопарное сопоставление k -кортежейОбаNAИ. Лонгден1998
ЯСССопоставление с образцом с заданными параметрамиНуклеотидМестныйЛ. Ноэ и Г. Кучеров [31]2004

* Тип последовательности: белок или нуклеотид ** Тип выравнивания: локальное или глобальное

Множественное выравнивание последовательностей

ИмяОписаниеТип последовательности*Тип выравнивания**АвторГодЛицензия
АБАВыравнивание А-БрейнБелокГлобальныйБ.Рафаэль и др.2004Запатентованное , бесплатное программное обеспечение для образования, исследований, некоммерческих организаций
ЭЛЕручное выравнивание; некоторая помощь программного обеспеченияНуклеотидыМестныйДж. Блэнди и К. Фогель1994 (последняя версия 2007)Бесплатно, GPL 2
ALLALIGNДля молекул ДНК, РНК и белков до 32 МБ выравнивает все последовательности размером K или больше, MSA или в пределах одной молекулы. Похожие выравнивания группируются вместе для анализа. Автоматический фильтр повторяющихся последовательностей.ОбаМестныйЭ. Вахтель2017Бесплатно
АМАППоследовательный отжигОбаГлобальныйА. Шварц и Л. Пахтер2006
BAli-PhyДерево+множественное выравнивание; вероятностно-байесовский; совместная оценкаОба + КодоныГлобальныйБ.Д. Ределингс и М.А. Сушард2005 (последняя версия 2018)Бесплатно, GPL
База-за-базойРедактор множественного выравнивания последовательностей на основе Java со встроенными инструментами анализаОбаЛокальный или глобальныйР. Броди и др.2004Запатентованное , бесплатное программное обеспечение , необходимо зарегистрироваться
ХАОС, ВЫРАВНИВАЙТЕИтеративное выравниваниеОбаМестный (предпочтительно)М. Брудно и Б. Моргенштерн2003
Клустал ВПрогрессивное выравниваниеОбаЛокальный или глобальныйТомпсон и др.1994Бесплатно, LGPL
Выравниватель кодона и кодаМногоуровневое выравнивание; поддержка ClustalW и PhrapНуклеотидыЛокальный или глобальныйП. Рихтерих и др.2003 (последняя версия 2009)
КомпасСравнение множественных выравниваний последовательностей белков с оценкой статистической значимостиБелокГлобальныйСадреев Р.И. и др.2009
РАСШИФРОВАТЬПрогрессивно-итеративное выравниваниеОбаГлобальныйЭрик С. Райт2014Бесплатно, GPL
DIALIGN-TX и DIALIGN-TМетод, основанный на сегментахОбаЛокальный (предпочтительно) или глобальныйARSubramanian2005 (последняя версия 2008)
Выравнивание ДНКМетод внутривидового выравнивания на основе сегментовОбаЛокальный (предпочтительно) или глобальныйА.Рёль2005 (последняя версия 2008)
Сборщик последовательности оснований ДНКМногократное выравнивание; Полное автоматическое выравнивание последовательностей; Автоматическое исправление неоднозначности; Внутренний вызов базы; Выравнивание последовательностей в командной строкеНуклеотидыЛокальный или глобальныйГеракл БиоСофт SRL2006 (последняя версия 2018)Коммерческое (некоторые модули бесплатны)
DNADynamoСвязанное ДНК с белком множественное выравнивание с MUSCLE , Clustal и Smith-WatermanОбаЛокальный или глобальныйDNADynamo2004 (последняя версия 2017)
ЭДНАМножественное выравнивание последовательностей на основе энергии для участков связывания ДНКНуклеотидыЛокальный или глобальныйСалама, Р.А. и др.2013
ФАМСАПрогрессивное выравнивание для очень больших семейств белков (сотни тысяч членов)БелокГлобальныйДеорович и др.2016Бесплатно, GPL 3
FSAПоследовательный отжигОбаГлобальныйРК Брэдли и др.2008
ГениальныйПрогрессивно-итеративное выравнивание; плагин ClustalWОбаЛокальный или глобальныйА. Дж. Драммонд и др.2005 (последняя версия 2017)
РУКОВОДСТВОКонтроль качества и фильтрация множественных выравниваний последовательностейОбаЛокальный или глобальныйО. Пенн и др.2010 (последняя версия 2015)
КалигнПрогрессивное выравниваниеОбаГлобальныйТ. Лассманн2005
МАКСЕПрогрессивно-итеративное выравнивание. Множественное выравнивание кодирующих последовательностей с учетом сдвигов рамки считывания и стоп-кодонов.НуклеотидыГлобальныйВ. Ранвез и др.2011 (последняя версия, v2.07 2023)
МАФФТПрогрессивно-итеративное выравниваниеОбаЛокальный или глобальныйК. Като и др.2005Бесплатно, BSD
МАРНАМногоуровневое выравнивание РНКРНКМестныйС. Зиберт и др.2005
МАВИДПрогрессивное выравниваниеОбаГлобальныйН. Брей и Л. Пэчтер2004
MegAlign Pro (молекулярная биология Lasergene)Программное обеспечение для выравнивания последовательностей ДНК, РНК, белков или ДНК + белок с помощью алгоритмов парного и множественного выравнивания последовательностей, включая MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson и анализ Dotplot.ОбаЛокальный или глобальныйДНК-СТАР1993-2023
МСАДинамическое программированиеОбаЛокальный или глобальныйDJ Липман и др.1989 (изменён в 1995)
MSAProbsДинамическое программированиеБелокГлобальныйЮ. Лю, Б. Шмидт, Д. Маскелл2010
МУЛЬТАЛИНДинамическое программирование-кластеризацияОбаЛокальный или глобальныйФ. Корпет1988
Мульти-ЛАГАНПрогрессивное динамическое программирование выравниванияОбаГлобальныйМ. Брудно и др.2003
МЫШЦАПрогрессивно-итеративное выравниваниеОбаЛокальный или глобальныйР. Эдгар2004
ОпалПрогрессивно-итеративное выравниваниеОбаЛокальный или глобальныйТ. Уилер и Дж. Кечечиоглу2007 (последняя стабильная версия 2013, последняя бета-версия 2016)
ПеканВероятностно-согласованностьДНКГлобальныйБ. Патен и др.2008
ФилоЧеловеческая вычислительная структура для сравнительной геномики для решения множественного выравниванияНуклеотидыЛокальный или глобальныйМакгилл Биоинформатика2010
PMFastRПрогрессивное структурно-ориентированное выравниваниеРНКГлобальныйД. ДеБлазио, Дж. Браунд, С. Чжан2009
ПралинеПрогрессивно-итеративное-согласованное-гомологическое-расширенное выравнивание с предварительным профилированием и прогнозированием вторичной структурыБелокГлобальныйДж. Херинга1999 (последняя версия 2009)
PicXAAНепрогрессивное, максимально ожидаемая точность выравниванияОбаГлобальныйМСП Сахрейян и Б.Дж. Юн2010
POAМодель частичного порядка/скрытого МарковаБелокЛокальный или глобальныйС. Ли2002
ProbalignВероятностность/согласованность с вероятностями функции распределенияБелокГлобальныйРошан и Ливси2006Бесплатно, общественное достояние
ПробКонсВероятность/согласованностьБелокЛокальный или глобальныйК. До и др.2005Бесплатно, общественное достояние
PROMALS3DПрогрессивное выравнивание/скрытая марковская модель/вторичная структура/3D-структураБелокГлобальныйДж. Пей и др.2008
ПРРН/ПРРПИтеративное выравнивание (особенно уточнение)БелокЛокальный или глобальныйY. Totoki (по мотивам O. Gotoh)1991 и позже
PSAlignСохранение выравнивания неэвристическоеОбаЛокальный или глобальныйШ. Цзе, И. Лу, Ц. Ян.2006
РевТрансОбъединяет выравнивание ДНК и белков путем обратного перевода выравнивания белков в ДНК.ДНК/Белок (специальный)Локальный или глобальныйВернерссон и Педерсен2003 (последняя версия 2005)
САГАВыравнивание последовательности с помощью генетического алгоритмаБелокЛокальный или глобальныйC. Нотрдам и др.1996 (новая версия 1998)
СЭМСкрытая марковская модельБелокЛокальный или глобальныйА. Крог и др.1994 (последняя версия 2002)
ТюленьРучное выравниваниеОбаМестныйА. Рамбо2002
СтатАлайнБайесовская совместная оценка выравнивания и филогении (MCMC)ОбаГлобальныйА. Новак и др.2008
СтемлокМножественное выравнивание и прогнозирование вторичной структурыРНКЛокальный или глобальныйИ. Холмс2005Бесплатно, GPL 3 (часть DART)
T-КофеБолее чувствительное прогрессивное выравниваниеОбаЛокальный или глобальныйC. Нотрдам и др.2000 (последняя версия 2008)Бесплатно, GPL 2
ЮГЕНПоддерживает множественное выравнивание с плагинами MUSCLE , KAlign, Clustal и MAFFTОбаЛокальный или глобальныйКоманда UGENE2010 (последняя версия 2020)Бесплатно, GPL 2
ВекторДрузьяVectorFriends Aligner, плагин MUSCLE и плагин Clustal WОбаЛокальный или глобальныйКоманда BioFriends2013Запатентованное , бесплатное программное обеспечение для академического использования
GLProbsАдаптивный подход на основе парно-скрытой марковской моделиБелокГлобальныйY. Ye и др.2013

* Тип последовательности: белок или нуклеотид. ** Тип выравнивания: локальное или глобальное.

Геномный анализ

ИмяОписаниеТип последовательности*
ОРЕЛ [32]Сверхбыстрый инструмент для поиска относительно отсутствующих слов в геномных данныхНуклеотид
ACT (инструмент сравнения Artemis)Синтения и сравнительная геномикаНуклеотид
ЖадныйПопарное глобальное выравнивание с целыми геномамиНуклеотид
БЛАТВыравнивание последовательностей кДНК с геномом.Нуклеотид
РАСШИФРОВАТЬВыравнивание перестроенных геномов с использованием 6-кадровой трансляцииНуклеотид
FLAKНечеткое выравнивание и анализ всего геномаНуклеотид
ГМАПВыравнивание последовательностей ДНК с геномом. Определяет соединения сайтов сплайсинга с высокой точностью.Нуклеотид
СплигнВыравнивание последовательностей ДНК с геномом. С высокой точностью определяет места соединения сайтов сплайсинга. Способен распознавать и разделять дупликации генов.Нуклеотид
СиреневыйМножественное выравнивание перестроенных геномовНуклеотид
МГАМногогеномный выравнивательНуклеотид
МуланЛокальные множественные выравнивания последовательностей длины геномаНуклеотид
МультизМножественное выравнивание геномовНуклеотид
PLAST-нкРНКПоиск некодируемых РНК в геномах с помощью локального выравнивания функции распределенияНуклеотид
СекверомПрофилирование данных выравнивания последовательностей с основными серверами/сервисамиНуклеотид, пептид
СекуилабПрофилирование данных выравнивания последовательностей из результатов NCBI-BLAST с основными серверами-сервисамиНуклеотид, пептид
Перетасовать-LAGANПопарное глобальное выравнивание завершенных участков геномаНуклеотид
SIBsim4, Sim4Программа, разработанная для выравнивания экспрессированной последовательности ДНК с геномной последовательностью, позволяющая использовать интроныНуклеотид
SLAMПоиск генов, выравнивание, аннотация (идентификация гомологии человека и мыши)Нуклеотид
СРПРИЗМЭффективный выравниватель для сборок с явными гарантиями, выравнивающий чтения без сращиванийНуклеотид

* Тип последовательности: белок или нуклеотид


Поиск мотива

ИмяОписаниеТип последовательности*
ПМСПоиск и обнаружение мотиваОба
ФММПоиск и обнаружение мотивов (можно также получить положительные и отрицательные последовательности в качестве входных данных для расширенного поиска мотивов)Нуклеотид
БЛОКИИдентификация неразрывного мотива из базы данных BLOCKSОба
eMOTIFИзвлечение и идентификация более коротких мотивовОба
сэмплер мотива ГиббсаСтохастическое извлечение мотива с помощью статистического правдоподобияОба
HMMТОППрогнозирование трансмембранных спиралей и топологии белковБелок
I-сайтыБиблиотека мотивов местной структурыБелок
JCoilsПрогнозирование спиральной спирали и лейциновой молнииБелок
МЕМ /МАСТОбнаружение и поиск мотивовОба
CUDA-МЕМАлгоритм MEME (v4.4.0) с ускорением на GPU для кластеров GPUОба
МЕРСИОбнаружение и поиск дискриминационных мотивовОба
PHI-BlastИнструмент поиска и выравнивания мотивовОба
ФилосканИнструмент поиска мотивовНуклеотид
ПРАТТГенерация шаблонов для использования с ScanPrositeБелок
ScanPrositeИнструмент поиска в базе данных MotifБелок
ТЕЙРЕСИЙИзвлечение мотивов и поиск в базе данныхОба
БАЗАЛЬТПоиск по нескольким мотивам и регулярным выражениямОба

* Тип последовательности: белок или нуклеотид


Бенчмаркинг

ИмяАвторы
ПФАМ 30.0 (2016)
УМНЫЙ (2015)Летунич, Копли, Шмидт, Чикарелли, Дёркс, Шульц, Понтинг, Борк
BAliBASE 3 (2015)Томпсон, Плевниак, Поч
Оксбенч (2011)Рагхава, Сирл, Одли, Барбер, Бартон
Коллекция эталонов (2009)Эдгар
ХОМСТРАД (2005)Мидзугучи
ПРЕФАБ 4.0 (2005)Эдгар
SABмарк (2004)Ван Валле, Ластерс, Винс

Просмотрщики, редакторы выравнивания

См. Список программного обеспечения для визуализации выравнивания .

Выравнивание последовательности коротких прочтений

ИмяОписаниевариант с парным концомИспользуйте качество FASTQРазрывМногопоточныйЛицензияСсылкаГод
АриокВычисляет выравнивания Смита-Уотермана с зазорами и качества отображения на одном или нескольких графических процессорах. Поддерживает выравнивания BS-seq. Обрабатывает от 100 000 до 500 000 считываний в секунду (зависит от данных, оборудования и настроенной чувствительности).ДаНетДаДаБесплатно, BSD[33]2015
BarraCUDAПрограмма выравнивания коротких прочтений с использованием преобразования Барроуза-Уиллера (индекс FM) на основе BWA, ускоренная GPGPU , поддерживает выравнивание инделей с открытиями и расширениями пробелов.ДаНетДаДа, потоки POSIX и CUDAБесплатно, GPL
BBMapИспользует короткие кмеры для быстрой индексации генома; нет ограничений по размеру или количеству скаффолдов. Более высокая чувствительность и специфичность, чем у выравнивателей Берроуза-Уиллера, с аналогичной или большей скоростью. Выполняет глобальное выравнивание с оптимизацией аффинного преобразования, которое медленнее, но точнее, чем у Смита-Уотермана. Обрабатывает данные Illumina, 454, PacBio, Sanger и Ion Torrent. Осведомлен о сплайсинге; способен обрабатывать длинные индели и РНК-секвенирование. Чистая Java; работает на любой платформе. Используется Объединенным институтом генома .ДаДаДаДаБесплатно, BSD2010
БФАСТЯвный компромисс времени и точности с предварительной оценкой точности, поддерживаемой индексацией референтных последовательностей. Оптимально сжимает индексы. Может обрабатывать миллиарды коротких прочтений. Может обрабатывать вставки, удаления, SNP и ошибки цвета (может отображать прочтения цветового пространства ABI SOLiD). Выполняет полное выравнивание Смита-Уотермана.Да, потоки POSIXБесплатно, GPL[34]2009
BigBWAЗапускает Burrows–Wheeler Aligner -BWA на кластере Hadoop . Поддерживает алгоритмы BWA-MEM, BWA-ALN и BWA-SW, работающие с парными и одиночными чтениями. Это подразумевает существенное сокращение времени вычислений при запуске в кластере Hadoop, добавляя масштабируемость и отказоустойчивость.ДаНизкое качество обрезки основанийДаДаБесплатно, GPL 3[35]2015
БЛАСТНПрограмма выравнивания нуклеотидов BLAST медленная и неточная для коротких прочтений, а также использует базу данных последовательностей (EST, последовательность Сэнгера) вместо референсного генома.
БЛАТСделано Джимом Кентом . Может справиться с одним несовпадением на начальном этапе выравнивания.Да, клиент-серверЗапатентованное , бесплатное программное обеспечение для академического и некоммерческого использования[36]2002
Галстук-бабочкаИспользует преобразование Барроуза-Уиллера для создания постоянного, повторно используемого индекса генома; 1,3 ГБ памяти для генома человека. Выравнивает более 25 миллионов чтений Illumina за 1 час ЦП. Поддерживает политики выравнивания Maq-like и SOAP-likeДаДаНетДа, потоки POSIXСвободный, Художественный[37]2009
БВАИспользует преобразование Барроуза–Уиллера для создания индекса генома. Это немного медленнее, чем Bowtie, но позволяет вставки в выравнивании.ДаНизкое качество обрезки основанийДаДаБесплатно, GPL[38]2009
BWA-PSSMВероятностный выравниватель коротких прочтений, основанный на использовании матриц оценки положения (PSSM). Выравниватель является адаптируемым в том смысле, что он может учитывать оценки качества прочтений и модели смещений, специфичных для данных, например, наблюдаемых в Ancient DNA, данных PAR-CLIP или геномах со смещенными нуклеотидными композициями. [39]ДаДаДаДаБесплатно, GPL[39]2014
CASHXКоличественная оценка и управление большими объемами данных коротких последовательностей. Конвейер CASHX содержит набор инструментов, которые можно использовать вместе или по отдельности в качестве модулей. Этот алгоритм очень точен для идеальных попаданий в референсный геном.НетЗапатентованное , бесплатное программное обеспечение для академического и некоммерческого использования
ЛивеньКороткое картирование с использованием Hadoop MapReduceДа, Hadoop MapReduceСвободный, Художественный
CUDA-ECИсправление ошибок выравнивания короткого считывания с использованием графических процессоров.Да, графический процессор включен
КУШОУСовместимый с CUDA выравниватель коротких прочтений для больших геномов на основе преобразования Барроуза-УиллераДаДаНетДа (графический процессор включен)Бесплатно, GPL[40]2012
КУШАВ2Выравнивание Gapped short-read и long-read на основе максимального точного соответствия семян. Этот выравниватель поддерживает как базовое пространство (например, от секвенаторов Illumina, 454, Ion Torrent и PacBio), так и цветовое пространство ABI SOLiD.ДаНетДаДаБесплатно, GPL2014
CUSHAW2-ГПУКороткосчитывающее выравнивающее устройство CUSHAW2 с ускорением на GPU.ДаНетДаДаБесплатно, GPL
КУШАВ3Чувствительное и точное выравнивание базового пространства и цветового пространства с коротким считыванием с гибридным посевомДаНетДаДаБесплатно, GPL[41]2012
докторФАСТПрограммное обеспечение для выравнивания карт чтения, реализующее забвение кэша для минимизации передач основной/кэш-памяти, как mrFAST и mrsFAST, однако разработанное для платформы секвенирования SOLiD (чтения цветового пространства). Оно также возвращает все возможные местоположения карты для улучшенного обнаружения структурных вариаций.ДаДа, для структурной вариацииДаНетБесплатно, BSD
ЭЛАНДРеализовано Illumina. Включает выравнивание без зазоров с конечной длиной считывания.
ЭРНЕРасширенный рандомизированный числовой alignEr для точного выравнивания прочтений NGS. Может картировать прочтения, обработанные бисульфитом.ДаНизкое качество обрезки основанийДаМногопоточность и поддержка MPIБесплатно, GPL 3
ГАСССТНаходит глобальные выравнивания коротких последовательностей ДНК по отношению к крупным банкам ДНКМногопоточностьЛицензия CeCILL версии 2.[42]2011
ДЖЕМВысококачественный движок выравнивания (исчерпывающее картирование с заменами и инделами). Более точный и в несколько раз более быстрый, чем BWA или Bowtie 1/2. Предоставлено множество автономных биологических приложений (картогенератор, сплит-картогенератор, картогенерация и другие).ДаДаДаДаБесплатно, GPL 3[43]2012
Дженалисе КАРТАСверхбыстрый и комплексный NGS-сканер с высокой точностью и малыми габаритами.ДаНизкое качество обрезки основанийДаДаЗапатентованный , коммерческий
Гениальный ассемблерБыстрый и точный ассемблер перекрытия, способный обрабатывать любую комбинацию технологий секвенирования, длины прочтения, любые ориентации спаривания, с любым размером спейсера для спаривания, с референсным геномом или без него.ДаЗапатентованный , коммерческий
GensearchNGSПолная структура с удобным графическим интерфейсом для анализа данных NGS. Она объединяет собственный высококачественный алгоритм выравнивания и возможность подключаемого модуля для интеграции различных общедоступных выравнивателей в структуру, позволяющую импортировать короткие чтения, выравнивать их, обнаруживать варианты и генерировать отчеты. Она создана для проектов по ресеквенированию, а именно в диагностических целях.ДаНетДаДаЗапатентованный , коммерческий
GMAP и GSNAPНадежное, быстрое выравнивание коротких прочтений. GMAP: более длинные прочтения с множественными инделями и сплайсингами (см. запись выше в разделе «Анализ геномики»); GSNAP: более короткие прочтения с одним инделем или до двух сплайсов на прочтение. Полезно для цифровой экспрессии генов, генотипирования SNP и инделей. Разработано Томасом Ву в Genentech. Используется Национальным центром геномных ресурсов (NCGR) в Альфеусе.ДаДаДаДаЗапатентованное , бесплатное программное обеспечение для академического и некоммерческого использования
GNUMAPТочно выполняет выравнивание с зазорами данных последовательности, полученных с помощью секвенирующих машин нового поколения (в частности, Solexa-Illumina), обратно в геном любого размера. Включает обрезку адаптера, вызов SNP и анализ последовательности бисульфита.Да, также поддерживает файлы Illumina *_int.txt и *_prb.txt со всеми 4 показателями качества для каждой базыМногопоточность и поддержка MPI[44]2009
HIVE-шестиугольникИспользует хэш-таблицу и матрицу Блума для создания и фильтрации потенциальных позиций в геноме. Для большей эффективности использует перекрестное сходство между короткими прочтениями и избегает повторного выравнивания неуникальных избыточных последовательностей. Он быстрее, чем Bowtie и BWA, и допускает индели и дивергентные чувствительные выравнивания на вирусах, бактериях и более консервативные эукариотические выравнивания.ДаДаДаДаЗапатентованное , бесплатное программное обеспечение для академических и некоммерческих пользователей, зарегистрированных в экземпляре развертывания HIVE[45]2014
ИМОСУлучшенный Meta-aligner и Minimap2 на Spark. Распределенный выравниватель с длинными чтениями на платформе Apache Spark с линейной масштабируемостью относительно выполнения на одном узле.ДаДаДаБесплатно
ИсаакПолностью использует всю вычислительную мощность, доступную на одном серверном узле; таким образом, он хорошо масштабируется в широком диапазоне аппаратных архитектур, а производительность выравнивания улучшается с возможностями оборудованияДаДаДаДаБесплатно, GPL
ПОСЛЕДНИЙИспользует адаптивные семена и более эффективно справляется с последовательностями, богатыми повторами (например, геномами). Например: он может выравнивать считывания с геномами без маскировки повторов, не перегружая себя повторяющимися попаданиями.ДаДаДаДаБесплатно, GPL[46]2011
МАКВыравнивание без пробелов, учитывающее показатели качества для каждой базы.Бесплатно, GPL
mrFAST, mrsFASTПрограммное обеспечение для выравнивания Gapped (mrFAST) и ungapped (mrsFAST), которое реализует кэш-забвение для минимизации передач основной/кэш-памяти. Они разработаны для платформы секвенирования Illumina и могут возвращать все возможные местоположения карты для улучшенного обнаружения структурных вариаций.ДаДа, для структурной вариацииДаНетБесплатно, BSD
МАМАMOM или максимальное олигонуклеотидное картирование — это инструмент сопоставления запросов, который фиксирует максимальное совпадение длины в коротком прочтении.Да
МОЗАИКАБыстрый выравниватель с зазорами и ассемблер с референсным управлением. Выравнивает считывания с помощью алгоритма Смита-Уотермана с полосами , затравленными результатами схемы хеширования k-mer. Поддерживает считывания размером от очень коротких до очень длинных.Да
MPscanБыстрое выравнивание на основе стратегии фильтрации (без индексации, с использованием q-грамм и обратного недетерминированного сопоставления DAWG )[47]2009
Novoalign и NovoalignCSВыравнивание с зазорами одиночных и парных концов Illumina GA I & II, цветовое пространство ABI и ION Torrent считывания. Высокая чувствительность и специфичность, использование базовых качеств на всех этапах выравнивания. Включает обрезку адаптера, калибровку базового качества, выравнивание Bi-Seq и опции для сообщения о нескольких выравниваниях на считывание. Использование неоднозначных кодов IUPAC в качестве ссылки для распространенных SNP может улучшить отзыв SNP и устранить аллельное смещение.ДаДаДаВерсии с многопоточностью и MPI доступны по платной лицензииЗапатентованная , бесплатная однопоточная версия для академического и некоммерческого использования
NextGENeРазработано для использования биологами, выполняющими анализ данных секвенирования нового поколения с платформ Roche Genome Sequencer FLX, Illumina GA/HiSeq, Life Technologies Applied BioSystems' SOLiD System, PacBio и Ion Torrent.ДаДаДаДаЗапатентованный , коммерческий
NextGenMapГибкая и быстрая программа картирования чтения (вдвое быстрее BWA), достигает чувствительности картирования, сравнимой со Stampy. Внутренне использует эффективную по памяти индексную структуру (хэш-таблицу) для хранения позиций всех 13-меров, присутствующих в эталонном геноме. Регионы картирования, где требуются парные выравнивания, динамически определяются для каждого считывания. Использует быстрые инструкции SIMD (SSE) для ускорения вычислений выравнивания на CPU. Если доступно, выравнивания вычисляются на GPU (с использованием OpenCL/CUDA), что дополнительно сокращает время выполнения на 20–50%.ДаНетДаДа, потоки POSIX , OpenCL/ CUDA , SSEБесплатно[48]2013
Набор инструментов Omixon VariantВключает высокочувствительные и высокоточные инструменты для обнаружения SNP и инделей. Он предлагает решение для картирования коротких прочтений NGS с умеренным расстоянием (до 30% расхождения последовательностей) от референтных геномов. Он не накладывает ограничений на размер референта, что в сочетании с его высокой чувствительностью делает Variant Toolkit хорошо подходящим для проектов целевого секвенирования и диагностики.ДаДаДаДаЗапатентованный , коммерческий
PALMapperЭффективно вычисляет как сплайсированные, так и несплайсированные выравнивания с высокой точностью. Опираясь на стратегию машинного обучения в сочетании с быстрым отображением на основе алгоритма типа полосового Смита-Уотермана, он выравнивает около 7 миллионов считываний в час на одном ЦП. Он совершенствует первоначально предложенный подход QPALMA.ДаБесплатно, GPL
Партек ФлоуДля использования биологами и биоинформатиками. Поддерживает выравнивание без разрывов, с разрывами и выравнивание сплайс-соединения из одно- и парных конечных прочтений из необработанных данных Illumina, Life technologies Solid TM, Roche 454 и Ion Torrent (с информацией о качестве или без нее). Интегрирует мощный контроль качества на уровне FASTQ/Qual и выровненных данных. Дополнительные функции включают обрезку и фильтрацию необработанных прочтений, обнаружение SNP и InDel, количественную оценку мРНК и микроРНК и обнаружение генов слияния.ДаДаДаМногоядерный процессор, возможна установка клиент-серверЗапатентованная , коммерческая , бесплатная пробная версия
ПРОХОДИТЬИндексирует геном, затем расширяет семена, используя предварительно вычисленные выравнивания слов. Работает с базовым пространством, цветовым пространством (SOLID) и может выравнивать геномные и сплайсированные считывания РНК-секвенирования.ДаДаДаДаЗапатентованное , бесплатное программное обеспечение для академического и некоммерческого использования
ПерМИндексирует геном с периодическими семенами для быстрого поиска выравниваний с полной чувствительностью до четырех несовпадений. Может картировать чтения Illumina и SOLiD. В отличие от большинства программ картирования, скорость увеличивается для более длинных чтений.ДаБесплатно, GPL[49]
ПРИМЕКСИндексирует геном с помощью таблицы поиска k-mer с полной чувствительностью вплоть до регулируемого числа несовпадений. Лучше всего подходит для сопоставления последовательностей 15-60 п.н. с геномом.НетНетДаНет, несколько процессов на один поиск[1]2003
QPalmaМожет использовать показатели качества, длины интронов и предсказания вычислительных сайтов сплайсинга для выполнения и выполняет беспристрастное выравнивание. Может быть обучен специфике эксперимента РНК-секвенирования и генома. Полезно для обнаружения сайтов сплайсинга/интронов и для построения моделей генов. (См. PALMapper для более быстрой версии).Да, клиент-серверБесплатно, GPL 2
RazerSНет ограничений на длину чтения. Картирование расстояния Хэмминга или редактирования с настраиваемыми частотами ошибок. Настраиваемая и предсказуемая чувствительность (компромисс между временем выполнения и чувствительностью). Поддерживает картирование чтения с парных концов.Бесплатно, LGPL
РЕАЛЬНЫЙ, РЕАЛЬНЫЙREAL — эффективный, точный и чувствительный инструмент для выравнивания коротких прочтений, полученных с помощью секвенирования следующего поколения. Программа может обрабатывать огромное количество одноконцевых прочтений, сгенерированных анализатором генома следующего поколения Illumina/Solexa. cREAL — простое расширение REAL для выравнивания коротких прочтений, полученных с помощью секвенирования следующего поколения, с геномом с кольцевой структурой.ДаДаБесплатно, GPL
РМАПМожет отображать чтения с информацией о вероятности ошибок или без нее (оценки качества) и поддерживает чтения с парными концами или картирование чтения, обработанного бисульфитом. Нет ограничений на длину чтения или количество несовпадений.ДаДаДаБесплатно, GPL 3
РНКРандомизированный числовой выравниватель для точного выравнивания результатов NGSДаНизкое качество обрезки основанийДаМногопоточность и поддержка MPIБесплатно, GPL 3
Следователь РТГЧрезвычайно быстрый, устойчив к высокому количеству инделей и замен. Включает полное выравнивание прочтений. Продукт включает комплексные конвейеры для обнаружения вариантов и метагеномного анализа с любой комбинацией данных Illumina, Complete Genomics и Roche 454.ДаДа, для вариантов вызоваДаДаЗапатентованное , бесплатное программное обеспечение для индивидуального использования исследователями
СегемельМожет обрабатывать вставки, удаления, несоответствия; использует расширенные массивы суффиксовДаНетДаДаЗапатентованное , бесплатное программное обеспечение для некоммерческого использования[50]2009
SeqMapДо 5 смешанных замен и вставок-удалений; различные варианты настройки и форматы ввода-выводаЗапатентованное , бесплатное программное обеспечение для академического и некоммерческого использования
ШрекКороткое исправление ошибок чтения с помощью структуры данных суффиксного дереваДа, Ява
КреветкаИндексирует эталонный геном версии 2. Использует маски для генерации возможных ключей. Может отображать считывания цветового пространства ABI SOLiD.ДаДаДаДа, OpenMPБесплатно, [[BSD лицензииБесплатно, производная BSD ]]

[51] [52]

2009-2011
СЛАЙДЕРSlider — это приложение для выходных данных Illumina Sequence Analyzer, которое использует файлы «вероятности» вместо файлов последовательностей в качестве входных данных для выравнивания с референтной последовательностью или набором референтных последовательностей.ДаДаНетНет[53] [54]2009-2010
SOAP, SOAP2, SOAP3, SOAP3-dpSOAP: надежный с небольшим (1-3) количеством пробелов и несовпадений. Улучшение скорости по сравнению с BLAT, использует 12-буквенную хэш-таблицу. SOAP2: использует двунаправленный BWT для построения индекса ссылок, и это намного быстрее первой версии. SOAP3: версия с ускорением на GPU, которая может найти все выравнивания по 4 несовпадениям за десятки секунд на миллион чтений. SOAP3-dp, также с ускорением на GPU, поддерживает произвольное количество несовпадений и пробелов в соответствии с оценками штрафа за аффинные пробелы.ДаНетДа, SOAP3-dpДа, потоки POSIX ; SOAP3, SOAP3-dp требуют GPU с поддержкой CUDAБесплатно, GPL[55] [56]
СОКСДля технологий ABI SOLiD. Значительное увеличение времени сопоставления считываний с несовпадениями (или ошибками цвета). Использует итеративную версию алгоритма поиска строк Рабина-Карпа.ДаБесплатно, GPL
SparkBWAИнтегрирует Burrows–Wheeler Aligner (BWA) на фреймворке Apache Spark, работающем поверх Hadoop . Версия 0.2 от октября 2016 года поддерживает алгоритмы BWA-MEM, BWA-backtrack и BWA-ALN. Все они работают с одиночными чтениями и чтениями с парных концов.ДаНизкое качество обрезки основанийДаДаБесплатно, GPL 3[57]2016
ССАХА, ССАХА2Быстро для небольшого количества вариантовЗапатентованное , бесплатное программное обеспечение для академического и некоммерческого использования
ШтампованныйДля прочтений Illumina. Высокая специфичность и чувствительность к прочтениям с инделями, структурными вариантами или многими SNP. Медленно, но скорость резко возросла при использовании BWA для первого прохода выравнивания.ДаДаДаНетЗапатентованное , бесплатное программное обеспечение для академического и некоммерческого использования[58]2010
StoRMДля прочтений Illumina или ABI SOLiD с собственным выводом SAM . Высокая чувствительность к прочтениям с большим количеством ошибок, инделей (полная поддержка от 0 до 15, в противном случае расширенная поддержка). Использует разнесенные семена (одиночное попадание) и очень быстрый фильтр выравнивания полос SSE - SSE2 - AVX2 - AVX-512 . Только для прочтений фиксированной длины авторы рекомендуют SHRiMP2 в противном случае.НетДаДаДа, OpenMPБесплатно[59]2010
Subread, SubjuncСверхбыстрые и точные выравниватели прочтений. Subread можно использовать для картирования прочтений как gDNA-seq, так и RNA-seq. Subjunc обнаруживает экзон-экзонные соединения и картирует прочтения RNA-seq. Они используют новую парадигму картирования, называемую seed-and-vote .ДаДаДаДаБесплатно, GPL 3
ТайпанАссемблер de-novo для Illumina читаетЗапатентованное , бесплатное программное обеспечение для академического и некоммерческого использования
ЮГЕНВизуальный интерфейс как для Bowtie, так и для BWA, а также встроенный элайнерДаДаДаДаБесплатно, GPL
VelociMapperИнструмент для выравнивания референтных последовательностей с ускорением ПЛИС от TimeLogic . Быстрее, чем алгоритмы на основе преобразования Барроуза-Уиллера, такие как BWA и Bowtie. Поддерживает до 7 несовпадений и/или инделей без потери производительности. Создает чувствительные выравнивания с зазорами Смита-Уотермана.ДаДаДаДаЗапатентованный , коммерческий
XpressAlignВыравниватель коротких считываний на основе скользящего окна FPGA, который использует смущающе параллельное свойство выравнивания коротких считываний. Производительность масштабируется линейно с количеством транзисторов на чипе (т. е. производительность гарантированно удваивается с каждой итерацией закона Мура без изменения алгоритма). Низкое энергопотребление полезно для оборудования центров обработки данных. Предсказуемое время выполнения. Лучшее соотношение цены и производительности, чем программные выравниватели скользящего окна на текущем оборудовании, но не лучше, чем программные выравниватели на основе BWT в настоящее время. Может обрабатывать большое количество (>2) несовпадений. Находит все позиции попаданий для всех начальных значений. Экспериментальная версия с одним FPGA, требуется работа по ее превращению в производственную версию с несколькими FPGA.Запатентованное , бесплатное программное обеспечение для академического и некоммерческого использования
УВЕЛИЧИТЬ100% чувствительность для считываний от 15 до 240 п.н. с практическими несовпадениями. Очень быстро. Поддерживает вставки и удаления. Работает с инструментами Illumina и SOLiD, но не 454.Да (графический интерфейс), нет (командная строка)Запатентованный , коммерческий[60]

Смотрите также

Ссылки

  1. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Miller; Myers; Lipman (октябрь 1990 г.). "Базовый инструмент поиска локального выравнивания". Журнал молекулярной биологии . 215 (3): 403–10. doi :10.1016/S0022-2836(05)80360-2. PMID  2231712. S2CID  14441902.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  2. ^ Репозиторий кода HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST
  3. ^ Angermüller, C.; Biegert, A.; Söding, J. (декабрь 2012 г.). «Дискриминативное моделирование вероятностей замен аминокислот в зависимости от контекста». Bioinformatics . 28 (24): 3240–7. doi : 10.1093/bioinformatics/bts622 . hdl : 11858/00-001M-0000-0015-8D22-F . PMID  23080114.
  4. ^ Бухфинк, Кси и Хасон (2015). «Быстрое и чувствительное выравнивание белков с использованием DIAMOND». Nature Methods . 12 (1): 59–60. doi :10.1038/nmeth.3176. PMID  25402007. S2CID  5346781.
  5. ^ B Buchfink, K Reuter и HG Drost (2021). «Чувствительные выравнивания белков в масштабе дерева жизни с использованием DIAMOND». Nature Methods . 18 (4): 366–368. doi : 10.1038/s41592-021-01101-x . PMC 8026399. PMID  33828273 . 
  6. ^ Дурбин, Ричард; Эдди, Шон Р.; Крог, Андерс ; Митчисон, Грэм, ред. (1998). Анализ биологической последовательности: вероятностные модели белков и нуклеиновых кислот . Кембридж, Великобритания: Cambridge University Press. ISBN 978-0-521-62971-3.[ нужна страница ]
  7. ^ Söding J (апрель 2005 г.). «Определение гомологии белков путем сравнения HMM-HMM». Биоинформатика . 21 (7): 951–60. doi : 10.1093/bioinformatics/bti125 . hdl : 11858/00-001M-0000-0017-EC7A-F . PMID  15531603.
  8. ^ Реммерт, Михаэль; Бигерт, Андреас; Хаузер, Андреас; Сёдинг, Йоханнес (2011-12-25). "HHblits: молниеносный итеративный поиск белковой последовательности с помощью выравнивания HMM-HMM". Nature Methods . 9 (2): 173–175. doi :10.1038/nmeth.1818. hdl : 11858/00-001M-0000-0015-8D56-A . ISSN  1548-7105. PMID  22198341. S2CID  205420247.
  9. ^ Хаусведелл Х., Сингер Дж., Рейнерт К. (2014-09-01). «Лямбда: локальный выравниватель для массивных биологических данных». Биоинформатика . 30 (17): 349–355. doi :10.1093/bioinformatics/btu439. PMC 4147892. PMID  25161219 . 
  10. ^ Steinegger, Martin; Soeding, Johannes (2017-10-16). «MMseqs2 обеспечивает чувствительный поиск белковых последовательностей для анализа больших наборов данных». Nature Biotechnology . 35 (11): 1026–1028. doi :10.1038/nbt.3988. hdl : 11858/00-001M-0000-002E-1967-3 . PMID  29035372. S2CID  402352.
  11. ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Джусти, Армандо Э. Де; Найуф, Марсело; Прието-Матиас, Мануэль (2016-06-30). "OSWALD: OpenCL Smith–Waterman на FPGA Altera для больших баз данных белков". Международный журнал по высокопроизводительным вычислительным приложениям . 32 (3): 337–350. doi : 10.1177/1094342016654215. hdl : 11336/48798 . ISSN  1094-3420. S2CID  212680914.
  12. ^ Altschul SF, Madden TL, Schäffer AA и др. (сентябрь 1997 г.). «Gapped BLAST и PSI-BLAST: новое поколение программ поиска в базе данных белков». Nucleic Acids Research . 25 (17): 3389–402. doi :10.1093/nar/25.17.3389. PMC 146917 . PMID  9254694. 
  13. ^ Li W, McWilliam H, Goujon M и др. (июнь 2012 г.). «PSI-Search: итеративный поиск SSEARCH с уменьшенным профилем HOE». Биоинформатика . 28 (12): 1650–1651. doi :10.1093/bioinformatics/bts240. PMC 3371869. PMID  22539666 . 
  14. ^ Oehmen, C.; Nieplocha, J. (август 2006 г.). «ScalaBLAST: масштабируемая реализация BLAST для высокопроизводительного анализа биоинформатики с интенсивным использованием данных». IEEE Transactions on Parallel and Distributed Systems . 17 (8): 740–749. doi :10.1109/TPDS.2006.112. S2CID  11122366.
  15. ^ Хьюи, Р.; Карплус, К.; Крог, А. (2003). SAM: система программного обеспечения для выравнивания и моделирования последовательностей. Технический отчет UCSC-CRL-99-11 (Отчет). Калифорнийский университет, Санта-Круз, Калифорния.
  16. ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Де Джусти, Армандо; Наиуф, Марсело; Прието-Матиас, Мануэль (2015-12-25). «Анализ производительности SWIMM с учетом энергопотребления: реализация Смита–Уотермана на архитектурах Intel Multicore и Manycore». Параллелизм и вычисления: практика и опыт . 27 (18): 5517–5537. doi :10.1002/cpe.3598. hdl : 11336/53930 . ISSN  1532-0634. S2CID  42945406.
  17. ^ Руччи, Энцо; Гарсиа, Карлос; Ботелла, Гильермо; Де Джусти, Армандо; Науф, Марсело; Прието-Матиас, Мануэль (25 декабря 2015 г.). «SWIMM 2.0: усовершенствованная технология Смита-Уотермана для многоядерных и многоядерных архитектур Intel на основе векторных расширений AVX-512». Международный журнал параллельного программирования . 47 (2): 296–317. дои : 10.1007/s10766-018-0585-7. ISSN  1573-7640. S2CID  49670113.
  18. ^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Выравнивание человека и мыши с помощью BLASTZ". Genome Research . 13 (1): 103–107. doi :10.1101/gr.809403. PMC 430961 . PMID  12529312. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  19. ^ Харрис RS (2007). Улучшенное попарное выравнивание геномной ДНК (диссертация).
  20. ^ Сандес, Эданс Ф. де О.; де Мело, Альба Кристина М. А. (май 2013 г.). «Извлечение выравниваний Смита-Уотермана с оптимизацией для биологических последовательностей Megabase с использованием GPU». Труды IEEE по параллельным и распределенным системам . 24 (5): 1009–1021. doi :10.1109/TPDS.2012.194.
  21. ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (май 2014 г.). CUDAlign 3.0: Параллельное сравнение биологических последовательностей в больших кластерах GPU . Кластерные, облачные и сеточные вычисления (CCGrid), 2014 14-й Международный симпозиум IEEE/ACM. стр. 160. doi :10.1109/CCGrid.2014.18.
  22. ^ Сандес, Эданс Ф. де О.; Миранда, Г.; Де Мело, ACMA; Марторелл, Х.; Айгуаде, Э. (август 2014 г.). Сравнение мелкозернистой параллельной мегабазовой последовательности с несколькими гетерогенными графическими процессорами . Труды 19-го симпозиума ACM SIGPLAN по принципам и практике параллельного программирования. стр. 383–384. doi :10.1145/2555243.2555280.
  23. ^ Chivian, D; Baker, D (2006). "Моделирование гомологии с использованием параметрической генерации ансамбля выравнивания с консенсусом и выбором модели на основе энергии". Nucleic Acids Research . 34 (17): e112. doi :10.1093/nar/gkl480. PMC 1635247 . PMID  16971460. 
  24. ^ Girdea, M; Noe, L; Kucherov, G (январь 2010 г.). "Обратная трансляция для обнаружения отдаленных белковых гомологий при наличии мутаций со сдвигом рамки считывания". Алгоритмы для молекулярной биологии . 5 (6): 6. doi : 10.1186/1748-7188-5-6 . PMC 2821327. PMID  20047662 . 
  25. ^ Ma, B.; Tromp, J.; Li, M. (2002). «PatternHunter: более быстрый и чувствительный поиск гомологии». Биоинформатика . 18 (3): 440–445. doi : 10.1093/bioinformatics/18.3.440 . PMID  11934743.
  26. ^ Ли, М.; Ма, Б.; Кисман, Д.; Тромп, Дж. (2004). «Patternhunter II: высокочувствительный и быстрый поиск гомологии». Журнал биоинформатики и вычислительной биологии . 2 (3): 417–439. CiteSeerX 10.1.1.1.2393 . doi :10.1142/S0219720004000661. PMID  15359419. 
  27. ^ Гасфилд, Дэн (1997). Алгоритмы на строках, деревьях и последовательностях . Cambridge university press. ISBN 978-0-521-58519-4.
  28. ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Наиуф, Марсело; Де Джусти, Армандо; Прието-Матиас, Мануэль (2018). "SWIFOLD: реализация Смита-Уотермана на FPGA с OpenCL для длинных последовательностей ДНК". BMC Systems Biology . 12 (Suppl 5): 96. doi : 10.1186/s12918-018-0614-6 . PMC 6245597 . PMID  30458766. 
  29. ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Наиуф, Марсело; Де Джусти, Армандо; Прието-Матиас, Мануэль. Ускорение выравнивания Смита-Уотермана длинных последовательностей ДНК с помощью OpenCL на ПЛИС . 5-я Международная рабочая конференция по биоинформатике и биомедицинской инженерии. стр. 500–511. doi :10.1007/978-3-319-56154-7_45.
  30. ^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). «Эффективные фильтры q-грамм для поиска всех совпадений эпсилона на заданной длине». Журнал вычислительной биологии . 13 (2): 296–308. CiteSeerX 10.1.1.465.2084 . doi :10.1089/cmb.2006.13.296. PMID  16597241. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  31. ^ Ноэ Л., Кучеров Г.; Кучеров (2005). «YASS: повышение чувствительности поиска сходства ДНК». Nucleic Acids Research . 33 (suppl_2): W540–W543. doi :10.1093/nar/gki478. PMC 1160238. PMID  15980530 . 
  32. ^ Пратас, Диого; Сильва, Хорхе (2020). «Стойкие минимальные последовательности SARS-CoV-2». Биоинформатика . 36 (21): 5129–5132. doi : 10.1093/биоинформатика/btaa686 . ПМК 7559010 . ПМИД  32730589. 
  33. ^ Уилтон, Ричард; Будавари, Тамас; Лэнгмид, Бен; Уилан, Сара Дж.; Зальцберг, Стивен Л.; Салэй, Александр С. (2015). «Arioc: высокопроизводительное выравнивание чтения с ускоренным на GPU исследованием пространства поиска «seed-and-extend»». PeerJ . 3 : e808. doi : 10.7717/peerj.808 . PMC 4358639 . PMID  25780763. 
  34. ^ Гомер, Нильс; Мерриман, Барри; Нельсон, Стэнли Ф. (2009). "BFAST: инструмент выравнивания для крупномасштабного повторного секвенирования генома". PLOS ONE . 4 (11): e7767. Bibcode : 2009PLoSO...4.7767H. doi : 10.1371/journal.pone.0007767 . PMC 2770639. PMID  19907642 . 
  35. ^ Абуин, Дж. М.; Пичель, Дж. К.; Пена, TF; Амиго, Дж. (2015). «BigBWA: приближение к выравнивателю Берроуза–Уиллера для технологий больших данных». Биоинформатика . 31 (24): 4003–5. doi : 10.1093/bioinformatics/btv506 . PMID  26323715.
  36. ^ Кент, У. Дж. (2002). «BLAT — инструмент выравнивания, подобный BLAST». Genome Research . 12 (4): 656–664. doi : 10.1101/gr.229202. ISSN  1088-9051. PMC 187518. PMID  11932250. 
  37. ^ Лэнгмид, Бен; Трапнелл, Коул; Поп, Михай; Зальцберг, Стивен Л. (2009). «Сверхбыстрое и эффективное с точки зрения памяти выравнивание коротких последовательностей ДНК с человеческим геномом». Genome Biology . 10 (3): R25. doi : 10.1186/gb-2009-10-3-r25 . ISSN  1465-6906. PMC 2690996. PMID 19261174  . 
  38. ^ Ли, Х.; Дурбин, Р. (2009). «Быстрое и точное выравнивание коротких прочтений с помощью преобразования Барроуза–Уиллера». Биоинформатика . 25 (14): 1754–1760. doi :10.1093/bioinformatics/btp324. ISSN  1367-4803. PMC 2705234. PMID 19451168  . 
  39. ^ ab Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). «Адаптивное вероятностное отображение коротких прочтений с использованием матриц оценки, специфичных для позиции». BMC Bioinformatics . 15 (1): 100. doi : 10.1186/1471-2105-15-100 . ISSN  1471-2105. PMC 4021105 . PMID  24717095. 
  40. ^ Лю, Y.; Шмидт, B.; Маскелл, DL (2012). «CUSHAW: совместимый с CUDA выравниватель коротких прочтений для больших геномов на основе преобразования Барроуза–Уиллера». Биоинформатика . 28 (14): 1830–1837. doi : 10.1093/bioinformatics/bts276 . ISSN  1367-4803. PMID  22576173.
  41. ^ Лю, И.; Шмидт, Б. (2012). «Выравнивание длинных прочтений на основе максимального точного соответствия семян». Биоинформатика . 28 (18): i318–i324. doi :10.1093/bioinformatics/bts414. ISSN  1367-4803. PMC 3436841. PMID 22962447  . 
  42. ^ Ризк, Гийом; Лавенье, Доминик (2010). «GASSST: инструмент поиска коротких последовательностей глобального выравнивания». Биоинформатика . 26 (20): 2534–2540. doi : 10.1093/bioinformatics/btq485. PMC 2951093. PMID  20739310. 
  43. ^ Марко-Сола, Сантьяго; Саммет, Майкл; Гиго, Родерик; Рибека, Паоло (2012). «GEM-картограф: быстрое, точное и универсальное выравнивание с помощью фильтрации». Nature Methods . 9 (12): 1185–1188. doi :10.1038/nmeth.2221. ISSN  1548-7091. PMID  23103880. S2CID  2004416.
  44. ^ Клемент, Н. Л.; Снелл, К.; Клемент, М. Дж.; Холленхорст, П. К.; Пурвар, Дж.; Грейвс, Б. Дж.; Кэрнс, Б. Р.; Джонсон, У. Э. (2009). «Алгоритм GNUMAP: беспристрастное вероятностное картирование олигонуклеотидов из секвенирования следующего поколения». Биоинформатика . 26 (1): 38–45. doi :10.1093/bioinformatics/btp614. ISSN  1367-4803. PMC 6276904. PMID 19861355  . 
  45. ^ Сантана-Кинтеро, Луис; Дингердиссен, Хейли; Тьерри-Миг, Жан; Мазумдер, Раджа; Симонян, Вахан (2014). «HIVE-Hexagon: высокопроизводительное параллельное выравнивание последовательностей для анализа данных секвенирования следующего поколения». PLOS ONE . 9 (6): 1754–1760. Bibcode : 2014PLoSO...999033S. doi : 10.1371/journal.pone.0099033 . PMC 4053384. PMID  24918764 . 
  46. ^ Kielbasa, SM; Wan, R.; Sato, K.; Horton, P.; Frith, MC (2011). «Адаптивные семена приручают сравнение геномных последовательностей». Genome Research . 21 (3): 487–493. doi :10.1101/gr.113985.110. PMC 3044862. PMID  21209072 . 
  47. ^ Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). "Mpscan: Быстрая локализация множественных прочтений в геномах". Алгоритмы в биоинформатике . Конспект лекций по информатике. Том 5724. С. 246–260. Bibcode :2009LNCS.5724..246R. CiteSeerX 10.1.1.156.928 . doi :10.1007/978-3-642-04241-6_21. ISBN  978-3-642-04240-9. S2CID  17187140.
  48. ^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). «NextGenMap: быстрое и точное картирование прочтений в высокополиморфных геномах». Биоинформатика . 29 (21): 2790–2791. doi : 10.1093/bioinformatics/btt468 . PMID  23975764.
  49. ^ Чен, Янго; Соуайя, Таде; Чен, Тин (2009). «PerM: эффективное картирование коротких прочтений секвенирования с периодическими полностью чувствительными разнесенными семенами». Биоинформатика . 25 (19): 2514–2521. doi :10.1093/bioinformatics/btp486. PMC 2752623 . PMID  19675096. 
  50. ^ Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). "Быстрое картирование коротких последовательностей с несовпадениями, вставками и удалениями с использованием индексных структур". PLOS Computational Biology . 5 (9): e1000502. Bibcode : 2009PLSCB...5E0502H. doi : 10.1371/journal.pcbi.1000502 . ISSN  1553-7358. PMC 2730575. PMID 19750212  . 
  51. ^ Рамбл, Стивен М.; Лакрут, Фил; Далка, Адриан В.; Фиуме, Марк; Сидов, Аренд; Брудно, Майкл (2009). "SHRiMP: Точное картирование коротких цветовых пространственных считываний". PLOS Computational Biology . 5 (5): e1000386. Bibcode : 2009PLSCB...5E0386R. doi : 10.1371/journal.pcbi.1000386 . PMC 2678294. PMID  19461883 . 
  52. ^ Дэвид, Матей; Дзамба, Миско; Листер, Дэн; Илие, Люциан; Брудно, Майкл (2011). «SHRiMP2: чувствительное, но практичное картирование коротких прочтений». Биоинформатика . 27 (7): 1011–1012. doi : 10.1093/bioinformatics/btr046 . PMID  21278192.
  53. ^ Малхис, Навар; Баттерфилд, Ярон SN; Эстер, Мартин; Джонс, Стивен JM (2009). «Слайдер – Максимальное использование вероятностной информации для выравнивания коротких последовательностей прочтений и обнаружения SNP». Биоинформатика . 25 (1): 6–13. doi :10.1093/bioinformatics/btn565. PMC 2638935 . PMID  18974170. 
  54. ^ Малхис, Навар; Джонс, Стивен Дж. М. (2010). «Высококачественный вызов SNP с использованием данных Illumina при неглубоком покрытии». Биоинформатика . 26 (8): 1029–1035. doi :10.1093/bioinformatics/btq092. PMID  20190250.
  55. ^ Ли, Р.; Ли, И.; Кристиансен, К.; Ванг, Дж. (2008). «SOAP: программа выравнивания коротких олигонуклеотидов». Биоинформатика . 24 (5): 713–714. doi : 10.1093/bioinformatics/btn025 . ISSN  1367-4803. PMID  18227114.
  56. ^ Ли, Р.; Ю, Ч.; Ли, Й.; Лам, Т.-В.; Ю, С.-М.; Кристиансен, К.; Ванг, Дж. (2009). «SOAP2: улучшенный сверхбыстрый инструмент для выравнивания коротких прочтений». Биоинформатика . 25 (15): 1966–1967. doi :10.1093/bioinformatics/btp336. ISSN  1367-4803. PMID  19497933.
  57. ^ Абуин, Хосе М.; Пишель, Хуан К.; Пенья, Томас Ф.; Амиго, Хорхе (16 мая 2016 г.). «SparkBWA: ускорение согласования данных высокопроизводительного секвенирования ДНК». ПЛОС ОДИН . 11 (5): e0155461. Бибкод : 2016PLoSO..1155461A. дои : 10.1371/journal.pone.0155461 . ISSN  1932-6203. ПМЦ 4868289 . ПМИД  27182962. 
  58. ^ Lunter, G.; Goodson, M. (2010). «Stampy: статистический алгоритм для чувствительного и быстрого картирования прочтений последовательностей Illumina». Genome Research . 21 (6): 936–939. doi :10.1101/gr.111120.110. ISSN  1088-9051. PMC 3106326. PMID 20980556  . 
  59. ^ Ноэ, Л.; Гирдеа, М.; Кучеров, Г. (2010). «Проектирование эффективных разнесенных семян для картирования прочтений SOLiD». Достижения в области биоинформатики . 2010 : 708501. doi : 10.1155/2010/708501 . PMC 2945724. PMID  20936175 . 
  60. ^ Линь, Х.; Чжан, З.; Чжан, М.К.; Ма, Б.; Ли, М. (2008). «ZOOM! Картировано множество олигонуклеотидов». Биоинформатика . 24 (21): 2431–2437. doi :10.1093/bioinformatics/btn416. PMC 2732274. PMID  18684737 . 
Получено с "https://en.wikipedia.org/w/index.php?title=Список_программного_обеспечения_выравнивания_последовательности&oldid=1241060480"