TopHat — это биоинформатический инструмент с открытым исходным кодом для выравнивания производительности прочтений секвенирования кДНК, полученных с помощью технологий транскриптомики (например, RNA-Seq ), сначала с использованием Bowtie , а затем сопоставления с референтным геномом для обнаружения сайтов сплайсинга РНК de novo . [1] TopHat выравнивает прочтения RNA-Seq с геномами млекопитающих. [2]
TopHat был первоначально разработан в 2009 году Коулом Трапнеллом , Лиором Пахтером и Стивеном Зальцбергом в Центре биоинформатики и вычислительной биологии Мэрилендского университета в Колледж-Парке и на математическом факультете Калифорнийского университета в Беркли . [1] TopHat2 был совместным проектом Дэхвана Кима и Стивена Зальцберга, изначально работавших в Мэрилендском университете в Колледж-Парке , а затем в Центре вычислительной биологии Университета Джонса Хопкинса . Ким переписал часть оригинального кода TopHat Трапнелла на C++ , чтобы сделать его намного быстрее, и добавил множество эвристик для повышения его точности в сотрудничестве с Коулом Трапнеллом и другими. Ким и Зальцберг также разработали TopHat-fusion, который использовал данные транскриптома для обнаружения слияний генов в раковых тканях. [3]
TopHat используется для выравнивания прочтений из эксперимента RNA-Seq. Это алгоритм картирования прочтений, который выравнивает прочтения с референсным геномом. Он полезен, поскольку не требует использования известных сайтов сплайсинга. [1] TopHat можно использовать с конвейером Tuxedo, и часто используется с Bowtie .
Когда TopHat впервые появился, он был быстрее предыдущих систем. Он отображал более 2,2 миллионов прочтений за час работы процессора. Такая скорость позволяла пользователю обрабатывать и весь эксперимент RNA-Seq менее чем за день, даже на стандартном настольном компьютере. [1] Tophat использует Bowtie в начале для анализа прочтений, но затем делает больше для анализа прочтений, которые охватывают экзон-экзонные соединения. Если вы используете TopHat для данных RNA-Seq, вы получите больше прочтений, выровненных с референсным геномом. [4]
Еще одним преимуществом TopHat является то, что ему не нужно полагаться на известные сайты сплайсинга при выравнивании прочтений с референсным геномом. [1]
TopHat находится на этапе низкого обслуживания и поддержки и содержит ошибки программного обеспечения, которые привели к появлению стороннего программного обеспечения для постобработки, требующего исправления. [5] Он был заменен на HISAT2, который более эффективен и точен и обеспечивает ту же основную функциональность (сплайсированное выравнивание прочтений РНК-Seq). [2]