TopHat (биоинформатика)

TopHat — это биоинформатический инструмент с открытым исходным кодом для выравнивания производительности прочтений секвенирования кДНК, полученных с помощью технологий транскриптомики (например, RNA-Seq ), сначала с использованием Bowtie , а затем сопоставления с референтным геномом для обнаружения сайтов сплайсинга РНК de novo . [1] TopHat выравнивает прочтения RNA-Seq с геномами млекопитающих. [2]

История

TopHat был первоначально разработан в 2009 году Коулом Трапнеллом , Лиором Пахтером и Стивеном Зальцбергом в Центре биоинформатики и вычислительной биологии Мэрилендского университета в Колледж-Парке и на математическом факультете Калифорнийского университета в Беркли . [1] TopHat2 был совместным проектом Дэхвана Кима и Стивена Зальцберга, изначально работавших в Мэрилендском университете в Колледж-Парке , а затем в Центре вычислительной биологии Университета Джонса Хопкинса . Ким переписал часть оригинального кода TopHat Трапнелла на C++ , чтобы сделать его намного быстрее, и добавил множество эвристик для повышения его точности в сотрудничестве с Коулом Трапнеллом и другими. Ким и Зальцберг также разработали TopHat-fusion, который использовал данные транскриптома для обнаружения слияний генов в раковых тканях. [3]

Использует

TopHat используется для выравнивания прочтений из эксперимента RNA-Seq. Это алгоритм картирования прочтений, который выравнивает прочтения с референсным геномом. Он полезен, поскольку не требует использования известных сайтов сплайсинга. [1] TopHat можно использовать с конвейером Tuxedo, и часто используется с Bowtie .

Преимущества/Недостатки

Преимущества

Когда TopHat впервые появился, он был быстрее предыдущих систем. Он отображал более 2,2 миллионов прочтений за час работы процессора. Такая скорость позволяла пользователю обрабатывать и весь эксперимент RNA-Seq менее чем за день, даже на стандартном настольном компьютере. [1] Tophat использует Bowtie в начале для анализа прочтений, но затем делает больше для анализа прочтений, которые охватывают экзон-экзонные соединения. Если вы используете TopHat для данных RNA-Seq, вы получите больше прочтений, выровненных с референсным геномом. [4]

Еще одним преимуществом TopHat является то, что ему не нужно полагаться на известные сайты сплайсинга при выравнивании прочтений с референсным геномом. [1]

Недостатки

TopHat находится на этапе низкого обслуживания и поддержки и содержит ошибки программного обеспечения, которые привели к появлению стороннего программного обеспечения для постобработки, требующего исправления. [5] Он был заменен на HISAT2, который более эффективен и точен и обеспечивает ту же основную функциональность (сплайсированное выравнивание прочтений РНК-Seq). [2]

Смотрите также

Ссылки

  1. ^ abcde Trapnell C, Pachter L, Salzberg SL (май 2009). "TopHat: discovery splice junctions with RNA-Seq". Биоинформатика . 25 (9): 1105– 11. doi :10.1093/bioinformatics/btp120. PMC  2672628. PMID  19289445 .
  2. ^ ab "TopHat". ccb.jhu.edu . Получено 2018-04-17 .
  3. ^ Kim D, Pertea G, Trapnell C, Pimentel H, Kelley R, Salzberg SL (апрель 2013 г.). «TopHat2: точное выравнивание транскриптомов при наличии вставок, делеций и слияний генов». Genome Biology . 14 (4): R36. doi : 10.1186/gb-2013-14-4-r36 . PMC 4053844 . PMID  23618408. 
  4. ^ "Галстук-бабочка и цилиндр". www.biostars.org . Получено 24.04.2018 .
  5. ^ Brueffer C, Saal LH (май 2016 г.). «TopHat-Recondition: постпроцессор для неотображенных прочтений TopHat». BMC Bioinformatics . 17 (1): 199. doi : 10.1186/s12859-016-1058-x . PMC 4855331. PMID  27142976 . 
  • Страница TopHat о Центре вычислительной биологии в Университете Джона Хьюза
Взято с "https://en.wikipedia.org/w/index.php?title=TopHat_(биоинформатика)&oldid=1187732314"