UCLUST

Алгоритм в генетике опубликован в 2010 году

UCLUST [1] — это алгоритм, разработанный для кластеризации последовательностей нуклеотидов или аминокислот в кластеры на основе сходства последовательностей. Алгоритм был опубликован в 2010 году и реализован в программе, также называемой UCLUST. Автор описывает алгоритм следующим двум простым критериям кластеризации относительно запрошенного порога сходства T. Первый критерий гласит, что последовательность центроида любого заданного кластера будет иметь сходство, меньшее, чем T, с последовательностью центроида любого другого кластера. Второй критерий гласит, что каждая последовательность-член в заданном кластере будет иметь сходство с последовательностью центроида кластера, равное или большее, чем T.

Алгоритм UCLUST является жадным. В результате порядок последовательностей во входном файле повлияет на результирующие кластеры и их качество. По этой причине рекомендуется сортировать последовательности перед началом этапа кластеризации. Программа UCLUST оснащена некоторыми опциями для сортировки входных последовательностей перед их кластеризацией.

Программа UCLUST широко используется в сообществе биоинформатических исследователей, где она применяется для множества приложений, включая назначение OTU (например, 16s), создание неизбыточных каталогов генов , таксономическое назначение и филогенетический анализ .

  • Эдгар, RC "Алгоритм UCLUST". drive5 .
  • «Проект документации программного обеспечения Bio-Linux». NEBC.

Смотрите также

Ссылки

  1. ^ Эдгар, RC (2010). «Поиск и кластеризация на порядок быстрее, чем BLAST». Биоинформатика . 26 (19): 2460– 2461. doi : 10.1093/bioinformatics/btq461 . ISSN  1367-4803. PMID  20709691.
Взято с "https://en.wikipedia.org/w/index.php?title=UCLUST&oldid=1138891571"