Кластеры метаболических генов или кластеры биосинтетических генов представляют собой тесно связанные наборы в основном негомологичных генов , участвующих в общем, дискретном метаболическом пути . Гены находятся в физической близости друг к другу в геноме , и их экспрессия часто корегулируется. [1] [2] [3] Кластеры метаболических генов являются общими чертами бактериальных [4] и большинства грибковых [5] геномов. Они реже встречаются в других [6] организмах. Они наиболее широко известны тем, что производят вторичные метаболиты , источник или основу большинства фармацевтических соединений, природных токсинов , химической коммуникации и химической войны между организмами. Кластеры метаболических генов также участвуют в получении питательных веществ, деградации токсинов, [7] устойчивости к противомикробным препаратам и биосинтезе витаминов. [5] Учитывая все эти свойства кластеров метаболических генов, они играют ключевую роль в формировании микробных экосистем, включая взаимодействия микробиома и хозяина. Таким образом, было разработано несколько инструментов вычислительной геномики для прогнозирования кластеров метаболических генов.
Базы данных
MIBiG, BiG-FAM
Биоинформатические инструменты
Инструменты, основанные на правилах
Биоинформационные инструменты были разработаны для прогнозирования и определения распространенности и экспрессии этого типа кластера генов в образцах микробиома на основе метагеномных данных. [8] Поскольку размер метагеномных данных значителен, их фильтрация и кластеризация являются важными частями этих инструментов. Эти процессы могут состоять из методов уменьшения размерности, таких как Minhash , [9] и алгоритмов кластеризации, таких как k-medoids и распространение сродства . Также было разработано несколько метрик и сходств для их сравнения.
Геномный майнинг для кластеров генов биосинтеза (BGC) стал неотъемлемой частью открытия натуральных продуктов. Более 200 000 микробных геномов, которые теперь общедоступны, содержат информацию об изобилии новой химии. Один из способов навигации по этому огромному геномному разнообразию — сравнительный анализ гомологичных BGC, который позволяет идентифицировать кросс-видовые паттерны, которые можно сопоставить с наличием метаболитов или биологической активностью. Однако современные инструменты сдерживаются узким местом, вызванным дорогим сетевым подходом, используемым для группировки этих BGC в семейства кластеров генов (GCF). BiG-SLiCE (Biosynthetic Genes Super-Linear Clustering Engine), инструмент, разработанный для кластеризации огромного количества BGC. Представляя их в евклидовом пространстве, BiG-SLiCE может группировать BGC в GCF непарным, почти линейным образом.
Satria et al., 2021 [10] через BiG-SLiCE демонстрируют полезность таких анализов путем реконструкции глобальной карты вторичного метаболического разнообразия в таксономии для выявления неизведанного биосинтетического потенциала, открывают новые возможности для ускорения открытия природных продуктов и предлагают первый шаг к построению глобальной и доступной для поиска взаимосвязанной сети BGC. По мере того, как все больше геномов секвенируются из недостаточно изученных таксонов, можно добыть больше информации, чтобы выделить их потенциально новую химию. [10]
инструменты на основе машинного обучения
Эволюция
Происхождение и эволюция кластеров метаболических генов обсуждаются с 1990-х годов. [11] [12] С тех пор было показано, что кластеры метаболических генов могут возникать в геноме путем перестройки генома, дупликации генов или горизонтального переноса генов , [13] и некоторые метаболические кластеры эволюционировали конвергентно у нескольких видов. [14] Горизонтальный перенос кластеров генов был связан с экологическими нишами, в которых, как считается, закодированные пути обеспечивают выгоду. [15] Утверждалось, что кластеризация генов для экологических функций является результатом репродуктивных тенденций среди организмов и продолжает способствовать ускоренной адаптации за счет увеличения уточнения сложных функций в пангеноме популяции. [16]
Ссылки
^ Schläpfer P, Zhang P, Wang C, Kim T, Banf M, Chae L и др. (апрель 2017 г.). «Прогнозирование метаболических ферментов, путей и кластеров генов в растениях по всему геному». Физиология растений . 173 (4): 2041–2059 . doi :10.1104/pp.16.01942. PMC 5373064. PMID 28228535 .
^ Miller BL, Miller KY, Roberti KA, Timberlake WE (январь 1987). «Позиционно-зависимые и -независимые механизмы регулируют клеточно-специфическую экспрессию кластера генов SpoC1 Aspergillus nidulans». Молекулярная и клеточная биология . 7 (1): 427–34 . doi :10.1128/MCB.7.1.427. PMC 365085. PMID 3550422.
^ Banf M, Zhao K, Rhee SY (сентябрь 2019 г.). «METACLUSTER-пакет R для контекстно-специфического анализа экспрессии кластеров метаболических генов». Биоинформатика . 35 (17): 3178– 3180. doi :10.1093/bioinformatics/btz021. PMC 6735823. PMID 30657869 .
^ Цимерманчик П., Медема М.Х., Клаесен Дж., Курита К., Виланд Браун LC, Мавромматис К. и др. (июль 2014 г.). «Понимание вторичного метаболизма на основе глобального анализа кластеров биосинтетических генов прокариот». Клетка . 158 (2): 412–421 . doi :10.1016/j.cell.2014.06.034. ПМК 4123684 . ПМИД 25036635.
^ ab Slot JC (2017). «Разнообразие и эволюция кластеров генов грибов». Fungal Philogenetics and Phylogenomics . Advances in Genetics. Vol. 100. pp. 141– 178. doi :10.1016/bs.adgen.2017.09.005. ISBN978-0-12-813261-6. PMID 29153399.
^ Wisecaver JH, Borowsky AT, Tzin V, Jander G, Kliebenstein DJ, Rokas A (май 2017 г.). «Глобальный подход к коэкспрессионной сети для подключения генов к специализированным метаболическим путям в растениях». The Plant Cell . 29 (5): 944–959 . doi :10.1105/tpc.17.00009. PMC 5466033. PMID 28408660.
^ Gluck-Thaler E, Slot JC (июнь 2018 г.). «Специализированная биохимия растений управляет кластеризацией генов у грибов». Журнал ISME . 12 (7): 1694– 1705. Bibcode : 2018ISMEJ..12.1694G. doi : 10.1038/s41396-018-0075-3. PMC 6018750. PMID 29463891 .
^ Паскаль-Андре В., Августейн Х., ван ден Берг К., ван дер Хоофт Дж., Фишбах М., Медема М. (2020). «BiG-MAP: автоматизированный конвейер для профилирования численности и экспрессии метаболических кластеров генов в микробиомах» (PDF) . биоRxiv . 6 (5): e00937-21. дои : 10.1101/2020.12.14.422671. ПМЦ 8547482 . ПМИД 34581602.
^ Ондов Б., Треанген Т., Мелстед П., Маллони А., Бергман Н., Корен С. и др. (2016). «Mash: быстрая оценка расстояний генома и метагенома с использованием MinHash». Genome Biology . 17 (32): 14. doi : 10.1186/s13059-016-0997-x . PMC 4915045. PMID 27323842 .
^ ab Kautsar SA, van der Hooft JJ, de Ridder D, Medema MH (13 января 2021 г.). «BiG-SLiCE: высокомасштабируемый инструмент отображает разнообразие 1,2 миллиона кластеров биосинтетических генов». GigaScience . 10 (1): giaa154. doi : 10.1093/gigascience/giaa154 . PMC 7804863 . PMID 33438731.
^ Лоуренс Дж. Г., Рот Дж. Р. (1996-08-01). «Эгоистичные опероны : горизонтальный перенос может управлять эволюцией генных кластеров». Генетика . 143 (4): 1843– 1860. doi :10.1093/genetics/143.4.1843. ISSN 0016-6731. PMC 1207444. PMID 8844169.
^ Pál C, Hurst LD (2004-06-01). «Доказательства против теории эгоистичного оперона». Trends in Genetics . 20 (6): 232– 234. doi :10.1016/j.tig.2004.04.001. PMID 15145575.
^ Слот JC, Рокас A (2010-06-01). «Множественные кластеры генов пути GAL эволюционировали независимо и разными механизмами у грибов». Труды Национальной академии наук . 107 (22): 10136– 10141. Bibcode : 2010PNAS..10710136S. doi : 10.1073/pnas.0914418107 . PMC 2890473. PMID 20479238 .
^ Greene GH, McGary KL, Rokas A, Slot JC (январь 2014 г.). «Экология движет распределением специализированных модулей метаболизма тирозина у грибов». Genome Biology and Evolution . 6 (1): 121– 132. doi :10.1093/gbe/evt208. ISSN 1759-6653. PMC 3914699. PMID 24391152 .
^ Слот JC, Глюк-Талер E (2019-10-01). «Метаболические генные кластеры, разнообразие грибов и генерация вспомогательных функций». Current Opinion in Genetics & Development . 58–59 : 17–24 . doi : 10.1016/j.gde.2019.07.006 . ISSN 0959-437X. PMID 31466036. S2CID 201674539.