Nextflow

Платформа управления рабочим процессом с открытым исходным кодом
Nextflow
Оригинальный автор(ы)Паоло Ди Томмазо
Разработчик(и)Seqera Labs, Центр геномной регуляции
Первоначальный выпуск9 апреля 2013 г.; 11 лет назад (2013-04-09)
Стабильный релиз
v23.10.1 / 12 января 2024 г. ; 12 месяцев назад (2024-01-12)
Предварительный релиз
v24.02.0-edge / 9 марта 2024 г. ; 10 месяцев назад (2024-03-09)
Репозиторийhttps://github.com/nextflow-io/nextflow
Написано вGroovy , Java
Операционная системаLinux , macOS , WSL
ТипСистема научного документооборота , Программирование потока данных , Большие данные
ЛицензияЛицензия Apache 2.0
Веб-сайтnextflow.io

Nextflow — это научная система рабочего процесса , используемая преимущественно для анализа биоинформатических данных. Она устанавливает стандарты для программного создания серии зависимых вычислительных шагов и облегчает их выполнение на различных локальных и облачных ресурсах. [1] [2]

Цель

Многие научные анализы данных требуют значительного количества последовательных этапов обработки. Пользовательские скрипты могут быть достаточны при разработке новых методов или нечастом запуске определенных анализов, но плохо масштабируются для сложных последовательностей задач или множества образцов. [3] [4] [5]

Научные системы рабочих процессов, такие как Nextflow, позволяют формализовать анализ как конвейер анализа данных. Конвейеры, также известные как рабочие процессы, определяют порядок и условия вычислительных шагов. Они выполняются специальными программами, так называемыми исполнителями рабочих процессов, которые обеспечивают предсказуемое и воспроизводимое поведение в различных вычислительных средах. [3] [6] [7] [8]

Системы рабочих процессов также предоставляют встроенные решения для общих проблем разработки рабочих процессов, таких как применение к нескольким образцам, проверка входных и промежуточных результатов, условное выполнение шагов, обработка ошибок и генерация отчетов. Расширенные функции систем рабочих процессов могут также включать возможности планирования, графические пользовательские интерфейсы для мониторинга выполнения рабочих процессов и управление зависимостями путем контейнеризации всего рабочего процесса или его компонентов. [9] [10]

Обычно научные системы рабочего процесса изначально представляют собой сложную задачу обучения, поскольку все их особенности и сложности строятся на дополнении к фактическому анализу. Однако стандарты и абстракция, налагаемые системами рабочего процесса, в конечном итоге улучшают прослеживаемость этапов анализа, что особенно актуально при совместной работе над разработкой конвейера, как это принято в научных условиях. [11]

Характеристики

Спецификация рабочих процессов

В Nextflow конвейеры строятся из отдельных процессов, которые работают параллельно для выполнения вычислительных задач. Каждый процесс определяется входными требованиями и выходными декларациями. Вместо того, чтобы работать в фиксированной последовательности, процесс начинает выполняться, когда все его входные требования выполнены. Указывая выход одного процесса как вход другого, устанавливается логическая и последовательная связь между процессами. [12]

Эта реактивная реализация является ключевым шаблоном проектирования Nextflow и также известна как функциональная модель потока данных . [13]

Процессы и целые рабочие процессы программируются на доменно-специфическом языке (DSL), который предоставляется Nextflow, основанном на Apache Groovy . [14] В то время как DSL Nextflow используется для объявления логики рабочего процесса, разработчики могут использовать свой язык сценариев по своему выбору в рамках процесса и смешивать несколько языков в рабочем процессе. Также возможно портировать существующие скрипты и рабочие процессы в Nextflow. Поддерживаемые языки сценариев включают bash, csh, ksh, Python , Ruby и R. Любой язык сценариев, который использует стандартное объявление Unix shebang ( #!/bin/bash), совместим с Nextflow.

Ниже приведен пример рабочего процесса, состоящего только из одного процесса:

процесс hello_world { ввод: приветствие val      вывод: путь "${greeting}.txt"   скрипт: """  echo "${greeting} Мир!" > ${greeting}.txt  """ } рабочий процесс { Канал . of ( "Hello" , "Ciao" , "Hola" , "Bonjour" ) | hello_world }       

Для обеспечения простой совместной работы над рабочими процессами Nextflow изначально поддерживает системы управления исходным кодом и платформы DevOps , включая GitHub , GitLab и другие. [15]

Выполнение рабочих процессов

DSL Nextflow позволяет вам развертывать и запускать рабочие процессы в различных вычислительных средах без необходимости изменять код конвейера. Nextflow поставляется со специальными исполнителями для различных платформ, включая основных поставщиков облачных вычислений. Он поддерживает следующие среды для выполнения конвейера: [16]

  • Локально : это исполнитель по умолчанию, в котором конвейеры Nextflow работают на Linux или Mac OS, и выполнение происходит на компьютере, где запущен конвейер.
  • Менеджеры рабочих нагрузок HPC : Nextflow поддерживает такие менеджеры рабочих нагрузок, как Slurm, SGE, LSF, Moab, PBS Pro, PBS/Torque, HTCondor, NQSII и OAR.
  • Kubernetes : Nextflow можно использовать с локальными или облачными реализациями Kubernetes (GKE, EKS или AKS).
  • Облачные пакетные сервисы : совместимы с AWS Batch [17] и Azure Batch [18].
  • Другие среды : Nextflow также можно использовать с Apache Ignite, Google Life Sciences и различными контейнерными фреймворками для обеспечения переносимости. [19]

Контейнеры для переносимости между вычислительными средами

В Nextflow есть тесная интеграция с программными контейнерами. Рабочие процессы и отдельные процессы могут использовать контейнеры для своего выполнения в различных вычислительных средах, устраняя необходимость в сложных процедурах установки и настройки. [3] [20]

Nextflow поддерживает контейнерные фреймворки, такие как Docker, Singularity, Charliecloud, Podman и Shifter. Эти контейнеры могут быть автоматически извлечены из внешних репозиториев при выполнении конвейера. Кроме того, на Nextflow Summit 2022 было объявлено, что будущие версии Nextflow будут поддерживать выделенную службу предоставления контейнеров для лучшей интеграции настраиваемых контейнеров в рабочие процессы. [21] [22]

История развития

Nextflow изначально был разработан в Центре геномной регуляции в Испании и выпущен как проект с открытым исходным кодом на GitHub в июле 2013 года. [23] В октябре 2018 года лицензия проекта Nextflow была изменена с GPLv3 на Apache 2.0 . [24]

В июле 2018 года Seqera Labs была запущена как ответвление Центра геномной регуляции. [20] Компания нанимает многих основных разработчиков и сопровождающих Nextflow и предоставляет коммерческие услуги и консультации с упором на Nextflow. [25]

В июле 2020 года было представлено крупное расширение и пересмотр предметно-ориентированного языка Nextflow , позволяющее использовать подпроцессы и дополнительные улучшения. [26] В том же году количество ежемесячных загрузок Nextflow достигло приблизительно 55 000. [20]

Принятие и прием

Thenf-ядросообщество

Проект nf-core был принят несколькими учреждениями по секвенированию , включая Центр геномной регуляции , [27] Центр количественной биологии в Тюбингене , Институт Фрэнсиса Крика , Институт генома A*STAR в Сингапуре и Шведскую национальную геномную инфраструктуру в качестве предпочтительной системы научного рабочего процесса . [20] Эти учреждения сотрудничали для обмена, гармонизации и курирования биоинформатических конвейеров, [28] [29] [30] [31] , что привело к созданию проекта nf-core. [32] Под руководством Фила Эвелса, работавшего в то время в Шведской национальной геномной инфраструктуре , [33] [34] nf-core фокусируется на обеспечении воспроизводимости и переносимости конвейеров на различном оборудовании, операционных системах и версиях программного обеспечения. В июле 2020 года Nextflow и nf-core получили грант от Инициативы Чана Цукерберга в знак признания их важности как программного обеспечения с открытым исходным кодом. [35] По состоянию на 2024 год организация nf-core размещает 117 конвейеров Nextflow для бионаук и более 1382 модулей процессов. С более чем 1200 вовлеченными разработчиками и учеными, это крупнейшее совместное усилие и сообщество для разработки конвейеров анализа биоинформатических данных. [36]

По предметной области и теме исследования

Nextflow — предпочтительный инструмент для обработки данных секвенирования и проведения геномного анализа данных по домену и предмету исследования. За последние пять лет было опубликовано множество конвейеров для различных приложений и анализов в области геномики.

Одним из примечательных вариантов использования является его роль в наблюдении за патогенами во время пандемии COVID-19 . [37] Быстрая и высокоавтоматизированная обработка необработанных данных, анализ вариантов и обозначение линий были необходимы для мониторинга появления новых вариантов вируса и отслеживания их глобального распространения. Конвейеры с поддержкой Nextflow сыграли решающую роль в этих усилиях. [38] [39] [40] [41] [42] [43] [44]

Nextflow также играет важную роль для некоммерческого репозитория плазмид Addgene , используя его для подтверждения целостности всех депонированных плазмид. [45]

Помимо геномики, Nextflow набирает популярность в других областях обработки биомедицинских данных, где требуются сложные рабочие процессы с большими объемами первичных данных. Эти области включают скрининг лекарств , [46] диффузионную магнитно-резонансную томографию (dMRI) в радиологии, [47] и обработку данных масс-спектрометрии , [48] [49] [50] последняя с особым акцентом на протеомику [51] [52] [53] [54] [55] [56] [57] [58]

Ссылки

  1. ^ Строцци, Франческо; Янссен, Роэль; Вурмус, Рикардо; Крузо, Майкл Р.; Гитинджи, Джордж; Ди Томмазо, Паоло; Бельхашеми, Доминик; Мёллер, Штеффен; Смант, Герт; Де Лигт, Джоп; Принс, Петр (2019). «Масштабируемые рабочие процессы и воспроизводимый анализ данных для геномики». Эволюционная геномика . Методы молекулярной биологии. Том. 1910. С.  723–745 . doi : 10.1007/978-1-4939-9074-0_24. ISBN 978-1-4939-9073-3. PMC  7613310 . PMID  31278683.
  2. ^ Гао, Минсюань; Линг, Минъи; Тан, Синьвэй; Ван, Шун; Сяо, Сюй; Цяо, Инь; Ян, Вэньсянь; Ю, Жуншань (2021). «Сравнение высокопроизводительных конвейеров обработки данных секвенирования одноклеточной РНК». Брифинги по биоинформатике . 22 (3). дои : 10.1093/нагрудник/bbaa116. ПМИД  34020539.
  3. ^ abc Враттен, Лаура; Вильм, Андреас; Гёке, Джонатан (октябрь 2021 г.). «Воспроизводимые, масштабируемые и общие аналитические конвейеры с менеджерами рабочих процессов биоинформатики». Nature Methods . 18 (10): 1161– 1168. doi :10.1038/s41592-021-01254-9. PMID  34556866. S2CID  237616424.
  4. ^ Террон-Камеро, Лаура К.; Гордильо-Гонсалес, Фернандо; Салас-Эспехо, Эдуардо; Андрес-Леон, Эдуардо (2022). «Сравнение инструментов метагеномики и метатранскриптомики: руководство по правильному выбору». Гены . 13 (12): 2280. doi : 10.3390/genes13122280 . ПМЦ 9777648 . ПМИД  36553546. 
  5. ^ Федерико, Энтони; Карагианнис, Таня; Карри, Критика; Кишор, Дилип; Кога, Юсуке; Кэмпбелл, Джошуа Д.; Монти, Стефано (2019). «Pipeliner: Основанная на Nextflow структура для определения конвейеров обработки данных секвенирования». Frontiers in Genetics . 10 : 614. doi : 10.3389/fgene.2019.00614 . PMC 6609566. PMID  31316552 . 
  6. ^ Колпаков, Федор; Акбердин Илья; Киселев Илья; Колмыков, Семен; Кондрахин, Юрий; Куляшов Михаил; Кутумова, Елена; Пинтус, Сергей; Рябова, Анна; Шарипов, Руслан; Евшин Иван; Жатченко Сергей; Кел, Александр (2022). «BioUML — к универсальной исследовательской платформе». Исследования нуклеиновых кислот . 50 (П1): П124 – П131 . doi : 10.1093/nar/gkac286. ПМЦ 9252820 . ПМИД  35536253.  
  7. ^ Юкселен, Онур; Туркилмаз, Осман; Озтюрк, Ахмет Расит; Гарбер, Мануэль; Кучукурал, Альпер (2020). «Dolphin Next: распределенная платформа обработки данных для высокопроизводительной геномики». BMC Genomics . 21 (1): 310. doi : 10.1186/s12864-020-6714-x . PMC 7168977 . PMID  32306927. 
  8. ^ Юэн, Денис; Кабансай, Луиза; Дункан, Эндрю; Луу, Гэри; Хог, Грегори; Овербек, Чарльз; Перес, Натали; Шандс, Уолт; Стейнберг, Дэвид; Рид, Чаз; Олунва, Ннека; Хансен, Ричард; Шитс, Элизабет; о'Фаррелл, Эш; Каллион, Ким; о'Коннор, Брайан Д.; Патен, Бенедикт; Стейн, Линкольн (2021). «Dockstore: улучшение платформы сообщества для обмена воспроизводимыми и доступными вычислительными протоколами». Nucleic Acids Research . 49 (W1): W624 – W632 . doi :10.1093/nar/gkab346. PMC 8218198 . PMID  33978761.  
  9. ^ Ахмед, Азза Э.; Аллен, Джошуа М.; Бхат, Таджесви; Бурра, Пракрути; Флиге, Кристина Э.; Харт, Стивен Н.; Хельденбранд, Джейкоб Р.; Хадсон, Мэтью Э.; Истанто, Дэйв Деандре; Калмбах, Майкл Т.; Капраун, Грегори Д.; Кендиг, Кэтрин И.; Кендзиор, Мэтью Чарльз; Клее, Эрик В.; Мэттсон, Нейт; Росс, Кристиан А.; Шариф, Сами М.; Венкатакришнан, Рамшанкар; Фадлельмола, Фейсал М.; Майнцер, Людмила С. (2021). «Вопросы проектирования систем управления рабочим процессом, используемых в исследованиях производственной геномики и клинике». Научные отчеты . 11 (1): 21680. Bibcode : 2021NatSR..1121680A. doi : 10.1038/s41598-021-99288-8. PMC 8569008. PMID  34737383 . 
  10. ^ Байчу, Шакунтала; Суильми, Ясин; Панджи, Сумир; Бота, Геррит; Мейнджес, Эйтон; Хейзелхерст, Скотт; Бендо, Хосин; Бесте, Юджин де; Мпангасе, Феелани Т.; Суай, Уссема; Алгали, Мустафа; Йи, Лонг; о'Коннор, Брайан Д.; Крузо, Майкл; Армстронг, Дон; Арон, Шон; Жубер, Фури; Ахмед, Азза Э.; Мбияванга, Мамана; Хойсден, Питер ван; Магоси, Лерато Э.; Зермено, Дженни; Майнцер Людмила Сергеевна; Фадделмола, Фейсал М.; Джонджинил, К. Виктор; Малдер, Никола (2018). «Разработка воспроизводимых рабочих процессов анализа биоинформатики для гетерогенных вычислительных сред для поддержки африканской геномики». BMC Bioinformatics . 19 (1): 457. doi : 10.1186/s12859-018-2446-1 . PMC 6264621. PMID  30486782 . 
  11. ^ Джексон, Майкл; Кавуссанакис, Костас; Уоллес, Эдвард WJ (2021). «Использование прототипирования для выбора системы управления рабочим процессом биоинформатики». PLOS Computational Biology . 17 (2): e1008622. Bibcode : 2021PLSCB..17E8622J. doi : 10.1371/journal.pcbi.1008622 . PMC 7906312. PMID  33630841 . 
  12. ^ Томмазо, Паоло Ди; Флоден, Эван В.; Магис, Седрик; Палумбо, Эмилио; Нотредам, Седрик (2017). «Nextflow: Unil efficace pour l’amélioration de la stabilité numérique des Calcules en Analytic Genomique». Биология Ожурдуи . 211 (3): 233–237 . doi :10.1051/jbio/2017029. ПМИД  29412134.
  13. ^ "Документация Nextflow - Каналы". docs.nextflow.io . Получено 6 июня 2022 г. .
  14. ^ "Nextflow Documentation - Domain Specific Language (DSL) 2". docs.nextflow.io . Март 2020 . Получено 6 июня 2022 .
  15. ^ "Документация Nextflow - Совместное использование конвейера". docs.nextflow.io . Получено 6 июня 2022 г. .
  16. ^ "Документация Nextflow - Исполнители". docs.nextflow.io . Получено 6 июня 2022 г. .
  17. ^ "Документация Nextflow - Amazon Cloud". docs.nextflow.io . Получено 6 июня 2022 г. .
  18. ^ "Документация Nextflow - Azure Cloud". docs.nextflow.io . Получено 6 июня 2022 г. .
  19. ^ "Документация Nextflow - Google Cloud". docs.nextflow.io . Получено 6 июня 2022 г. .
  20. ^ abcd Ди Томассо, Паоло (14 октября 2021 г.). «История Nextflow: создание современного оркестратора конвейеров». eLifeSciences.org . Получено 6 июня 2022 г. .
  21. ^ "Документация Nextflow - Контейнеры". docs.nextflow.io . Получено 7 июня 2022 г. .
  22. ^ Ди Томмазо, Паоло (13 октября 2022 г.). «Nextflow и будущее контейнеров». YouTube . Получено 17 ноября 2022 г. .
  23. ^ "Версия выпуска 0.3.0 · nextflow-io/nextflow". GitHub . Получено 31 мая 2022 г. .
  24. Ди Томассо, Паоло (24 октября 2018 г.). «Прощай, ноль, здравствуй, Апач!». Nextflow.io/блог . Проверено 7 июня 2022 г.
  25. ^ Ди Томмазо, Паоло (8 октября 2019 г.). «Представляем Nextflow Tower — бесшовный мониторинг рабочих процессов анализа данных из любой точки мира». Seqera.IO . Получено 7 июня 2022 г.
  26. ^ Ди Томмазо, Паоло (24 июля 2020 г.). «Nextflow DSL 2 уже здесь!». Nextflow.IO/blog . Получено 7 июня 2022 г. .
  27. ^ Ди Томассо, Паоло; Чацу, Мария; Флоден, Эван; Прието Барха, Пабло; Палумбо, Эмилио; Нотредам, Седрик (11 апреля 2017 г.). «Nextflow обеспечивает воспроизводимые вычислительные процессы». Природная биотехнология . 35 (4): 316–319 . doi :10.1038/nbt.3820. PMID  28398311. S2CID  9690740 . Проверено 7 июня 2022 г.
  28. ^ Товарищи Йейтс, Джеймс А.; Ламнидис, Тисей К.; Борри, Максим; Андрадес Валтуэнья, Аида; Фагернес, Зандра; Клейтон, Стивен; Гарсия, Максим У.; Нойкамм, Юдит; Пельтцер, Александр (2021). «Воспроизводимая, портативная и эффективная реконструкция древнего генома с помощью nf-core/Eager». ПерДж . 9 : е10947. дои : 10.7717/peerj.10947 . ПМЦ 7977378 . ПМИД  33777521. 
  29. ^ Кракау, Сабрина; Штрауб, Даниэль; Гурле, Хадриен; Габерне, Гизела; Нансен, Свен (2022). «Nf-core/Mag: передовой конвейер для сборки и биннинга гибридов метагенома». Nar Genomics and Bioinformatics . 4 : lqac007. doi :10.1093/nargab/lqac007. PMC 8808542 . PMID  35118380. 
  30. ^ Гарсия, Максим; Юхос, Сильвестр; Ларссон, Малин; Оласон, Палл И.; Мартин, Марсель; Эйсфельдт, Йеспер; Дилоренцо, Себастьян; Сандгрен, Джоанна; Диас Де Стол, Тересита; Юэлс, Филип; Вирта, Валттери; Нистер, Моника; Келлер, Макс; Нистедт, Бьёрн (2020). «Сарек: портативный рабочий процесс для анализа полногеномного секвенирования зародышевых и соматических вариантов». F1000Исследования . 9:63 . дои : 10.12688/f1000research.16665.2 . ПМЦ 7111497 . ПМИД  32269765. 
  31. ^ Дигби, Барри; Финн, Стивен П.; ó Бройн, Пилиб (2023). "Nf-core/Circrna: портативный рабочий процесс для количественной оценки, прогнозирования целевых миРНК и анализа дифференциальной экспрессии кольцевых РНК". BMC Bioinformatics . 24 (1): 27. doi : 10.1186/s12859-022-05125-8 . PMC 9875403 . PMID  36694127. 
  32. ^ Эвельс, Филипп; Пельцер, Александр; Филлингер, Свен; Альнеберг, Йоханнес; Патель, Харшил; Вильм, Андреас; Гарсия, Максим Улисс; Ди Томмазо, Паоло; Нансен, Свен (1 апреля 2019 г.). "Nf-core: биоинформатические конвейеры, курируемые сообществом". Research Gate . Получено 30 июня 2022 г.
  33. ^ Запата Гарин, Клэр-Аликс. "nf-core: инициатива сообщества по стандартизации конвейеров на базе Nextflow". Lifebit.ai . Получено 30 июня 2022 г. .
  34. ^ "Сообщество nf-core предоставляет вычислительные конвейеры". SciLifeLab . 14 февраля 2020 г. Получено 30 июня 2022 г.
  35. ^ «Nextflow и nf-core: воспроизводимые рабочие процессы для научного сообщества». Chan Zuckerberg Initiative . 27 июля 2020 г. Получено 15 июня 2022 г.
  36. ^ "nf-core Github organization". GitHub . Получено 12 ноября 2024 .
  37. ^ Флоден, Эван (5 ноября 2021 г.). «Генетическое секвенирование позволит нам выиграть глобальную битву против COVID-19».
  38. ^ Афолаян, Айоринде О.; и др. (2021). «Преодоление узких мест в данных при наблюдении за геномными патогенами». Клинические инфекционные заболевания . 73 (Suppl_4): S267 – S274 . doi :10.1093/cid/ciab785. PMC 8634317. PMID  34850839 .  
  39. ^ Тиллой, Валентин; Кузен, Пьер; Леруа, Лора; Герен, Эмили; Дюран, Патрик; Ален, Софи (2022). «ASPICov: автоматизированный конвейер для идентификации нуклеотидных вариантов SARS-Cov2». PLOS ONE . 17 (1): e0262953. Bibcode : 2022PLoSO..1762953T. doi : 10.1371/journal.pone.0262953 . PMC 8791494. PMID  35081137 . 
  40. ^ Пети, Роберт А.; Рид, Тимоти Д. (2020). «Бактопия: гибкий конвейер для полного анализа бактериальных геномов». mSystems . 5 (4). doi :10.1128/mSystems.00190-20. PMC 7406220. PMID  32753501 . 
  41. ^ Пандольфо, Маттиа; Телатин, Андреа; Лаццари, Джоэле; Адрианссенс, Эвелин М.; Витуло, Никола (2022). «Метафаг: автоматизированный конвейер для анализа, аннотирования и классификации бактериофагов в данных метагеномного секвенирования». mSystems . 7 (5): e0074122. doi :10.1128/msystems.00741-22. PMC 9599279 . PMID  36069454. 
  42. ^ Готье, Мари-Эмили А.; Лелвала, Рувини В.; Эллиотт, Кэндис Э.; Винделл, Крейг; Фиорито, Соня; Динсдейл, Адриан; Уоттам, Марк; Паттемор, Джули; Барреро, Роберто А. (2022). «Параллельное сравнение методов пост-въездного карантина и высокопроизводительного секвенирования для диагностики вирусов и вироидов». Биология . 11 (2): 263. doi : 10.3390/biology11020263 . PMC 8868628. PMID  35205129 . 
  43. ^ Брандт, Кристиан; Краутвурст, Себастьян; Спотт, Риккардо; Лоде, Мара; Юндзилл, Матеуш; Марке, Майк; Хельцер, Мартин (2021). «Pore Cov — простой в использовании, быстрый и надежный рабочий процесс для реконструкции генома SARS-CoV-2 с помощью нанопорового секвенирования». Frontiers in Genetics . 12 : 711437. doi : 10.3389/fgene.2021.711437 . PMC 8355734. PMID  34394197 . 
  44. ^ Афиахаяти; Бернар, Стефанус; Гунади; Вибава, Хендра; Хаким Мохамад Сайфудин; Марцелл; Парикешит, Арли Адитья; Дева, Чандра Кусума; Сакакибара, Ясубуми (2022). «Сравнение биоинформатических конвейеров для обогащения систем секвенирования следующего поколения Illumina при обнаружении штаммов вируса SARS-CoV-2». Гены . 13 (8): 1330. doi : 10.3390/genes13081330 . ПМЦ 9394340 . ПМИД  35893066. 
  45. ^ Нихаус, Джейсон (14 июля 2022 г.). «Биоинформатика в Addgene». Корпоративный блог Addgene . Получено 25 февраля 2023 г.
  46. ^ Ссекагири, Альфред; Джинго, Дауди; Лужумба, Ибра; Ббоса, Николас; Бугембе, Дэниел Л.; Катит, Дэвид П.; Иордания, I король; Калибу, Понтиано; Ссемванга, Деогратиус (2022). «Quasi Flow: конвейер Nextflow для анализа данных о лекарственной устойчивости ВИЧ-1 на основе NGS». Достижения биоинформатики . 2 : vbac089. doi : 10.1093/bioadv/vbac089. ПМЦ 9722223 . ПМИД  36699347. 
  47. ^ Теод, Гийом; Уд, Жан-Кристоф; Боре, Арно; Рео, Франсуа; Моренси, Феликс; Деското, Максим (2020). «Tracto Flow: надежный, эффективный и воспроизводимый конвейер диффузионной МРТ, использующий Nextflow и Singularity». НейроИмидж . 218 : 116889. doi : 10.1016/j.neuroimage.2020.116889 . PMID  32447016. S2CID  164318811.
  48. ^ Ван Малдегем, Фебе; Валанд, Каришма; Коул, Меган; Патель, Харшил; Ангелова, Михаэла; Рана, Сарина; Колливер, Эмма; Энфилд, Кэти; Бах, Нурдин; Келли, Гэвин; Цанг, Виктория Сиу Кван; Мугарза, Эдурне; Мур, Кристофер; Хобсон, Филипп; Леви, Дина; Молина-Аркас, Мириам; Свантон, Чарльз; Даунвард, Джулиан (2021). «Характеристика ремоделирования микроокружения опухоли после ингибирования онкогенов в доклинических исследованиях с использованием массовой цитометрии с визуализацией». Nature Communications . 12 (1): 5906. Bibcode :2021NatCo..12.5906V. doi :10.1038/s41467-021-26214-x. PMC 8501076. PMID  34625563 . 
  49. ^ Ли, Чэньсинь; Гао, Минсюань; Ян, Вэньсянь; Чжун, Чуаньци; Ю, Жуншань (2021). «Алмаз: мультимодальный конвейер обработки данных масс-спектрометрии DIA». Биоинформатика . 37 (2): 265–267 . doi :10.1093/bioinformatics/btaa1093. ПМИД  33416868.
  50. ^ Луу, Гордон Т.; Фрейтас, Майкл А.; Лизама-Чаму, Итцель; МакКоги, Кэтрин С.; Санчес, Лора М.; Ван, Минсюнь (2022). «TIMSCONVERT: рабочий процесс для преобразования данных о подвижности захваченных ионов в открытые форматы данных». Биоинформатика . 38 (16): 4046– 4047. doi :10.1093/bioinformatics/btac419. PMC 9991885. PMID  35758608 . 
  51. ^ Перес-Риверол, Яссет; Морено, Пабло (2020). «Масштабируемый анализ данных в протеомике и метаболомике с использованием биоконтейнеров и рабочих процессов». Протеомика . 20 (9): e1900147. doi :10.1002/pmic.201900147. PMC 7613303. PMID  31657527 . 
  52. ^ Власова, Анна; Эрмосо Пулидо, Тони; Камара, Франциско; Пономаренко Юлия; Гиго, Родерик (2021). «FA-nf: конвейер функциональных аннотаций для белков немодельных организмов, реализованный в Nextflow». Гены . 12 (10): 1645. doi : 10.3390/genes12101645 . ПМЦ 8535801 . ПМИД  34681040. 
  53. ^ Миллер, Рэйчел М.; Джордан, Бен Т.; Мельфербер, Мэдисон М.; Джеффри, Эрин Д.; Хаципанциу, Кристина; Каур, Сими; Милликин, Роберт Дж.; Дай, Юньсян; Тибери, Симона; Кастальди, Питер Дж.; Шортрид, Майкл Р.; Лаки, Ченс Джон; Конеса, Ана; Смит, Ллойд М.; Деслаттес Мейс, Энн; Шейнкман, Глория М. (2022). «Улучшенная характеристика изоформ белка с помощью протеогеномики с длинными прочтениями». Genome Biology . 23 (1): 69. doi : 10.1186/s13059-022-02624-y . PMC 8892804 . PMID  35241129. 
  54. ^ Осман, Хаусемедин; Джемайма, Шерлин; Да Роша, Хорхе Эмануэль Батиста (2022). «Рабочий процесс биоинформатики SWAAT для аннотации вариантов гена ADME на основе структуры белка». Журнал персонализированной медицины . 12 (2): 263. дои : 10.3390/jpm12020263 . ПМЦ 8875676 . ПМИД  35207751. 
  55. ^ Бичманн, Леон; Гупта, Шубхам; Розенбергер, Джордж; Кюхенбекер, Леон; Заксенберг, Тимо; Эвельс, Фил; Алка, Оливер; Пфойффер, Джулианус; Кольбахер, Оливер; Рёст, Ханнес (2021). «DIAproteomics: многофункциональный конвейер анализа данных для независимой от данных протеомики и пептидомики». Журнал исследований протеома . 20 (7): 3758– 3766. doi : 10.1021/acs.jproteome.1c00123 . PMID  34153189. S2CID  235597603.
  56. ^ Уолцер, Матиас; Гарсия-Сейсдедос, Дэвид; Пракаш, Анант; Брак, Пол; Кроутер, Питер; Грэм, Роберт Л.; Джордж, Нэнси; Мохаммед, Сухаиб; Морено, Пабло; Папатеодору, Ирен; Хаббард, Саймон Дж.; Вискайно, Хуан Антонио (2022). «Реализация повторного использования общедоступных наборов данных протеомики DIA: от базы данных PRIDE до Expression Atlas». Scientific Data . 9 (1): 335. Bibcode : 2022NatSD...9..335W. doi : 10.1038/s41597-022-01380-9. PMC 9197839. PMID  35701420 . 
  57. ^ Хульштаерт, Нильс; Шофшталь, Джим; Заксенберг, Тимо; Вальцер, Матиас; Барснес, Харальд; Мартенс, Леннарт; Перес-Риверол, Яссет (2020). «ThermoRawFile Parser: Modular, Scalable, and Cross-Platform RAW File Conversion». Журнал исследований протеома . 19 (1): 537– 542. doi : 10.1021/acs.jproteome.9b00328. PMC 7116465. PMID  31755270 . 
  58. ^ Ли, Кай; Джейн, Антрикс; Малованная, Анна; Вэнь, Бо; Чжан, Бин (2020). «Глубокая переоценка: использование глубокого обучения для улучшения идентификации пептидов в иммунопептидомике». Протеомика . 20 ( 21–22 ): e1900334. doi :10.1002/pmic.201900334. PMC 7718998. PMID  32864883 . 
  • Официальный сайт
  • проект nf-core
  • Seqera Лаборатории

Смотрите также

Галактика Снейкмейк

Retrieved from "https://en.wikipedia.org/w/index.php?title=Nextflow&oldid=1268448304"