Пилотный проект трубопровода

Разработчик(и)Accelrys
Первоначальный выпуск1999 (1999)
Стабильный релиз
18.1 / Май 2018 (2018-05)
Написано вС++
Операционная системаWindows и Linux
ТипВизуальный и потоковый язык программирования
ЛицензияЗапатентованный
Веб-сайтaccelrys.com/products/collaborative-science/biovia-pipeline-pilot/ 

Pipeline Pilot — это настольное программное приложение, разработанное Dassault Systèmes . Изначально ориентированное на процессы извлечения, преобразования и загрузки (ETL) и аналитику данных, программное обеспечение развивалось, предлагая более широкие возможности в различных научных и промышленных приложениях.

Pipeline Pilot использует визуальный и потоковый интерфейс программирования, позволяя пользователям разрабатывать рабочие процессы для обработки данных. Функциональность программного обеспечения охватывает несколько областей, включая хемоинформатику , QSAR , [1] [2] секвенирование следующего поколения , [3] анализ изображений , [4] и текстовую аналитику . [5]

Pipeline Pilot в основном используется в отраслях, где требуется обширная обработка и анализ данных, включая науки о жизни, материаловедение и инженерию. Программное обеспечение позволяет пользователям создавать рабочие процессы путем перетаскивания функциональных компонентов, которые автоматизируют задачи анализа данных, интегрируются с базами данных и выполняют различные научные вычисления. Эти рабочие процессы называются «протоколами» и могут совместно использоваться и повторно использоваться в группах или организациях.

Продукт поддерживает несколько языков программирования, включая Python, .NET, Matlab, Perl, SQL, Java, VBScript и R, что дает пользователям гибкость в интеграции пользовательского кода в их рабочие процессы. Кроме того, Pipeline Pilot предлагает поддержку PilotScript, собственного языка сценариев на основе PLSQL, который позволяет пользователям выполнять пользовательские манипуляции данными в своих рабочих процессах.

Pipeline Pilot продолжает расширять свои возможности за счет дополнительных модулей и наборов инструментов для решения конкретных научных задач, таких как анализ последовательностей нового поколения, хемоинформатика и прогнозирование свойств полимеров.

История

Pipeline Pilot изначально был разработан компанией SciTegic , которая была приобретена BIOVIA в 2004 году. В 2014 году BIOVIA стала частью Dassault Systèmes .

Первоначально разработанный для приложений в области химии, возможности Pipeline Pilot с тех пор были расширены для поддержки более широкого спектра задач обработки данных, включая процессы извлечения, преобразования и загрузки (ETL), а также общие аналитические и задачи обработки данных в различных областях. Программное обеспечение используется в таких областях, как науки о жизни, материаловедение и инженерия, предоставляя пользователям инструменты для создания автоматизированных рабочих процессов для анализа данных и научных вычислений.

Обзор

Pipeline Pilot — это программный инструмент, предназначенный для обработки и анализа данных. Он предоставляет графический пользовательский интерфейс для создания рабочих процессов, которые интегрируют и обрабатывают данные из нескольких источников, включая файлы CSV, текстовые файлы и базы данных. Программное обеспечение обычно используется в задачах извлечения, преобразования и загрузки (ETL).

Интерфейс, известный как Pipeline Pilot Professional Client, позволяет пользователям создавать рабочие процессы, выбирая и упорядочивая отдельные блоки обработки данных, называемые «компонентами». Эти компоненты выполняют различные функции, такие как загрузка, фильтрация, объединение или изменение данных. Дополнительные компоненты могут выполнять более сложные задачи, такие как построение регрессионных моделей, обучение нейронных сетей или создание отчетов в форматах, таких как PDF.

Pipeline Pilot следует архитектуре на основе компонентов, где компоненты служат узлами в рабочем процессе, соединенными «трубами», которые представляют поток данных в направленном графе . Эта структура позволяет обрабатывать данные по мере их перемещения между компонентами.

Пользователи имеют возможность работать с предустановленными компонентами или разрабатывать собственные компоненты в рабочих процессах, называемых «протоколами». Протоколы, состоящие из связанных компонентов, можно сохранять, повторно использовать и совместно использовать, что позволяет оптимизировать обработку данных. Интерфейс визуализирует связи между компонентами, упрощая сложные рабочие процессы данных, представляя их в виде последовательностей операций.

Коллекции компонентов

Pipeline Pilot предлагает несколько дополнений, называемых «коллекциями», которые представляют собой группы специализированных функций, нацеленных на определенные области, такие как обработка генетической информации или анализ полимеров. Эти коллекции доступны пользователям за дополнительную плату за лицензию.

Коллекции организованы в две основные группы: научно-специфические и общие. Научно-специфические коллекции сосредоточены на таких областях, как химия, биология и моделирование материалов, в то время как общие коллекции предоставляют инструменты для составления отчетов, анализа данных и поиска документов. Ниже приведен обзор доступных коллекций: [6]

ГруппаДоменСбор компонентов
Научные особенностиХимияХимия
АДМЕТ
Хеминформатика
БиологияЭкспрессия генов
Анализ последовательности
Масс-спектрометрия для протеомики
Секвенирование следующего поколения
Моделирование и имитация материаловСтудия материалов
Свойства полимеров (Synthia)
ОбщийОтчетность и визуализацияОтчетность
Интеграция баз данных и приложенийИнтеграция
ВизуализацияВизуализация
Анализ и статистикаМоделирование данных
Расширенное моделирование данных
Статистика Р
Поиск и анализ документовХимический анализ текста
Текстовая аналитика
ЛабораторияАналитика данных пластин
Аналитическое приборостроение

Пользовательские скрипты

Pipeline Pilot обычно используется для обработки больших и сложных наборов данных, часто превышающих 1 ТБ в размере. На раннем этапе разработки Pipeline Pilot представил язык сценариев под названием «PilotScript», который позволяет пользователям писать базовые сценарии, которые могут быть интегрированы в протокол. Со временем была добавлена ​​поддержка дополнительных языков программирования, включая Python, .NET, Matlab, Perl, SQL, Java, VBScript и R. Эти языки можно использовать через API, которые выполняют команды без необходимости использования графического пользовательского интерфейса. [7]

PilotScript, язык, смоделированный на основе PLSQL, используется в определенных компонентах, таких как «Пользовательский манипулятор (PilotScript)» или «Пользовательский фильтр (PilotScript)». Ниже показан пример простой команды PilotScript, где свойство с именем «Hello» добавляется к каждой записи, проходящей через компонент со значением «Hello World!»:

 Привет := "Привет, мир!" ;  

Ссылки

  1. ^ Хассан, Моисес; Браун, Роберт Д.; Варма-О'Брайен, Шикха; Роджерс, Дэвид (2007). «Анализ и обучение хемоинформатики в среде конвейерной обработки данных». ChemInform . 38 (12). doi :10.1002/chin.200712278. ISSN  0931-7597.
  2. ^ Ху, Йе; Лункин, Ойген; Баджорат, Юрген (2009). «Улучшение производительности поиска расширенных отпечатков пальцев связности с помощью фильтрации признаков, ориентированных на активность, и применения функции сходства, зависящей от плотности битов». ChemMedChem . 4 (4): 540– 548. doi :10.1002/cmdc.200800408. ISSN  1860-7179. PMID  19263458. S2CID  35868099.
  3. ^ "Accelrys выходит на рынок секвенирования нового поколения с коллекцией NGS для пилотного проекта". Business Wire. 2011-02-23 . Получено 15 февраля 2013 г.
  4. ^ Rabal, Obdulia; Link, Wolfgang; G. Serelde, Beatriz; Bischoff, James R.; Oyarzabal, Julen (2010). «Интегрированная одношаговая система для извлечения, анализа и аннотирования всей соответствующей информации из скрининга клеток на основе изображений химических библиотек». Molecular BioSystems . 6 (4): 711– 720. doi :10.1039/b919830j. ISSN  1742-206X. PMID  20237649.
  5. ^ Павелей, Росс А.; Мансур, Нуха Р.; Халлибертон, Ирен; Блейхер, Лео С.; Бенн, Алекс Э.; Микич, Ивана; Гуиди, Алессандра; Гилберт, Ян Х.; Хопкинс, Эндрю Л.; Бикл, Квентин Д. (2012). «Высококонтентный скрининг всего организма с помощью байесовской классификации паразитарных заболеваний на основе изображений без меток». PLOS Neglected Tropical Diseases . 6 (7): e1762. doi : 10.1371/journal.pntd.0001762 . ISSN  1935-2735. PMC 3409125. PMID 22860151  . 
  6. ^ "Pipeline Pilot Component Collections". Accelrys. Архивировано из оригинала 15 января 2013 г. Получено 26 января 2013 г.
  7. ^ "Pipeline Pilot Integration Component Collection Datasheet" (PDF) . Accelrys . Получено 8 февраля 2013 г. .
Retrieved from "https://en.wikipedia.org/w/index.php?title=Pipeline_Pilot&oldid=1270905517"