Проточная цитометрия биоинформатика

Биоинформатика проточной цитометрии — это применение биоинформатики к данным проточной цитометрии , которое включает хранение, извлечение, организацию и анализ данных проточной цитометрии с использованием обширных вычислительных ресурсов и инструментов. Биоинформатика проточной цитометрии требует широкого использования и вносит вклад в разработку методов вычислительной статистики и машинного обучения . Проточная цитометрия и связанные с ней методы позволяют количественно определять несколько независимых биомаркеров на большом количестве отдельных клеток . Быстрый рост многомерности и пропускной способности данных проточной цитометрии, особенно в 2000-х годах, привел к созданию различных методов вычислительного анализа, стандартов данных и общедоступных баз данных для обмена результатами.

Существуют вычислительные методы, помогающие в предварительной обработке данных проточной цитометрии, идентификации популяций клеток в ней, сопоставлении этих популяций клеток в образцах и выполнении диагностики и обнаружения с использованием результатов предыдущих шагов. Для предварительной обработки это включает компенсацию спектрального перекрытия, преобразование данных в шкалы, благоприятные для визуализации и анализа, оценку данных по качеству и нормализацию данных по образцам и экспериментам. Для идентификации популяции доступны инструменты, помогающие традиционной ручной идентификации популяций на двумерных диаграммах рассеяния (селекции), использовать уменьшение размерности для помощи в селекции и автоматически находить популяции в пространстве более высокой размерности различными способами. Также возможно характеризовать данные более комплексными способами, такими как метод разбиения двоичного пространства с учетом плотности , известный как вероятностное биннинг, или комбинаторное селекция. Наконец, диагностике с использованием данных проточной цитометрии могут способствовать контролируемые методы обучения и обнаружение новых типов клеток, имеющих биологическое значение, с помощью высокопроизводительных статистических методов в рамках конвейеров, включающих все вышеупомянутые методы.

Открытые стандарты , данные и программное обеспечение также являются ключевыми частями биоинформатики проточной цитометрии. Стандарты данных включают широко принятый стандарт проточной цитометрии (FCS), определяющий, как должны храниться данные с цитометров, а также несколько новых стандартов, разрабатываемых Международным обществом по развитию цитометрии (ISAC) для помощи в хранении более подробной информации об экспериментальном дизайне и аналитических этапах. Открытые данные медленно растут с открытием базы данных CytoBank в 2010 году и FlowRepository в 2012 году, обе из которых позволяют пользователям свободно распространять свои данные, и последняя из которых была рекомендована ISAC в качестве предпочтительного репозитория для данных, совместимых с MIFlowCyt. Открытое программное обеспечение наиболее широко доступно в виде набора пакетов Bioconductor , но также доступно для веб-исполнения на платформе GenePattern .

Сбор данных

Принципиальная схема проточного цитометра, показывающая фокусировку жидкостной оболочки, лазер, оптику (в упрощенном виде, без фокусировки), фотоэлектронные умножители (ФЭУ), аналого-цифровой преобразователь и аналитическую рабочую станцию.

Проточные цитометры работают путем гидродинамической фокусировки взвешенных клеток таким образом, чтобы они отделялись друг от друга в потоке жидкости. Поток опрашивается одним или несколькими лазерами, и полученный флуоресцентный и рассеянный свет обнаруживается фотоумножителями . Используя оптические фильтры , можно количественно определить отдельные флуорофоры на клетках или внутри них по пикам в их спектрах испускания . Это могут быть эндогенные флуорофоры, такие как хлорофилл или трансгенный зеленый флуоресцентный белок , или это могут быть искусственные флуорофоры, ковалентно связанные с молекулами обнаружения, такими как антитела для обнаружения белков или гибридизационные зонды для обнаружения ДНК или РНК .

Возможность количественной оценки этих показателей привела к использованию проточной цитометрии в широком спектре приложений, включая, помимо прочего:

До начала 2000-х годов проточная цитометрия могла измерять только несколько флуоресцентных маркеров за раз. Однако с конца 1990-х до середины 2000-х годов быстрое развитие новых флуорофоров привело к появлению современных инструментов, способных количественно определять до 18 маркеров на клетку. [7] Совсем недавно новая технология массовой цитометрии заменила флуорофоры редкоземельными элементами , обнаруженными с помощью времяпролетной масс-спектрометрии , что позволило измерить экспрессию 34 или более маркеров. [8] В то же время методы микрофлюидной ПЦР предоставляют метод, подобный проточной цитометрии, для количественной оценки 48 или более молекул РНК на клетку. [9] Быстрое увеличение размерности данных проточной цитометрии в сочетании с разработкой высокопроизводительных роботизированных платформ, способных автоматически анализировать сотни и тысячи образцов, создали потребность в улучшенных методах вычислительного анализа. [7]

Данные

Представление данных проточной цитометрии с прибора с тремя каналами рассеивания и 13 флуоресцентными каналами. Показаны только значения для первых 30 (из сотен тысяч) клеток.

Данные проточной цитометрии представлены в виде большой матрицы интенсивностей по M длинам волн по N событиям. Большинство событий будут представлять собой определенную клетку, хотя некоторые могут быть дублетами (парами клеток, которые проходят лазер близко друг к другу). Для каждого события регистрируется измеренная интенсивность флуоресценции по определенному диапазону длин волн.

Измеренная интенсивность флуоресценции указывает на количество этого флуорофора в клетке, что указывает на количество, которое связалось с молекулами детектора, такими как антитела. Таким образом, интенсивность флуоресценции можно считать прокси-фактором для количества молекул детектора, присутствующих в клетке. Упрощенный, хотя и не строго точный, способ рассмотрения данных проточной цитометрии — это матрица из M измерений, умноженных на N ячеек, где каждый элемент соответствует количеству молекул.

Этапы анализа данных вычислительной проточной цитометрии

Пример конвейера для анализа данных FCM и некоторые пакеты Bioconductor, относящиеся к каждому этапу.

Процесс перехода от первичных данных FCM к диагностике заболеваний и обнаружению биомаркеров включает четыре основных этапа:

  1. Предварительная обработка данных (включая компенсацию, преобразование и нормализацию)
  2. Идентификация популяции клеток (т.е. гейтирование)
  3. Сопоставление популяций клеток для сравнения перекрестных выборок
  4. Связь популяций клеток с внешними переменными (диагностика и обнаружение)

Сохранение шагов, выполненных в конкретном рабочем процессе проточной цитометрии , поддерживается некоторым программным обеспечением для проточной цитометрии и важно для воспроизводимости экспериментов проточной цитометрии. Однако сохраненные файлы рабочего пространства редко являются взаимозаменяемыми между программным обеспечением. [10] Попыткой решить эту проблему является разработка стандарта данных на основе XML Gating-ML (подробнее обсуждается в разделе стандартов), который медленно принимается как в коммерческом, так и в программном обеспечении для проточной цитометрии с открытым исходным кодом. [11] Пакет CytoML R также заполняет пробел путем импорта/экспорта Gating-ML, совместимого с программным обеспечением FlowJo , CytoBank и FACS Diva.

Предварительная обработка данных

Перед анализом данные проточной цитометрии обычно должны пройти предварительную обработку для удаления артефактов и данных низкого качества, а также для преобразования в оптимальный масштаб для идентификации интересующих популяций клеток. Ниже приведены различные этапы типичного конвейера предварительной обработки проточной цитометрии.

Компенсация

Когда с одним и тем же лазером используется более одного флуорохрома, их спектры излучения часто перекрываются. Каждый конкретный флуорохром обычно измеряется с помощью полосового оптического фильтра, установленного на узкую полосу на пике интенсивности излучения флуорохрома или около него. Результатом является то, что показания для любого данного флуорохрома фактически являются суммой пиковой интенсивности излучения этого флуорохрома и интенсивности спектров всех других флуорохромов, где они перекрываются с этой полосой частот. Это перекрытие называется переливом, а процесс удаления перелива из данных проточной цитометрии называется компенсацией. [12]

Компенсация обычно достигается путем запуска серии репрезентативных образцов, каждый из которых окрашен только одним флуорохромом, чтобы получить измерения вклада каждого флуорохрома в каждый канал. [12] Общий сигнал, который необходимо удалить из каждого канала, можно вычислить путем решения системы линейных уравнений на основе этих данных для получения матрицы перетока, которая при инвертировании и умножении на необработанные данные из цитометра дает скомпенсированные данные. [12] [13] Процессы вычисления матрицы перетока или применения предварительно вычисленной матрицы перетока для компенсации данных проточной цитометрии являются стандартными функциями программного обеспечения проточной цитометрии. [14]

Трансформация

Клеточные популяции, обнаруженные с помощью проточной цитометрии, часто описываются как имеющие приблизительно логарифмически нормальную экспрессию. [15] Таким образом, они традиционно преобразовывались в логарифмическую шкалу . В ранних цитометрах это часто достигалось даже до получения данных с помощью логарифмического усилителя . На современных приборах данные обычно хранятся в линейной форме и преобразуются в цифровую форму перед анализом.

Однако компенсированные данные проточной цитометрии часто содержат отрицательные значения из-за компенсации, и встречаются популяции клеток с низкими средними значениями и нормальным распределением. [16] Логарифмические преобразования не могут правильно обрабатывать отрицательные значения и плохо отображают нормально распределенные типы клеток. [16] [17] Альтернативные преобразования, которые решают эту проблему, включают логарифмически-линейные гибридные преобразования Logicle [16] [18] и Hyperlog, [19] , а также гиперболический арксинус и Бокс-Кокс . [20]

Сравнение обычно используемых преобразований пришло к выводу, что биэкспоненциальное преобразование и преобразование Бокса-Кокса при оптимальной параметризации обеспечивают наиболее четкую визуализацию и наименьшую дисперсию популяций клеток в разных образцах. [17] Однако более позднее сравнение пакета flowTrans, использованного в этом сравнении, показало, что он не параметризовал преобразование Logicle способом, соответствующим другим реализациям, что потенциально ставит эти результаты под сомнение. [21]

Контроль качества

В частности, в новых, высокопроизводительных экспериментах необходимы методы визуализации , помогающие обнаруживать технические ошибки в отдельных образцах. Один из подходов заключается в визуализации сводных статистик, таких как эмпирические функции распределения отдельных измерений технических или биологических повторов, чтобы гарантировать их схожесть. [22] Для большей строгости можно использовать тест Колмогорова-Смирнова , чтобы определить, отклоняются ли отдельные образцы от нормы. [22] Тест Граббса на выбросы можно использовать для обнаружения образцов, отклоняющихся от группы.

Метод контроля качества в многомерном пространстве заключается в использовании вероятностного биннинга с бинами, подходящими для всего набора данных, объединенных вместе. [23] Затем стандартное отклонение количества ячеек, попадающих в бины в пределах каждого образца, можно принять в качестве меры многомерного сходства, при этом образцы, которые ближе к норме, имеют меньшее стандартное отклонение. [23] При использовании этого метода более высокое стандартное отклонение может указывать на выбросы, хотя это относительная мера, поскольку абсолютное значение частично зависит от количества бинов.

При использовании всех этих методов измеряется вариация между образцами. Однако это комбинация технических вариаций, вносимых приборами и обработкой, и фактической биологической информации, которую желательно измерить. Устранение неоднозначности между техническим и биологическим вкладами в вариацию между образцами может быть сложной или невозможной задачей. [24]

Нормализация

В частности, в многоцентровых исследованиях технические вариации могут затруднить сопоставление биологически эквивалентных популяций клеток между образцами. Методы нормализации для устранения технической дисперсии, часто получаемые из методов регистрации изображений , являются, таким образом, критическим шагом во многих анализах проточной цитометрии. Нормализация по одному маркеру может быть выполнена с использованием регистрации ориентиров, при которой пики в оценке плотности ядра каждого образца идентифицируются и выравниваются между образцами. [24]

Определение популяций клеток

Двумерные диаграммы рассеяния, охватывающие все три комбинации трех выбранных измерений. Цвета показывают сравнение консенсуса восьми независимых ручных вентилей (полигоны) и автоматизированных вентилей (цветные точки). Консенсус ручных вентилей и алгоритмов был получен с использованием пакета CLUE. [25] Рисунок воспроизведен из. [26]

Сложность необработанных данных проточной цитометрии (десятки измерений для тысяч или миллионов клеток) затрудняет получение ответов на вопросы напрямую с использованием статистических тестов или контролируемого обучения. Таким образом, критическим шагом в анализе данных проточной цитометрии является снижение этой сложности до чего-то более поддающегося обработке при установлении общих черт во всех образцах. Обычно это включает в себя идентификацию многомерных областей, которые содержат функционально и фенотипически однородные группы клеток. [27] Это форма кластерного анализа . Существует ряд методов, с помощью которых этого можно достичь, подробно описанных ниже.

Стробирование

Данные, полученные с помощью проточных цитометров, можно нанести на график в одном или двух измерениях для получения гистограммы или диаграммы рассеяния. Области на этих графиках можно последовательно разделять на основе интенсивности флуоресценции , создавая ряд извлечений подмножеств, называемых « воротами ». Эти ворота можно создавать с помощью программного обеспечения, например, FlowJo , [28] FCS Express, [29] WinMDI, [30] CytoPaint (он же Paint-A-Gate), [31] VenturiOne, Cellcion, CellQuest Pro, Cytospec, [32] Kaluza. [33] или flowCore.

В наборах данных с небольшим количеством измерений и ограниченной перекрестной технической и биологической изменчивостью (например, клинические лаборатории) ручной анализ определенных популяций клеток может давать эффективные и воспроизводимые результаты. Однако исследовательский анализ большого количества популяций клеток в многомерном наборе данных невозможен. [34] Кроме того, ручной анализ в менее контролируемых условиях (например, перекрестные лабораторные исследования) может увеличить общую частоту ошибок исследования. [35] В одном исследовании несколько алгоритмов вычислительного гейтирования работали лучше, чем ручной анализ при наличии некоторой вариации. [26] Однако, несмотря на значительные достижения в вычислительном анализе, ручное гейтирование остается основным решением для идентификации определенных редких популяций клеток, которые недостаточно хорошо отделены от других типов клеток.

Литниковое управление, направленное на уменьшение размеров

Количество диаграмм рассеяния, которые необходимо исследовать, увеличивается с квадратом количества измеренных маркеров (или быстрее, поскольку некоторые маркеры необходимо исследовать несколько раз для каждой группы клеток, чтобы разрешить многомерные различия между типами клеток, которые кажутся схожими по большинству маркеров). [36] Для решения этой проблемы был использован анализ главных компонент для суммирования многомерных наборов данных с использованием комбинации маркеров, которая максимизирует дисперсию всех точек данных. [37] Однако PCA является линейным методом и не способен сохранять сложные и нелинейные отношения. Совсем недавно для руководства процессом ручного стробирования использовались двумерные макеты минимального остовного дерева . Основанная на плотности субдискретизация и кластеризация использовались для лучшего представления редких популяций и контроля временной и памяти сложности процесса построения минимального остовного дерева. [38] Более сложные алгоритмы снижения размерности еще предстоит изучить. [39]

Популяции клеток в массиве данных масс-цитометрии с высокой размерностью, вручную отобранные после уменьшения размерности с использованием 2D-макета для минимального связующего дерева. Рисунок воспроизведен из данных, предоставленных в. [40]

Автоматизированное стробирование

Разработка вычислительных инструментов для идентификации популяций клеток стала областью активных исследований только с 2008 года. Недавно было разработано много индивидуальных подходов к кластеризации , включая алгоритмы на основе моделей (например, flowClust [41] и FLAME [42] ), алгоритмы на основе плотности (например, FLOCK [43] и SWIFT), графовые подходы (например, SamSPECTRAL [44] ) и совсем недавно гибриды нескольких подходов (flowMeans [45] и flowPeaks [46] ). Эти алгоритмы различаются по сложности памяти и времени, требованиям к программному обеспечению, способности автоматически определять необходимое количество популяций клеток, а также чувствительности и специфичности. Проект FlowCAP (проточная цитометрия: критическая оценка методов идентификации популяций) при активном участии большинства академических групп, ведущих исследования в этой области, предоставляет способ объективного перекрестного сравнения современных автоматизированных подходов к анализу. [26] В других исследованиях также сравнивались автоматизированные инструменты гейтирования на нескольких наборы данных. [47] [48] [49] [50]

Методы вероятностного биннинга

Пример частотного разностного стробирования, созданного с использованием пакета flowFP Bioconductor. Точки представляют отдельные события в файле FCS. Прямоугольники представляют ячейки.

Вероятностное биннинг — это метод анализа без стробирования, в котором данные проточной цитометрии разделяются на квантили на одномерной основе. [51] Расположение квантилей затем можно использовать для проверки различий между образцами (в неразделенных переменных) с использованием критерия хи-квадрат. [51]

Позже это было расширено на несколько измерений в форме частотного разностного стробирования, метода бинарного разделения пространства , где данные итеративно разделяются вдоль медианы. [52] Эти разделы (или ячейки) подгоняются под контрольную выборку. Затем долю клеток, попадающих в каждую ячейку в тестовых выборках, можно сравнить с контрольной выборкой с помощью теста хи-квадрат.

Наконец, цитометрическое фингерпринтинг использует вариант частотного разностного стробирования для установки бинов и измерения для серии образцов того, сколько клеток попадает в каждый бин. [23] Эти бины можно использовать в качестве ворот и использовать для последующего анализа аналогично методам автоматического ворот.

Комбинаторное стробирование

Алгоритмы кластеризации высокой размерности часто неспособны идентифицировать редкие типы клеток, которые не очень хорошо отделены от других основных популяций. Сопоставление этих небольших популяций клеток в нескольких образцах еще более сложная задача. При ручном анализе предшествующие биологические знания (например, биологический контроль) дают указания для разумной идентификации этих популяций. Однако интеграция этой информации в процесс исследовательской кластеризации (например, как в полуконтролируемом обучении ) не увенчалась успехом.

Альтернативой кластеризации высокой размерности является идентификация популяций клеток с использованием одного маркера за раз, а затем их объединение для создания кластеров более высокой размерности. Эта функциональность была впервые реализована в FlowJo. [28] Алгоритм flowType строится на этой структуре, позволяя исключать маркеры. [53] Это позволяет разрабатывать статистические инструменты (например, RchyOptimyx), которые могут исследовать важность каждого маркера и исключать избыточность высокой размерности. [54]

Диагностика и открытие

Обзор конвейера flowType/RchyOptimyx для идентификации коррелятов защиты от ВИЧ: во-первых, десятки тысяч популяций клеток идентифицируются путем объединения одномерных разделов (панель 1). Затем популяции клеток анализируются с использованием статистического теста (и метода Бонферрони для коррекции множественного тестирования) для выявления тех, которые коррелируют с информацией о выживании. Третья панель показывает полную иерархию гейтирования, описывающую все возможные стратегии гейтирования этой популяции клеток. Этот график можно использовать для определения «лучшей» стратегии гейтирования (т. е. той, в которой наиболее важные маркеры появляются раньше). Эти иерархии для всех выбранных фенотипов показаны на панели 4. На панели 5 эти иерархии объединены в один график, который суммирует весь набор данных и демонстрирует компромисс между количеством маркеров, вовлеченных в каждый фенотип, и значимостью корреляции с клиническим результатом (например, как измерено с помощью оценщика Каплана–Майера на панели 6). Рисунок частично воспроизведен из [53] и. [54]

После идентификации интересующей популяции клеток можно провести перекрестный анализ выборки для выявления фенотипических или функциональных вариаций, которые коррелируют с внешней переменной (например, клиническим результатом). Эти исследования можно разделить на две основные группы:

Диагноз

В этих исследованиях целью обычно является диагностика заболевания (или подкласса заболевания) с использованием вариаций в одной или нескольких популяциях клеток. Например, можно использовать многомерную кластеризацию для идентификации набора кластеров, сопоставить их по всем образцам, а затем использовать контролируемое обучение для построения классификатора для прогнозирования интересующих классов (например, этот подход можно использовать для повышения точности классификации определенных подтипов лимфомы [55] ). В качестве альтернативы все клетки из всей когорты можно объединить в единое многомерное пространство для кластеризации перед классификацией. [56] Этот подход особенно подходит для наборов данных с большим количеством биологических вариаций (в которых сопоставление перекрестных образцов является сложной задачей), но требует тщательного контроля технических вариаций. [57]

Открытие

В условиях обнаружения цель состоит в том, чтобы идентифицировать и описать популяции клеток, коррелирующие с внешней переменной (в отличие от диагностических условий, в которых цель состоит в том, чтобы объединить предсказательную силу нескольких типов клеток для максимизации точности результатов). Подобно варианту использования диагностики, сопоставление кластеров в многомерном пространстве может использоваться для исследовательского анализа, но описательная сила этого подхода очень ограничена, поскольку трудно охарактеризовать и визуализировать популяцию клеток в многомерном пространстве без предварительного уменьшения размерности. [56] [58] Наконец, комбинаторные подходы к гейтированию оказались особенно успешными в исследовательском анализе данных FCM. Упрощенное представление невероятно сложных оценок (SPICE) — это программный пакет, который может использовать функциональность гейтирования FlowJo для статистической оценки широкого спектра различных популяций клеток и визуализации тех, которые коррелируют с внешним результатом. flowType и RchyOptimyx (как обсуждалось выше) расширяют эту технику, добавляя возможность исследования влияния независимых маркеров на общую корреляцию с внешним результатом. Это позволяет удалять ненужные маркеры и обеспечивает простую визуализацию всех идентифицированных типов клеток. В недавнем анализе большой (n=466) когорты пациентов с ВИЧ+ этот конвейер выявил три коррелята защиты от ВИЧ, только один из которых был ранее идентифицирован посредством обширного ручного анализа того же набора данных. [53]

Форматы данных и обмен

Стандарт проточной цитометрии

Стандарт проточной цитометрии (FCS) был разработан в 1984 году для записи и обмена данными проточной цитометрии. [59] С тех пор FCS стал стандартным форматом файла , поддерживаемым всеми поставщиками программного обеспечения и оборудования для проточной цитометрии. Спецификация FCS традиционно разрабатывалась и поддерживалась Международным обществом по развитию цитометрии (ISAC). [60] На протяжении многих лет были включены обновления для адаптации к технологическим достижениям как в проточной цитометрии, так и в вычислительных технологиях: FCS 2.0 был представлен в 1990 году, [61] FCS 3.0 в 1997 году, [62] и самая последняя спецификация FCS 3.1 в 2010 году. [63] FCS был единственным широко принятым форматом файла в проточной цитометрии. Недавно ISAC разработал дополнительные стандартные форматы файлов.

netCDF

ISAC рассматривает возможность замены FCS на версию формата файла Network Common Data Form (netCDF), предназначенную для проточной цитометрии. [64] netCDF — это набор свободно доступных библиотек программного обеспечения и машинно-независимых форматов данных, которые поддерживают создание, доступ и совместное использование научных данных, ориентированных на массивы. В 2008 году ISAC разработал первую версию соглашений netCDF для хранения необработанных данных проточной цитометрии. [65]

Стандарт архивной цитометрии (ACS)

Стандарт архивной цитометрии (ACS) разрабатывается для объединения данных с различными компонентами, описывающими эксперименты по цитометрии. [66] Он фиксирует связи между данными, метаданными, файлами анализа и другими компонентами и включает поддержку контрольных журналов, управления версиями и цифровых подписей. Контейнер ACS основан на формате файла ZIP с таблицей содержания на основе XML , определяющей связи между файлами в контейнере. Рекомендация W3C по подписи XML была принята для обеспечения цифровых подписей компонентов в контейнере ACS. Первоначальный проект ACS был разработан в 2007 году и завершен в 2010 году. С тех пор поддержка ACS была введена в нескольких программных инструментах, включая FlowJo и Cytobank.

Gating-ML

Отсутствие взаимодействия гейтинга традиционно было узким местом, препятствующим воспроизводимости анализа данных проточной цитометрии и использованию нескольких аналитических инструментов. Для устранения этого недостатка ISAC разработал Gating-ML, механизм на основе XML для формального описания гейтов и связанных с ними преобразований данных (масштабов). [10] Проект рекомендации Gating-ML был одобрен ISAC в 2008 году, и он частично поддерживается такими инструментами, как FlowJo, flowUtils, библиотеки CytoML в R/BioConductor и FlowRepository. [66] Он поддерживает прямоугольные гейты, многоугольные гейты, выпуклые многогранники, эллипсоиды, деревья решений и булевы коллекции любых других типов гейтов. Кроме того, он включает десятки встроенных общедоступных преобразований, которые, как было показано, потенциально полезны для отображения или анализа данных цитометрии. В 2013 году версия Gating-ML 2.0 была одобрена Целевой группой по стандартам данных ISAC в качестве рекомендации. Эта новая версия предлагает немного меньшую гибкость с точки зрения мощности описания стробирования; однако ее также значительно проще реализовать в программных инструментах. [11]

Результаты классификации (CLR)

Формат файла результатов классификации (CLR) [67] был разработан для обмена результатами ручного гейтирования и алгоритмических подходов к классификации стандартным способом, чтобы иметь возможность сообщать и обрабатывать классификацию. CLR основан на широко поддерживаемом формате файла CSV со столбцами, соответствующими различным классам, и значениями ячеек, содержащими вероятность того, что событие является членом определенного класса. Они фиксируются как значения от 0 до 1. Простота формата и его совместимость с распространенными инструментами электронных таблиц были основными требованиями, определяющими дизайн спецификации. Хотя изначально он был разработан для области проточной цитометрии, он применим в любой области, где необходимо фиксировать как нечеткие, так и однозначные классификации практически любых видов объектов.

Публичные данные и программное обеспечение

Как и в других областях биоинформатики, разработка новых методов в основном осуществлялась в форме бесплатного программного обеспечения с открытым исходным кодом , и было создано несколько баз данных для размещения открытых данных .

АвтоГейт

AutoGate [68] выполняет компенсацию, стробирование, предварительный просмотр кластеров, исчерпывающее проекционное преследование (EPP), многомерное масштабирование и фенограмму, создает визуальную дендрограмму для выражения готовности HiD. Он бесплатен для исследователей и врачей в академических, государственных и некоммерческих учреждениях.

Биопроводник

Проект Bioconductor представляет собой репозиторий бесплатного программного обеспечения с открытым исходным кодом, в основном написанного на языке программирования R. [69] По состоянию на июль 2013 года Bioconductor содержал 21 программный пакет для обработки данных проточной цитометрии. [ 70] Эти пакеты охватывают большую часть спектра функциональных возможностей, описанных ранее в этой статье.

GenePattern

GenePattern — это преимущественно геномная аналитическая платформа с более чем 200 инструментами для анализа экспрессии генов, протеомики и других данных. Веб-интерфейс обеспечивает легкий доступ к этим инструментам и позволяет создавать автоматизированные аналитические конвейеры, позволяющие проводить воспроизводимые исследования. Недавно был разработан пакет GenePattern Flow Cytometry Suite, чтобы предоставить расширенные инструменты анализа данных проточной цитометрии экспериментаторам без навыков программирования. Он содержит около 40 модулей проточной цитометрии GenePattern с открытым исходным кодом, охватывающих методы от базовой обработки стандартных файлов проточной цитометрии (т. е. FCS) до расширенных алгоритмов для автоматизированной идентификации популяций клеток, нормализации и оценки качества. Внутренне большинство этих модулей используют функциональность, разработанную в BioConductor.

Большая часть функциональных возможностей пакетов Bioconductor для анализа проточной цитометрии была упакована для использования с системой рабочего процесса GenePattern [71] в форме пакета GenePattern Flow Cytometry Suite. [72]

FACSanadu

FACSanadu [73] — это портативное приложение с открытым исходным кодом для визуализации и анализа данных FCS. В отличие от Bioconductor, это интерактивная программа, предназначенная для непрограммистов для рутинного анализа. Она поддерживает стандартные файлы FCS, а также данные профиля COPAS.

hema.to

hema.to — это веб-сервис для классификации данных проточной цитометрии пациентов с подозрением на лимфому. [74] Искусственный интеллект в инструменте использует глубокую сверточную нейронную сеть для распознавания шаблонов отдельных подтипов. Все данные и код находятся в открытом доступе. [75] Он обрабатывает необработанные данные, что делает стробирование ненужным. Для лучшей производительности на новых данных требуется тонкая настройка путем передачи знаний. [76]

Публичные базы данных

Минимальная информация об эксперименте по проточной цитометрии (MIFlowCyt) требует, чтобы любые данные проточной цитометрии, используемые в публикации, были доступны, хотя это не включает требование о том, чтобы они были размещены в общедоступной базе данных. [77] Таким образом, хотя журналы Cytometry Part A и B, а также все журналы из Nature Publishing Group требуют соответствия MIFlowCyt, общедоступных данных по проточной цитометрии по-прежнему относительно мало. Однако были предприняты некоторые усилия по созданию общедоступных баз данных.

Во-первых, CytoBank, который является полной веб-платформой для хранения и анализа данных проточной цитометрии, был предоставлен общественности в ограниченной форме. [78] Используя кодовую базу CytoBank, в 2012 году при поддержке ISAC был разработан FlowRepository, который стал публичным репозиторием данных проточной цитометрии. [79] FlowRepository обеспечивает соответствие MIFlowCyt [80] и по состоянию на июль 2013 года содержал 65 публичных наборов данных. [81]

Наборы данных

В 2012 году сообщество проточной цитометрии начало выпускать набор общедоступных наборов данных. Ниже описывается подмножество этих наборов данных, представляющее существующие проблемы анализа данных. Для сравнения с ручным гейтированием проект FlowCAP-I выпустил пять наборов данных, вручную гейтированных аналитиками-людьми, и два из них гейтированы восемью независимыми аналитиками. [26] Проект FlowCAP-II включал три набора данных для бинарной классификации, а также сообщал о нескольких алгоритмах, которые смогли идеально классифицировать эти образцы. FlowCAP-III включал два больших набора данных для сравнения с ручным гейтированием, а также один более сложный набор данных классификации образцов. По состоянию на март 2013 года публичный выпуск FlowCAP-III все еще продолжался. [82] Наборы данных, используемые в FlowCAP-I, II и III, либо имеют небольшое количество субъектов или параметров. Однако недавно было опубликовано несколько более сложных клинических наборов данных, включая набор данных по 466 ВИЧ-инфицированным субъектам, который обеспечивает как 14 параметрических анализов, так и достаточную клиническую информацию для анализа выживаемости. [54] [83] [84] [85]

Другой класс наборов данных — это многомерные массовые цитометрические анализы. Представитель этого класса наборов данных — исследование, включающее анализ двух образцов костного мозга с использованием более 30 поверхностных или внутриклеточных маркеров при широком диапазоне различных стимуляций. [8] Исходные данные для этого набора данных общедоступны, как описано в рукописи, а ручной анализ поверхностных маркеров доступен по запросу у авторов.

Открытые проблемы

Несмотря на бурное развитие биоинформатики в области проточной цитометрии, еще предстоит решить ряд проблем.

Изменчивость в экспериментах по проточной цитометрии возникает из-за биологической изменчивости между образцами, технических различий в используемых приборах, а также методов анализа. В 2010 году группа исследователей из Стэнфордского университета и Национальных институтов здравоохранения отметила, что, хотя технические различия могут быть улучшены путем стандартизации обработки образцов, настройки приборов и выбора реагентов, решение проблемы вариабельности в методах анализа потребует аналогичной стандартизации и вычислительной автоматизации методов гейтирования. [86] Они также высказали мнение, что централизация как данных, так и анализа может помочь в снижении изменчивости между экспериментами и в сравнении результатов. [86]

Это было поддержано другой группой исследователей Pacific Biosciences и Стэнфордского университета, которые предположили, что облачные вычисления могут обеспечить централизованный, стандартизированный, высокопроизводительный анализ экспериментов по проточной цитометрии. [87] Они также подчеркнули, что продолжающаяся разработка и принятие стандартных форматов данных могут продолжать помогать в снижении изменчивости между экспериментами. [87] Они также предположили, что потребуются новые методы для моделирования и обобщения результатов высокопроизводительного анализа способами, которые могут быть интерпретированы биологами, [87] а также способы интеграции крупномасштабных данных проточной цитометрии с другой высокопроизводительной биологической информацией, такой как экспрессия генов , генетическая изменчивость , уровни метаболитов и состояния болезней. [87]

Смотрите также

Ссылки

Эта статья была адаптирована из следующего источника по лицензии CC BY 4.0 (2013) (отчеты рецензентов): Киран О'Нил; Нима Агаипур; Йозеф Шпидлен; Райан Бринкман (5 декабря 2013 г.). "Flow cytometry bioinformatics". PLOS Computational Biology . 9 (12): e1003365. doi : 10.1371/JOURNAL.PCBI.1003365 . ISSN  1553-734X. PMC 3867282.  PMID 24363631.  Wikidata Q21045422  .

  1. ^ Брандо, Б.; Барнетт, Д.; Яносси, Г.; Мэнди, Ф.; Аутран, Б.; Роте, Г.; Скарпати, Б.; д'Аванцо, Г.; д'Откур, Дж. Л.; Ленкей, Р.; Шмитц, Г.; Кункль, А.; Кьянезе, Р.; Папа, С.; Гратама, Дж. В. (2000). "Цитофлуориметрические методы оценки абсолютного числа подмножеств клеток в крови". Цитометрия . 42 (6): 327– 346. doi : 10.1002/1097-0320(20001215)42:6<327::AID-CYTO1000>3.0.CO;2-F . PMID  11135287. S2CID  13492197.
  2. ^ Феррейра-Фасио, CS; Милито, К.; Ботафого, В.; Фонтана, М.; Тьяго, Л.С.; Оливейра, Э.; Да Роша-Фильо, AS; Вернек, Ф.; Форни, Д.Н.; Декермахер, С.; Де Азамбуджа, AP; Ферман, SE; Де Фариа, ПАНС; Земля, МГП; Орфао, А.; Коста, ЕС (2013). Азиз, Сайед А. (ред.). «Вклад многопараметрического иммунофенотипирования проточной цитометрии в диагностический скрининг и классификацию детского рака». ПЛОС ОДИН . 8 (3): e55534. Бибкод : 2013PLoSO...855534F. дои : 10.1371/journal.pone.0055534 . PMC 3589426. PMID  23472067 . 
  3. ^ Wu, D.; Wood, BL; Fromm, JR (2013). "Проточная цитометрия для неходжкинской и классической лимфомы Ходжкина". Лимфома . Методы в молекулярной биологии. Т. 971. С.  27–47 . doi :10.1007/978-1-62703-269-8_2. ISBN 978-1-62703-268-1. PMID  23296956.
  4. ^ Ван, И.; Хаммес, Ф.; Де Рой, К.; Верстрате, В.; Бун, Н. (2010). «Прошлое, настоящее и будущее применение проточной цитометрии в водной микробиологии». Тенденции в биотехнологии . 28 (8): 416– 424. doi :10.1016/j.tibtech.2010.04.006. PMID  20541271.
  5. ^ Джонсон, LA; Флок, JP; Лук, MV; Пинкель, D. (1987). «Сортировка потока сперматозоидов, несущих X и Y хромосому, в две популяции». Gamete Research . 16 (1): 1– 9. doi :10.1002/mrd.1120160102. PMID  3506896.
  6. ^ Baerlocher, GM; Vulto, I.; De Jong, G.; Lansdorp, PM (2006). «Проточная цитометрия и FISH для измерения средней длины теломер (проточная FISH)». Nature Protocols . 1 (5): 2365– 2376. doi :10.1038/nprot.2006.263. PMID  17406480. S2CID  20463557.
  7. ^ ab Chattopadhyay, PK; Hogerkorp, CM; Roederer, M. (2008). «Хроматический взрыв: развитие и будущее многопараметрической проточной цитометрии». Иммунология . 125 (4): 441– 449. doi :10.1111/j.1365-2567.2008.02989.x. PMC 2612557. PMID  19137647 . 
  8. ^ ab Behbehani, GK; Bendall, SC; Clutter, MR; Fantl, WJ; Nolan, GP (2012). «Цитометрия масс отдельных клеток, адаптированная для измерений клеточного цикла». Цитометрия , часть A. 81A (7): 552–566 . doi :10.1002/cyto.a.22075. PMC 3667754. PMID 22693166  . 
  9. ^ Уайт, AK; Ванинсберг, M.; Петрив, OI; Хамиди, M.; Сикорский, D.; Марра, MA; Пирет, J.; Апарисио, S.; Хансен, CL (2011). «Высокопроизводительная микрофлюидная ОТ-ПЦР отдельных клеток». Труды Национальной академии наук . 108 (34): 13999– 14004. Bibcode : 2011PNAS..10813999W . doi : 10.1073/pnas.1019446108 . PMC 3161570. PMID  21808033. 
  10. ^ ab Spidlen, J.; Leif, RC; Moore, W.; Roederer, M.; Brinkman, RR; Brinkman, RR (2008). "Gating-ML: XML-based gating descriptions in flow cytometry". Cytometry Part A. 73A ( 12): 1151– 1157. doi :10.1002/cyto.a.20637. PMC 2585156. PMID  18773465 . 
  11. ^ ab Gating-ML 2.0 (PDF) (Отчет). Международное общество по развитию цитометрии. 2013.
  12. ^ abc Roederer, M. (2002). J. Paul Robinson (ред.). Компенсация в проточной цитометрии . Текущие протоколы в цитометрии. Том 22. стр. 1.14.1–1.14.20. doi :10.1002/0471142956.cy0114s22. ISBN 978-0471142959. PMID  18770762. S2CID  7256386.
  13. ^ Багвелл, К. Б.; Адамс, Э. Г. (1993). «Компенсация спектрального перекрытия флуоресценции для любого числа параметров проточной цитометрии». Анналы Нью-Йоркской академии наук . 677 (1): 167– 184. Bibcode : 1993NYASA.677..167B. doi : 10.1111/j.1749-6632.1993.tb38775.x. PMID  8494206. S2CID  26763280.
  14. ^ Хане, Ф.; Лемёр, Н.; Бринкман, Р.Р.; Эллис, Б.; Хааланд, П.; Саркар, Д.; Спидлен, Дж.; Стрейн, Э.; Джентльмен, Р. (2009). "FlowCore: пакет Bioconductor для высокопроизводительной проточной цитометрии". BMC Bioinformatics . 10 : 106. doi : 10.1186/1471-2105-10-106 . PMC 2684747. PMID  19358741 . 
  15. ^ Шапиро, Говард М. (2003). Практическая проточная цитометрия . Нью-Йорк: Wiley-Liss. стр. 235. ISBN 978-0-471-41125-3.
  16. ^ abc Parks DR, Roederer M, Moore WA (2006). «Новый метод отображения «Logicle» позволяет избежать обманчивых эффектов логарифмического масштабирования для слабых сигналов и компенсированных данных». Цитометрия Часть A. 69 ( 6): 541– 51. doi :10.1002/cyto.a.20258. PMID  16604519. S2CID  8012792.
  17. ^ ab Finak, G.; Perez, JM; Weng, A.; Gottardo, R. (2010). «Оптимизация преобразований для автоматизированного высокопроизводительного анализа данных проточной цитометрии». BMC Bioinformatics . 11 : 546. doi : 10.1186/1471-2105-11-546 . PMC 3243046. PMID  21050468 . 
  18. ^ Мур, WA; Паркс, DR (2012). «Обновление для шкалы данных логики, включая реализации операционного кода». Цитометрия , часть A. 81A (4): 273– 277. doi :10.1002/cyto.a.22030. PMC 4761345. PMID 22411901  . 
  19. ^ Bagwell, CB (2005). "Гиперлогарифм? Гибкое логарифмическое преобразование для отрицательных, нулевых и положительных данных". Цитометрия Часть A. 64A ( 1): 34– 42. doi : 10.1002/cyto.a.20114 . PMID  15700280. S2CID  13705174.
  20. ^ Ло, К.; Бринкман, Р.Р.; Готтардо, Р. (2008). «Автоматизированное гейтирование данных проточной цитометрии с помощью надежной кластеризации на основе моделей». Цитометрия , часть A. 73A (4): 321–332 . doi : 10.1002/cyto.a.20531 . PMID  18307272. S2CID  2943705.
  21. ^ Qian, Y.; Liu, Y.; Campbell, J.; Thomson, E.; Kong, YM; Scheuermann, RH (2012). "FCSTrans: Система программного обеспечения с открытым исходным кодом для преобразования файлов FCS и преобразования данных". Cytometry Part A. 81A ( 5): 353– 356. doi :10.1002/cyto.a.22037. PMC 3932304. PMID 22431383  . 
  22. ^ ab Le Meur, N.; Rossini, A.; Gasparetto, M.; Smith, C.; Brinkman, RR; Gentleman, R. (2007). «Оценка качества данных проточной цитометрии без гейта в экспериментах с высокой пропускной способностью». Cytometry Part A. 71A ( 6): 393– 403. doi :10.1002/cyto.a.20396. PMC 2768034. PMID  17366638 . 
  23. ^ abc Rogers, WT; Moser, AR; Holyst, HA; Bantly, A.; Mohler, ER; Scangas, G.; Moore, JS (2008). «Цитометрическая дактилоскопия: количественная характеристика многомерных распределений». Цитометрия , часть A. 73A (5): 430–441 . doi : 10.1002/cyto.a.20545 . PMID  18383310. S2CID  23555926.
  24. ^ ab Hahne, F.; Khodabakhshi, AH; Bashashati, A.; Wong, CJ; Gascoyne, RD; Weng, AP; Seyfert-Margolis, V.; Bourcier, K.; Asare, A.; Lumley, T.; Gentleman, R.; Brinkman, RR (2009). "Методы нормализации поканальных данных проточной цитометрии". Cytometry Part A. 77 ( 2): 121– 131. doi :10.1002/cyto.a.20823. PMC 3648208. PMID 19899135  . 
  25. ^ "Пакет CLUE" . Получено 2013-02-15 .
  26. ^ abcd Агаипур, Н.; Финак, Г.; Флоукэп, Д.; Мечта, АХ; Хоос, П.; Мосманн, Г.; Бринкман, Дж.; Готтардо, И.; Шойерманн, SA; Брэмсон, Дж.; Ивз, К.; Венг, AP; III, ЕСФ; Хо, К.; Коллманн, Т.; Роджерс, В.; Де Роза, С.; Далал, Б.; Азад, А.; Потен, А.; Брандес, А.; Бретшнайдер, Х.; Бруггнер, Р.; Финк, Р.; Цзя, Р.; Циммерман, Н.; Линдерман, М.; Дилл, Д.; Нолан, Г.; Чан, К. (2013). «Критическая оценка методов анализа данных автоматизированной проточной цитометрии». Природные методы . 10 (3): 228– 238. doi :10.1038/nmeth.2365. PMC 3906045. PMID  23396282 . 
  27. ^ Lugli, E.; Roederer, M.; Cossarizza, A. (2010). «Анализ данных в проточной цитометрии: будущее только началось». Цитометрия Часть A. 77A ( 7): 705–713 . doi :10.1002/cyto.a.20901. PMC 2909632. PMID  20583274 . 
  28. ^ ab "FlowJo". Архивировано из оригинала 2013-05-03 . Получено 2013-04-05 .
  29. ^ "FCS Express" . Получено 2013-04-03 .
  30. ^ "Страница программного обеспечения цитометрии TSRI". Архивировано из оригинала 1996-11-19 . Получено 03-09-2009 .
  31. ^ "CytoPaint Classic". Архивировано из оригинала 2017-12-29 . Получено 2013-04-05 .
  32. ^ "Страница программного обеспечения цитометрии PUCL" . Получено 2011-07-07 .
  33. ^ "Beckman Coulter" . Получено 2013-02-10 .
  34. ^ Бендалл, SC; Нолан, GP (2012). «От отдельных клеток к глубоким фенотипам при раке». Nature Biotechnology . 30 (7): 639– 647. doi :10.1038/nbt.2283. PMID  22781693. S2CID  163651.
  35. ^ Мекер, HT; Ринфрет, А.; д'Суза, П.; Дарден, Дж.; Ройг, Э.; Лэндри, К.; Хейс, П.; Бирунги, Дж.; Анзала, О.; Гарсия, М.; Харари, А.; Фрэнк, И.; Байдо, Р.; Бейкер, М.; Холбрук, Дж.; Оттингер, Дж.; Ламоро, Л.; Эплинг, КЛ; Синклер, Э.; Суни, Массачусетс; Пунт, К.; Каларота, С.; Эль-Бахи, С.; Альтер, Г.; Майла, Х.; Кута, Э.; Кокс, Дж.; Грей, К.; Альтфельд, М.; Нугаред, Н. (2005). «Стандартизация методов проточной цитометрии цитокинов». БМК Иммунология . 6 : 13. doi : 10.1186/1471-2172-6-13 . PMC 1184077 . PMID  15978127. 
  36. ^ Вирго, П. Ф.; Гиббс, Г. Дж. (2011). «Проточная цитометрия в клинической патологии». Annals of Clinical Biochemistry . 49 (Pt 1): 17–28 . doi : 10.1258/acb.2011.011128 . PMID  22028426.
  37. ^ Коста, ES; Педрейра, CE; Баррена, S.; Лекревисс, Q.; Флорес, J.; Кихано, S.; Алмейда, J.; Дель Кармен Гарсия-Масиас, M.; Боттчер, S.; Ван Донген, JJM; Орфао, A. (2010). «Автоматизированный анализ главных компонентов на основе шаблонов против иммунофенотипической классификации хронических лимфопролиферативных заболеваний В-клеток на основе экспертов: шаг вперед в стандартизации клинического иммунофенотипирования». Leukemia . 24 (11): 1927– 1933. doi :10.1038/leu.2010.160. PMC 3035971 . PMID  20844562. 
  38. ^ Qiu, P.; Simonds, EF; Bendall, SC; Gibbs Jr, KD; Bruggner, RV; Linderman, MD; Sachs, K.; Nolan, GP; Plevritis, SK (2011). «Извлечение клеточной иерархии из многомерных данных цитометрии с помощью SPADE». Nature Biotechnology . 29 (10): 886– 891. doi :10.1038/nbt.1991. PMC 3196363 . PMID  21964415. 
  39. ^ "Matlab Toolbox for Dimensionality Reduction" . Получено 2013-02-10 .
  40. ^ Bendall, SC; Simonds, EF; Qiu, P.; Amir, E. -AD; Krutzik, PO; Finck, R.; Bruggner, RV; Melamed, R.; Trejo, A.; Ornatsky, OI; Balderas, RS; Plevritis, SK; Sachs, K.; Pe'Er, D.; Tanner, SD; Nolan, GP (2011). "Массовая цитометрия отдельных клеток дифференциальных иммунных и лекарственных ответов в кроветворном континууме человека". Science . 332 (6030): 687– 696. Bibcode :2011Sci...332..687B. doi :10.1126/science.1198704. PMC 3273988 . PMID  21551058. 
  41. ^ Ло, К.; Хане, Ф.; Бринкман, Р.Р.; Готтардо, Р. (2009). "FlowClust: пакет Bioconductor для автоматического гейтирования данных проточной цитометрии". BMC Bioinformatics . 10 : 145. doi : 10.1186/1471-2105-10-145 . PMC 2701419. PMID  19442304 . 
  42. ^ Pyne, S.; Hu, X.; Wang, K.; Rossin, E.; Lin, T. -I.; Maier, LM; Baecher-Allan, C.; McLachlan, GJ; Tamayo, P.; Hafler, DA; De Jager, PL; Mesirov, JP (2009). "Автоматизированный анализ данных проточной цитометрии высокой размерности". Труды Национальной академии наук . 106 (21): 8519– 8524. Bibcode : 2009PNAS..106.8519P. doi : 10.1073/pnas.0903028106 . PMC 2682540. PMID  19443687 . 
  43. ^ Qian, Y.; Wei, C.; Eun-Hyung Lee, F.; Campbell, J.; Halliley, J.; Lee, JA; Cai, J.; Kong, YM; Sadat, E.; Thomson, E.; Dunn, P.; Seegmiller, AC; Karandikar, NJ; Tipton, CM; Mosmann, T.; Sanz, IA; Scheuermann, RH (2010). "Выявление семнадцати подмножеств В-клеток периферической крови человека и количественная оценка реакции на столбняк с использованием метода на основе плотности для автоматизированной идентификации популяций клеток в данных многомерной проточной цитометрии". Цитометрия, часть B. 78B ( Приложение 1): S69 – S82 . doi :10.1002/cyto.b.20554. PMC 3084630 . PMID  20839340.  
  44. ^ Zare, H.; Shooshtari, P.; Gupta, A.; Brinkman, RR (2010). «Сокращение данных для спектральной кластеризации для анализа данных высокопроизводительной проточной цитометрии». BMC Bioinformatics . 11 : 403. doi : 10.1186/1471-2105-11-403 . PMC 2923634. PMID  20667133 . 
  45. ^ Aghaeepour, N.; Nikolic, R.; Hoos, HH; Brinkman, RR (2011). «Быстрая идентификация популяции клеток в данных проточной цитометрии». Цитометрия Часть A. 79A ( 1): 6– 13. doi :10.1002/cyto.a.21007. PMC 3137288. PMID 21182178  . 
  46. ^ Ge, Y.; Sealfon, SC (2012). «FlowPeaks: быстрая неконтролируемая кластеризация данных проточной цитометрии с помощью K-средних и поиска пиков плотности». Биоинформатика . 28 (15): 2052–2058 . doi :10.1093/bioinformatics/bts300. PMC 3400953. PMID  22595209 . 
  47. ^ Вебер, Лукас; Робинсон, Марк. «Сравнение методов кластеризации для высокоразмерных данных одноклеточного потока и массовой цитометрии». bioRxiv 10.1101/047613 . 
  48. ^ Честер, С (2015). «Алгоритмические инструменты для добычи многомерных данных цитометрии». Журнал иммунологии . 195 (3): 773– 779. doi :10.4049/jimmunol.1500633. PMC 4507289. PMID  26188071 . 
  49. ^ Diggins, KE (2015). «Методы обнаружения и характеристики подмножеств клеток в данных массовой цитометрии высокой размерности». Методы . 82 : 55–63 . doi :10.1016/j.ymeth.2015.05.008. PMC 4468028. PMID  25979346 . 
  50. ^ Wiwie, C (2015). «Сравнение производительности методов биомедицинской кластеризации». Nature Methods . 12 (11): 1033– 1038. doi :10.1038/nmeth.3583. PMID  26389570. S2CID  8960399.
  51. ^ ab Roederer, M.; Treister, A.; Moore, W.; Herzenberg, LA (2001). "Сравнение вероятностного биннинга: метрика для количественной оценки различий в одномерном распределении". Цитометрия . 45 (1): 37– 46. doi : 10.1002/1097-0320(20010901)45:1<37::AID-CYTO1142>3.0.CO;2-E . PMID  11598945.
  52. ^ Редерер, М.; Харди, Р. Р. (2001). «Частотное разностное стробирование: многомерный метод идентификации подмножеств, которые различаются между образцами». Цитометрия . 45 (1): 56– 64. doi : 10.1002/1097-0320(20010901)45:1<56::AID-CYTO1144>3.0.CO;2-9 . PMID  11598947.
  53. ^ abc Aghaeepour, N.; Chattopadhyay, PK; Ganesan, A.; O'Neill, K.; Zare, H.; Jalali, A.; Hoos, HH; Roederer, M.; Brinkman, RR (2012). «Ранние иммунологические корреляты защиты от ВИЧ могут быть определены с помощью вычислительного анализа сложных многомерных анализов проточной цитометрии Т-клеток». Биоинформатика . 28 (7): 1009– 1016. doi :10.1093/bioinformatics/bts082. PMC 3315712 . PMID  22383736. 
  54. ^ abc Aghaeepour, N.; Jalali, A.; O'Neill, K.; Chattopadhyay, PK; Roederer, M.; Hoos, HH; Brinkman, RR (2012). "RchyOptimyx: Оптимизация клеточной иерархии для проточной цитометрии". Цитометрия Часть A. 81A ( 12): 1022– 1030. doi :10.1002/cyto.a.22209. PMC 3726344. PMID  23044634 . 
  55. ^ Zare, H.; Bashashati, A.; Kridel, R.; Aghaeepour, N.; Haffari, G.; Connors, JM; Gascoyne, RD; Gupta, A.; Brinkman, RR; Weng, AP (2011). «Автоматизированный анализ данных многомерной проточной цитометрии повышает точность диагностики между лимфомой мантийных клеток и мелкой лимфоцитарной лимфомой». American Journal of Clinical Pathology . 137 (1): 75– 85. doi :10.1309/AJCPMMLQ67YOMGEW. PMC 4090220 . PMID  22180480. 
  56. ^ ab Qiu, P. (2012). Ma'Ayan, Avi (ред.). "Вывод фенотипических свойств из характеристик отдельных клеток". PLOS ONE . ​​7 (5): e37038. Bibcode :2012PLoSO...737038Q. doi : 10.1371/journal.pone.0037038 . PMC 3360688 . PMID  22662133. 
  57. ^ Боденмиллер, Б.; Цундер, Э.Р.; Финк, Р.; Чен, Т.Дж.; Савиг, Э.С.; Брюггнер, Р.В.; Саймондс, Э.Ф.; Бендалл, С.К.; Сакс, К.; Круцик, ПО; Нолан, Г.П. (2012). «Мультиплексное масс-цитометрическое профилирование клеточных состояний, возмущенных регуляторами малых молекул». Nature Biotechnology . 30 (9): 858– 867. doi :10.1038/nbt.2317. PMC 3627543 . PMID  22902532. 
  58. ^ Башашати, А.; Джонсон, NA; Ходабахши, AH; Уайтсайд, MD; Заре, H.; Скотт, DW; Ло, K.; Готтардо, R.; Бринкман, FSL; Коннорс, JM; Слэк, GW; Гаскойн, RD; Венг, AP; Бринкман, RR (2012). «В-клетки с высоким параметром бокового рассеяния по данным проточной цитометрии коррелируют с более низкой выживаемостью при диффузной крупноклеточной В-клеточной лимфоме». Американский журнал клинической патологии . 137 (5): 805– 814. doi :10.1309/AJCPGR8BG4JDVOWR. PMC 3718075. PMID  22523221. 
  59. ^ Murphy, RF; Chused, TM (1984). «Предложение о стандарте файла данных проточной цитометрии». Цитометрия . 5 (5): 553–555 . doi : 10.1002/cyto.990050521 . PMID  6489069.
  60. ^ "Международное общество по развитию цитометрии" . Получено 5 марта 2013 г.
  61. ^ Дин, П. Н.; Багвелл, К. Б.; Линдмо, Т.; Мерфи, Р. Ф.; Зальцман, Г. К. (1990). «Введение в стандарт файла данных проточной цитометрии». Цитометрия . 11 (3): 321– 322. doi : 10.1002/cyto.990110302 . PMID  2340768.
  62. ^ Seamer, LC; Bagwell, CB; Barden, L.; Redelman, D.; Salzman, GC; Wood, JCS; Murphy, RF (1997). "Предложенный новый стандарт файла данных для проточной цитометрии, версия FCS 3.0". Цитометрия . 28 (2): 118– 122. doi : 10.1002/(SICI)1097-0320(19970601)28:2<118::AID-CYTO3>3.0.CO;2-B . PMID  9181300.
  63. ^ Spidlen, J.; Moore, W.; Parks, D.; Goldberg, M.; Bray, C.; Bierre, P.; Gorombey, P.; Hyun, B.; Hubbard, M.; Lange, S.; Lefebvre, R.; Leif, R.; Novo, D.; Ostruszka, L.; Treister, A.; Wood, J.; Murphy, RF; Roederer, M.; Sudar, D.; Zigon, R.; Brinkman, RR (2009). "Стандарт файла данных для проточной цитометрии, версия FCS 3.1". Cytometry Part A. 77 ( 1): 97– 100. doi :10.1002/cyto.a.20825. PMC 2892967. PMID 19937951  . 
  64. ^ Роберт С. Лейф, Йозеф Шпидлен, Райан Р. Бринкман (2008). "Континуум стандартов цитометрии" (PDF) . В Farkas, Daniel L; Nicolau, Dan V; Leif, Robert C (ред.). Визуализация, манипуляция и анализ биомолекул, клеток и тканей VI . Том 6859. стр. 17. Bibcode : 2008SPIE.6859E..17L. CiteSeerX 10.1.1.397.3647 . doi : 10.1117/12.762514. S2CID  62650477.  {{cite book}}: |journal=проигнорировано ( помощь )CS1 maint: несколько имен: список авторов ( ссылка )
  65. ^ Международное общество по развитию цитометрии (2008). Стандарт аналитической цитометрии NetCDF Соглашения для компонента двоичного файла данных в режиме списка
  66. ^ ab Spidlen, J.; Shooshtari, P.; Kollmann, TR; Brinkman, RR (2011). "Стандарты данных проточной цитометрии". BMC Research Notes . 4 : 50. doi : 10.1186/1756-0500-4-50 . PMC 3060130. PMID  21385382 . 
  67. ^ Формат файла результатов классификации (PDF) (Отчет). Международное общество по развитию цитометрии. 2012.
  68. ^ "CytoGenie - Домашняя страница программного обеспечения AutoGate". CytoGenie.org . Лаборатория Герценберга в Стэнфордском университете . Получено 14 января 2020 г. .
  69. ^ Джентльмен, RC; Кэри, VJ; Бейтс, DM; Болстад, B.; Деттлинг, M.; Дюдуа, S .; Эллис, B.; Готье, L.; Ге, Y.; Джентри, J.; Хорник, K.; Хоторн, T.; Хубер, W.; Иакус, S.; Иризарри, R.; Лейш, F.; Ли, C.; Мейхлер, M.; Россини, AJ; Савицки, G.; Смит, C.; Смит, G.; Тирни, L.; Янг, JY; Чжан, J. (2004). "Биопроводник: разработка открытого программного обеспечения для вычислительной биологии и биоинформатики". Genome Biology . 5 (10): R80. doi : 10.1186/gb-2004-5-10-r80 . PMC 545600. PMID  15461798 . 
  70. ^ Биопроводник. "Вид проточной цитометрии BioConductor" . Получено 11 июля 2013 г.
  71. ^ Райх, М.; Лифельд, Т.; Гулд, Дж.; Лернер, Дж.; Тамайо, П.; Месиров, Дж. П. (2006). «ГенПаттерн 2.0». Природная генетика . 38 (5): 500–501 . doi : 10.1038/ng0506-500. PMID  16642009. S2CID  5503897.
  72. ^ "GenePattern Flow Cytometry Suite". Архивировано из оригинала 29 января 2013 г. Получено 14 февраля 2013 г.
  73. ^ «FACSanadu — бесплатное и простое в использовании программное обеспечение для анализа FCS».
  74. ^ Чжао, Макс; Маллеш, Нандита; Хелляйн, Александр; Шабат, Ричард; Хаферлах, Клаудия; Хаферлах, Торстен; Элснер, Франц; Люлинг, Ханнес; Кравиц, Питер; Керн, Вольфганг (2020). «Классификация зрелых В-клеточных неоплазм на уровне гематолога с использованием глубокого обучения на многопараметрических данных проточной цитометрии». Цитометрия , часть A. 97 (10): 1073–1080 . doi : 10.1002/cyto.a.24159 . ISSN  1552-4930. PMID  32519455. S2CID  219563125.
  75. ^ Чжао, Макс Сяохан; Маллеш, Нандита (2021-06-16). «Данные репликации для: Передача знаний для повышения производительности моделей глубокого обучения для автоматизированной классификации новообразований В-клеток». Harvard Dataverse. doi : 10.7910/DVN/CQHHEH. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  76. ^ Маллеш, Нандита; Чжао, Макс; Мейнткер, Лиза; Хёлляйн, Александр; Эльснер, Франц; Люлинг, Ханнес; Хаферлах, Торстен; Керн, Вольфганг; Вестерманн, Йорг; Броссар, Питер; Краузе, Стефан В. (сентябрь 2021 г.). «Передача знаний для повышения эффективности моделей глубокого обучения для автоматизированной классификации В-клеточных новообразований». Узоры . 2 (10): 100351. doi :10.1016/j.patter.2021.100351. ISSN  2666-3899. ПМК 8515009 . ПМИД  34693376. 
  77. ^ Ли, JA; Спидлен, J.; Бойс, K.; Кай, J.; Кросби, N.; Дальфин, M.; Фурлонг, J.; Гаспаретто, M.; Голдберг, M.; Горалчик, EM; Хён, B.; Янсен, K.; Коллманн, T.; Конг, M.; Лейф, R.; МакВини, S.; Молошок, TD; Мур, W.; Нолан, G.; Нолан, J.; Николич-Цугич, J.; Пэрриш, D.; Перселл, B.; Цянь, Y.; Сельварадж, B.; Смит, C.; Чуваткина, O.; Вертхаймер, A.; Уилкинсон, P.; Уилсон, C. (2008). "MIFlowCyt: Минимальная информация об эксперименте по проточной цитометрии". Цитометрия , часть A. 73A (10): 926– 930. doi :10.1002/cyto.a.20623. PMC 2773297. PMID 18752282  . 
  78. ^ Kotecha, N.; Krutzik, PO; Irish, JM (2010). J. Paul Robinson (ред.). Анализ и публикация результатов экспериментов по проточной цитометрии на основе веб-технологий . Текущие протоколы в цитометрии. Том. Глава 10. стр. 10.17.1–10.17.24. doi :10.1002/0471142956.cy1017s53. ISBN 978-0471142959. PMC  4208272 . PMID  20578106.
  79. ^ Spidlen, J.; Breuer, K.; Rosenberg, C.; Kotecha, N.; Brinkman, RR (2012). «FlowRepository: Ресурс аннотированных наборов данных проточной цитометрии, связанных с рецензируемыми публикациями». Cytometry Part A. 81A ( 9): 727– 731. doi : 10.1002/cyto.a.22106 . PMID  22887982. S2CID  6498066.
  80. ^ Spidlen, J.; Breuer, K.; Brinkman, R. (2012). "Подготовка минимальной информации об эксперименте по проточной цитометрии (MIFlowCyt) совместимой рукописи с использованием репозитория файлов FCS Международного общества по развитию цитометрии (ISAC) (FlowRepository.org)". В J. Paul Robinson (ред.). Подготовка минимальной информации об эксперименте по проточной цитометрии (MIFlow Cyt ) совместимой рукописи с использованием репозитория файлов FCS Международного общества по развитию цитометрии (ISAC) (Flow Repository .org) . Текущие протоколы в цитометрии. Том. Глава 10. стр. Раздел Un10.18. doi :10.1002/0471142956.cy1018s61. ISBN 978-0471142959. PMID  22752950. S2CID  24921940.
  81. ^ "FlowRepository".
  82. ^ "FlowCAP - Проточная цитометрия: критическая оценка методов идентификации популяции" . Получено 15 марта 2013 г.
  83. ^ "Набор данных по исследованию естественного течения ВИЧ IDCRP" . Получено 3 марта 2013 г.
  84. ^ Craig, FE; Brinkman, RR; Eyck, ST; Aghaeepour, N. (2013). «Вычислительный анализ оптимизирует проточную цитометрическую оценку лимфомы». Цитометрия Часть B : n/a. doi : 10.1002/cytob.21115. PMID  23873623.
  85. ^ Вилланова, Ф.; Ди Мельо, П.; Инокума, М.; Агаипур, Н.; Перуча, Э.; Моллон, Дж.; Номура, Л.; Эрнандес-Фуэнтес, М.; Коуп, А.; Превост, А. Т.; Хек, С.; Майно, В.; Лорд, Г.; Бринкман, Р. Р.; Нестле, ФО (2013). Фон Херрат, Маттиас Г. (ред.). «Интеграция проточной цитометрии на основе лиоплатов и вычислительного анализа для стандартизированного обнаружения иммунологических биомаркеров». PLOS ONE . 8 (7): e65485. Bibcode : 2013PLoSO...865485V. doi : 10.1371/journal.pone.0065485 . PMC 3701052 . PMID  23843942. 
  86. ^ ab Maecker, HT; McCoy, JP; Nussenblatt, R. (2012). «Стандартизация иммунофенотипирования для проекта по иммунологии человека». Nature Reviews Immunology . 12 (3): 191– 200. doi :10.1038/nri3158. PMC 3409649. PMID 22343568  . 
  87. ^ abcd Шадт, EE; Линдерман, MD; Соренсон, J.; Ли, L.; Нолан, GP (2010). «Вычислительные решения для управления и анализа крупномасштабных данных». Nature Reviews Genetics . 11 (9): 647– 657. doi :10.1038/nrg2857. PMC 3124937. PMID  20717155 . 
Взято с "https://en.wikipedia.org/w/index.php?title=Проточная_цитометрия_биоинформатика&oldid=1254905658"