Методы анализа микрочипов

Пример микроматрицы олигонуклеотидов с приблизительно 40 000 зондов и увеличенной вставкой для демонстрации деталей.

Методы анализа микрочипов используются для интерпретации данных, полученных в ходе экспериментов с ДНК ( анализ генных чипов ), РНК и белковыми микрочипами , которые позволяют исследователям исследовать состояние экспрессии большого количества генов — во многих случаях всего генома организма  — в одном эксперименте. [1] Такие эксперименты могут генерировать очень большие объемы данных, позволяя исследователям оценивать общее состояние клетки или организма. Данные в таких больших объемах трудно — если не невозможно — анализировать без помощи компьютерных программ.

Введение

Анализ данных микрочипов является заключительным этапом в считывании и обработке данных, полученных с помощью микрочипа. Образцы подвергаются различным процессам, включая очистку и сканирование с использованием микрочипа, который затем производит большой объем данных, требующих обработки с помощью компьютерного программного обеспечения. Он включает в себя несколько отдельных этапов, как показано на изображении ниже. Изменение любого из этапов изменит результат анализа, поэтому был создан проект MAQC [2] для определения набора стандартных стратегий. Существуют компании, которые используют протоколы MAQC для выполнения полного анализа. [3]

Шаги, необходимые для проведения эксперимента с микрочипами

Методы

Ученый Национального центра токсикологических исследований изучает данные микрочипов

Большинство производителей микрочипов, таких как Affymetrix и Agilent , [4] предоставляют коммерческое программное обеспечение для анализа данных вместе со своими продуктами микрочипов. Существуют также варианты с открытым исходным кодом, которые используют различные методы для анализа данных микрочипов.

Агрегация и нормализация

Сравнение двух различных массивов или двух различных образцов, гибридизированных с одним и тем же массивом, обычно включает в себя корректировку систематических ошибок, вносимых различиями в процедурах и эффектами интенсивности красителя. Нормализация красителя для двух цветовых массивов часто достигается локальной регрессией . LIMMA предоставляет набор инструментов для коррекции фона и масштабирования, а также возможность усреднения дублирующихся пятен на слайде. [5] Распространенным методом оценки того, насколько хорошо нормализован массив, является построение графика MA данных. Графики MA можно создавать с помощью программ и языков, таких как R и MATLAB. [6] [7]

Необработанные данные Affy содержат около двадцати зондов для одной и той же РНК-мишени. Половина из них — это «пятна несовпадения», которые не совсем соответствуют целевой последовательности. Теоретически они могут измерять количество неспецифического связывания для данной цели. Надежное многомассивное среднее (RMA) [8] — это подход к нормализации, который не использует преимущества этих пятен несовпадения, но все равно должен суммировать идеальные совпадения с помощью медианной полировки . [9] Алгоритм медианной полировки, хотя и надежный, ведет себя по-разному в зависимости от количества проанализированных образцов. [10] Квантильная нормализация , также часть RMA, — это один из разумных подходов к нормализации партии массивов для того, чтобы сделать дальнейшие сравнения осмысленными.

Текущий алгоритм Affymetrix MAS5, который использует как идеальное совпадение, так и несовпадение зондов, продолжает пользоваться популярностью и показывает хорошие результаты в сравнительных тестах. [11]

Блок-схема, показывающая, как работает алгоритм MAS5 от Agilent.

Факторный анализ для Robust Microarray Summarization (FARMS) [12] — это основанный на модели метод для суммирования данных массива на уровне идеального соответствия. Он основан на модели факторного анализа, для которой метод байесовского максимума апостериори оптимизирует параметры модели в предположении гауссовского шума измерения. Согласно бенчмарку Affycomp [13], FARMS превзошел все другие методы суммирования по чувствительности и специфичности.

Выявление значимой дифференциальной экспрессии

Существует множество стратегий для идентификации зондов массива, которые показывают необычный уровень сверхэкспрессии или недостаточной экспрессии. Простейшая из них — назвать «значимым» любой зонд, который отличается в среднем как минимум в два раза между группами лечения. Более сложные подходы часто связаны с t-тестами или другими механизмами, которые учитывают как размер эффекта, так и изменчивость. Любопытно, что p-значения, связанные с конкретными генами, плохо воспроизводятся между повторными экспериментами, а списки, созданные путем прямого изменения кратности, работают намного лучше. [14] [15] Это представляет собой чрезвычайно важное наблюдение, поскольку смысл проведения экспериментов связан с прогнозированием общего поведения. Группа MAQC рекомендует использовать оценку изменения кратности плюс нестрогое ограничение p-значения, дополнительно указывая на то, что изменения в процессе коррекции фона и масштабирования оказывают лишь минимальное влияние на порядок рангов различий изменения кратности, но существенное влияние на p-значения. [14]

Кластеризация

Кластеризация — это метод добычи данных, используемый для группировки генов, имеющих схожие паттерны экспрессии. Иерархическая кластеризация и кластеризация k-средних — широко используемые методы в анализе микрочипов.

Иерархическая кластеризация

Иерархическая кластеризация — это статистический метод поиска относительно однородных кластеров. Иерархическая кластеризация состоит из двух отдельных фаз. Первоначально вычисляется матрица расстояний, содержащая все попарные расстояния между генами. Корреляция Пирсона и корреляция Спирмена часто используются в качестве оценок различий, но могут применяться и другие методы, такие как манхэттенское расстояние или евклидово расстояние . Учитывая количество доступных мер расстояния и их влияние на результаты алгоритма кластеризации, в нескольких исследованиях сравнивались и оценивались различные меры расстояния для кластеризации данных микрочипов с учетом их внутренних свойств и устойчивости к шуму. [16] [17] [18] После вычисления начальной матрицы расстояний иерархический алгоритм кластеризации либо (A) итеративно объединяет два ближайших кластера, начиная с отдельных точек данных (агломеративный, восходящий подход, который используется довольно часто), либо (B) итеративно разделяет кластеры, начиная с полного набора (разделительный, нисходящий подход). После каждого шага пересчитывается новая матрица расстояний между вновь сформированными кластерами и другими кластерами. Методы иерархического кластерного анализа включают:

  • Одинарная связь (минимальный метод, ближайший сосед)
  • Средняя связь ( UPGMA )
  • Полная связь (максимальный метод, дальний сосед)

Различные исследования уже показали эмпирически, что алгоритм кластеризации с одинарной связью дает плохие результаты при использовании для данных микрочипов экспрессии генов, и поэтому его следует избегать. [18] [19]

Кластеризация методом k-средних

Кластеризация методом K-средних — это алгоритм группировки генов или образцов на основе шаблона в группы K. Группировка выполняется путем минимизации суммы квадратов расстояний между данными и соответствующим центроидом кластера . Таким образом, целью кластеризации методом K-средних является классификация данных на основе схожего выражения. [20] Было показано, что алгоритм кластеризации методом K-средних и некоторые его варианты (включая k-медоиды ) дают хорошие результаты для данных об экспрессии генов (по крайней мере, лучше, чем методы иерархической кластеризации). Эмпирические сравнения методов k-средних , k-медоидов , иерархических методов и различных мер расстояния можно найти в литературе. [18] [19]

Распознавание образов

Коммерческие системы для анализа генных сетей, такие как Ingenuity [21] и Pathway studio [22], создают визуальные представления дифференциально экспрессируемых генов на основе современной научной литературы. Некоммерческие инструменты, такие как FunRich, [23] GenMAPP и Moksiskaan, также помогают в организации и визуализации данных генных сетей, полученных из одного или нескольких экспериментов с микрочипами. Широкий спектр инструментов для анализа микрочипов доступен через Bioconductor, написанный на языке программирования R. Часто цитируемый модуль SAM и другие инструменты для микрочипов [24] доступны через Стэнфордский университет. Другой набор доступен из Гарварда и Массачусетского технологического института. [25]

Пример вывода инструмента FunRich. На изображении показан результат сравнения 4 разных генов.

Специализированные программные инструменты для статистического анализа для определения степени избыточной или недостаточной экспрессии гена в эксперименте с микрочипом относительно исходного состояния также были разработаны для помощи в идентификации генов или наборов генов, связанных с определенными фенотипами . Один из таких методов анализа, известный как анализ обогащения набора генов (GSEA), использует статистику в стиле Колмогорова-Смирнова для идентификации групп генов, которые регулируются вместе. [1] Этот сторонний статистический пакет предлагает пользователю информацию о генах или наборах генов, представляющих интерес, включая ссылки на записи в таких базах данных, как GenBank NCBI и курируемых базах данных, таких как Biocarta [26] и Gene Ontology . Инструмент анализа обогащения белковых комплексов (COMPLEAT) обеспечивает аналогичный анализ обогащения на уровне белковых комплексов. [27] Инструмент может идентифицировать динамическую регуляцию белковых комплексов при различных условиях или временных точках. Связанные системы, PAINT [28] и SCOPE [29], выполняют статистический анализ областей промотора гена, выявляя избыточное и недостаточное представительство ранее идентифицированных элементов ответа фактора транскрипции . Другим инструментом статистического анализа является Rank Sum Statistics for Gene Set Collections (RssGsc), который использует функции распределения вероятностей ранговой суммы для поиска наборов генов, которые объясняют экспериментальные данные. [30] Еще одним подходом является контекстный метаанализ, т. е. выяснение того, как кластер генов реагирует на различные экспериментальные контексты. Genevestigator — это общедоступный инструмент для выполнения контекстного метаанализа в таких контекстах, как анатомические части, стадии развития и реакция на заболевания, химические вещества, стрессы и новообразования .

Анализ значимости микрочипов (SAM)

Анализ значимости микрочипов (SAM) — это статистический метод , созданный в 2001 году Вирджинией Ташер, Робертом Тибширани и Гилбертом Чу для определения того, являются ли изменения в экспрессии генов статистически значимыми. С появлением ДНК-микрочипов теперь стало возможным измерять экспрессию тысяч генов в одном эксперименте по гибридизации. Полученные данные значительны, и метод сортировки того, что является значимым, а что нет, имеет важное значение. SAM распространяется Стэнфордским университетом в R-пакете . [31]

SAM идентифицирует статистически значимые гены, выполняя специфичные для генов t-тесты и вычисляя статистику d j для каждого гена j , которая измеряет силу связи между экспрессией гена и переменной отклика. [32] [33] [34] Этот анализ использует непараметрическую статистику , поскольку данные могут не следовать нормальному распределению . Переменная отклика описывает и группирует данные на основе экспериментальных условий. В этом методе повторные перестановки данных используются для определения того, является ли экспрессия любого гена значимой по отношению к ответу. Использование анализа на основе перестановок учитывает корреляции в генах и позволяет избежать параметрических предположений о распределении отдельных генов. Это является преимуществом по сравнению с другими методами (например, ANOVA и Bonferroni ), которые предполагают равную дисперсию и/или независимость генов. [35]

Базовый протокол

  • Проведение экспериментов с микрочипами — ДНК-микрочипы с олиго- и кДНК-праймерами, массивы SNP, белковые массивы и т. д.
  • Анализ входных выражений в Microsoft Excel — см. ниже
  • Запустить SAM как надстройку Microsoft Excel
  • Отрегулируйте параметр настройки Delta, чтобы получить значимое число генов вместе с приемлемым уровнем ложных срабатываний (FDR) и оцените размер выборки, рассчитав среднюю разницу в экспрессии в контроллере участков SAM.
  • Список дифференциально экспрессируемых генов (положительно и отрицательно экспрессируемых генов)

Запуск SAM

  • SAM доступен для загрузки онлайн по адресу http://www-stat.stanford.edu/~tibs/SAM/ для академических и неакадемических пользователей после завершения этапа регистрации.
  • SAM запускается как надстройка Excel, а контроллер графика SAM позволяет настраивать частоту ложных открытий и дельту, в то время как функции графика SAM и вывода SAM генерируют список значимых генов, таблицу дельты и оценку размеров выборки.
  • Перестановки рассчитываются на основе количества образцов.
  • Перестановки блоков
    • Блоки представляют собой партии микрочипов; например, для восьми образцов, разделенных на две группы (контрольная и затронутая), существует 4!=24 перестановки для каждого блока, а общее количество перестановок составляет (24)(24)= 576. Рекомендуется минимум 1000 перестановок; [32] [36] [37]

количество перестановок задается пользователем при подстановке корректных значений для набора данных для запуска SAM

Форматы ответа

Типы: [32]

  • Количественный — действительный (например, частота сердечных сокращений)
  • Один класс — проверяет, отличается ли средняя экспрессия гена от нуля
  • Два класса — два набора измерений
    • Непарные — единицы измерения в двух группах разные; например, контрольная и лечебная группы с образцами от разных пациентов.
    • Парные — в двух группах измеряются одни и те же экспериментальные единицы; например, образцы до и после лечения от одних и тех же пациентов.
  • Мультикласс — более двух групп, каждая из которых содержит различные экспериментальные единицы; обобщение двухклассового непарного типа
  • Выживаемость — данные о времени до события (например, смерти или рецидива)
  • Временной ход — каждая экспериментальная единица измеряется в более чем одной временной точке; экспериментальные единицы попадают в одно- или двухклассовую структуру
  • Обнаружение шаблона — явный параметр ответа не указан; пользователь указывает собственный ген (главный компонент) данных выражения и рассматривает его как количественный ответ

Алгоритм

SAM вычисляет статистику теста для относительной разницы в экспрессии генов на основе анализа перестановок данных экспрессии и вычисляет частоту ложных открытий. Основные расчеты программы проиллюстрированы ниже. [32] [33] [34]

Константа s o выбирается для минимизации коэффициента вариации d i . r i равен уровням экспрессии (x) для гена i в экспериментальных условиях y.

Ф а л с е   г я с с о в е г у   г а т е   ( Ф Д Р ) = М е г я а н   ( о г   90 т час   п е г с е н т я л е )   о ф   #   о ф   ф а л с е л у   с а л л е г   г е н е с Н ты м б е г   о ф   г е н е с   с а л л е г   с я г н я ф я с а н т {\displaystyle \mathrm {Ложный\ показатель\ обнаружения\ (FDR)={\frac {Медиана\ (или\ 90^{й}\ процентиль)\ ложно\ названных\ генов}{Число\ генов,\ названных\ значимыми}}} }

Изменения кратности (t) указываются для того, чтобы гарантировать, что гены, называемые значительными, изменятся по крайней мере на заранее указанную величину. Это означает, что абсолютное значение средних уровней экспрессии гена при каждом из двух условий должно быть больше изменения кратности (t), чтобы называться положительным, и меньше обратного значения изменения кратности (t), чтобы называться отрицательным.

Алгоритм SAM можно сформулировать следующим образом:

  1. Упорядочить статистику испытаний по величине [33] [34]
  2. Для каждой перестановки вычислите упорядоченные нулевые (незатронутые) оценки [33] [34]
  3. Постройте график упорядоченной тестовой статистики против ожидаемых нулевых оценок [33] [34]
  4. Назовите каждый ген значимым, если абсолютное значение тестовой статистики для этого гена за вычетом средней тестовой статистики для этого гена больше указанного порогового значения [34]
  5. Оцените частоту ложных срабатываний на основе ожидаемых и наблюдаемых значений [33] [34]

Выход

  • Значимые наборы генов
    • Положительный набор генов — более высокая экспрессия большинства генов в наборе генов коррелирует с более высокими значениями фенотипа y
    • Отрицательный набор генов — более низкая экспрессия большинства генов в наборе генов коррелирует с более высокими значениями фенотипа y

Особенности СЭМ

  • Данные из массивов олиго- или кДНК, массивов однонуклеотидных полиморфизмов, белковых массивов и т. д. могут быть использованы в SAM [33] [34]
  • Сопоставляет данные экспрессии с клиническими параметрами [35]
  • Коррелирует данные экспрессии со временем [32]
  • Использует перестановку данных для оценки частоты ложных срабатываний при многократном тестировании [33] [34] [35] [38]
  • Сообщает о локальной частоте ложных срабатываний (FDR для генов, имеющих такой же d i, как у данного гена) [32] и частоте промахов [32] [33]
  • Может работать с блочным дизайном, когда обработки применяются в разных партиях массивов [32]
  • Можно настроить пороговое значение, определяющее число генов, называемых значимыми [32]

Исправление ошибок и контроль качества

Контроль качества

Целые массивы могут иметь очевидные недостатки, обнаруживаемые при визуальном осмотре, парных сравнениях с массивами в той же экспериментальной группе или при анализе деградации РНК. [39] Результаты могут быть улучшены, если полностью исключить эти массивы из анализа.

Коррекция фона

В зависимости от типа массива сигнал, связанный с неспецифическим связыванием флуорофора, может быть вычтен для достижения лучших результатов. Один из подходов заключается в вычитании средней интенсивности сигнала области между пятнами. Различные инструменты для коррекции фона и дальнейшего анализа доступны от TIGR, [40] Agilent (GeneSpring), [41] и Ocimum Bio Solutions (Genowiz). [42]

Точечная фильтрация

Визуальное выявление локальных артефактов, таких как дефекты печати или стирки, также может указывать на необходимость удаления отдельных пятен. Это может занять значительное время в зависимости от качества изготовления массива. Кроме того, некоторые процедуры требуют удаления всех пятен со значением экспрессии ниже определенного порога интенсивности.

Смотрите также

Ссылки

  1. ^ ab Subramanian A, Tamayo P, Mootha VK и др. (2005). «Анализ обогащения набора генов: основанный на знаниях подход к интерпретации профилей экспрессии по всему геному». Proc . Natl. Acad. Sci. USA . 102 (43): 15545– 50. doi : 10.1073/pnas.0506580102 . PMC  1239896. PMID  16199517.
  2. ^ Доктор Леминг Ши, Национальный центр токсикологических исследований. "Проект контроля качества микрочипов (MAQC)". Управление по контролю за продуктами питания и лекарственными средствами США . Получено 26 декабря 2007 г.
  3. ^ "GenUs BioSystems - Услуги - Анализ данных" . Получено 2008-01-02 .
  4. ^ "Agilent | DNA Microarrays". Архивировано из оригинала 22 декабря 2007 г. Получено 2008-01-02 .
  5. ^ "Библиотека LIMMA: Линейные модели для данных микрочипов" . Получено 01.01.2008 .
  6. ^ Гатто, Лоран; Брекельс, Лиза М.; Нааке, Томас; Гибб, Себастьян (2015). «Визуализация данных протеомики с использованием R и Bioconductor». Proteomics . 15 (8): 1375– 1389. doi :10.1002/pmic.201400392. ISSN  1615-9853. PMC 4510819 . PMID  25690415. 
  7. ^ "Создание диаграммы рассеяния интенсивности против отношения данных микрочипов - MATLAB mairplot". MathWorks . Получено 2023-11-24 .
  8. ^ Иризарри, РА ; Хоббс, Б; Коллин, Ф; Бизер-Барклей, И.Д.; Антонеллис, К.Дж.; Шерф, У; Спид, Т.П. (2003). «Исследование, нормализация и резюме данных о уровне зонда массива олигонуклеотидов высокой плотности». Биостатистика . 4 (2): 249–64 . doi : 10.1093/biostatistics/4.2.249 . PMID  12925520.
  9. ^ Bolstad BM, Irizarry RA, Astrand M, Speed ​​TP (2003). "Сравнение методов нормализации для данных массива олигонуклеотидов высокой плотности на основе дисперсии и смещения". Биоинформатика . 19 (2): 185–93 . doi : 10.1093/bioinformatics/19.2.185 . PMID  12538238.
  10. ^ Giorgi FM, Bolger AM, Lohse M, Usadel B (2010). "Артефакты, управляемые алгоритмом, в медианном польском обобщении данных микрочипов". BMC Bioinformatics . 11 : 553. doi : 10.1186/1471-2105-11-553 . PMC 2998528. PMID  21070630 . 
  11. ^ Lim WK, Wang K, Lefebvre C, Califano A (2007). «Сравнительный анализ процедур нормализации микрочипов: влияние на обратную инженерию генных сетей». Биоинформатика . 23 (13): i282–8. doi : 10.1093/bioinformatics/btm201 . PMID  17646307.
  12. ^ Хохрайтер С., Клеверт ДА, Обермайер К. (2006). «Новый метод суммирования данных на уровне зонда affymetrix». Биоинформатика . 22 (8): 943–949 . doi : 10.1093/bioinformatics/btl033 . PMID  16473874.
  13. ^ «Affycomp III: эталон для измерения экспрессии Affymetrix GeneChip».
  14. ^ ab Shi L, Reid LH, Jones WD и др. (2006). «Проект контроля качества микрочипов (MAQC) демонстрирует межплатформенную и внутриплатформенную воспроизводимость измерений экспрессии генов». Nat. Biotechnol . 24 (9): 1151– 61. doi :10.1038/nbt1239. PMC 3272078. PMID 16964229  . 
  15. ^ Guo L, Lobenhofer EK, Wang C, et al. (2006). «Исследование токсикогеномики крыс выявляет аналитическую согласованность на платформах микрочипов». Nat. Biotechnol . 24 (9): 1162– 9. doi :10.1038/nbt1238. PMID  17061323. S2CID  8192240.
  16. ^ Джентльмен, Роберт и др. (2005). Решения в области биоинформатики и вычислительной биологии с использованием R и Bioconductor . Нью-Йорк: Springer Science+Business Media. ISBN 978-0-387-29362-2.
  17. ^ Jaskowiak, Pablo A.; Campello, Ricardo JGB; Costa, Ivan G. (2013). «Меры близости для кластеризации данных микрочипов экспрессии генов: методология проверки и сравнительный анализ». IEEE/ACM Transactions on Computational Biology and Bioinformatics . 10 (4): 845– 857. doi :10.1109/TCBB.2013.9. PMID  24334380. S2CID  760277.
  18. ^ abc Jaskowiak, Pablo A; Campello, Ricardo JGB; Costa, Ivan G (2014). «О выборе соответствующих расстояний для кластеризации данных по экспрессии генов». BMC Bioinformatics . 15 (Suppl 2): ​​S2. doi : 10.1186/1471-2105-15-S2-S2 . PMC 4072854. PMID  24564555 . 
  19. ^ Аб де Соуто, Марсилио CP; Коста, Иван Г.; де Араужо, Даниэль С.А.; Людермир, Тереза ​​​​Б.; Шлип, Александр (2008). «Кластеризация данных об экспрессии генов рака: сравнительное исследование». БМК Биоинформатика . 9 (1): 497. дои : 10.1186/1471-2105-9-497 . ПМЦ 2632677 . ПМИД  19038021. 
  20. ^ "Главная". biostat.ucsf.edu .
  21. ^ "Ingenuity Systems" . Получено 2007-12-31 .
  22. ^ "Ariadne Genomics: Pathway Studio". Архивировано из оригинала 2007-12-30 . Получено 2007-12-31 .
  23. ^ "FunRich: Анализ функционального обогащения" . Получено 2014-09-09 .
  24. ^ [ "Анализ значимости микрочипов" . Получено 31 декабря 2007 г.]
  25. ^ "Software - Broad" . Получено 2007-12-31 .
  26. ^ "BioCarta - Картографирование путей жизни" . Получено 2007-12-31 .
  27. ^ Винаягам А., Ху И., Кулкарни М., Роесел С. и др. (2013). «Основа анализа белковых комплексов для высокопроизводительных наборов данных. 6, rs5 (2013)». Sci. Signal . 6 (r5): rs5. doi :10.1126/scisignal.2003629. PMC 3756668. PMID 23443684  . 
  28. ^ "DBI Web". Архивировано из оригинала 2007-07-05 . Получено 2007-12-31 .
  29. ^ "SCOPE". Архивировано из оригинала 2011-08-17 . Получено 2007-12-31 .
  30. ^ "RssGsc" . Получено 2008-10-15 .
  31. ^ "SAM: Анализ значимости микрочипов". tibshirani.su.domains . Получено 2023-11-24 .
  32. ^ abcdefghi Чу, Г., Нарасимхан, Б., Тибширани, Р., Ташер, В. «Руководство пользователя SAM «Анализ значимости микрочипов» и технический документ». [1]
  33. ^ abcdefghi Zang, S.; Guo, R.; et al. (2007). «Интеграция методов статистического вывода и новая мера контроля для улучшения чувствительности и специфичности анализа данных в исследованиях по профилированию экспрессии». Журнал биомедицинской информатики . 40 (5): 552–560 . doi : 10.1016/j.jbi.2007.01.002 . PMID  17317331.
  34. ^ abcdefghi <Zhang, S. (2007). «Комплексная оценка SAM, R-пакета SAM и простая модификация для улучшения его производительности». BMC Bioinformatics 8: 230.
  35. ^ abc Tusher, VG; Tibshirani, R.; et al. (2001). "Анализ значимости микрочипов, применяемых для анализа реакции на ионизирующее излучение" (PDF) . Труды Национальной академии наук . 98 (9): 5116– 5121. Bibcode :2001PNAS...98.5116G. doi : 10.1073/pnas.091062498 . PMC 33173 . PMID  11309499. 
  36. ^ Дину, IP; JD; ​​Мюллер, T; Лю, Q; Адевале, AJ; Джангри, GS; Эйнеке, G; Фамульски, KS; Халлоран, P; Ясуи, Y. (2007). "Улучшение анализа набора генов в данных микрочипов с помощью SAM-GS". BMC Bioinformatics . 8 : 242. doi : 10.1186 /1471-2105-8-242 . PMC 1931607. PMID  17612399. 
  37. ^ Джеффри, И. Х.; Д. Г.; Калхейн, А. К. (2006). «Сравнение и оценка методов создания списков дифференциально экспрессируемых генов из данных микрочипов». BMC Bioinformatics . 7 : 359. doi : 10.1186/1471-2105-7-359 . PMC 1544358. PMID  16872483 . 
  38. ^ Larsson, OW C; Timmons, JA. (2005). "Соображения при использовании алгоритма анализа значимости микрочипов (SAM)". BMC Bioinformatics . 6 : 129. doi : 10.1186/1471-2105-6-129 . PMC 1173086. PMID  15921534 . 
  39. ^ Wilson CL, Miller CJ (2005). «Simpleaffy: пакет BioConductor для контроля качества Affymetrix и анализа данных». Биоинформатика . 21 (18): 3683– 5. doi : 10.1093/bioinformatics/bti605 . PMID  16076888.
  40. ^ "J. Craig Venter Institute -- Software" . Получено 2008-01-01 .
  41. ^ "Agilent | GeneSpring GX" . Получено 2008-01-02 .
  42. ^ "Ocimum Biosolutions | Genowiz". Архивировано из оригинала 2009-11-24 . Получено 2009-04-02 .
  • ArrayExplorer — сравните микрочипы бок о бок, чтобы найти тот, который лучше всего соответствует вашим исследовательским потребностям
  • FARMS - Факторный анализ для надежного суммирования микрочипов, пакет R — программное обеспечение
  • StatsArray - Онлайн-сервисы анализа микрочипов — программное обеспечение
  • ArrayMining.net - веб-приложение для онлайн-анализа данных микрочипов — программное обеспечение
  • FunRich - Выполнение анализа обогащения набора генов — программное обеспечение
  • Сравнительный транскриптомный анализ в справочном модуле по естественным наукам
  • Инструкции по загрузке SAM
  • GeneChip® Expression Analysis — основы анализа данных (Affymetrix)
  • Duke data_analysis_fundamentals_manual
Взято с "https://en.wikipedia.org/w/index.php?title=Методы_анализа_микроматриц&oldid=1227689310#Анализ_значимости_микроматриц_(SAM)"