Рейтинг продукта

Ранговый продукт — это биологически мотивированный ранговый тест для обнаружения дифференциально экспрессируемых генов в реплицированных экспериментах с микрочипами . Это простой непараметрический статистический метод, основанный на рангах изменений кратности. Помимо использования в профилировании экспрессии , его можно использовать для объединения ранжированных списков в различных прикладных областях, включая протеомику , метаболомику , статистический метаанализ и общий выбор признаков .

Расчет рангового произведения

Заполненные круги представляют ранги одного гена в разных репликациях. Произведение рангов для этого гена будет (2×1×4×2) 1/4 = 2

Дано n генов и k репликаций, пусть будет рангом гена g в i -й репликации. г г , я {\displaystyle r_{g,i}}

Вычислите ранговое произведение через среднее геометрическое :

Р П ( г ) = ( П я = 1 к г г , я ) 1 / к {\displaystyle RP(г)=(\Пи _{я=1}^{к}г_{г,я})^{1/к}}

Определение уровней значимости

Простая оценка на основе перестановки используется для определения вероятности того, насколько вероятно, что заданное значение RP или выше будет наблюдаться в случайном эксперименте.

  1. сгенерировать p перестановок из k ранговых списков длины n .
  2. вычислить ранговые произведения n генов в p перестановках.
  3. подсчитайте, во сколько раз произведения рангов генов в перестановках меньше или равны наблюдаемому произведению рангов. Установите c на это значение.
  4. рассчитайте среднее ожидаемое значение для рангового произведения по формуле: . Э Р П ( г ) = с / п {\displaystyle \mathrm {E} _ {\mathrm {RP} }(g)=c/p}
  5. рассчитайте процент ложноположительных результатов как: где — ранг гена g в списке всех n генов, отсортированных по возрастанию . п ф п ( г ) = Э Р П ( г ) / г а н к ( г ) {\ displaystyle \ mathrm {pfp} (g) = \ mathrm {E} _ {RP} (g)/\ mathrm {rank} (g)} г а н к ( г ) {\displaystyle \mathrm {ранг} (г)} Р П {\displaystyle \mathrm {RP} }

Точное распределение вероятностей и точная аппроксимация

Повторная выборка перестановок требует вычислительно требовательного числа перестановок для получения надежных оценок p -значений для наиболее дифференциально выраженных генов, если n велико. Eisinga, Breitling и Heskes (2013) предоставляют точное распределение вероятностной массы статистики рангового произведения. Расчет точных p -значений обеспечивает существенное улучшение по сравнению с аппроксимацией перестановок, что наиболее важно для той части анализа рангового произведения распределения, которая больше всего интересует, т. е. тонкого правого хвоста. Однако для вычисления точной статистической значимости больших ранговых произведений может потребоваться неприемлемо много времени. Heskes, Eisinga и Breitling (2014) предоставляют метод определения точных приближенных p -значений статистики рангового произведения вычислительно быстрым способом.

Смотрите также

Ссылки

  • Breitling, R., Armengaud, P., Amtmann, A. и Herzyk, P. (2004) Rank Products: простой, но мощный новый метод обнаружения дифференциально регулируемых генов в экспериментах с реплицированными микрочипами, FEBS Letters, 573:83–-92
  • Eisinga, R.; Breitling, R.; Heskes, T. (2013). «Точное распределение вероятностей статистики рангового произведения для повторных экспериментов». FEBS Letters . 587 (6): 677–682. Bibcode : 2013FEBSL.587..677E. doi : 10.1016/j.febslet.2013.01.037. hdl : 2066/116720 . PMID  23395607. S2CID  246960.
  • Хескес, Т.; Эйсинга, Р.; Брейтлинг, Р. (2014). "Быстрый алгоритм определения границ и точных приближенных p-значений статистики рангового произведения для повторных экспериментов". BMC Bioinformatics . 15 (1): 367. doi : 10.1186/preaccept-1857144210135244 . PMC  4245829 . PMID  25413493.
Получено с "https://en.wikipedia.org/w/index.php?title=Rank_product&oldid=1253848430"