Простая оценка на основе перестановки используется для определения вероятности того, насколько вероятно, что заданное значение RP или выше будет наблюдаться в случайном эксперименте.
сгенерировать p перестановок из k ранговых списков длины n .
вычислить ранговые произведения n генов в p перестановках.
подсчитайте, во сколько раз произведения рангов генов в перестановках меньше или равны наблюдаемому произведению рангов. Установите c на это значение.
рассчитайте среднее ожидаемое значение для рангового произведения по формуле: .
рассчитайте процент ложноположительных результатов как: где — ранг гена g в списке всех n генов, отсортированных по возрастанию .
Точное распределение вероятностей и точная аппроксимация
Повторная выборка перестановок требует вычислительно требовательного числа перестановок для получения надежных оценок p -значений для наиболее дифференциально выраженных генов, если n велико. Eisinga, Breitling и Heskes (2013) предоставляют точное распределение вероятностной массы статистики рангового произведения. Расчет точных p -значений обеспечивает существенное улучшение по сравнению с аппроксимацией перестановок, что наиболее важно для той части анализа рангового произведения распределения, которая больше всего интересует, т. е. тонкого правого хвоста. Однако для вычисления точной статистической значимости больших ранговых произведений может потребоваться неприемлемо много времени. Heskes, Eisinga и Breitling (2014) предоставляют метод определения точных приближенных p -значений статистики рангового произведения вычислительно быстрым способом.
Breitling, R., Armengaud, P., Amtmann, A. и Herzyk, P. (2004) Rank Products: простой, но мощный новый метод обнаружения дифференциально регулируемых генов в экспериментах с реплицированными микрочипами, FEBS Letters, 573:83–-92
Eisinga, R.; Breitling, R.; Heskes, T. (2013). «Точное распределение вероятностей статистики рангового произведения для повторных экспериментов». FEBS Letters . 587 (6): 677–682. Bibcode : 2013FEBSL.587..677E. doi : 10.1016/j.febslet.2013.01.037. hdl : 2066/116720 . PMID 23395607. S2CID 246960.
Хескес, Т.; Эйсинга, Р.; Брейтлинг, Р. (2014). "Быстрый алгоритм определения границ и точных приближенных p-значений статистики рангового произведения для повторных экспериментов". BMC Bioinformatics . 15 (1): 367. doi : 10.1186/preaccept-1857144210135244 . PMC 4245829 . PMID 25413493.