Z -фактор — это мера размера статистического эффекта . Он был предложен для использования в высокопроизводительном скрининге (HTS), где он также известен как Z-prime [1] , чтобы судить, является ли ответ в конкретном анализе достаточно большим, чтобы заслуживать дальнейшего внимания.
В HTS экспериментаторы часто сравнивают большое количество (сотни тысяч до десятков миллионов) отдельных измерений неизвестных образцов с положительными и отрицательными контрольными образцами. Конкретный выбор экспериментальных условий и измерений называется анализом. Большие экраны требуют больших затрат времени и ресурсов. Поэтому перед началом большого экрана используются меньшие тестовые (или пилотные) экраны для оценки качества анализа в попытке предсказать, будет ли он полезен в условиях высокой пропускной способности. Z-фактор — это попытка количественно оценить пригодность конкретного анализа для использования в полномасштабном HTS.
Z-фактор определяется с помощью четырех параметров: средних значений ( ) и стандартных отклонений ( ) образцов (s) и контролей (c). При этих значениях ( , , и , ) Z-фактор определяется как:
Для анализов типа агониста/активации данные контроля (c) ( , ) в уравнении заменяются данными положительного контроля (p) ( , ), которые представляют максимальный активированный сигнал; для анализов типа антагониста/ингибирования данные контроля (c) ( , ) в уравнении заменяются данными отрицательного контроля (n) ( , ), которые представляют минимальный сигнал.
На практике Z-фактор оценивается на основе выборочных средних значений и выборочных стандартных отклонений.
Z'-фактор (Z-prime factor) определяется четырьмя параметрами: средними значениями ( ) и стандартными отклонениями ( ) как положительного (p), так и отрицательного (n) контроля ( , , и , ). Учитывая эти значения, Z'-фактор определяется как:
Z'-фактор является характерным параметром самого анализа, без вмешательства образцов.
Z-фактор определяет характерный параметр возможности идентификации попаданий для каждого данного анализа. Следующая классификация качества анализа HTS по значению Z-фактора является модификацией Таблицы 1, показанной в работе Чжана и др. (1999); [2] обратите внимание, что Z-фактор не может превышать единицу.
Значение Z-фактора | Относится к скринингу | Интерпретация |
---|---|---|
1.0 | Идеальный анализ | |
1,0 > Z ≥ 0,5 | Отличный анализ | Обратите внимание, что если , 0,5 эквивалентно разделению в 12 стандартных отклонений между и . |
0,5 > Z > 0 | Пограничный анализ | |
0 | Анализ типа «да/нет» | |
< 0 | Скрининг по сути невозможен | Слишком большое совпадение между положительными и отрицательными контролями делает анализ бесполезным. |
Обратите внимание, что по стандартам многих типов экспериментов нулевой Z-фактор предполагает большую величину эффекта, а не пограничный бесполезный результат, как предполагалось выше. Например, если σ p =σ n =1, то μ p =6 и μ n =0 дают нулевой Z-фактор. Но для нормально распределенных данных с этими параметрами вероятность того, что положительное контрольное значение будет меньше отрицательного контрольного значения, составляет менее 1 из 10 5 . Крайний консерватизм используется при высокопроизводительном скрининге из-за большого количества проведенных тестов.
Постоянный фактор 3 в определении Z-фактора мотивирован нормальным распределением , для которого более 99% значений попадают в пределы трехкратного стандартного отклонения от среднего. Если данные следуют сильно ненормальному распределению, опорные точки (например, значение отрицательного значения) могут быть обманчивыми.
Другая проблема заключается в том, что обычные оценки среднего значения и стандартного отклонения не являются надежными ; соответственно, многие пользователи в сообществе высокопроизводительного скрининга предпочитают «Надежный Z-штрих», который заменяет среднее значение на медиану, а среднее значение на абсолютное отклонение. [3] Экстремальные значения (выбросы) как в положительном, так и в отрицательном контроле могут отрицательно повлиять на Z-фактор, потенциально приводя к явно неблагоприятному Z-фактору, даже если анализ будет хорошо работать при реальном скрининге. [4] Кроме того, применение одного критерия, основанного на Z-факторе, к двум или более положительным контролям с разной силой в одном и том же анализе приведет к вводящим в заблуждение результатам. [5] Абсолютный знак в Z-факторе делает неудобным математический вывод статистического вывода Z-фактора. [6] Недавно предложенный статистический параметр, строго стандартизированная средняя разность ( SSMD ), может решить эти проблемы. [5] [6] [7] Одна из оценок SSMD является надежной к выбросам.