Аддитивное неравновесие и z-статистика

Студент

Аддитивное неравновесие ( D ) — это статистика, которая оценивает разницу между наблюдаемыми генотипическими частотами и генотипическими частотами, которые можно было бы ожидать при равновесии Харди–Вайнберга . В биаллельном локусе с аллелями 1 и 2 аддитивное неравновесие существует в соответствии с уравнениями [1]

ф 11 = п 1 2 + Д ф 12 = 2 п 1 ( 1 п 1 ) 2 Д ф 22 = ( 1 п 1 ) 2 + Д {\displaystyle {\begin{align}f_{11}&=p_{1}^{2}+D\\[5pt]f_{12}&=2p_{1}(1-p_{1})-2D\\[5pt]f_{22}&=(1-p_{1})^{2}+D\end{align}}}

где f ij — частота генотипа ij в популяции, pчастота аллеля в популяции, а D — аддитивный коэффициент неравновесия. [1]

Значение D > 0 указывает на избыток гомозигот /дефицит гетерозигот в популяции, тогда как D < 0 указывает на избыток гетерозигот/дефицит гомозигот. Когда D = 0, генотипы считаются находящимися в равновесии Харди-Вайнберга. На практике предполагаемое аддитивное неравновесие из выборки, , редко будет точно равняться 0, но может быть достаточно малым, чтобы сделать вывод, что оно не сильно отличается от 0. Нахождение значения коэффициента аддитивного неравновесия дает альтернативную оценку принятия или отклонения равновесия Харди-Вайнберга в наборе генотипических частот. [1] Д ^ {\displaystyle {\widehat {D}}}

Поскольку частоты генотипа и аллеля должны быть положительными числами в интервале (0,1), существует ограничение на диапазон возможных значений D , которое выглядит следующим образом:

макс ты ( 1 , 2 ) п ты 2 Д п 1 ( 1 п 1 ) {\displaystyle \max _{u\,\in \,(1,2)}-p_{u}^{2}\leq D\leq p_{1}(1-p_{1})}

Чтобы оценить D по образцу, используйте формулу:

Д ^ = ф ^ 11 п ^ 1 2 = н 11 н ( 2 н 11 + н 12 2 н ) 2 {\displaystyle {\widehat {D}}={\widehat {f}}_{11}-{\widehat {p}}_{1}^{2}={\frac {n_{11}}{n}}-\left({\frac {2n_{11}+n_{12}}{2n}}\right)^{2}}

где n 11 ( n 12 ) — число особей в выборке с данным генотипом, а n — общее число особей в выборке. Обратите внимание, что и — это выборочные оценки генотипа популяции и частот аллелей. ф ^ 11 {\displaystyle {\widehat {f}}_{11}} п ^ 1 {\displaystyle {\widehat {p}}_{1}}

Приблизительная дисперсия выборки (задается формулой ) составляет: Д ^ {\displaystyle {\widehat {D}}} вар ( Д ^ ) {\displaystyle \operatorname {var} ({\widehat {D}})}

вар Д ^ = п ^ 1 2 ( 1 п ^ 1 2 ) н {\displaystyle \operatorname {var} {\widehat {D}}={\frac {{\widehat {p}}_{1}^{2}(1-{\widehat {p}}_{1}^{2})}{n}}}    [2]

Из этого можно рассчитать предполагаемый 95% доверительный интервал , который составляет

Д ^ ± 1.96 вар ( Д ^ ) {\displaystyle {\widehat {D}}\pm 1.96{\sqrt {\operatorname {var} ({\widehat {D}})}}}

Примечание: также равно расчетному стандартному отклонению . вар ( Д ^ ) {\displaystyle {\sqrt {\operatorname {var} ({\widehat {D}})}}}

Если доверительный интервал не включает ноль, мы можем отвергнуть нулевую гипотезу для равновесия Харди-Вайнберга. Д ^ {\displaystyle {\widehat {D}}}

  • Аналогично, мы также можем проверить равновесие Харди-Вайнберга, используя z -статистику , которая использует информацию из оценки аддитивного неравновесия для определения значимости. Однако при использовании z- статистики цель состоит в том, чтобы преобразовать статистику таким образом, чтобы асимптотически она имела стандартное нормальное распределение . Чтобы сделать это, разделите на ее стандартное отклонение, что дает упрощенное уравнение: [1] Д ^ {\displaystyle {\widehat {D}}}
з = Д ^ н п ^ 1 ( 1 п ^ 1 ) {\displaystyle z={\frac {{\widehat {D}}{\sqrt {n}}}{{\widehat {p}}_{1}(1-{\widehat {p}}_{1})}}}

Когда z велико, то и отклонение от равновесия Харди-Вайнберга также велико. Если значение z достаточно велико, то маловероятно, что отклонения возникнут случайно, и, таким образом, гипотезу о равновесии Харди-Вайнберга можно отвергнуть. [1] Д ^ {\displaystyle {\widehat {D}}}

Чтобы определить, является ли z значительно больше или меньше ожидаемого в равновесии Харди-Вайнберга, найдите «вероятность наблюдения» значения, столь же или более экстремального, как наблюдаемое z «в нулевой гипотезе». Обычно используется вероятность хвоста ( y  >  z ), где y — стандартная нормальная случайная величина. Когда z положительно, вероятность хвоста равна 1 −  ( y  ≤  z ). Поскольку нормальные распределения симметричны, верхняя и нижняя вероятности хвоста будут равны, и, таким образом, вы можете найти верхнюю вероятность и умножить ее на 2, чтобы найти объединенные вероятности хвоста. П {\displaystyle \mathbb {P} } П {\displaystyle \mathbb {P} }

Если z отрицательно, найдите вероятность отрицательного хвоста ( yz ) и умножьте на 2, чтобы найти объединенную вероятность как в верхнем, так и в нижнем хвосте. П {\displaystyle \mathbb {P} }

Значения вероятности, рассчитанные из этих уравнений, можно проанализировать путем сравнения с заранее заданным значением α . Когда наблюдаемая вероятность p  ≤  α , мы можем «отвергнуть нулевую гипотезу равновесия Харди-Вайнберга». Если p  >  α , мы не можем отвергнуть нулевую гипотезу. Обычно используемые значения α составляют 0,05, 0,01 и 0,001. [3]

При значимости α  = 0,05 мы можем отвергнуть гипотезу равновесия Харди-Вайнберга, если абсолютное значение z «больше или равно критическому значению 1,96» для двустороннего теста. [1] [4]

Ссылки

  1. ^ abcdef Weir, Bruce (1996). Генетический анализ данных: методы для дискретных популяционных генетических данных (2-е изд., [испр. и расширен. изд.]. Сандерленд, Массачусетс: Sinauer. стр.  94–96 . ISBN 0-87893-902-4.
  2. ^ Чен, Дж. Дж.; Дуань, Т.; Сингл, Р.; Мазер, К.; Томсон, Г. (23 мая 2005 г.). «Тестирование Харди-Вайнберга одного гомозиготного генотипа». Генетика . 170 (3): 1439– 1442. doi :10.1534/genetics.105.043190. PMC 1451168. PMID  15911570 . 
  3. ^ "7.1.3.1. Критические значения и значения p". www.itl.nist.gov . NIST SEMATECH . Получено 4 декабря 2017 г. .
  4. ^ "Тесты значимости". www.stat.yale.edu . Получено 2017-12-05 .
Взято с "https://en.wikipedia.org/w/index.php?title=Аддитивное_неравновесие_и_z_статистика&oldid=1164913094"