Структура популяции (генетика)

Стратификация генетической популяции на основе частот аллелей

Структура популяции (также называемая генетической структурой и стратификацией популяции ) — это наличие систематической разницы в частотах аллелей между субпопуляциями . В случайно спаривающейся (или панмиктической ) популяции частоты аллелей, как ожидается, будут примерно одинаковыми между группами. Однако спаривание, как правило, в некоторой степени неслучайно, что приводит к возникновению структуры. Например, барьер, такой как река, может разделять две группы одного вида и затруднять пересечение для потенциальных партнеров; если происходит мутация , в течение многих поколений она может распространиться и стать распространенной в одной субпопуляции, полностью отсутствуя в другой.

Генетические варианты не обязательно вызывают наблюдаемые изменения в организмах, но могут быть коррелированы по совпадению из-за структуры популяции — вариант, который распространен в популяции с высоким уровнем заболеваемости, может ошибочно считаться причиной заболевания. По этой причине структура популяции является распространенной смешивающей переменной в исследованиях медицинской генетики , и учет и контроль ее эффекта важны в исследованиях ассоциаций по всему геному (GWAS). Отслеживая происхождение структуры, также можно изучать генетическое происхождение групп и индивидуумов.

Описание

Основной причиной структуры популяции у видов, размножающихся половым путем , является неслучайное спаривание между группами: если все особи в популяции спариваются случайным образом, то частоты аллелей должны быть схожими между группами. Структура популяции обычно возникает из-за физического разделения расстоянием или барьерами, такими как горы и реки, за которыми следует генетический дрейф . Другие причины включают поток генов от миграций, узкие места и расширения популяции , эффекты основателя , эволюционное давление , случайность и (у людей) культурные факторы. Даже вместо этих факторов особи имеют тенденцию оставаться близко к месту своего рождения, что означает, что аллели не будут распределяться случайным образом по всему ареалу вида. [1] [2]

Меры

Структура популяции — это сложное явление, и ни одна мера не охватывает ее полностью. Понимание структуры популяции требует сочетания методов и мер. [3] [4] Многие статистические методы полагаются на простые модели популяции, чтобы вывести исторические демографические изменения, такие как наличие узких мест в популяции, событий смешения или времени расхождения популяции. Часто эти методы полагаются на предположение о панмикции или однородности в предковой популяции. Неправильная спецификация таких моделей, например, не принимая во внимание существование структуры в предковой популяции, может привести к сильно смещенным оценкам параметров. [5] Исследования с помощью моделирования показывают, что историческая структура популяции может даже иметь генетические эффекты, которые можно легко неверно истолковать как исторические изменения в размере популяции или существование событий смешения, даже если таких событий не было. [6]

Гетерозиготность

Популяционное бутылочное горлышко может привести к потере гетерозиготности. В этой гипотетической популяции аллель зафиксировался после того, как популяция многократно сократилась с 10 до 3.

Одним из результатов структуры популяции является снижение гетерозиготности . Когда популяции разделяются, аллели имеют более высокий шанс достичь фиксации в субпопуляциях, особенно если субпопуляции небольшие или были изолированы в течение длительных периодов. Это снижение гетерозиготности можно рассматривать как расширение инбридинга , при котором особи в субпопуляциях с большей вероятностью разделяют недавнего общего предка . [7] Масштаб важен — особь, оба родителя которой родились в Соединенном Королевстве, не инбридна относительно населения этой страны, но более инбридна, чем два человека, выбранных из всего мира. Это мотивирует вывод F -статистики Райта (также называемой «индексами фиксации»), которая измеряет инбридинг через наблюдаемую и ожидаемую гетерозиготность. [8] Например, измеряет коэффициент инбридинга в одном локусе для особи относительно некоторой субпопуляции : [9] Ф я С {\displaystyle F_{IS}} я {\displaystyle Я} С {\displaystyle S}

Ф я С = 1 ЧАС я ЧАС С {\displaystyle F_{IS}=1-{\frac {H_{I}}{H_{S}}}}

Здесь, — доля гетерозиготных особей в субпопуляции. Предполагая, что есть два аллеля, которые встречаются с соответствующими частотами , ожидается, что при случайном спаривании субпопуляция будет иметь уровень гетерозиготности . Тогда: ЧАС я {\displaystyle H_{I}} С {\displaystyle S} А 1 , А 2 {\displaystyle А_{1},А_{2}} п С , д С {\displaystyle p_{S},q_{S}} С {\displaystyle S} ЧАС С = 2 п С ( 1 п С ) = 2 п С д С {\displaystyle H_{S}=2p_{S}(1-p_{S})=2p_{S}q_{S}}

Ф я С = 1 ЧАС я 2 п С д С {\displaystyle F_{IS}=1-{\frac {H_{I}}{2p_{S}q_{S}}}}

Аналогично, для всей популяции мы можем определить, что позволяет нам вычислить ожидаемую гетерозиготность субпопуляции и значение как: [9] Т {\displaystyle Т} ЧАС Т = 2 п Т д Т {\displaystyle H_{T}=2p_{T}q_{T}} С {\displaystyle S} Ф С Т {\displaystyle F_{ST}}

Ф С Т = 1 ЧАС С ЧАС Т = 1 2 п С д С 2 п Т д Т {\displaystyle F_{ST}=1-{\frac {H_{S}}{H_{T}}}=1-{\frac {2p_{S}q_{S}}{2p_{T}q_{T}}}}

Если F равен 0, то частоты аллелей между популяциями идентичны, что предполагает отсутствие структуры. Теоретическое максимальное значение 1 достигается, когда аллель достигает полной фиксации, но большинство наблюдаемых максимальных значений намного ниже. [7] F ST является одной из наиболее распространенных мер популяционной структуры, и существует несколько различных формулировок в зависимости от количества популяций и интересующих аллелей. Хотя иногда она используется как генетическое расстояние между популяциями, она не всегда удовлетворяет неравенству треугольника и, таким образом, не является метрикой . [10] Она также зависит от внутрипопуляционного разнообразия, что затрудняет интерпретацию и сравнение. [4]

Вывод о примеси

Генотип индивидуума может быть смоделирован как примесь между K дискретными кластерами популяций. [9] Каждый кластер определяется частотами его генотипов, а вклад кластера в генотипы индивидуума измеряется с помощью оценщика . В 2000 году Джонатан К. Притчард представил алгоритм STRUCTURE для оценки этих пропорций с помощью Монте-Карло с цепями Маркова , моделируя частоты аллелей в каждом локусе с помощью распределения Дирихле . [11] С тех пор были разработаны алгоритмы (такие как ADMIXTURE), использующие другие методы оценки. [12] [13] Оцененные пропорции можно визуализировать с помощью столбчатых диаграмм — каждый столбец представляет индивидуума и подразделяется для представления доли генетического происхождения индивидуума из одной из K популяций. [9]

Изменение K может иллюстрировать различные масштабы структуры населения; использование малого K для всей популяции людей будет подразделять людей примерно по континентам, в то время как использование большого K будет разделять популяции на более мелкие подгруппы. [9] Хотя методы кластеризации популярны, они открыты для неправильной интерпретации: для немоделированных данных никогда не существует «истинного» значения K , а скорее приближение, считающееся полезным для данного вопроса. [3] Они чувствительны к стратегиям выборки, размеру выборки и близким родственникам в наборах данных; может вообще не быть дискретных популяций; и может быть иерархическая структура, в которой субпопуляции вложены. [3] Кластеры могут быть смешаны сами по себе, [9] и могут не иметь полезной интерпретации в качестве исходных популяций. [14]

Исследование популяционной структуры людей в Северной Африке и соседних популяциях, смоделированное с использованием ADMIXTURE и предполагающее, что популяции K=2,4,6,8 (рисунок B, сверху вниз). Изменение K изменяет масштаб кластеризации. При K =2 80% предполагаемого происхождения большинства североафриканцев отнесено к кластеру, который является общим для баскских, тосканских и катарских арабов (фиолетовый). При K =4 появляются клины североафриканского происхождения (светло-голубой). При K =6 появляются противоположные клины ближневосточного (катарского) происхождения (зеленый). При K =8 тунисские берберы появляются как кластер (темно-синий). [15]

Уменьшение размерности

Карта местоположений генетических образцов нескольких африканских популяций (слева) и главные компоненты 1 и 2 данных, наложенных на карту (справа). Главная координатная плоскость была повернута на 16,11° для выравнивания с картой. Она соответствует распределению популяций с востока на запад и с севера на юг. [16]

Генетические данные являются высокоразмерными , и методы снижения размерности могут захватывать структуру популяции. Анализ главных компонент (PCA) был впервые применен в популяционной генетике в 1978 году Кавалли-Сфорца и коллегами и возродился с высокопроизводительным секвенированием . [9] [17] Первоначально PCA использовался для частот аллелей в известных генетических маркерах для популяций, хотя позже было обнаружено, что путем кодирования SNP как целых чисел (например, как количество нереферентных аллелей ) и нормализации значений PCA можно применять на уровне особей. [13] [18] Одна формулировка рассматривает особей и биаллельные SNP. Для каждой особи значение в локусе равно количеству нереферентных аллелей (одному из ). Если частота аллеля в равна , то результирующая матрица нормализованных генотипов имеет записи: [9] Н {\displaystyle N} С {\displaystyle S} я {\displaystyle я} л {\displaystyle л} г я , л {\displaystyle g_{i,l}} 0 , 1 , 2 {\displaystyle 0,1,2} л {\displaystyle л} п л {\displaystyle p_{l}} Н × С {\displaystyle N\times S}

г я , л 2 п л 2 п л ( 1 п л ) {\displaystyle {\frac {g_{i,l}-2p_{l}}{\sqrt {2p_{l}(1-p_{l})}}}}

PCA преобразует данные для максимизации дисперсии; при наличии достаточного количества данных, когда каждый индивид визуализируется как точка на графике, могут формироваться дискретные кластеры. [13] Индивиды со смешанным происхождением будут иметь тенденцию попадать между кластерами, и когда в данных есть однородная изоляция по расстоянию , верхние векторы PC будут отражать географическую изменчивость. [19] [13] Собственные векторы, сгенерированные PCA, могут быть явно записаны в терминах среднего времени коалесценции для пар индивидов, что делает PCA полезным для вывода об истории популяции групп в данной выборке. Однако PCA не может различать разные процессы, которые приводят к одному и тому же среднему времени коалесценции. [20]

Многомерное масштабирование и дискриминантный анализ использовались для изучения дифференциации, распределения популяций и анализа генетических расстояний. [21] Подходы к графам соседства , такие как t-распределенное стохастическое вложение соседей (t-SNE) и равномерное многообразие аппроксимации и проекции (UMAP), могут визуализировать континентальную и субконтинентальную структуру в человеческих данных. [22] [23] При работе с большими наборами данных UMAP лучше фиксирует множественные масштабы структуры популяции; мелкомасштабные паттерны можно скрыть или разделить с помощью других методов, и они представляют интерес, когда диапазон популяций разнообразен, когда есть смешанные популяции или при изучении взаимосвязей между генотипами, фенотипами и/или географией. [23] [24] Вариационные автокодировщики могут генерировать искусственные генотипы со структурой, репрезентативной для входных данных, хотя они не воссоздают паттерны неравновесного сцепления. [25]

Демографический вывод

Структура популяции является важным аспектом эволюционной и популяционной генетики . Такие события, как миграции и взаимодействия между группами, оставляют генетический отпечаток на популяциях. Смешанные популяции будут иметь фрагменты гаплотипа от своих предковых групп, которые постепенно уменьшаются со временем из-за рекомбинации . Используя этот факт и сопоставляя общие фрагменты гаплотипа от людей в генетическом наборе данных, исследователи могут проследить и датировать происхождение смешения популяций и реконструировать исторические события, такие как подъем и падение империй, работорговля, колониализм и расширение населения. [26]

Роль в генетической эпидемиологии

Структура популяции может быть проблемой для ассоциативных исследований , таких как исследования случай-контроль , где ассоциация между интересующим признаком и локусом может быть неверной. Например, в исследуемой популяции европейцев и жителей Восточной Азии ассоциативное исследование использования палочек для еды может «обнаружить» ген у азиатских индивидуумов, который приводит к использованию палочек для еды. Однако это ложная связь , поскольку генетический вариант просто более распространен у азиатов, чем у европейцев. [27] Кроме того, фактические генетические результаты могут быть упущены из виду, если локус менее распространен в популяции, где выбираются субъекты случая. По этой причине в 1990-х годах было принято использовать данные на основе семей, где эффект структуры популяции можно было легко контролировать с помощью таких методов, как тест на неравновесие передачи (TDT). [28]

Фенотипы (измеримые признаки), такие как рост или риск сердечных заболеваний, являются продуктом некоторой комбинации генов и окружающей среды . Эти признаки можно предсказать с помощью полигенных оценок , которые стремятся выделить и оценить вклад генетики в признак путем суммирования эффектов многих отдельных генетических вариантов. Чтобы построить оценку, исследователи сначала регистрируют участников в ассоциативном исследовании, чтобы оценить вклад каждого генетического варианта. Затем они могут использовать предполагаемые вклады каждого генетического варианта, чтобы рассчитать оценку признака для человека, который не был в исходном ассоциативном исследовании. Если структура в исследуемой популяции коррелирует с вариацией окружающей среды, то полигенная оценка больше не измеряет только генетический компонент. [29]

Несколько методов могут, по крайней мере, частично контролировать этот смешивающий эффект. Метод геномного контроля был введен в 1999 году и является относительно непараметрическим методом контроля инфляции статистики тестов . [30] Также возможно использовать несвязанные генетические маркеры для оценки пропорций предков каждого индивидуума из некоторых субпопуляций K , которые, как предполагается, неструктурированы. [31] Более поздние подходы используют анализ главных компонент (PCA), как продемонстрировали Элкс Прайс и коллеги, [32] или путем получения матрицы генетического родства (также называемой матрицей родства) и включения ее в линейную смешанную модель (LMM). [33] [34]

PCA и LMM стали наиболее распространенными методами контроля за искажениями из структуры популяции. Хотя они, вероятно, достаточны для избежания ложных положительных результатов в исследованиях ассоциаций, они все еще уязвимы для переоценки размеров эффекта незначительно ассоциированных вариантов и могут существенно смещать оценки полигенных оценок и наследуемости признаков . [35] [36] Если экологические эффекты связаны с вариантом, который существует только в одном конкретном регионе (например, загрязнитель обнаружен только в одном городе), может оказаться вообще невозможным скорректировать этот эффект структуры популяции. [29] Для многих признаков роль структуры сложна и не полностью понята, и включение ее в генетические исследования остается проблемой и является активной областью исследований. [37]

Ссылки

  1. ^ Cardon LR, Palmer LJ (февраль 2003 г.). «Стратификация населения и ложная аллельная ассоциация». Lancet . 361 (9357): 598–604. doi :10.1016/S0140-6736(03)12520-2. PMID  12598158. S2CID  14255234.
  2. ^ МакВин Г (2001). "Структура населения" (PDF) . Архивировано из оригинала (PDF) 2018-11-23 . Получено 2020-11-14 .
  3. ^ abc Lawson DJ, van Dorp L, Falush D (2018). "Учебник о том, как не переусердствовать с интерпретацией столбчатых диаграмм STRUCTURE и ADMIXTURE". Nature Communications . 9 (1): 3258. Bibcode :2018NatCo...9.3258L. doi :10.1038/s41467-018-05257-7. ISSN  2041-1723. PMC 6092366 . PMID  30108219. 
  4. ^ ab Meirmans PG, Hedrick PW (2010). «Оценка структуры популяции: FST и связанные с ней меры». Ресурсы молекулярной экологии . 11 (1): 5–18. doi : 10.1111/j.1755-0998.2010.02927.x . ISSN  1755-098X. PMID  21429096. S2CID  24403040.
  5. ^ Scerri EM, Thomas MG, Manica A, Gunz P, Stock JT, Stringer C и др. (август 2018 г.). «Развивались ли наши виды в разделенных популяциях по всей Африке и почему это имеет значение?». Trends in Ecology & Evolution . 33 (8): 582–594. doi :10.1016/j.tree.2018.05.005. PMC 6092560. PMID  30007846 . 
  6. ^ Rodríguez W, Mazet O, Grusea S, Arredondo A, Corujo JM, Boitard S, Chikhi L (декабрь 2018 г.). «IICR и нестационарное структурированное объединение: к демографическому выводу с произвольными изменениями в структуре населения». Heredity . 121 (6): 663–678. doi :10.1038/s41437-018-0148-0. PMC 6221895 . PMID  30293985. 
  7. ^ ab Hartl DL, Clark AG (1997). Принципы популяционной генетики (3-е изд.). Сандерленд, Массачусетс: Sinauer Associates. стр. 111–163. ISBN 0-87893-306-9. OCLC  37481398.
  8. ^ Райт С. (1949). «Генетическая структура популяций». Annals of Eugenics . 15 (1): 323–354. doi :10.1111/j.1469-1809.1949.tb02451.x. ISSN  2050-1420. PMID  24540312.
  9. ^ abcdefgh Coop G (2019). Популяционная и количественная генетика . С. 22–44.
  10. ^ Arbisser IM, Rosenberg NA (2020). «FST и неравенство треугольника для биаллельных маркеров». Теоретическая популяционная биология . 133 : 117–129. doi :10.1016/j.tpb.2019.05.003. ISSN  0040-5809. PMC 8448291 . PMID  31132375. 
  11. ^ Притчард Дж. К., Стивенс М., Доннелли П. (2000). «Вывод структуры популяции с использованием данных о многолокусном генотипе». Генетика . 155 (2): 945–959. doi : 10.1093/genetics/155.2.945 . ISSN  1943-2631. PMC 1461096. PMID 10835412  . 
  12. ^ Alexander DH, Novembre J, Lange K (2009). «Быстрая модельная оценка происхождения неродственных особей». Genome Research . 19 (9): 1655–1664. doi :10.1101/gr.094052.109. ISSN  1088-9051. PMC 2752134. PMID  19648217 . 
  13. ^ abcd Novembre J, Ramachandran S (2011). «Перспективы структуры человеческой популяции на пороге эры секвенирования». Annu Rev Genomics Hum Genet . 12 (1): 245–74. doi :10.1146/annurev-genom-090810-183123. PMID  21801023.
  14. ^ Novembre J (2016). «Притчард, Стивенс и Доннелли о структуре популяции». Genetics . 204 (2): 391–393. doi :10.1534/genetics.116.195164. ISSN  1943-2631. PMC 5068833 . PMID  27729489. 
  15. ^ Henn BM, Botigué LR, Gravel S, Wang W, Brisbin A, Byrnes JK, Fadhlaoui-Zid K, Zalloua PA, Moreno-Estrada A, Bertranpetit J, Bustamante CD, Comas D (январь 2012 г.). «Геномное происхождение североафриканцев подтверждает миграцию обратно в Африку». PLOS Genet . 8 (1): e1002397. doi : 10.1371/journal.pgen.1002397 . PMC 3257290. PMID  22253600 . 
  16. ^ Wang C, Zöllner S, Rosenberg NA (август 2012 г.). «Количественное сравнение сходства между генами и географией в мировых популяциях людей». PLOS Genet . 8 (8): e1002886. doi : 10.1371/journal.pgen.1002886 . PMC 3426559. PMID  22927824 . 
  17. ^ Menozzi P, Piazza A, Cavalli-Sforza L (1978). «Синтетические карты частот человеческих генов у европейцев». Science . 201 (4358): 786–792. Bibcode :1978Sci...201..786M. doi :10.1126/science.356262. ISSN  0036-8075. PMID  356262.
  18. ^ Паттерсон Н., Прайс А. Л., Рейх Д. (декабрь 2006 г.). «Структура популяции и анализ собственных значений». PLOS Genetics . 2 (12): e190. doi : 10.1371/journal.pgen.0020190 . PMC 1713260. PMID  17194218 . 
  19. ^ Novembre J, Johnson T, Bryc K, Kutalik Z, Boyko AR, Auton A, Indap A, King KS, Bergmann S, Nelson MR, Stephens M, Bustamante CD (2008). «Гены отражают географию в Европе». Nature . 456 (7218): 98–101. Bibcode :2008Natur.456...98N. doi :10.1038/nature07331. ISSN  0028-0836. PMC 2735096 . PMID  18758442. 
  20. ^ МакВин Г. (2009). «Генеалогическая интерпретация анализа главных компонент». PLOS Genetics . 5 (10): e1000686. doi : 10.1371/journal.pgen.1000686 . ISSN  1553-7404. PMC 2757795. PMID 19834557  . 
  21. ^ Jombart T, Pontier D, Dufour AB (апрель 2009 г.). «Генетические маркеры на игровой площадке многомерного анализа». Наследственность (Edinb) . 102 (4): 330–41. doi : 10.1038/hdy.2008.130 . PMID  19156164. S2CID  10739417.
  22. ^ Li W, Cerise JE, Yang Y, Han H (август 2017 г.). «Применение t-SNE к генетическим данным человека». J Bioinform Comput Biol . 15 (4): 1750017. doi :10.1142/S0219720017500172. PMID  28718343.
  23. ^ ab Diaz-Papkovich A, Anderson-Trocmé L, Ben-Eghan C, Gravel S (ноябрь 2019 г.). «UMAP раскрывает скрытую структуру популяции и гетерогенность фенотипа в больших геномных когортах». PLOS Genet . 15 (11): e1008432. doi : 10.1371/journal.pgen.1008432 . PMC 6853336. PMID  31675358 . 
  24. ^ Сакауэ С, Хирата Дж, Канаи М, Сузуки К, Акияма М, Лай Тоо С, Арайсси Т, Хаммудэ М, Аль Эмади С, Масри БК, Халаби Х, Бадша Х, Усман И.В., Саксена Р, Падюков Л, Хирата М , Мацуда К., Мураками Ю., Каматани Ю., Окада Ю. (март 2020 г.). «Уменьшение размерности выявляет мелкомасштабную структуру населения Японии, что имеет последствия для прогнозирования полигенного риска». Нат Коммун . 11 (1): 1569. Бибкод : 2020NatCo..11.1569S. doi : 10.1038/s41467-020-15194-z. ПМК 7099015 . ПМИД  32218440. 
  25. ^ Battey CJ, Coffing GC, Kern AD (январь 2021 г.). «Визуализация структуры популяции с помощью вариационных автоэнкодеров». G3 (Bethesda) . 11 (1). doi :10.1093/g3journal/jkaa036. PMC 8022710. PMID  33561250 . 
  26. ^ Hellenthal G, Busby GB, Band G, Wilson JF, Capelli C, Falush D, Myers S (февраль 2014 г.). «Генетический атлас истории человеческого смешения». Science . 343 (6172): 747–751. Bibcode :2014Sci...343..747H. doi :10.1126/science.1243518. PMC 4209567 . PMID  24531965. 
  27. ^ Хамер Д., Сирота Л. (январь 2000 г.). «Остерегайтесь гена палочек для еды». Молекулярная психиатрия . 5 (1): 11–3. doi :10.1038/sj.mp.4000662. PMID  10673763. S2CID  9760182.
  28. ^ Pritchard JK, Rosenberg NA (июль 1999). «Использование несвязанных генетических маркеров для определения стратификации населения в ассоциативных исследованиях». American Journal of Human Genetics . 65 (1): 220–8. doi :10.1086/302449. PMC 1378093. PMID  10364535 . 
  29. ^ ab Blanc J, Berg JJ ( декабрь 2020 г.). «Насколько хорошо мы можем отделить генетику от окружающей среды?». eLife . 9 : e64948. doi : 10.7554/eLife.64948 . PMC 7758058. PMID  33355092. 
  30. ^ Девлин Б., Редер К. (декабрь 1999 г.). «Геномный контроль для ассоциативных исследований». Биометрия . 55 (4): 997–1004. doi :10.1111/j.0006-341X.1999.00997.x. PMID  11315092. S2CID  6297807.
  31. ^ Pritchard JK, Stephens M, Rosenberg NA, Donnelly P (июль 2000 г.). «Картирование ассоциаций в структурированных популяциях». American Journal of Human Genetics . 67 (1): 170–81. doi :10.1086/302959. PMC 1287075. PMID  10827107 . 
  32. ^ Price AL, Patterson NJ, Plenge RM, Weinblatt ME, Shadick NA, Reich D (август 2006 г.). «Анализ главных компонентов корректирует стратификацию в исследованиях ассоциаций на уровне генома». Nature Genetics . 38 (8): 904–9. doi :10.1038/ng1847. PMID  16862161. S2CID  8127858.
  33. ^ Yu J, Pressoir G, Briggs WH, Vroh Bi I, Yamasaki M, Doebley JF и др. (февраль 2006 г.). «Унифицированный метод смешанной модели для картирования ассоциаций, учитывающий множественные уровни родства». Nature Genetics . 38 (2): 203–8. doi :10.1038/ng1702. PMID  16380716. S2CID  8507433.
  34. ^ Loh PR, Tucker G, Bulik-Sullivan BK, Vilhjálmsson BJ, Finucane HK , Salem RM и др. (март 2015 г.). «Эффективный байесовский смешанный анализ модели увеличивает силу ассоциации в больших когортах». Nature Genetics . 47 (3): 284–90. doi :10.1038/ng.3190. PMC 4342297 . PMID  25642633. 
  35. ^ Zaidi AA, Mathieson I (ноябрь 2020 г.). Perry GH, Turchin MC, Martin P (ред.). «Демографическая история опосредует влияние стратификации на полигенные оценки». eLife . 9 : e61548. doi : 10.7554/eLife.61548 . PMC 7758063 . PMID  33200985. 
  36. ^ Sohail M, Maier RM, Ganna A, Bloemendal A, Martin AR, Turchin MC и др. (март 2019 г.). Nordborg M, McCarthy MI, Barton NH, Hermisson J (ред.). «Полигенная адаптация по высоте переоценена из-за неисправленной стратификации в исследованиях ассоциаций по всему геному». eLife . 8 : e39702. doi : 10.7554/eLife.39702 . PMC 6428571 . PMID  30895926. 
  37. ^ Lawson DJ, Davies NM, Haworth S, Ashraf B, Howe L, Crawford A и др. (январь 2020 г.). «Является ли структура населения в эпоху генетических биобанков неактуальной, проблемой или возможностью?». Human Genetics . 139 (1): 23–41. doi :10.1007/s00439-019-02014-8. PMC 6942007 . PMID  31030318. 
Взято с "https://en.wikipedia.org/w/index.php?title=Структура_популяции_(генетика)&oldid=1222419822"