перекос GC

Избыток или недостаток гуанина и цитозина в определенном участке ДНК или РНК
Указание начала и окончания репликации ДНК на графике GC-скоса и кумулятивном графике GC-скоса.
Обилие G над T в ведущей цепи, приводящее к перекосу знака GC в начале и конце.

GC-перекос возникает, когда нуклеотиды гуанин и цитозин избыточны или недостаточны в определенном регионе ДНК или РНК . GC-перекос также является статистическим методом измерения специфического для цепи избыточного представительства гуанина. [1]

В условиях равновесия (без мутационного или селективного давления и с нуклеотидами, случайно распределенными в геноме ) наблюдается одинаковая частота четырех оснований ДНК ( аденин , гуанин , тимин и цитозин ) на обеих одиночных цепях молекулы ДНК. [2] Однако у большинства бактерий (например, E. coli ) и некоторых архей (например, Sulfolobus solfataricus ) состав нуклеотидов асимметричен между ведущей и отстающей цепями : ведущая цепь содержит больше гуанина (G) и тимина (T), тогда как отстающая цепь содержит больше аденина (A) и цитозина (C). [2] Это явление называется перекосом GC и AT , и соответствующая статистика была определена [2] как:

Наклон GC = (G - C)/(G + C)

Наклон AT = (A − T)/(A + T)

Асимметричный состав нуклеотидов

Работа Эрвина Чаргаффа в 1950 году продемонстрировала, что в ДНК основания гуанин и цитозин были обнаружены в равном количестве, а основания аденин и тимин были обнаружены в равном количестве. Однако не было равенства между количеством одной пары по сравнению с другой. [3] Открытие Чаргаффа называют правилом Чаргаффа или правилом четности 2. [ 3] Три года спустя Уотсон и Крик использовали этот факт при выводе структуры ДНК, своей модели двойной спирали .

Естественным результатом правила четности 1 в состоянии равновесия, в котором нет мутаций и/или смещений отбора в любой из двух цепей ДНК, является то, что при равной скорости замещения комплементарные нуклеотиды на каждой цепи имеют равное количество данного основания и его дополнения. [4] Другими словами, в каждой цепи ДНК частота появления T равна A, а частота появления G равна C, поскольку скорость замещения предположительно одинакова. Это явление называется правилом четности 2. Следовательно, второе правило четности существует только тогда, когда нет мутации или замещения.

Любое отклонение от правила четности 2 приведет к асимметричному составу оснований, который отличает ведущую цепь, т. е. цепь ДНК, которая реплицируется в прямом направлении, от отстающей цепи. Эта асимметрия называется GC или AT перекосом. [2]

В некоторых бактериальных геномах наблюдается обогащение гуанином над цитозином и тимином над аденином на ведущей нити и наоборот для отстающей нити. Спектры перекоса нуклеотидного состава варьируются от −1, что соответствует G = 0 или A = 0, до +1, что соответствует T = 0 или C = 0. [2] Таким образом, положительный перекос GC представляет собой богатство G над C, а отрицательный перекос GC представляет собой богатство C над G. В результате можно ожидать увидеть положительный перекос GC и отрицательный перекос AT в ведущей нити, а также отрицательный перекос GC и положительный перекос AT в отстающей нити. [5] Перекос GC или AT меняет знак на границах двух репликор , которые соответствуют началу или концу репликации ДНК. [2] [4] [5] Первоначально этот асимметричный состав нуклеотидов объяснялся как другой механизм, используемый в репликации ДНК между ведущей и отстающей цепями. Репликация ДНК является полуконсервативным и асимметричным процессом сама по себе. [6] Эта асимметрия обусловлена ​​образованием репликационной вилки и ее разделением на зарождающиеся ведущую и отстающую цепи. Ведущая цепь синтезируется непрерывно и в противовес ведущей цепи; отстающая цепь реплицируется через короткие фрагменты полинуклеотида ( фрагменты Оказаки ) в направлении от 5' к 3'. [6]

Расчет и графики наклона ГХ

Существует три основных подхода к расчету и графической демонстрации перекоса ГХ и его свойств.

Асимметрия ГЦ

Первый подход — асимметрия GC и AT. [2] Жан Р. Лобри был первым, кто сообщил в 1996 году [7] о наличии композиционной асимметрии в геномах трех бактерий: E. coli , Bacillus subtilis и Haemophilus influenzae . Первоначальные формулы в то время не назывались перекосом, а скорее отклонением от [A] = [T] или [C] = [G]:

отклонение от [A] = [T] как (A − T)/(A + T);

отклонение от [C] = [G] как (C − G)/(C + G);

где A, T, G и C представляют частоту встречаемости эквивалентного основания в определенной последовательности определенной длины. Стратегия скользящего окна используется для расчета отклонения от C по геному. На этих графиках положительное отклонение от C соответствует отстающей нити, а отрицательное отклонение от C соответствует ведущей нити. [8] Кроме того, участок, где меняется знак отклонения, соответствует началу или концу. Ось x представляет собой расположение хромосом, нанесенное на график от 5′ до 3′, а ось y представляет собой значение отклонения. Главным недостатком этого метода является его свойство зависимости от размера окна. Поэтому выбор адекватного размера окна сильно влияет на результат графика. Другие методы следует комбинировать с отклонением, чтобы с большей точностью идентифицировать и локализовать начало репликации ДНК.

CGC перекос

Кумулятивный перекос CG и AT для 49 бактериальных хромосом

Второй подход называется кумулятивным GC-скосом (CGC-скосом). [9] Этот метод по-прежнему использует стратегию скользящего окна, но он использует преимущество суммы соседних окон с произвольного начала. В этой схеме весь геном обычно отображается от 5' до 3' с использованием произвольного начала и произвольной цепи. На кумулятивном GC-скосе пики соответствуют точкам переключения (конец или начало).

В отличие от более ранней статьи Лобри, недавние реализации GC skew переворачивают первоначальное определение, давая ему следующее переопределение:

Наклон GC = (G − C)/(G + C).

При перевернутом определении перекоса GC максимальное значение кумулятивного перекоса соответствует терминалу, а минимальное значение соответствует началу репликации.

Z-образная кривая

Последний подход — это кривая Z. [10] В отличие от предыдущих методов, этот метод не использует стратегию скользящего окна и считается более эффективным в поиске источника репликации. [10] В этом методе исследуется кумулятивная частота каждого основания по отношению к основанию в начале последовательности. Кривая Z использует трехмерное представление со следующими параметрами:

х н = ( А н + Г н ) ( С н + Т н ) {\displaystyle x_{n}=(A_{n}+G_{n})-(C_{n}+T_{n})}

у н = ( А н + С н ) ( Г н + Т н ) {\displaystyle y_{n}=(A_{n}+C_{n})-(G_{n}+T_{n})}

з н = ( А н + Т н ) ( С н + Г н ) {\displaystyle z_{n}=(A_{n}+T_{n})-(C_{n}+G_{n})}

Где , представляет избыток пурина над пиримидином, обозначает избыток кето над амино и показывает соотношение между слабыми и сильными водородными связями . и компоненты могут самостоятельно обнаружить начало репликации и асимметричный состав нитей. Для прогнозирования начала репликации и окончания следует использовать комбинацию этих методов, чтобы компенсировать их слабость. н = 0 , 1 , 2 , . . . Н {\displaystyle n=0,1,2,...N} х н {\displaystyle x_{n}} у н {\displaystyle y_{n}} з н {\displaystyle z_{n}} х {\displaystyle x} у {\displaystyle у}

Механизм

В научном сообществе отсутствует консенсус относительно механизма, лежащего в основе смещения в составе нуклеотидов в каждой цепи ДНК. Существуют две основные школы мысли, которые объясняют механизм, лежащий в основе специфического для цепи состава нуклеотидов в бактериях. [4]

Первый описывает смещение и асимметричное мутационное давление на каждую нить ДНК во время репликации и транскрипции . [4] [11] Из-за асимметричной природы процесса репликации, неравная частота мутаций и эффективность репарации ДНК во время процесса репликации могут вносить больше мутаций в одну нить по сравнению с другой. [5] Кроме того, время, используемое для репликации между двумя нитями, варьируется и может привести к асимметричному мутационному давлению между ведущей и отстающей нитью. [12] В дополнение к мутациям во время репликации ДНК, транскрипционные мутации могут создавать перекос нуклеотидного состава, специфичный для нити. [5] Дезаминирование цитозина и, в конечном итоге, мутация цитозина в тимин в одной нити ДНК может увеличить относительное количество гуанина и тимина в цитозин и аденин. [5] У большинства бактерий большинство генов кодируется в ведущей нити. [4] Например, ведущая нить у Bacillus subtilis кодирует 75% генов. [5] Кроме того, сообщалось об избытке дезаминирования и превращения цитозина в тимин в кодирующей цепи по сравнению с некодирующей цепью. [4] [5] [13] Одним из возможных объяснений является то, что нетранскрибированная цепь ( кодирующая цепь ) является одноцепочечной во время процесса транскрипции; поэтому она более уязвима для дезаминирования по сравнению с транскрибированной цепью ( некодирующей цепью ). [5] [14] Другое объяснение заключается в том, что активность дезаминирования во время транскрипции не происходит в кодирующей цепи. [5] Только транскрибированная цепь получает выгоду от этих событий дезаминирования.

Вторая школа мысли описывает механизм перекоса GC и AT как результат разницы в селективном давлении между ведущими и отстающими цепями. [4] [5] [14] Исследование прокариотического генома показывает предпочтение в третьей позиции кодона для G по сравнению с C и T по сравнению с A. [5] Эта дискриминация создает асимметричный состав нуклеотидов, если кодирующая цепь неравномерно распределена между ведущей и отстающей цепями, как в случае с бактериями. Кроме того, было показано, что высокотранскрибируемые гены, такие как рибосомальные белки , в основном расположены на ведущей цепи у бактерий. [5] Таким образом, смещение в выборе кодона третьей позиции G по сравнению с C может привести к перекосу GC. Кроме того, некоторые сигнальные последовательности богаты гуанином и тимином, такие как последовательности хи , и эти последовательности могут иметь более высокую частоту встречаемости в одной цепи по сравнению с другой. [4] [5]

Как мутационное, так и селективное давление могут независимо друг от друга вносить асимметрию в цепи ДНК. Однако сочетание и кумулятивный эффект обоих механизмов является наиболее правдоподобным объяснением перекоса GC и AT. [4] [14]

Использует

Доказано, что наклон GC полезен в качестве индикатора ведущей цепи ДНК, отстающей цепи, начала репликации и окончания репликации. [2] [4] [5] Большинство бактерий и архей содержат только одну точку начала репликации ДНК. [2] Наклон GC положителен и отрицателен в ведущей цепи и в отстающей цепи соответственно; поэтому ожидается, что знак наклона GC изменится только в точке начала и окончания репликации ДНК. [4] Наклон GC также можно использовать для изучения смещений цепей и связанных с ними механизмов путем вычисления избытка одного основания над его комплементарным основанием в различных средах. [4] [5] [14] Такие методы, как наклон GC, наклон CGC и кривая Z, являются инструментами, которые могут предоставить возможность лучше исследовать механизм репликации ДНК в различных организмах.

Ссылки

  1. ^ Кеннеди, Шон П.; Нг, Вайлап Виктор; Зальцберг, Стивен Л.; Худ, Лерой; ДасСарма, Шиладитья (2001-10-01). «Понимание адаптации вида Halobacterium NRC-1 к экстремальным условиям окружающей среды посредством вычислительного анализа последовательности его генома». Genome Research . 11 (10): 1641–1650. doi :10.1101/gr.190201. ISSN  1088-9051. PMC  311145 . PMID  11591641.
  2. ^ abcdefghi Лобри, Дж. Р. Асимметричные паттерны замещения в двух цепях ДНК бактерий. Молекулярная биология и эволюция 13, 660-665 (1996).
  3. ^ Чаргафф, Э. Химическая специфичность нуклеиновых кислот и механизм их ферментативного расщепления. Experientia 6, 201-209 (1950).
  4. ^ abcdefghijkl Нексулеа, А. и Лобри, Дж. Р. Новый метод оценки влияния репликации на асимметрию состава оснований ДНК. Молекулярная биология и эволюция 24, 2169-2179, doi:10.1093/molbev/msm148 (2007).
  5. ^ abcdefghijklmno Тиллье, Э. Р. и Коллинз, Р. А. Вклад ориентации репликации, направления генов и сигнальных последовательностей в асимметрию состава оснований в бактериальных геномах. Журнал молекулярной эволюции 50, 249-257 (2000).
  6. ^ ab Rocha, EP Организация бактериальных геномов, связанная с репликацией. Микробиология 150, 1609-1627, doi:10.1099/mic.0.26974-0 (2004).
  7. ^ Lobry, JR (май 1996). «Асимметричные шаблоны замещения в двух цепях ДНК бактерий». Молекулярная биология и эволюция . 13 (5): 660–665. doi : 10.1093/oxfordjournals.molbev.a025626 . ISSN  0737-4038. PMID  8676740.
  8. ^ "Объяснение статьи Лобри 1996 года"
  9. ^ Григорьев, А. Анализ геномов с помощью кумулятивных косых диаграмм. Nucleic Acids Research 26, 2286-2290 (1998).
  10. ^ ab Zhang, R. & Zhang, CT (Источники множественной репликации археи вида Halobacterium NRC-1. Сообщения по биохимическим и биофизическим исследованиям 302, 728-734 (2003).
  11. ^ Лобри, Дж. Р. и Суэока, Н. Асимметричное направленное мутационное давление у бактерий. Геномная биология 3, RESEARCH0058 (2002).
  12. ^ Эппингер, М., Баар, К., Раддатц, Г., Хасон, Д. Х. и Шустер, С. К. Сравнительный анализ четырех кампилобактерий. Nature Reviews. Microbiology 2, 872-885, doi:10.1038/nrmicro1024 (2004).
  13. ^ Marin, A. & Xia, X. GC skew в генах, кодирующих белки, между ведущими и отстающими цепями в бактериальных геномах: новые модели замещения, включающие смещение цепей. Журнал теоретической биологии 253, 508-513, doi:10.1016/j.jtbi.2008.04.004 (2008).
  14. ^ abcd Чарнески КА, Хонти Ф., Брайант ДЖМ, Херст ЛД, Фейл Э.Дж. Атипичный перекос АТ в геномах фирмикутов является результатом отбора, а не мутации. PLoS Genetics 7(9):e1002283 (2011).
  • Мьюз, Х. В. и др. MIPS: анализ и аннотация белков из целых геномов в 2005 г. Nucleic Acids Res 34, D169-172, doi:10.1093/nar/gkj148 (2006).
Получено с "https://en.wikipedia.org/w/index.php?title=GC_skew&oldid=1192109060"