GC-контент

Процент гуанина и цитозина в молекулах ДНК или РНК
Нуклеотидные связи, показывающие пары AT и GC. Стрелки указывают на водородные связи .

В молекулярной биологии и генетике содержание GC (или содержание гуанина-цитозина ) — это процент азотистых оснований в молекуле ДНК или РНК , которые являются либо гуанином (G), либо цитозином (C). [1] Эта мера указывает на долю оснований G и C из предполагаемых четырех общих оснований, включая также аденин и тимин в ДНК и аденин и урацил в РНК.

Содержание GC может быть дано для определенного фрагмента ДНК или РНК или для всего генома . Когда это относится к фрагменту, это может обозначать содержание GC отдельного гена или части гена (домена), группы генов или кластеров генов, некодирующей области или синтетического олигонуклеотида , такого как праймер .

Структура

Качественно, гуанин (G) и цитозин (C) подвергаются специфическому водородному связыванию друг с другом, тогда как аденин (A) связывается специфически с тимином (T) в ДНК и с урацилом (U) в РНК. Количественно, каждая пара оснований GC удерживается вместе тремя водородными связями, тогда как пары оснований AT и AU удерживаются вместе двумя водородными связями. Чтобы подчеркнуть это различие, пары оснований часто представляются как «G≡C» вместо «A=T» или «A=U».

ДНК с низким содержанием GC менее стабильна, чем ДНК с высоким содержанием GC; однако водородные связи сами по себе не оказывают особенно значительного влияния на молекулярную стабильность, которая вместо этого обусловлена ​​в основном молекулярными взаимодействиями укладки оснований. [2] Несмотря на более высокую термостабильность, присущую нуклеиновой кислоте с высоким содержанием GC, было замечено, что по крайней мере некоторые виды бактерий с ДНК с высоким содержанием GC легче подвергаются автолизу , тем самым сокращая продолжительность жизни клетки как таковой . [3] Из-за термостабильности пар GC когда-то предполагалось, что высокое содержание GC является необходимой адаптацией к высоким температурам, но эта гипотеза была опровергнута в 2001 году. [4] Тем не менее, было показано, что существует сильная корреляция между оптимальным ростом прокариот при более высоких температурах и содержанием GC структурных РНК, таких как рибосомальная РНК , транспортная РНК и многие другие некодирующие РНК . [4] [5] Пары оснований AU менее стабильны, чем пары оснований GC, что делает структуры РНК с высоким содержанием GC более устойчивыми к воздействию высоких температур.

Совсем недавно было показано, что наиболее важным фактором, способствующим термической стабильности двухцепочечных нуклеиновых кислот, на самом деле является укладка соседних оснований, а не количество водородных связей между основаниями. Для пар GC существует более благоприятная энергия укладки, чем для пар AT или AU из-за относительного положения экзоциклических групп. Кроме того, существует корреляция между порядком, в котором укладываются основания, и термической стабильностью молекулы в целом. [6]

Определение

Схематическая кариограмма человека, показывающая обзор генома человека с помощью G-бэндинга (включая окрашивание по Гимзе ), где области, богатые GC, более светлые, а области, бедные GC, более темные.

Содержание GC обычно выражается в процентах, но иногда в виде отношения (называемого отношением G+C или отношением GC ). Процент содержания GC рассчитывается как [7]

Г + С А + Т + Г + С × 100 % {\displaystyle {\cfrac {G+C}{A+T+G+C}}\times 100\%}

тогда как соотношение AT/GC рассчитывается как [8]

А + Т Г + С {\displaystyle {\cfrac {A+T}{G+C}}} .

Процент содержания GC, а также GC-соотношение можно измерить несколькими способами, но одним из самых простых методов является измерение температуры плавления двойной спирали ДНК с помощью спектрофотометрии . Поглощение ДНК на длине волны 260 нм довольно резко увеличивается, когда двухцепочечная молекула ДНК разделяется на две одинарные нити при достаточном нагревании. [9] Наиболее часто используемый протокол для определения GC-соотношений использует проточную цитометрию для большого количества образцов. [10]

Альтернативным способом является то, что если исследуемая молекула ДНК или РНК надежно секвенирована , то содержание ГЦ можно точно рассчитать с помощью простых арифметических действий или с помощью различных общедоступных программных инструментов, таких как бесплатный онлайн-калькулятор ГЦ.

Геномное содержание

Внутригеномная вариация

Обнаружено, что соотношение GC в геноме заметно варьируется. Эти вариации соотношения GC в геномах более сложных организмов приводят к образованию мозаично-подобных образований с островковыми областями, называемыми изохорами . [11] Это приводит к вариациям в интенсивности окрашивания хромосом . [12] Богатые GC изохоры обычно включают в себя множество генов, кодирующих белки, и, таким образом, определение соотношений GC этих конкретных областей способствует картированию богатых генами областей генома. [13] [14]

Кодирующие последовательности

В пределах длинной области геномной последовательности гены часто характеризуются более высоким содержанием GC по сравнению с фоновым содержанием GC для всего генома. [15] Имеются данные о том, что длина кодирующей области гена прямо пропорциональна более высокому содержанию G+C. [16] Это указывает на тот факт, что стоп-кодон имеет смещение в сторону нуклеотидов A и T, и , таким образом, чем короче последовательность, тем выше смещение AT. [17]

Сравнение более 1000 ортологичных генов у млекопитающих показало выраженные внутригеномные вариации содержания GC в третьей позиции кодона с диапазоном от менее 30% до более 80%. [18]

Внутригеномная вариация

Содержание GC, как выяснилось, варьируется в зависимости от организма, и предполагается, что этот процесс обусловлен вариациями в отборе , мутационными смещениями и смещенной рекомбинационной репарацией ДНК . [19]

Среднее содержание GC в геномах человека колеблется от 35% до 60% по фрагментам размером 100 Кб, со средним значением 41%. [20] Содержание GC у дрожжей ( Saccharomyces cerevisiae ) составляет 38%, [21] а у другого распространенного модельного организма , кресс-салата Таля ( Arabidopsis thaliana ), — ​​36%. [22] Из-за природы генетического кода практически невозможно, чтобы организм имел геном с содержанием GC, приближающимся либо к 0%, либо к 100%. Однако видом с чрезвычайно низким содержанием GC является Plasmodium falciparum (GC% = ~20%), [23] и обычно такие примеры называют AT-богатыми, а не GC-бедными. [24]

Несколько видов млекопитающих (например, землеройка , микроб , тенрек , кролик ) независимо друг от друга претерпели заметное увеличение содержания GC в своих генах. Эти изменения содержания GC коррелируют с особенностями жизненного цикла вида (например, массой тела или продолжительностью жизни) и размером генома [ 18] и могут быть связаны с молекулярным явлением, называемым GC-смещенной генной конверсией [25] .

Приложения

Молекулярная биология

В экспериментах с полимеразной цепной реакцией (ПЦР) содержание GC коротких олигонуклеотидов, известных как праймеры, часто используется для прогнозирования их температуры отжига с шаблонной ДНК. Более высокий уровень содержания GC указывает на относительно более высокую температуру плавления.

Многие технологии секвенирования, такие как секвенирование Illumina , имеют проблемы с чтением последовательностей с высоким содержанием GC. Известно, что геномы птиц имеют много таких частей, что приводит к проблеме «отсутствующих генов», которые, как ожидается, присутствуют в ходе эволюции и фенотипа, но никогда не секвенировались — пока не были использованы улучшенные методы. [26]

Систематика

Проблема видов в неэукариотической таксономии привела к различным предложениям по классификации бактерий, и специальный комитет по согласованию подходов к бактериальной систематике 1987 года рекомендовал использовать GC-соотношения в иерархической классификации более высокого уровня. [27] Например, Actinomycetota характеризуются как « бактерии с высоким содержанием GC ». [28] У Streptomyces coelicolor A3(2) содержание GC составляет 72%. [29] С использованием более надежных современных методов молекулярной систематики определение GC-содержания Actinomycetota было отменено, и были обнаружены бактерии с низким содержанием GC этой клады . [30]

Программные инструменты

GCSpeciesSorter [31] и TopSort [32] — это программные инструменты для классификации видов на основе их GC-содержания.

Смотрите также

Ссылки

  1. ^ Определение GC – содержание CancerWeb Ньюкаслского университета , Великобритания
  2. ^ Яковчук П., Протозанова Е., Франк-Каменецкий М.Д. (2006). "Вклад стэкинга и спаривания оснований в термическую стабильность двойной спирали ДНК". Nucleic Acids Res . 34 (2): 564–74 . doi :10.1093/nar/gkj454. PMC  1360284. PMID  16449200 .
  3. ^ Левин Р.Э., Ван Сикл С. (1976). «Аутолиз изолятов Pseudomonas putrefaciens с высоким содержанием GC». Антони ван Левенгук . 42 ( 1–2 ): 145–55 . doi :10.1007/BF00399459. PMID  7999. S2CID  9960732.
  4. ^ ab Hurst LD, Merchant AR (март 2001 г.). «Высокое содержание гуанина-цитозина не является адаптацией к высокой температуре: сравнительный анализ среди прокариот». Proc. Biol. Sci . 268 (1466): 493– 7. doi :10.1098/rspb.2000.1397. PMC 1088632. PMID  11296861 . 
  5. ^ Гэлтье, Н.; Лобри, Дж. Р. (1997). «Связь между содержанием геномных G+C, вторичными структурами РНК и оптимальной температурой роста у прокариот». Журнал молекулярной эволюции . 44 (6): 632– 636. Bibcode : 1997JMolE..44..632G. doi : 10.1007/PL00006186. PMID  9169555. S2CID  19054315.
  6. ^ Яковчук, Питер; Протозанова, Екатерина; Франк-Каменецкий, Максим Д. (2006). "Вклад стэкинга и спаривания оснований в термическую стабильность двойной спирали ДНК". Nucleic Acids Research . 34 (2): 564– 574. doi :10.1093/nar/gkj454. ISSN  0305-1048. PMC 1360284. PMID 16449200  . 
  7. ^ Madigan, MT. и Martinko JM. (2003). Биология микроорганизмов Брока (10-е изд.). Pearson-Prentice Hall. ISBN 978-84-205-3679-8.
  8. ^ "Определение GC-ratio в Северо-Западном университете, Иллинойс, США". Архивировано из оригинала 20 июня 2010 г. Получено 11 июня 2007 г.
  9. ^ Wilhelm J, Pingoud A, Hahn M (май 2003 г.). "Метод оценки размеров генома на основе ПЦР в реальном времени". Nucleic Acids Res . 31 (10): e56. doi :10.1093/nar/gng056. PMC 156059. PMID  12736322 . 
  10. ^ Виноградов А.Е. (май 1994). «Измерение методом проточной цитометрии соотношения геномных AT/GC и размера генома». Цитометрия . 16 (1): 34– 40. doi : 10.1002/cyto.990160106 . PMID  7518377.
  11. ^ Бернарди Г. (январь 2000 г.). «Изохоры и эволюционная геномика позвоночных». Gene . 241 (1): 3– 17. doi :10.1016/S0378-1119(99)00485-0. PMID  10607893.
  12. ^ Furey TS, Haussler D (май 2003). «Интеграция цитогенетической карты с проектом последовательности генома человека». Hum. Mol. Genet . 12 (9): 1037– 44. doi : 10.1093/hmg/ddg113 . PMID  12700172.
  13. ^ Sumner AT, de la Torre J, Stuppia L (август 1993). «Распределение генов на хромосомах: цитологический подход». J. Mol. Evol . 37 (2): 117– 22. Bibcode :1993JMolE..37..117S. doi :10.1007/BF02407346. PMID  8411200. S2CID  24677431.
  14. ^ Aïssani B, Bernardi G (октябрь 1991 г.). «CpG-островки, гены и изохоры в геномах позвоночных». Gene . 106 (2): 185–95 . doi :10.1016/0378-1119(91)90198-K. PMID  1937049.
  15. ^ Romiguier J, Roux C (2017). «Аналитические смещения, связанные с содержанием GC в молекулярной эволюции». Front Genet . 8 : 16. doi : 10.3389/fgene.2017.00016 . PMC 5309256. PMID  28261263 . 
  16. ^ Pozzoli U, Menozzi G, Fumagalli M и др. (2008). «Как селективные, так и нейтральные процессы управляют эволюцией содержания GC в геноме человека». BMC Evol. Biol . 8 (1): 99. Bibcode :2008BMCEE...8...99P. doi : 10.1186/1471-2148-8-99 . PMC 2292697 . PMID  18371205. 
  17. ^ Wuitschick JD, Karrer KM (1999). "Анализ содержания геномных G + C, использования кодонов, контекста инициирующего кодона и сайтов терминации трансляции в Tetrahymena thermophila ". J. Eukaryot. Microbiol . 46 (3): 239– 47. doi :10.1111/j.1550-7408.1999.tb05120.x. PMID  10377985. S2CID  28836138.
  18. ^ ab Romiguier, Jonathan; Ranwez, Vincent; Douzery, Emmanuel JP; Galtier, Nicolas (1 августа 2010 г.). «Контрастная динамика содержания GC в 33 геномах млекопитающих: связь с признаками жизненного цикла и размерами хромосом». Genome Research . 20 (8): 1001– 1009. doi :10.1101/gr.104372.109. ISSN  1088-9051. PMC 2909565 . PMID  20530252. 
  19. ^ Birdsell JA (1 июля 2002 г.). «Интеграция геномики, биоинформатики и классической генетики для изучения эффектов рекомбинации на эволюцию генома». Mol. Biol. Evol . 19 (7): 1181– 97. CiteSeerX 10.1.1.337.1535 . doi :10.1093/oxfordjournals.molbev.a004176. PMID  12082137. 
  20. ^ Международный консорциум по секвенированию генома человека (февраль 2001 г.). «Первоначальное секвенирование и анализ генома человека». Nature . 409 (6822): 860– 921. Bibcode :2001Natur.409..860L. doi : 10.1038/35057062 . hdl : 2027.42/62798 . PMID  11237011.(страница 876)
  21. ^ Данные о полном геноме Saccharomyces cerevisiae на NCBI
  22. ^ Данные о полном геноме Arabidopsis thaliana на NCBI
  23. ^ Данные о полном геноме Plasmodium falciparum на NCBI
  24. ^ Мусто Х, Каччио С, Родригес-Маседа Х, Бернарди Г (1997). «Композиционные ограничения в чрезвычайно бедном GC геноме Plasmodium falciparum» (PDF) . Mem. Inst. Oswaldo Cruz . 92 (6): 835– 41. doi : 10.1590/S0074-02761997000600020 . PMID  9566216.
  25. ^ Дюре Л., Галтье Н. (2009). «Предвзятая конверсия генов и эволюция геномных ландшафтов млекопитающих». Анну Рев Геном Хум Генет . 10 : 285–311 . doi : 10.1146/annurev-genom-082908-150001. PMID  19630562. S2CID  9126286.
  26. ^ Huttener R, Thorrez L, Veld TI и др. (2021). «Секвенирование рефрактерных областей в геномах птиц — это горячие точки для ускоренной эволюции белков». BMC Ecol Evol . 21 (176): 176. doi : 10.1186/s12862-021-01905-7 . PMC 8449477. PMID  34537008 . 
  27. ^ Уэйн LG; и др. (1987). «Отчет специального комитета по согласованию подходов к бактериальной систематике». Международный журнал систематической бактериологии . 37 (4): 463– 4. doi : 10.1099/00207713-37-4-463 .
  28. ^ Браузер таксономии на NCBI
  29. ^ Данные о полном геноме Streptomyces coelicolor A3(2) на NCBI
  30. ^ Ghai R, McMahon KD, Rodriguez-Valera F (2012). «Нарушение парадигмы: космополитичные и многочисленные пресноводные актинобактерии имеют низкий GC». Environmental Microbiology Reports . 4 (1): 29– 35. Bibcode : 2012EnvMR...4...29G. doi : 10.1111/j.1758-2229.2011.00274.x. PMID  23757226.
  31. ^ Карими К, Вуитчик Д, Олдах М, Визе П (2018). «Различение видов с использованием содержания GC в смешанных последовательностях ДНК или РНК». Evol Bioinform Online . 14 (1 января 2018 г.): 1176934318788866. doi :10.1177/1176934318788866. PMC 6052495. PMID  30038485 . 
  32. ^ Lehnert E, Mouchka M, Burriesci M, Gallo N, Schwarz J, Pringle J (2014). «Обширные различия в экспрессии генов между симбиотическими и апосимбиотическими книдариями». G3 (Bethesda) . 4 (2): 277–95 . doi :10.1534/g3.113.009084. PMC 3931562. PMID  24368779. 
  1. Таблица с GC-содержанием всех секвенированных прокариот
  2. Таксономический браузер бактерий на основе соотношения GC на сайте NCBI.
  3. Соотношение ГЦ у разных видов.

Retrieved from "https://en.wikipedia.org/w/index.php?title=GC-content&oldid=1254906757"