ДНК -связывающий домен ( DBD ) — это независимо свернутый белковый домен , содержащий по крайней мере один структурный мотив , который распознает двух- или одноцепочечную ДНК . DBD может распознавать конкретную последовательность ДНК ( последовательность распознавания ) или иметь общее сродство к ДНК. [1] Некоторые ДНК-связывающие домены могут также включать нуклеиновые кислоты в своей свернутой структуре.
Один или несколько доменов связывания ДНК часто являются частью более крупного белка, состоящего из дополнительных доменов белка с отличающейся функцией. Дополнительные домены часто регулируют активность домена связывания ДНК. Функция связывания ДНК является либо структурной, либо включает регуляцию транскрипции , причем эти две роли иногда перекрываются. [ необходима цитата ]
ДНК-связывающие домены с функциями, связанными со структурой ДНК, играют биологическую роль в репликации , восстановлении , хранении и модификации ДНК, например, в метилировании . [ необходима ссылка ]
Многие белки, участвующие в регуляции экспрессии генов , содержат ДНК-связывающие домены. Например, белки, которые регулируют транскрипцию путем связывания ДНК, называются факторами транскрипции . Конечным результатом большинства клеточных сигнальных каскадов является регуляция генов. [ необходима цитата ]
DBD взаимодействует с нуклеотидами ДНК в ДНК -специфической или неспецифической последовательности, но даже неспецифическое последовательности распознавание включает в себя своего рода молекулярную комплементарность между белком и ДНК. Распознавание ДНК DBD может происходить в большой или малой бороздке ДНК или в сахарофосфатном остове ДНК (см. структуру ДНК ). Каждый конкретный тип распознавания ДНК приспособлен к функции белка. Например, ДНК-резающий фермент ДНКаза I разрезает ДНК почти случайным образом и поэтому должен связываться с ДНК неспецифическим последовательности образом. Но, даже в этом случае, ДНКаза I распознает определенную трехмерную структуру ДНК , давая несколько специфическую схему расщепления ДНК, которая может быть полезна для изучения распознавания ДНК с помощью метода, называемого ДНК-отпечатками . [ требуется цитата ]
Многие ДНК-связывающие домены должны распознавать определенные последовательности ДНК, такие как DBD факторов транскрипции , которые активируют определенные гены, или те из ферментов, которые модифицируют ДНК в определенных местах, таких как рестриктазы и теломераза . Схема водородных связей в большой бороздке ДНК менее вырожденная, чем в малой бороздке ДНК, что обеспечивает более привлекательный участок для распознавания ДНК, специфичной для последовательности . [ необходима цитата ]
Специфичность ДНК-связывающих белков можно изучать с помощью многих биохимических и биофизических методов, таких как гель-электрофорез , аналитическое ультрацентрифугирование , калориметрия , мутация ДНК , мутация или модификация структуры белка , ядерный магнитный резонанс , рентгеновская кристаллография , поверхностный плазмонный резонанс , электронный парамагнитный резонанс , сшивание и микромасштабный термофорез (МСТ).
Большая часть генов в каждом геноме кодирует ДНК-связывающие белки (см. таблицу). Однако, только довольно небольшое количество семейств белков являются ДНК-связывающими. Например, более 2000 из ~20 000 человеческих белков являются «ДНК-связывающими», включая около 750 белков с цинковыми пальцами. [3]
Разновидность | ДНК-связывающие белки [4] | ДНК-связывающие семейства [4] |
---|---|---|
Arabidopsis thaliana (кресс-салат Таля) | 4471 | 300 |
Saccharomyces cerevisiae (дрожжи) | 720 | 243 |
Caenorhabditis elegans (червь) | 2028 | 271 |
Drosophila melanogaster (плодовая мушка) | 2620 | 283 |
Первоначально обнаруженный в бактериях, мотив спираль-поворот-спираль обычно встречается в белках-репрессорах и имеет длину около 20 аминокислот. У эукариот гомеодомен состоит из 2 спиралей, одна из которых распознает ДНК (также известная как спираль распознавания). Они распространены в белках, которые регулируют процессы развития. [5]
Домен цинкового пальца в основном встречается у эукариот, но некоторые примеры были обнаружены у бактерий. [6] Домен цинкового пальца обычно имеет длину от 23 до 28 аминокислот и стабилизируется путем координации ионов цинка с регулярно расположенными остатками, координирующими цинк (гистидинами или цистеинами). Наиболее распространенный класс цинкового пальца (Cys2His2) координирует один ион цинка и состоит из спирали распознавания и 2-цепочечного бета-слоя. [7] В факторах транскрипции эти домены часто встречаются в массивах (обычно разделенных короткими линкерными последовательностями), а соседние пальцы расположены с интервалом в 3 пары оснований при связывании с ДНК.
Домен основной лейциновой молнии ( bZIP ) встречается в основном у эукариот и в ограниченной степени у бактерий. Домен bZIP содержит альфа-спираль с лейцином на каждой 7-й аминокислоте. Если две такие спирали находят друг друга, лейцины могут взаимодействовать как зубцы в молнии, что позволяет димеризовать два белка. При связывании с ДНК остатки основных аминокислот связываются с сахарофосфатным остовом, в то время как спирали располагаются в основных бороздках. Он регулирует экспрессию генов.
Домен крылатой спирали (WH) , состоящий примерно из 110 аминокислот, имеет четыре спирали и двухцепочечный бета-слой.
Домен крылатой спирали-поворота-спирали (wHTH) SCOP 46785 обычно имеет длину 85-90 аминокислот. Он образован 3-спиральным пучком и 4-тяжевым бета-слоем (крылом).
Основной домен спираль-петля-спираль (bHLH) встречается в некоторых факторах транскрипции и характеризуется двумя альфа-спиралями (α-спиралями), соединенными петлей. Одна спираль обычно меньше и из-за гибкости петли допускает димеризацию путем складывания и упаковки против другой спирали. Большая спираль обычно содержит области связывания ДНК.
Домены HMG-box обнаружены в белках группы высокой подвижности, которые участвуют в различных ДНК-зависимых процессах, таких как репликация и транскрипция. Они также изменяют гибкость ДНК, вызывая изгибы. [8] [9] Домен состоит из трех альфа-спиралей, разделенных петлями.
Домены Wor3, названные в честь непрозрачного регулятора 3 (Wor3) у Candida albicans, возникли в ходе эволюции позже, чем большинство ранее описанных доменов связывания ДНК, и ограничены небольшим числом грибов. [10]
OB -fold — это небольшой структурный мотив, первоначально названный так из-за его свойств связывания олигонуклеотида / олигосахарида . Домены OB-fold имеют длину от 70 до 150 аминокислот. [11] OB-fold связывают одноцепочечную ДНК и, следовательно, являются одноцепочечными связывающими белками . [11]
Было установлено, что белки OB-fold имеют решающее значение для репликации ДНК , рекомбинации ДНК , репарации ДНК , транскрипции , трансляции , реакции на холодовой шок и поддержания теломер . [12]
Иммуноглобулиновый домен ( InterPro : IPR013783 ) состоит из структуры бета-листа с большими соединительными петлями, которые служат для распознавания либо основных бороздок ДНК, либо антигенов. Обычно они встречаются в белках иммуноглобулинов, но также присутствуют в белках Stat цитокинового пути. Вероятно, это связано с тем, что цитокиновый путь развился относительно недавно и использовал уже функционирующие системы, а не создавал свои собственные.
B3 DBD ( InterPro : IPR003340 , SCOP 117343 ) встречается исключительно в факторах транскрипции из высших растений и эндонуклеазах рестрикции EcoRII и BfiI и обычно состоит из 100-120 остатков. Он включает семь бета-слоев и две альфа-спирали , которые образуют ДНК-связывающую псевдобочкообразную белковую складку .
Эффекторы TAL обнаружены в бактериальных фитопатогенах рода Xanthomonas и участвуют в регуляции генов растения-хозяина с целью содействия бактериальной вирулентности, пролиферации и распространению. [13] Они содержат центральную область тандемных повторов остатков 33-35, и каждая область повтора кодирует одно основание ДНК в сайте связывания TALE. [14] [15] Внутри повтора только остаток 13 напрямую контактирует с основанием ДНК, определяя специфичность последовательности, в то время как другие позиции контактируют с остовом ДНК, стабилизируя взаимодействие связывания ДНК. [16] Каждый повтор в массиве принимает форму парных альфа-спиралей, в то время как весь массив повторов образует правую суперспираль, обвивающуюся вокруг двойной спирали ДНК. Было показано, что массивы эффекторных повторов TAL сокращаются при связывании ДНК, и был предложен механизм поиска с двумя состояниями, при котором удлиненный TALE начинает сокращаться вокруг ДНК, начиная с успешного распознавания тимина с уникальной повторяющейся единицы N-конца массива эффекторных повторов TAL. [17] Связанные белки обнаружены в бактериальном патогене растений Ralstonia solanacearum , [18] грибковом эндосимбионте Burkholderia rhizoxinica [19] и двух пока еще не идентифицированных морских микроорганизмах. [20] Код связывания ДНК и структура массива повторов сохраняются между этими группами, которые вместе называются TALE-подобными .