В генетике промотор — это последовательность ДНК , с которой связываются белки, чтобы инициировать транскрипцию одного транскрипта РНК из ДНК ниже промотора. Транскрипт РНК может кодировать белок ( мРНК ) или может иметь функцию сам по себе, например, тРНК или рРНК . Промоторы расположены вблизи мест начала транскрипции генов, выше по течению на ДНК (по направлению к 5'-области смысловой цепи ). Промоторы могут быть длиной около 100–1000 пар оснований , последовательность которых сильно зависит от гена и продукта транскрипции, типа или класса РНК-полимеразы, привлеченной к сайту, и вида организма. [1] [2]
Для осуществления транскрипции фермент, синтезирующий РНК, известный как РНК-полимераза , должен прикрепиться к ДНК вблизи гена. Промоторы содержат определенные последовательности ДНК, такие как элементы ответа , которые обеспечивают безопасный начальный сайт связывания для РНК-полимеразы и для белков, называемых факторами транскрипции , которые рекрутируют РНК-полимеразу. Эти факторы транскрипции имеют определенные активаторные или репрессорные последовательности соответствующих нуклеотидов, которые прикрепляются к определенным промоторам и регулируют экспрессию генов. [ необходима цитата ]
Промоторы представляют собой критические элементы, которые могут работать совместно с другими регуляторными областями ( энхансерами , сайленсерами , граничными элементами/ изоляторами ) для управления уровнем транскрипции данного гена. Промотор индуцируется в ответ на изменения в избытке или конформации регуляторных белков в клетке, что позволяет активировать факторы транскрипции для привлечения РНК-полимеразы. [3] [4]
Учитывая короткие последовательности большинства элементов промотора, промоторы могут быстро эволюционировать из случайных последовательностей. Например, в E. coli ~60% случайных последовательностей могут эволюционировать до уровней экспрессии, сопоставимых с диким типом промотора lac с одной мутацией, и что ~10% случайных последовательностей могут служить активными промоторами даже без эволюции. [5]
Поскольку промоторы обычно непосредственно примыкают к рассматриваемому гену, позиции в промоторе обозначаются относительно сайта начала транскрипции , где начинается транскрипция ДНК для конкретного гена (т. е. позиции выше по течению представляют собой отрицательные числа, отсчитываемые в обратном порядке от -1, например, -100 представляет собой позицию на 100 пар оснований выше по течению). [ необходима ссылка ]
У бактерий промотор содержит два коротких элемента последовательности, расположенных примерно в 10 ( Pribnow Box ) и 35 нуклеотидах выше места начала транскрипции . [2]
Вышеуказанные промоторные последовательности распознаются только голоферментом РНК-полимеразы, содержащим сигма-70 . Холоферменты РНК-полимеразы, содержащие другие сигма-факторы, распознают различные основные промоторные последовательности.
← вверх по течению вниз по течению →5'-XXXXXXXXXPPPPPPXXXXXXPPPPPPXXXXGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGXXXX-3' -35 -10 Ген, который будет транскрибирован
для последовательности -10 ТАТААТ77% 76% 60% 61% 56% 82%
для последовательности -35 ТТГАСА69% 79% 61% 56% 54% 54%
Промоторы могут быть очень близко расположены в ДНК. Такие «близко расположенные промоторы» наблюдались в ДНК всех форм жизни, от людей [8] до прокариот [9] и являются высококонсервативными. [10] Следовательно, они могут обеспечивать некоторые (в настоящее время неизвестные) преимущества. Эти пары промоторов могут быть расположены в расходящихся, тандемных и сходящихся направлениях. Они также могут регулироваться факторами транскрипции и различаться по различным признакам, таким как расстояние между нуклеотидами, сила двух промоторов и т. д. Наиболее важным аспектом двух близко расположенных промоторов является то, что они, скорее всего, будут мешать друг другу. Несколько исследований изучали это с использованием как аналитических, так и стохастических моделей. [11] [12] [13] Существуют также исследования, в которых измерялась экспрессия генов в синтетических генах или от одного до нескольких генов, контролируемых двунаправленными промоторами. [14]
Совсем недавно одно исследование измерило большинство генов, контролируемых тандемными промоторами в E. coli . [15] В этом исследовании были измерены две основные формы помех. Одна из них — когда РНК-полимераза находится на нисходящем промоторе, блокируя движение РНК-полимераз, удлиняющихся от восходящего промотора. Другая — когда два промотора расположены так близко, что когда РНК-полимераза находится на одном из промоторов, она блокирует любую другую РНК-полимеразу от достижения другого промотора. Эти события возможны, поскольку РНК-полимераза занимает несколько нуклеотидов при связывании с ДНК, в том числе в местах начала транскрипции. Аналогичные события происходят, когда промоторы находятся в расходящихся и сходящихся формациях. Возможные события также зависят от расстояния между ними.
Промоторы генов обычно располагаются выше гена и могут иметь регуляторные элементы, находящиеся на расстоянии нескольких килобаз от места начала транскрипции (энхансеры). У эукариот транскрипционный комплекс может заставить ДНК согнуться, что позволяет размещать регуляторные последовательности далеко от фактического места транскрипции. Эукариотические РНК-полимераза-II-зависимые промоторы могут содержать ТАТА-бокс ( консенсусная последовательность TATAAA), который распознается общим фактором транскрипции TATA-связывающим белком (TBP); и элемент распознавания B (BRE), который распознается общим фактором транскрипции TFIIB . [16] [17] [18] Элемент TATA и BRE обычно располагаются близко к месту начала транскрипции (обычно в пределах 30–40 пар оснований).
Регуляторные последовательности эукариотических промоторов обычно связывают белки, называемые факторами транскрипции, которые участвуют в формировании транскрипционного комплекса. Примером является E-box (последовательность CACGTG), который связывает факторы транскрипции в основном семействе спираль-петля-спираль (bHLH) (например, BMAL1-Clock , cMyc ). [19] Некоторые промоторы, на которые нацелены множественные факторы транскрипции, могут достигать гиперактивного состояния, что приводит к повышенной транскрипционной активности. [20]
Этот раздел может потребовать очистки для соответствия стандартам качества Википедии . Конкретная проблема: текст о млекопитающих часто дублируется среди использований одной и той же картинки — можем ли мы сделать «каноническую» версию и перенаправлять людей туда? ( Сентябрь 2021 г. ) |
Повышенная экспрессия генов у млекопитающих инициируется, когда сигналы передаются на промоторы, связанные с генами. Последовательности ДНК промотора могут включать различные элементы, такие как CpG-островки (присутствуют примерно в 70% промоторов), TATA-бокс (присутствуют примерно в 24% промоторов), инициатор (Inr) (присутствуют примерно в 49% промоторов), элементы распознавания TFIIB выше и ниже по течению (BREu и BREd) (присутствуют примерно в 22% промоторов) и элемент промотора ниже по течению (DPE) (присутствуют примерно в 12% промоторов). [22] Наличие нескольких метилированных сайтов CpG в CpG-островках промоторов вызывает стабильное подавление генов. [23] Однако присутствие или отсутствие других элементов оказывает относительно небольшое влияние на экспрессию генов в экспериментах. [24] Две последовательности, TATA-бокс и Inr, вызвали небольшое, но значительное увеличение экспрессии (увеличение на 45% и 28% соответственно). Элементы BREu и BREd значительно снизили экспрессию на 35% и 20% соответственно, а элемент DPE не оказал никакого обнаруженного эффекта на экспрессию. [24]
Цис-регуляторные модули , локализованные в областях ДНК, удаленных от промоторов генов, могут оказывать очень большое влияние на экспрессию генов, при этом некоторые гены подвергаются 100-кратному увеличению экспрессии из-за такого цис-регуляторного модуля. [25] Эти цис-регуляторные модули включают энхансеры , сайленсеры , инсуляторы и элементы привязки. [26] Среди этого созвездия элементов энхансеры и связанные с ними факторы транскрипции играют ведущую роль в регуляции экспрессии генов. [27]
Энхансеры — это области генома, которые являются основными элементами регуляции генов. Энхансеры контролируют программы экспрессии генов, специфичные для типа клеток, чаще всего, прокладывая петли на больших расстояниях, чтобы физически приблизиться к промоторам своих целевых генов. [28] В исследовании нейронов коры головного мозга было обнаружено 24 937 петель, которые приводят энхансеры к промоторам. [25] Множественные энхансеры, каждый из которых часто находится на расстоянии десятков или сотен тысяч нуклеотидов от своих целевых генов, прокладывают петли к своим промоторам целевых генов и координируют друг с другом, чтобы контролировать экспрессию своего общего целевого гена. [28]
Схематическая иллюстрация в этом разделе показывает энхансер, образующий петлю, чтобы приблизиться к промотору целевого гена. Петля стабилизируется димером соединительного белка (например, димером CTCF или YY1 ), при этом один член димера прикреплен к своему связывающему мотиву на энхансере, а другой член прикреплен к своему связывающему мотиву на промоторе (представлен красными зигзагами на иллюстрации). [29] Несколько факторов транскрипции, специфичных для клеточных функций (в человеческой клетке насчитывается около 1600 факторов транскрипции [30] ), обычно связываются со специфическими мотивами на энхансере [31] , и небольшая комбинация этих связанных с энхансером факторов транскрипции, когда они приближаются к промотору с помощью петли ДНК, регулируют уровень транскрипции целевого гена. Медиатор (коактиватор) (комплекс, обычно состоящий из около 26 белков во взаимодействующей структуре) передает регуляторные сигналы от факторов транскрипции, связанных с ДНК-энхансером, непосредственно ферменту РНК-полимеразе II (pol II), связанному с промотором. [32]
Активные энхансеры обычно транскрибируются с обеих цепей ДНК с помощью РНК-полимераз, действующих в двух разных направлениях, производя две эРНК, как показано на рисунке. [33] Неактивный энхансер может быть связан с неактивным фактором транскрипции. Фосфорилирование фактора транскрипции может активировать его, а активированный фактор транскрипции может затем активировать энхансер, с которым он связан (см. маленькую красную звездочку, представляющую фосфорилирование фактора транскрипции, связанного с энхансером на рисунке). [34] Активированный энхансер начинает транскрипцию своей РНК перед активацией промотора для инициирования транскрипции информационной РНК с его целевого гена. [35]
Двунаправленные промоторы — это короткие (<1 кбн) межгенные области ДНК между 5'-концами генов в двунаправленной паре генов. [36] «Двунаправленная пара генов» относится к двум соседним генам, закодированным на противоположных цепях, с их 5'-концами, ориентированными друг на друга. [37] Два гена часто функционально связаны, и модификация их общей промотерной области позволяет им совместно регулироваться и, таким образом, совместно экспрессироваться. [38] Двунаправленные промоторы являются общей чертой геномов млекопитающих . [39] Около 11% человеческих генов являются двунаправленно парными. [36]
Двунаправленно спаренные гены в базе данных Gene Ontology разделяли по крайней мере одну назначенную базой данных функциональную категорию со своими партнерами в 47% случаев. [40] Анализ микрочипов показал, что двунаправленно спаренные гены коэкспрессируются в более высокой степени, чем случайные гены или соседние однонаправленные гены. [36] Хотя коэкспрессия не обязательно указывает на корегуляцию, было показано, что метилирование двунаправленных промоторных областей снижает регуляцию обоих генов, а деметилирование повышает регуляцию обоих генов. [41] Однако из этого правила есть исключения. В некоторых случаях (около 11%) экспрессируется только один ген из двунаправленной пары. [36] В этих случаях промотор участвует в подавлении неэкспрессированного гена. Механизмом, лежащим в основе этого, может быть конкуренция за те же полимеразы или модификация хроматина . Дивергентная транскрипция может смещать нуклеосомы для повышения регуляции транскрипции одного гена или удалять связанные факторы транскрипции для снижения регуляции транскрипции одного гена. [42]
Некоторые функциональные классы генов с большей вероятностью будут двунаправленно спаренными, чем другие. Гены, вовлеченные в репарацию ДНК, в пять раз чаще регулируются двунаправленными промоторами, чем однонаправленными. Шаперонные белки в три раза чаще, а митохондриальные гены — более чем в два раза чаще. Многие основные гены домашнего хозяйства и клеточного метаболизма регулируются двунаправленными промоторами. [36] Чрезмерное представительство двунаправленно спаренных генов репарации ДНК связывает эти промоторы с раком . Сорок пять процентов соматических онкогенов человека , по-видимому, регулируются двунаправленными промоторами — значительно больше, чем гены, не вызывающие рак. Гиперметилирование промоторов между парами генов WNT9A /CD558500, CTDSPL /BC040563 и KCNK15 /BF195580 было связано с опухолями. [41]
Определенные характеристики последовательности были обнаружены в двунаправленных промоторах, включая отсутствие боксов TATA , обилие CpG-островков и симметрию вокруг средней точки доминирующих Cs и As с одной стороны и Gs и Ts с другой. Недавно было показано, что мотив с консенсусной последовательностью TCTCGCGAGA, также называемый элементом CGCG, управляет двунаправленной транскрипцией, управляемой PolII, в CpG-островках. [43] Боксы CCAAT являются обычным явлением, поскольку они присутствуют во многих промоторах, в которых отсутствуют боксы TATA. Кроме того, мотивы NRF-1, GABPA , YY1 и ACTACAnnTCCC представлены в двунаправленных промоторах со значительно более высокой частотой, чем в однонаправленных промоторах. Отсутствие боксов TATA в двунаправленных промоторах предполагает, что боксы TATA играют роль в определении направленности промоторов, но контрпримеры двунаправленных промоторов действительно обладают боксами TATA, а однонаправленные промоторы без них указывают на то, что они не могут быть единственным фактором. [44]
Хотя термин «двунаправленный промотор» относится конкретно к промоторным областям генов, кодирующих мРНК , анализы люциферазы показали, что более половины человеческих генов не имеют сильного направленного смещения. Исследования показывают, что некодирующие РНК часто связаны с промоторными областями генов, кодирующих мРНК. Была выдвинута гипотеза, что набор и инициация РНК-полимеразы II обычно начинаются двунаправленно, но расходящаяся транскрипция останавливается на контрольной точке позже во время элонгации. Возможные механизмы, лежащие в основе этой регуляции, включают последовательности в промоторной области, модификацию хроматина и пространственную ориентацию ДНК. [42]
Субгеномный промотор — это промотор, добавляемый к вирусу для определенного гетерологичного гена, что приводит к образованию мРНК только для этого гена. Многие вирусы РНК с положительным смыслом производят эти субгеномные мРНК (sgRNA) в качестве одного из распространенных методов инфицирования, используемых этими вирусами, и обычно транскрибируют поздние вирусные гены. Субгеномные промоторы варьируются от 24 нуклеотидов ( вирус Синдбис ) до более чем 100 нуклеотидов ( вирус некротического желтого венозного свеклы ) и обычно находятся выше начала транскрипции. [45]
Разработано множество алгоритмов для облегчения обнаружения промоторов в геномной последовательности, а предсказание промотора является общим элементом многих методов предсказания генов . Промоторная область расположена перед консенсусными последовательностями -35 и -10. Чем ближе промоторная область к консенсусным последовательностям, тем чаще будет происходить транскрипция этого гена. Для промоторных областей не существует установленного шаблона, как для консенсусных последовательностей.
Инициация транскрипции представляет собой многоступенчатый последовательный процесс, включающий несколько механизмов: локализацию промотора, первоначальное обратимое связывание РНК-полимеразы, конформационные изменения в РНК-полимеразе, конформационные изменения в ДНК, связывание нуклеозидтрифосфата (NTP) с функциональным комплексом РНК-полимераза-промотор и непродуктивную и продуктивную инициацию синтеза РНК. [46] [2]
Процесс связывания промотора имеет решающее значение для понимания процесса экспрессии генов. Настройка синтетических генетических систем основана на точно спроектированных синтетических промоторах с известными уровнями скоростей транскрипции. [2]
Хотя РНК-полимераза голофермента проявляет высокое сродство к неспецифическим участкам ДНК, эта характеристика не позволяет нам прояснить процесс локализации промотора. [47] Этот процесс локализации промотора был приписан структуре голофермента к ДНК и сигма 4 к ДНК комплексам. [48]
Большинство заболеваний имеют гетерогенную природу, что означает, что одно «заболевание» часто представляет собой множество различных заболеваний на молекулярном уровне, хотя проявляющиеся симптомы и реакция на лечение могут быть идентичны. То, как заболевания различного молекулярного происхождения реагируют на лечение, частично рассматривается в дисциплине фармакогеномики .
Здесь не перечислены многие виды рака, включающие аберрантную транскрипционную регуляцию из-за создания химерных генов посредством патологической хромосомной транслокации . Важно отметить, что вмешательство в количество или структуру белков, связанных с промотором, является одним из ключей к лечению заболевания без воздействия на экспрессию неродственных генов, разделяющих элементы с целевым геном. [49] Некоторые гены, изменение которых нежелательно, способны влиять на потенциал клетки стать раковой. [50]
У людей около 70% промоторов, расположенных вблизи места начала транскрипции гена (проксимальные промоторы), содержат островок CpG . [51] [52] Островки CpG обычно имеют длину от 200 до 2000 пар оснований, содержат пары оснований C: G >50% и имеют области ДНК , где за нуклеотидом цитозина следует нуклеотид гуанина , и это часто происходит в линейной последовательности оснований вдоль направления 5' → 3' .
Дистальные промоторы также часто содержат CpG-островки, такие как промотор гена репарации ДНК ERCC1 , где промотор, содержащий CpG-островок, расположен примерно на 5400 нуклеотидов выше кодирующей области гена ERCC1 . [53] CpG-островки также часто встречаются в промоторах для функциональных некодирующих РНК, таких как микроРНК .
У людей метилирование ДНК происходит в 5'-положении пиримидинового кольца остатков цитозина в CpG-сайтах с образованием 5-метилцитозинов . Наличие множественных метилированных CpG-сайтов в CpG-островках промоторов вызывает стабильное подавление генов. [23] Подавление гена может быть инициировано другими механизмами, но за этим часто следует метилирование CpG-сайтов в CpG-островке промотора, что вызывает стабильное подавление гена. [23]
Как правило, при прогрессировании рака сотни генов подавляются или активируются . Хотя подавление некоторых генов при раке происходит в результате мутации, большая часть канцерогенного подавления генов является результатом измененного метилирования ДНК (см. Метилирование ДНК при раке ). Метилирование ДНК, вызывающее подавление при раке, обычно происходит в нескольких сайтах CpG на островах CpG , которые присутствуют в промоторах генов, кодирующих белки.
Измененная экспрессия микроРНК также подавляет или активирует многие гены при прогрессировании рака (см. микроРНК при раке ). Измененная экспрессия микроРНК происходит посредством гипер/гипометилирования участков CpG в CpG-островках в промоторах, контролирующих транскрипцию микроРНК .
Подавление активности генов репарации ДНК посредством метилирования CpG-островков в их промоторах, по-видимому, особенно важно при прогрессировании рака (см. метилирование генов репарации ДНК при раке ).
Использование термина каноническая последовательность для обозначения промотора часто проблематично и может привести к недопониманию последовательностей промотора. Канонический подразумевает идеальный, в некотором смысле.
В случае сайта связывания фактора транскрипции может быть одна последовательность, которая связывает белок наиболее сильно в определенных клеточных условиях. Это можно назвать каноническим.
Однако естественный отбор может благоприятствовать менее энергичному связыванию как способу регулирования транскрипционного выхода. В этом случае мы можем назвать наиболее распространенную последовательность в популяции последовательностью дикого типа. Она может даже не быть самой выгодной последовательностью в преобладающих условиях.
Последние данные также указывают на то, что несколько генов (включая протоонкоген c-myc ) имеют мотивы G-квадруплекса в качестве потенциальных регуляторных сигналов.
Промоторы являются важными элементами регуляции генов, используемыми при настройке синтетически разработанных генетических цепей и метаболических сетей . Например, для сверхэкспрессии важного гена в сети, чтобы обеспечить более высокую выработку целевого белка, синтетические биологи разрабатывают промоторы для повышения его экспрессии . Автоматизированные алгоритмы могут использоваться для проектирования нейтральной ДНК или инсуляторов, которые не запускают экспрессию генов нижестоящих последовательностей. [54] [2]
Некоторые случаи многих генетических заболеваний связаны с изменениями в промоторах или факторах транскрипции.
Вот несколько примеров:
Некоторые промоторы называются конститутивными, поскольку они активны в любых условиях в клетке, в то время как другие регулируются , становясь активными в клетке только в ответ на определенные стимулы.
Тканеспецифический промотор — это промотор, который активен только в определенных типах клеток.
Когда некоторые авторы ссылаются на промотор, то на самом деле имеют в виду промотор + оператор ; т. е. промотор lac является индуцируемым IPTG, что означает, что помимо промотора lac присутствует также оперон lac . Если бы оператор lac отсутствовал, IPTG не имел бы индуцируемого эффекта. [ необходима цитата ] Другим примером является система Tac-промотор (Ptac). Обратите внимание, что tac записывается как промотор tac, в то время как на самом деле tac является и промотором, и оператором. [59]