Протеиногенные аминокислоты — это аминокислоты , которые биосинтетически включаются в белки во время трансляции . Слово «протеиногенный» означает «создание белка». На протяжении всей известной жизни существует 22 генетически кодируемых (протеиногенных) аминокислоты, 20 из которых находятся в стандартном генетическом коде , а еще 2 ( селеноцистеин и пирролизин ) могут быть включены с помощью специальных механизмов трансляции. [1]
Напротив, непротеиногенные аминокислоты — это аминокислоты, которые либо не включены в белки (например, ГАМК , L -ДОФА или трийодтиронин ), либо неправильно включены вместо генетически закодированной аминокислоты, либо не производятся напрямую и изолированно стандартными клеточными механизмами (например, гидроксипролин ). Последнее часто является результатом посттрансляционной модификации белков. Некоторые непротеиногенные аминокислоты включены в нерибосомальные пептиды , которые синтезируются нерибосомальными пептидсинтетазами.
Как эукариоты , так и прокариоты могут включать селеноцистеин в свои белки через нуклеотидную последовательность, известную как элемент SECIS , который направляет клетку на трансляцию близлежащего кодона UGA как селеноцистеина (UGA обычно является стоп-кодоном ). У некоторых метаногенных прокариот кодон UAG (обычно стоп-кодон) также может транслироваться в пирролизин . [2]
У эукариот есть только 21 протеиногенная аминокислота, 20 из стандартного генетического кода, плюс селеноцистеин . Люди могут синтезировать 12 из них друг из друга или из других молекул промежуточного метаболизма. Остальные девять должны потребляться (обычно в виде их белковых производных), и поэтому они называются незаменимыми аминокислотами . Незаменимыми аминокислотами являются гистидин , изолейцин , лейцин , лизин , метионин , фенилаланин , треонин , триптофан и валин (т. е. H, I, L, K, M, F, T, W, V). [3]
Было обнаружено, что протеиногенные аминокислоты связаны с набором аминокислот , которые могут быть распознаны системами аутоаминоацилирования рибозима . [4] Таким образом, непротеиногенные аминокислоты были бы исключены из-за случайного эволюционного успеха форм жизни на основе нуклеотидов. Были предложены и другие причины, объясняющие, почему некоторые специфические непротеиногенные аминокислоты обычно не включаются в белки; например, орнитин и гомосерин циклизуются против пептидного остова и фрагментируют белок с относительно коротким периодом полураспада , в то время как другие токсичны, поскольку могут быть ошибочно включены в белки, такие как аналог аргинина канаванин .
Предполагается, что эволюционный отбор определенных протеиногенных аминокислот из первичного бульона обусловлен их лучшей встраиваемостью в полипептидную цепь по сравнению с непротеиногенными аминокислотами. [5]
Ниже приведены структуры и сокращения 21 аминокислоты, которые напрямую закодированы для синтеза белка генетическим кодом эукариот. Приведенные ниже структуры являются стандартными химическими структурами, а не типичными формами цвиттерионов , которые существуют в водных растворах.
IUPAC / IUBMB теперь также рекомендует стандартные сокращения для следующих двух аминокислот:
Ниже приведена таблица, в которой перечислены однобуквенные символы, трехбуквенные символы и химические свойства боковых цепей стандартных аминокислот. Перечисленные массы основаны на средневзвешенных значениях элементарных изотопов при их естественном содержании . Образование пептидной связи приводит к удалению молекулы воды . Таким образом, масса белка равна массе аминокислот, из которых состоит белок, минус 18,01524 Да на пептидную связь.
Аминокислота | Короткий | Сокращенно. | Средняя масса ( Да ) | пи | pK 1 (α-COO - ) | рК 2 (α-NH 3 + ) |
---|---|---|---|---|---|---|
Аланин | А | Ала | 89.09404 | 6.01 | 2.35 | 9.87 |
Цистеин | С | Цис | 121.15404 | 5.05 | 1.92 | 10.70 |
Аспарагиновая кислота | Д | Аспид | 133.10384 | 2.85 | 1.99 | 9.90 |
Глутаминовая кислота | Э | Глю | 147.13074 | 3.15 | 2.10 | 9.47 |
Фенилаланин | Ф | Пхе | 165.19184 | 5.49 | 2.20 | 9.31 |
Глицин | Г | Гли | 75.06714 | 6.06 | 2.35 | 9.78 |
Гистидин | ЧАС | Его | 155.15634 | 7.60 | 1.80 | 9.33 |
Изолейцин | я | Иль | 131.17464 | 6.05 | 2.32 | 9.76 |
Лизин | К | Лис | 146.18934 | 9.60 | 2.16 | 9.06 |
Лейцин | Л | Лея | 131.17464 | 6.01 | 2.33 | 9.74 |
Метионин | М | Встретился | 149.20784 | 5.74 | 2.13 | 9.28 |
Аспарагин | Н | Асн | 132.11904 | 5.41 | 2.14 | 8.72 |
Пирролизин | О | Пыл | 255.31 | ? | ? | ? |
Пролин | П | Профи | 115.13194 | 6.30 | 1.95 | 10.64 |
Глютамин | В | Глн | 146.14594 | 5.65 | 2.17 | 9.13 |
Аргинин | Р | Арг | 174.20274 | 10.76 | 1.82 | 8.99 |
Серин | С | Сер | 105.09344 | 5.68 | 2.19 | 9.21 |
Треонин | Т | Чт | 119.12034 | 5.60 | 2.09 | 9.10 |
Селеноцистеин | У | Сек | 168.053 | 5.47 | 1.91 | 10 |
Валин | В | Вал | 117.14784 | 6.00 | 2.39 | 9.74 |
триптофан | Вт | Трп | 204.22844 | 5.89 | 2.46 | 9.41 |
Тирозин | И | Тир | 181.19124 | 5.64 | 2.20 | 9.21 |
Аминокислота | Короткий | Сокращенно. | Боковая цепь | Гидрофобный | рКа § | Полярный | рН | Маленький | Крошечный | Ароматические или алифатические | Объем Ван-дер-Ваальса (Å 3 ) |
---|---|---|---|---|---|---|---|---|---|---|---|
Аланин | А | Ала | -СН 3 | - | - | Алифатический | 67 | ||||
Цистеин | С | Цис | -СН 2 Ш | 8.55 | кислый | - | 86 | ||||
Аспарагиновая кислота | Д | Аспид | -СН2СООН | 3.67 | кислый | - | 91 | ||||
Глутаминовая кислота | Э | Глю | -СН2СН2СООН | 4.25 | кислый | - | 109 | ||||
Фенилаланин | Ф | Пхе | -СН2С6Н5 | - | - | Ароматный | 135 | ||||
Глицин | Г | Гли | -ЧАС | - | - | - | 48 | ||||
Гистидин | ЧАС | Его | -СН2 - С3Н3Н2 | 6.54 | слабый базовый | Ароматный | 118 | ||||
Изолейцин | я | Иль | -СН(СН 3 )СН 2 СН 3 | - | - | Алифатический | 124 | ||||
Лизин | К | Лис | - ( СН2 ) 4NH2 | 10.40 | базовый | - | 135 | ||||
Лейцин | Л | Лея | -СН 2 СН(СН 3 ) 2 | - | - | Алифатический | 124 | ||||
Метионин | М | Встретился | -СН 2 СН 2 С СН 3 | - | - | Алифатический | 124 | ||||
Аспарагин | Н | Асн | -CH 2 КОНХ 2 | - | - | - | 96 | ||||
Пирролизин | О | Пыл | -(CH 2 ) 4 NHCO C 4 H 5 N CH 3 | НД | слабый базовый | - | ? | ||||
Пролин | П | Профи | -СН 2 СН 2 СН 2 - | - | - | - | 90 | ||||
Глютамин | В | Глн | -СН 2 СН 2 КОНН 2 | - | - | - | 114 | ||||
Аргинин | Р | Арг | -(CH2 ) 3NH - C(NH) NH2 | 12.3 | строго базовый | - | 148 | ||||
Серин | С | Сер | -СН2ОН | - | - | - | 73 | ||||
Треонин | Т | Чт | -СН(ОН)СН 3 | - | - | - | 93 | ||||
Селеноцистеин | У | Сек | -CH2SeH | 5.43 | кислый | - | ? | ||||
Валин | В | Вал | -СН( СН3 ) 2 | - | - | Алифатический | 105 | ||||
триптофан | Вт | Трп | -СН2С8Н6Н | - | - | Ароматный | 163 | ||||
Тирозин | И | Тир | -СН2 - С6Н4ОН | 9.84 | слабый кислый | Ароматный | 141 |
§: Значения для Asp, Cys, Glu, His, Lys и Tyr были определены с использованием аминокислотного остатка, размещенного в центре пентапептида аланина. [6] Значение для Arg взято из Pace et al. (2009). [7] Значение для Sec взято из Byun & Kang (2011). [8]
НД: Значение pKa пирролизина не сообщалось.
Примечание: Значение pKa аминокислотного остатка в небольшом пептиде обычно немного отличается, когда он находится внутри белка. Расчеты pKa белка иногда используются для расчета изменения значения pKa аминокислотного остатка в этой ситуации.
Аминокислота | Короткий | Сокращенно. | Кодон (ы) | Происшествие | Необходим‡ для человека | |||
---|---|---|---|---|---|---|---|---|
в архейских белках (%)& | в белках бактерий (%)& | в белках эукариот (%)& | в белках человека (%)& | |||||
Аланин | А | Ала | GCU, GCC, GCA, GCG | 8.2 | 10.06 | 7.63 | 7.01 | Нет |
Цистеин | С | Цис | UGU, UGC | 0,98 | 0,94 | 1.76 | 2.3 | Условно |
Аспарагиновая кислота | Д | Аспид | ГАУ, ГАЦ | 6.21 | 5.59 | 5.4 | 4.73 | Нет |
Глутаминовая кислота | Э | Глю | ГАА, ГАГ | 7.69 | 6.15 | 6.42 | 7.09 | Условно |
Фенилаланин | Ф | Пхе | УУУ, УУК | 3.86 | 3.89 | 3.87 | 3.65 | Да |
Глицин | Г | Гли | ГГУ, ГГК, ГГА, ГГГ | 7.58 | 7.76 | 6.33 | 6.58 | Условно |
Гистидин | ЧАС | Его | КАУ, САС | 1.77 | 2.06 | 2.44 | 2.63 | Да |
Изолейцин | я | Иль | АУУ, АУК, АУА | 7.03 | 5.89 | 5.1 | 4.33 | Да |
Лизин | К | Лис | ААА, ААГ | 5.27 | 4.68 | 5.64 | 5.72 | Да |
Лейцин | Л | Лея | UUA, UUG, CUU, CUC, CUA, CUG | 9.31 | 10.09 | 9.29 | 9.97 | Да |
Метионин | М | Встретился | АВГУСТ | 2.35 | 2.38 | 2.25 | 2.13 | Да |
Аспарагин | Н | Асн | ААУ, ААК | 3.68 | 3.58 | 4.28 | 3.58 | Нет |
Пирролизин | О | Пыл | УАГ* | 0 | 0 | 0 | 0 | Нет |
Пролин | П | Профи | CCU, CCC, CCA, CCG | 4.26 | 4.61 | 5.41 | 6.31 | Нет |
Глютамин | В | Глн | CAA, CAG | 2.38 | 3.58 | 4.21 | 4.77 | Нет |
Аргинин | Р | Арг | CGU, CGC, CGA, CGG, AGA, AGG | 5.51 | 5.88 | 5.71 | 5.64 | Условно |
Серин | С | Сер | UCU, UCC, UCA, UCG, AGU, AGC | 6.17 | 5.85 | 8.34 | 8.33 | Нет |
Треонин | Т | Чт | АКУ, АКК, АКА, АКГ | 5.44 | 5.52 | 5.56 | 5.36 | Да |
Селеноцистеин | У | Сек | УГА** | 0 | 0 | 0 | >0 | Нет |
Валин | В | Вал | ГУУ, ГУК, ГУА, ГУГ | 7.8 | 7.27 | 6.2 | 5.96 | Да |
триптофан | Вт | Трп | УГГ | 1.03 | 1.27 | 1.24 | 1.22 | Да |
Тирозин | И | Тир | УАУ, УАК | 3.35 | 2.94 | 2.87 | 2.66 | Условно |
Стоп-кодон† | - | Срок | УАА, УАГ, УГА†† | ? | ? | ? | — | — |
* UAG обычно является янтарным стоп-кодоном , но в организмах, содержащих биологические механизмы, кодируемые кластером генов pylTSBCD, будет включена аминокислота пирролизин. [9]
** UGA обычно является опаловым (или умбровым) стоп-кодоном, но кодирует селеноцистеин, если присутствует элемент SECIS .
† Стоп -кодон не является аминокислотой, но включен для полноты.
†† UAG и UGA не всегда действуют как стоп-кодоны (см. выше).
‡ Незаменимая аминокислота не может быть синтезирована в организме человека и, следовательно, должна поступать с пищей. Условно незаменимые аминокислоты обычно не требуются в пище, но должны поставляться экзогенно определенным популяциям, которые не синтезируют ее в достаточных количествах.
& Распространение аминокислот основано на 135 протеомах архей, 3775 бактерий, 614 эукариот и человеческом протеоме (21 006 белков) соответственно. [10]
В масс-спектрометрии пептидов и белков знание масс остатков полезно. Масса пептида или белка представляет собой сумму масс остатков плюс масса воды ( моноизотопная масса = 18,01056 Да; средняя масса = 18,0153 Да). Массы остатков рассчитываются по табличным химическим формулам и атомным весам. [11] В масс-спектрометрии ионы также могут включать один или несколько протонов ( моноизотопная масса = 1,00728 Да; средняя масса* = 1,0074 Да). *Протоны не могут иметь среднюю массу, это сбивает с толку, делая дейтроны допустимым изотопом, но они должны быть другим видом (см. Гидрон (химия) )
Аминокислота | Короткий | Сокращенно. | Формула | Пн. месса§ ( Da ) | Средняя масса ( Да ) |
---|---|---|---|---|---|
Аланин | А | Ала | С 3 Н 5 НЕТ | 71.03711 | 71.0779 |
Цистеин | С | Цис | С 3 Н 5 НУС | 103.00919 | 103.1429 |
Аспарагиновая кислота | Д | Аспид | С4Н5НО3 | 115.02694 | 115.0874 |
Глутаминовая кислота | Э | Глю | С 5 Н 7 НЕТ 3 | 129.04259 | 129.1140 |
Фенилаланин | Ф | Пхе | С 9 Н 9 НЕТ | 147.06841 | 147.1739 |
Глицин | Г | Гли | С2Н3НЕТ | 57.02146 | 57.0513 |
Гистидин | ЧАС | Его | С6Н7Н3О | 137.05891 | 137.1393 |
Изолейцин | я | Иль | С 6 Н 11 НЕТ | 113.08406 | 113.1576 |
Лизин | К | Лис | С6Н12Н2О | 128.09496 | 128.1723 |
Лейцин | Л | Лея | С 6 Н 11 НЕТ | 113.08406 | 113.1576 |
Метионин | М | Встретился | С 5 Н 9 НУС | 131.04049 | 131.1961 |
Аспарагин | Н | Асн | С4Н6Н2О2 | 114.04293 | 114.1026 |
Пирролизин | О | Пыл | С12Н19Н3О2 | 237.14773 | 237.2982 |
Пролин | П | Профи | С 5 Н 7 НЕТ | 97.05276 | 97.1152 |
Глютамин | В | Глн | С5Н8Н2О2 | 128.05858 | 128.1292 |
Аргинин | Р | Арг | С6Н12Н4О | 156.10111 | 156.1857 |
Серин | С | Сер | С3Н5НО2 | 87.03203 | 87.0773 |
Треонин | Т | Чт | С4Н7НО2 | 101.04768 | 101.1039 |
Селеноцистеин | У | Сек | C 3 H 5 НОС | 150.95364 | 150.0489 |
Валин | В | Вал | С 5 Н 9 НЕТ | 99.06841 | 99.1311 |
триптофан | Вт | Трп | С11Н10Н2О | 186.07931 | 186.2099 |
Тирозин | И | Тир | С9Н9НО2 | 163.06333 | 163.1733 |
В таблице ниже приведено обилие аминокислот в клетках E.coli и метаболическая стоимость (АТФ) синтеза аминокислот. Отрицательные числа указывают на то, что метаболические процессы энергетически выгодны и не требуют чистой АТФ клетки. [12] Обилие аминокислот включает аминокислоты в свободной форме и в форме полимеризации (белки).
Аминокислота | Короткий | Сокращенно. | Распространенность (количество молекул (×10 8 ) на клетку E. coli ) | Стоимость АТФ при синтезе | |
---|---|---|---|---|---|
Аэробные условия | Анаэробные условия | ||||
Аланин | А | Ала | 2.9 | -1 | 1 |
Цистеин | С | Цис | 0,52 | 11 | 15 |
Аспарагиновая кислота | Д | Аспид | 1.4 | 0 | 2 |
Глутаминовая кислота | Э | Глю | 1.5 | -7 | -1 |
Фенилаланин | Ф | Пхе | 1.1 | -6 | 2 |
Глицин | Г | Гли | 3.5 | -2 | 2 |
Гистидин | ЧАС | Его | 0,54 | 1 | 7 |
Изолейцин | я | Иль | 1.7 | 7 | 11 |
Лизин | К | Лис | 2.0 | 5 | 9 |
Лейцин | Л | Лея | 2.6 | -9 | 1 |
Метионин | М | Встретился | 0,88 | 21 | 23 |
Аспарагин | Н | Асн | 1.4 | 3 | 5 |
Пирролизин | О | Пыл | - | - | - |
Пролин | П | Профи | 1.3 | -2 | 4 |
Глютамин | В | Глн | 1.5 | -6 | 0 |
Аргинин | Р | Арг | 1.7 | 5 | 13 |
Серин | С | Сер | 1.2 | -2 | 2 |
Треонин | Т | Чт | 1.5 | 6 | 8 |
Селеноцистеин | У | Сек | - | - | - |
Валин | В | Вал | 2.4 | -2 | 2 |
триптофан | Вт | Трп | 0,33 | -7 | 7 |
Тирозин | И | Тир | 0,79 | -8 | 2 |
Аминокислота | Сокращенно. | Замечания | |
---|---|---|---|
Аланин | А | Ала | Очень распространенный и очень универсальный, он более жесткий, чем глицин, но достаточно мал, чтобы накладывать лишь небольшие стерические ограничения на конформацию белка. Он ведет себя довольно нейтрально и может располагаться как в гидрофильных областях снаружи белка, так и в гидрофобных областях внутри. |
Аспарагин или аспарагиновая кислота | Б | Асх | Заполнитель, когда любая аминокислота может занимать позицию |
Цистеин | С | Цис | Атом серы легко связывается с ионами тяжелых металлов . В окислительных условиях два цистеина могут соединяться дисульфидной связью , образуя аминокислоту цистин . Когда цистины являются частью белка, например , инсулина , третичная структура стабилизируется, что делает белок более устойчивым к денатурации ; поэтому дисульфидные связи распространены в белках, которые должны функционировать в суровых условиях, включая пищеварительные ферменты (например, пепсин и химотрипсин ) и структурные белки (например, кератин ). Дисульфиды также встречаются в пептидах, слишком маленьких, чтобы удерживать стабильную форму самостоятельно (например, инсулин ). |
Аспарагиновая кислота | Д | Аспид | Asp ведет себя подобно глутаминовой кислоте и несет гидрофильную кислотную группу с сильным отрицательным зарядом. Обычно она расположена на внешней поверхности белка, что делает его водорастворимым. Она связывается с положительно заряженными молекулами и ионами и часто используется в ферментах для фиксации иона металла. Находясь внутри белка, аспартат и глутамат обычно соединяются с аргинином и лизином. |
Глутаминовая кислота | Э | Глю | Glu ведет себя подобно аспарагиновой кислоте и имеет более длинную, немного более гибкую боковую цепь. |
Фенилаланин | Ф | Пхе | Необходимые для человека фенилаланин, тирозин и триптофан содержат большую, жесткую ароматическую группу в боковой цепи. Это самые большие аминокислоты. Подобно изолейцину, лейцину и валину, они гидрофобны и имеют тенденцию ориентироваться по направлению к внутренней части свернутой молекулы белка. Фенилаланин может быть преобразован в тирозин. |
Глицин | Г | Гли | Из-за двух атомов водорода у α-углерода глицин оптически не активен . Это самая маленькая аминокислота, легко вращается и добавляет гибкости белковой цепи. Он способен вписаться в самые узкие пространства, например, в тройную спираль коллагена . Поскольку слишком большая гибкость обычно нежелательна, как структурный компонент он встречается реже, чем аланин. |
Гистидин | ЧАС | Его | Он необходим для человека. Даже в слегка кислых условиях происходит протонирование азота, изменяя свойства гистидина и полипептида в целом. Он используется многими белками в качестве регуляторного механизма, изменяя конформацию и поведение полипептида в кислых областях, таких как поздняя эндосома или лизосома , обеспечивая изменение конформации в ферментах. Однако для этого требуется всего несколько гистидинов, поэтому он сравнительно редок. |
Изолейцин | я | Иль | Ile необходим для человека. Изолейцин, лейцин и валин имеют большие алифатические гидрофобные боковые цепи. Их молекулы жесткие, и их взаимные гидрофобные взаимодействия важны для правильного сворачивания белков, поскольку эти цепи, как правило, располагаются внутри молекулы белка. |
Лейцин или изолейцин | Дж. | Xle | Заполнитель, когда любая аминокислота может занимать позицию |
Лизин | К | Лис | Lys необходим для человека и ведет себя подобно аргинину. Он содержит длинную гибкую боковую цепь с положительно заряженным концом. Гибкость цепи делает лизин и аргинин подходящими для связывания с молекулами с большим количеством отрицательных зарядов на их поверхности. Например, ДНК -связывающие белки имеют свои активные области, богатые аргинином и лизином. Сильный заряд делает эти две аминокислоты склонными располагаться на внешних гидрофильных поверхностях белков; когда они находятся внутри, они обычно образуют пару с соответствующей отрицательно заряженной аминокислотой, например, аспартатом или глутаматом. |
Лейцин | Л | Лея | Лей необходим человеку и ведет себя аналогично изолейцину и валину. |
Метионин | М | Встретился | Met необходим для человека. Всегда первая аминокислота, включаемая в белок, иногда удаляется после трансляции. Как и цистеин, он содержит серу, но с метильной группой вместо водорода. Эта метильная группа может быть активирована и используется во многих реакциях, где новый атом углерода добавляется к другой молекуле. |
Аспарагин | Н | Асн | Подобно аспарагиновой кислоте, Asn содержит амидную группу, тогда как Asp имеет карбоксильную группу . |
Пирролизин | О | Пыл | Похож на лизин , но имеет присоединенное пирролиновое кольцо. |
Пролин | П | Профи | Pro содержит необычное кольцо в N-концевой аминогруппе, что заставляет последовательность амида CO-NH принимать фиксированную конформацию. Он может нарушать структуры сворачивания белка, такие как α-спираль или β-слой , вызывая желаемый изгиб в белковой цепи. Распространенный в коллагене , он часто подвергается посттрансляционной модификации в гидроксипролин . |
Глютамин | В | Глн | Подобно глутаминовой кислоте, Gln содержит амидную группу, где Glu имеет карбоксильную группу . Используется в белках и как хранилище аммиака , это самая распространенная аминокислота в организме. |
Аргинин | Р | Арг | Функционально аналогичен лизину. |
Серин | С | Сер | Серин и треонин имеют короткую группу, заканчивающуюся гидроксильной группой. Ее водород легко удалить, поэтому серин и треонин часто выступают в качестве доноров водорода в ферментах. Оба очень гидрофильны, поэтому внешние области растворимых белков, как правило, богаты ими. |
Треонин | Т | Чт | Необходимый для человека треон ведет себя подобно серину. |
Селеноцистеин | У | Сек | Селеновый аналог цистеина, в котором селен заменяет атом серы . |
Валин | В | Вал | Необходимый для человека валин ведет себя подобно изолейцину и лейцину. |
триптофан | Вт | Трп | Необходимый для человека, Trp ведет себя подобно фенилаланину и тирозину. Он является предшественником серотонина и имеет естественную флуоресценцию . |
Неизвестный | Х | Хаа | Заполнитель, если аминокислота неизвестна или не важна. |
Тирозин | И | Тир | Тир ведет себя подобно фенилаланину (предшественнику тирозина) и триптофану и является предшественником меланина , адреналина и гормонов щитовидной железы . Будучи естественным флуоресцентным , его флуоресценция обычно гасится передачей энергии триптофанам. |
Глутаминовая кислота или глутамин | З | Глкс | Заполнитель, когда любая аминокислота может занимать позицию |
Аминокислоты можно классифицировать по свойствам их основных продуктов: [13]