- STRING предсказал взаимодействие белков для человеческого PRP36.
LOC105371752 | |||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Идентификаторы | |||||||||||||||||||||||||||||||||||||||||||||||||||
Псевдонимы | ПРП36 | ||||||||||||||||||||||||||||||||||||||||||||||||||
Внешние идентификаторы | GeneCards : [1]; OMA :- ортологи | ||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
Викиданные | |||||||||||||||||||||||||||||||||||||||||||||||||||
|
PRP36 (Proline Rich Protein 36) — внеклеточный белок у Homo sapiens , который кодируется геном PRR36 (Proline Rich Region 36) , содержащим домен неизвестной функции , DUF4596, в направлении C-конца белка. [1] Функция PRP36 неизвестна, но высокая экспрессия гена наблюдалась в различных областях мозга, таких как префронтальная кора , мозжечок и миндалевидное тело . [2] [3] PRP36 имеет одно название : предполагаемый нехарактеризованный белок FLJ22184 . [4]
Ген человека PRR36 состоит из 7 экзонов и имеет длину 5723 пар оснований . [5]
PRR36 расположен на коротком плече человеческой хромосомы 19 в 19p13.2 (регион 1, полоса 3 и подполоса 2). [5] Ген охватывает номера пар оснований 7868719 и 7874441 на хромосоме 19 и расположен между двумя другими генами — LYPLA2P2, псевдогеном , и EVI5L , геном, который производит белок, регулирующий активность Rab GTPase . [6] [7]
Альтернативный сплайсинг гена PRR36 приводит к двум вариантам транскрипта . PRR36 (FLJ22184) Транскрипт Вариант 1, показанный на изображении ниже, имеет длину 4518 пар оснований и состоит из шести экзонов, из которых последние пять используются в кодировании белка. Полученный белок, PRP36, состоит из 1346 аминокислот . [8] PRR36 Транскрипт Вариант 2 имеет длину 780 пар оснований и состоит из пяти экзонов. PRR36 Транскрипт Вариант 2 теоретически кодирует белок длиной 260 аминокислот. Однако в настоящее время подозревают, что этот вариант транскрипта никогда не транслируется . [ 5]
Было обнаружено, что вариант транскрипта PRR36 1 имеет только один сайт полиаденилирования . [9]
DUF4596 на человеческом PRP36 состоит из 47 аминокислот, имеет изоэлектрическую точку 3,77 и почти полностью сохраняется у млекопитающих . [10] Несмотря на отсутствие сигнального пептида , предполагается, что PRP36 выводится из клетки после того, как он подвергается процессингу. [11] [12]
Несколько различных тандемных повторов , отдельных повторов и повторяющихся последовательностей существуют на протяжении всего PRP36. Эти повторы наблюдаются в ортологах PRP36 приматов , но отсутствуют в ортологах PRP36 более отдаленных родственных видов, таких как опоссум, что предполагает, что некоторая форма эволюции происходила на протяжении всей последовательности PRP36 в относительно недавней истории. [10]
PRP36 состоит из 1346 аминокислот и богат пролином , что означает, что большая доля остатков пролина присутствует во всем белке, включая домен DUF4596, по сравнению с другими человеческими белками. Белки, богатые пролином, часто наблюдаются как внутренне неструктурированные и связаны с белок-белковыми взаимодействиями в сигнальных путях. [13] Однако неясно, сохраняются ли эти черты в PRP36. В PRP36 аминокислоты изолейцин , тирозин и аспарагин присутствуют в уменьшенной пропорции по сравнению с типичным человеческим белком. Существуют две высокоположительные последовательности в направлении N-конца PRP36, в то время как высокоотрицательная последовательность существует в доменах DUF4596 в направлении C-конца. Однако в целом PRP36, по-видимому, является слегка основным и в целом положительно заряженным белком, поскольку он имеет соответствующую изоэлектрическую точку 10,98. [10] PRP36 является полярным и растворимым белком. [14]
Предполагается, что PRP36 содержит 24 участка фосфорилирования у людей, включая 14 участков серина , 9 участков треонина и 1 участок тирозина. [15] [16] [17] Кроме того, существует 8 предсказанных участков присоединения N-ацетилглюкозамина и 2 высококонсервативных предсказанных участка SUMO-илирования . [18] [19]
Вторичная структура PRP36 не была явно определена, но предсказания, основанные на мРНК PRR36, дают некоторые возможности. Альфа-спирали , бета-слои и другие структурные характеристики не сохраняются среди ортологов PRP36, за исключением мотива альфа-спираль альфа-спираль бета-цепь бета-цепь, который был высококонсервативным среди млекопитающих. [10] Этот мотив начинается немного раньше и продолжается в области DUF4596, что предполагает высокую важность этого домена в функции PRP36.
PRP36 имеет средние показатели для предсказанного взаимодействия с двумя другими белками с неизвестной функцией, OVCH1 и FAM179A. [20] Эти предсказания, однако, не были экспериментально подтверждены, поэтому уверенность во взаимодействии белок-белок с PRP36 не очень высока. [20]
Не прогнозируется существование сигнального пептида или другого маркера в последовательности PRP36. [21] Однако, по словам Фобиуса, PRP36, как предполагается, является нецитоплазматическим белком, существующим во внеклеточном пространстве. [21] Если предположить, что это предсказание верно, это может указывать на то, что PRP36 подвергается нетрадиционной секреции белка .
Genomatix предсказывает существование одного промотора для белка PRP36. Этот промоутер существует на отрицательной цепи от позиции 7939226 до 7939826 и имеет длину 601 пары оснований . [22] Область промотора PRP36 содержит ряд предсказанных факторов транскрипции различных типов, включая различные цинковые пальцы , факторы E2F и факторы CDF. Особого внимания заслуживает присутствие элемента промотора XGene на отрицательной цепи, который является медиатором РНК-полимеразы II для промоторов, не имеющих ТАТА-бокса , как в случае промотора PRP36. [23] В следующей таблице приведены 12 факторов транскрипции, которые взаимодействуют с PRP36, как предсказывает инструмент ElDorado от Genomatix — все показанные факторы получили минимальный балл Matrix Sim 0,877. [23]
Матричная семья | Подробная информация о матрице | Подробная информация о семье | Начальная позиция | Конечная позиция | Позиция якоря | Стрэнд | Последовательность |
---|---|---|---|---|---|---|---|
O$XCPE | Элемент промотора ядра гена X 1 | Активатор-, медиатор- и TBP-зависимый основной элемент промотора для транскрипции РНК-полимеразы II с промоторов без TATA | 513 | 523 | 518 | + | ggGCGGgaccg |
V$ZF5F | ZF5 POZ домен цинковый палец, белок цинковый палец 161 | ZF5 POZ домен цинковый палец | 477 | 491 | 484 | + | gagcgCGCGcccccg |
V$GLIF | GLIS семейство цинковых пальцев 2 | GLI семейство цинковых пальцев | 16 | 32 | 24 | + | tcgaCCCCccaaccaga |
V$ZF02 | Цинковый палец и домен BTB, содержащий 7A, Pokémon | Факторы транскрипции цинковых пальцев C2H2 2 | 550 | 572 | 561 | + | gcagcCCCCtcccctcgcctcct |
V$E2FF | Фактор транскрипции E2F 6 | Активатор/регулятор клеточного цикла E2F-myc | 490 | 506 | 498 | - | cgcggGCGGgagagccg |
V$E2FF | Фактор транскрипции E2F 2 | Активатор/регулятор клеточного цикла E2F-myc | 476 | 492 | 484 | + | cgagcGCGCgcccccgg |
V$SP1F | Sp2, представитель факторов транскрипции Sp/XKLF с тремя цинковыми пальцами C2H2 в консервативном домене карбоксильного конца | Факторы GC-Box SP1/GC | 189 | 205 | 197 | - | ccaggaggcgGGACcac |
V$MAZF | Белок цинкового пальца, ассоциированный с Myc (MAZ) | Цинковые пальцы, связанные с Myc | 557 | 569 | 563 | - | aggcGAGGggagg |
V$E2FF | Фактор транскрипции E2F 2 | Активатор/регулятор клеточного цикла E2F-myc | 411 | 427 | 419 | + | ccaaaGCGCgcttctcc |
O$XCPE | Элемент промотора ядра гена X 1 | Активатор-, медиатор- и TBP-зависимый основной элемент промотора для транскрипции РНК-полимеразы II с промоторов без TATA | 493 | 503 | 498 | - | ggGCGGgagag |
V$E2FF | Фактор транскрипции E2F 3 | Активатор/регулятор клеточного цикла E2F-myc | 475 | 491 | 483 | - | cggggGCGCgcgctcga |
O$XCPE | Элемент промотора ядра гена X 1 | Активатор-, медиатор- и TBP-зависимый основной элемент промотора для транскрипции РНК-полимеразы II с промоторов без TATA | 190 | 200 | 195 | - | agGCGGgacca |
Дисплей распределения тканей EST cDNA и атлас белков Unigene показывают, что PRP36 имеет значительные уровни экспрессии в мозге , эмбриональной ткани, глазах , кишечнике , почках , нервах и яичниках . [24] Дополнительные доказательства подтверждают некоторые из этих результатов, поскольку анализ нормальных тканей показал, что более 50% клеток в мозжечке , мозге плода, префронтальной коре и верхнем шейном ганглии экспрессируют PRP36. [25] [26] PRP36, по-видимому, сверхэкспрессируется в образцах клеток, взятых у пациентов с протоковой карциномой молочной железы , что позволяет предположить, что состояние болезни и экспрессия PRP36 могут быть связаны. [27]
PRP36 не имеет известных паралогов у людей, но было обнаружено, что ряд ортологов существует у видов по всему царству млекопитающих . [28] PRP36 высококонсервативен среди приматов , но существует несколько коротких последовательностей, уникальных для человеческой версии гена. [10] На основании отсутствия консерватизма среди всех млекопитающих можно предположить быструю эволюцию PRP36. Однако область DUF4596 высококонсервативна среди млекопитающих, что предполагает, что домен имеет решающее значение для функционирования PRP36, в то время как остальной частью белка легче манипулировать, не причиняя вреда. Список ортологов для PRP36 можно найти ниже [28]
# | Род и вид | Общее название | Дивергенция (MYA) [29] | Регистрационный номер | E-значение | Длина (аа) | Личность (%) | Сходство (%) |
---|---|---|---|---|---|---|---|---|
1 | Homo sapiens | Человек | 0 | NP_001177396 | 0 | 1346 | 100 | 100 |
2 | Пан троглодиты | Шимпанзе | 6.3 | XP_009432808 | 0 | 1280 | 87 | 88 |
3 | Callithrix jacchus | Мартышка | 42.6 | XP_008985368 | 0 | 1243 | 78 | 79 |
4 | Саймири боливийский боливийский | Черношапочная беличья обезьяна | 42.6 | XP_010347967.1 | 0 | 1161 | 75 | 77 |
5 | Отолемур гарнетти | Северный большой галаго | 74.0 | XP_003793753 | 5x10 -158 | 1084 | 59 | 64 |
6 | Mesocricetus auratus | Золотой хомяк | 92.3 | XP_005085339 | 2x10 -106 | 1034 | 82 | 86 |
7 | Mus musculus | Домовая мышь | 92.3 | XP_006508977 | 6x10 -104 | 1046 | 67 | 71 |
8 | Нанноспалакс галили | Слепой слепыш из гор Верхней Галилеи | 92.3 | XP_008822351.1 | 1x10 -117 | 1167 | 62 | 65 |
9 | Якулюс якулюс | Малый египетский тушканчик | 92.3 | XP_004672230 | 1x10 -123 | 1007 | 55 | 59 |
10 | Ictidomys tridecemlineatus | Тринадцатиполосый суслик | 92.3 | XP_005332306.1 | 1x10 -111 | 826 | 58 | 65 |
11 | Bubalus bubalis | Водяной буйвол | 94.2 | XP_006046812 | 5x10 -119 | 1068 | 75 | 77 |
12 | Felis catus | Домашняя кошка | 94.2 | XP_011287775 | 2x10 -89 | 668 | 73 | 77 |
13 | Верблюд одногорбый | Дромадер | 94.2 | XP_010976676.1 | 4x10 -119 | 868 | 65 | 70 |
14 | Myotis lucifugus | Маленькая коричневая летучая мышь | 94.2 | XP_006101945.1 | 4x10 -111 | 935 | 58 | 63 |
15 | Balaenoptera acutorostrata scammoni | Малый полосатик | 94.2 | XP_007169287.1 | 7x10 -132 | 684 | 62 | 67 |
16 | Бизон бизон бизон | американский бизон | 94.2 | XP_010826582 | 8x10 -101 | 1054 | 51 | 58 |
17 | Викунья пакос | Альпака | 94.2 | XP_006206574 | 8x10 -64 | 680 | 51 | 56 |
18 | Мордовник телфаири | Малый ёж-тенрек | 98.7 | XP_004717416 | 2x10 -96 | 850 | 61 | 65 |
19 | Trichechus manatus latirostris | Флоридский ламантин | 98.7 | XP_004378653.1 | 4x10 -114 | 879 | 59 | 63 |
20 | Монодельфис домашний | Серый короткохвостый опоссум | 162.6 | XP_007489701.1 | 4x10-85 | 653 | 48 | 54 |
Множественное выравнивание последовательностей предполагает, что PRP36 развился на ранней стадии развития млекопитающих. [10] У млекопитающих, очень отдаленно связанных с человеком, таких как опоссум, есть версия PRP36, что предполагает, что белок появился до этого эволюционного расхождения . Однако, за исключением домена DUF4596, очень немногие области в последовательности PRP36 сохраняются. [10]
На данный момент функция белка PRP36 неизвестна. Однако можно сделать некоторые предположения о его функции. В 2009 году было обнаружено, что источником фенотипов пациента было генетическое состояние, включающее микроделецию 19p13.2 — у пациента отсутствовал очень небольшой участок хромосомы (весь регион 19p13.2 не отсутствовал). [30] [31] С тех пор были поставлены дополнительные диагнозы, и у нескольких пациентов были обнаружены микродельции, которые затрагивают регион, в котором находится ген PRR36, что означает, что белок PRP36 не будет обнаружен у этих людей. Однако этот регион также включал другие гены, функции которых хорошо известны; например, ожирение, наблюдаемое у пациентов, можно проследить до делеции гена рецептора инсулина . Другие симптомы, такие как трудности в обучении и нарушения речи, могут быть связаны с аналогичными делециями генов. [30] Однако, возможно, что отсутствие PRP36 вызывает незначительную инвалидность, которая маскируется этими другими симптомами. Кроме того, возможно, что PRP36 играет вторичную роль с одним или несколькими из этих других удаленных генов. Этот второй вариант может быть немного поддержан, отметив, что другие богатые пролином белки , имеющие известную функцию, как на человеческой хромосоме 19, так и на других хромосомах, имеют тенденцию чаще производить белки, которые участвуют во взаимодействиях белок-белок, чем многие другие общие типы генов. [32]