YJU2B | |||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Идентификаторы | |||||||||||||||||||||||||||||||||||||||||||||||||||
Псевдонимы | YJU2B , домен с двойной спиралью, содержащий 130, CCDC130, гомолог B фактора сплайсинга YJU2 | ||||||||||||||||||||||||||||||||||||||||||||||||||
Внешние идентификаторы | МГИ : 1914986; гомологен : 12183; Генные карты : YJU2B; OMA :YJU2B — ортологи | ||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
Викиданные | |||||||||||||||||||||||||||||||||||||||||||||||||||
|
Спиральный домен, содержащий 130, является белком , который у людей кодируется геном CCDC130 . Он является частью три-snRNP U4/U5/U6 в части U5. Этот три- snRNP объединяется с другими белками, образуя комплекс B зрелой сплайсосомы . Зрелый белок имеет массу приблизительно 45 килодальтон (кДа) и является чрезвычайно гидрофильным из-за аномально большого количества заряженных и полярных аминокислот . [5] CCDC130 является высококонсервативным белком, он имеет ортологичные гены в некоторых дрожжах и растениях, которые были обнаружены с использованием нуклеотидных и белковых версий инструмента поиска базового локального выравнивания ( BLAST ) из Национального центра биотехнологической информации . [6] Профили GEO для CCDC130 показали, что этот белок экспрессируется повсеместно, но самые высокие уровни экспрессии обнаружены в Т-лимфоцитах . [6]
Хотя конкретная функция CCDC130 до сих пор неизвестна, было проведено несколько исследований и научных работ, в которых он был идентифицирован как компонент части U5 три-snRNP U4/U5/U6, который помогает формировать комплекс B человеческой сплайсосомы после соединения с комплексом A. Затем комплекс B претерпевает больше модификаций и конформационных изменений, прежде чем стать зрелой сплайсосомой. В одном исследовании консервация сплайсосомных компонентов обсуждается путем сравнения человеческой сплайсосомы со сплайсосомой дрожжей. В этом исследовании CCDC130 классифицируется как известный фактор сплайсинга, а его гомологом в дрожжах является Yju2. [7] Этот белок дрожжей является фактором сплайсинга, который помогает формировать полную активную сплайсосому и способствует первому этапу сплайсинга, который включает расщепление в 5'-сайте сплайсинга первого экзона. [7] На основании этой информации, вероятно, что CCDC130 играет аналогичную роль в человеческой сплайсосоме, но из-за более высокой сложности человеческой сплайсосомы этот белок может выполнять другие функции или совершенно иную функцию. Из-за большого количества участков фосфорилирования, вероятно, что этот белок активируется и привлекается в сплайсосомный комплекс через фосфорилирование или дефосфорилирование (см. Посттрансляционные модификации). Поскольку этот ген повсеместно экспрессируется и экспрессируется в 2,9 раза выше, чем средний ген, ясно, что этот белок играет неотъемлемую роль в правильном функционировании сплайсосомы. [6]
Домен спиральной спирали, содержащий 130, имеет несколько псевдонимов, включая CCDC130, SB115, LOC81576 и MGC10471.
CCDC130 расположен на коротком плече хромосомы 19 у людей. Точный локус — 19p13.2. Весь ген охватывает участок 13858753–13874106 на +-цепи хромосомы 19. [6] CCDC130 граничит выше по течению с CACNA1A на --цепи, glatobu, smagly и socho на +-цепи, а ниже по течению с MGC3207 , C19orf53, ZSWIM4 на +-цепи и joypaw, smeygly, floytobu, smawgly и wycho на --цепи. [6] Glatobu, smagly, socho, joypaw, smeygly, floytobu, smawgly и wycho были проверены только с помощью последовательностей кДНК в GenBank и не имеют доступной информации об их функции. В последовательности CCDC130 также обнаружено несколько небольших генов, при этом snugly, glytobu, stygly и glartobu находятся на +-цепи, а chacho, zoycho, spogly, glotobu, glutobu и sneygly — на --цепи. [6] Все эти небольшие гены имеют чрезвычайно низкие уровни экспрессии (менее 3% от экспрессии среднего гена), при этом stygly имеет самую высокую экспрессию — 2,8% от среднего. [6]
С помощью ElDorado из Genomatix было найдено несколько предсказанных промоторов для CCDC130, но промотор , который соответствует наиболее близкой к последовательности белка, состоит из 760 оснований и охватывает диапазон от 13858094 до 13858853 на хромосоме 19. [8]
Для CCDC130 идентифицирован только один паралог, которым является CCDC94, единственный другой известный человеческий член семейства белков CWC16. У этих двух белков примерно 27% идентичности, большая часть которой находится в домене COG5134 и на C-конце . CCDC94 имеет три предсказанных сайта фосфорилирования серина в положениях 213, 220 и 306, которые совпадают с серинами в CCDC130 в множественном выравнивании последовательностей, и сайт фосфорилирования треонина, который совпадает с фосфорилированным серином в CCDC130. [5] [9]
CCDC130 — высококонсервативный белок, истинные ортологи которого присутствуют у приматов, других млекопитающих, амфибий, рептилий, рыб и даже беспозвоночных, таких как насекомые и морские беспозвоночные. Ортологи птиц не были обнаружены в нуклеотидных или белковых BLAST [6]. Были задокументированы гомологичные гены у дрожжей и других грибов, а также у растений. Неясно, когда возник самый отдаленный гомолог CCDC130, но это было задолго до расхождения автотрофов и гетеротрофов
Последовательность | Род | Разновидность | Общее название | Дата расхождения (млн лет назад) | Номер поступления | Длина последовательности (аа) | % Личность |
---|---|---|---|---|---|---|---|
1 | Гомо | сапиенс | Человек | Н/Д | NP_110445 | 396 | 100 |
2 | Саймири | боливийский | Беличья обезьяна | 42.6 | XP_003941759 | 396 | 94 |
3 | Ailuropoda | меланолеука | Гигантская панда | 94.2 | XP_002921062 | 392 | 88 |
4 | Пес | волчанка фамилиарис | Собака | 94.2 | XP_542031 | 397 | 87 |
5 | Бос | Телец | Корова | 94.2 | NP_001069812 | 400 | 86 |
6 | Сус | скрофа | Дикий кабан | 94.2 | XP_003123393 | 398 | 86 |
7 | Крицетулус | грисей | китайский хомяк | 92.3 | XP_003501975 | 383 | 79 |
8 | Мус | мускулус | Мышь | 92.3 | NP_080626 | 385 | 78 |
9 | Саркофилус | харрисии | Тасманийский дьявол | 162.6 | XP_003760711 | 367 | 77 |
10 | Анолис | каролинский | Ящерица-анол | 296 | XP_003216443 | 373 | 62 |
11 | Ксенопус | лаевис | африканская когтистая лягушка | 371.2 | NP_001086365 | 384 | 61 |
12 | Данио | рерио | Зебрафиш | 400.1 | NP_991158 | 390 | 56 |
13 | Такифугу | рубрипес | Рыба-собака | 400.1 | XP_003972319 | 379 | 65 |
14 | Амфимедон | квинслендика | Губка | 716.5 | XP_003388671 | 299 | 46 |
15 | Кулекс | квинкефасциатус | Комар | 782.7 | XP_001846118 | 329 | 53 |
16 | Бомбус | недотрога | Шмель | 782.7 | XP_003485202 | 314 | 55 |
17 | Каэнорабдитис | реманей | Нематода | 937,5 | XP_003094402 | 365 | 44 |
18 | Шизосахаромицеты | помбе | Дрожжи | 1215.8 | NP_595734.2 | 294 | 27 |
19 | Кукумис | сативус | Огурец | 1369 | XP_004135117 | 313 | 47 |
CCDC130 имеет два консервативных домена и область спиральной спирали. Первый — это домен COG5134, который, как обнаружено, сохраняется в огурцах и, вероятно, играет роль в функции белка, поскольку он всегда является наиболее высококонсервативной областью в любом множественном выравнивании последовательностей . [5] Он охватывает приблизительно первые 170 аминокислот белка. Другой домен — это домен DUF572, который является эукариотическим доменом неизвестной функции , который является общим для всех ортологов и большинства более отдаленных гомологов. Этот домен не имеет определенного диапазона, поскольку разные источники сообщают о разной длине, некоторые говорят, что это весь белок. Область спиральной спирали находится в диапазоне 182-214 в человеческом белке и богата заряженными аминокислотами. Модифицированные остатки также очень хорошо сохраняются.
Наиболее распространенный вариант CCDC130 кодируется второй по длине открытой рамкой считывания (ORF), соответствующей белку из 396 аминокислот с молекулярной массой 44,8 кДа и изоэлектрической точкой 8,252. [5] Белок CCDC130 богат заряженными аминокислотами и дефицитен по незаряженным, неполярным аминокислотам. [5] Mobyle @ Pasteur предсказал, что CCDC130 будет чрезвычайно гидрофильным из-за большого количества заряженных и полярных аминокислот, при этом ни один сайт не имеет оценки выше нуля на графике гидрофобности, а некоторые сайты достигают всего лишь -6 (F180). В домене спиральной спирали (182-214) есть область, в которой 14 из 18 аминокислот заряжены. Анализ SAPS предсказал, что этот белок будет нестабильным. [5] Из-за своей высокой гидрофильности этот белок определенно не содержит трансмембранных сегментов.
Ген CCDC130 производит 17 различных мРНК. 13 из этих мРНК происходят из альтернативного сплайсинга, а остальные четыре не сплайсируются. [6] Было описано четыре альтернативных промотора, пять альтернативных сайтов полиаденилирования и четыре альтернативных последних экзона . [6] Было описано два случая удержания интрона . Из гена CCDC130 было идентифицировано 14 различных белков, все из которых содержат домен DUF572, но только пять, по-видимому, показывают спирально-спиральный участок. Остальные три мРНК были очень низкого качества и не были транслированы. Также было отмечено, что этот ген может кодировать несколько неперекрывающихся белков. 45 однонуклеотидных полиморфизмов были задокументированы для CCDC130 в NCBI: 29 миссенс-мутаций и 16 синонимичных мутаций, которые не изменяют аминокислоту. [6]
CCDC130 — это сильно фосфорилированный белок, с 31 различным сайтом фосфорилирования, предсказанным NetPhos, и 26 из этих 31 расположены в C-концевой половине белка. [9] 17 из 22 серинов, 4 из 6 треонинов и 2 из 3 предсказанных тирозинов имели оценки вероятности более .800, что указывает на высокую вероятность того, что они являются истинными сайтами фосфорилирования. [9] Было предсказано шесть сайтов сумоилирования , но только один из этих сайтов (K177) имел оценку вероятности выше .500, при .640. [10] Физиологическая функция сумоилирования все еще относительно загадочна, но эта модификация может добавить значительное количество молекулярной массы к белку (11 кДа). Было предсказано 13 сайтов гликирования с оценками вероятности более .500, и 10 из 13 гликированных лизинов встречаются в N-концевой половине белка. [11] NetOGlyc предсказал 11 возможных сайтов O-гликозилирования с вероятностными оценками более .500, причем все 11 встречаются в диапазоне из 64 аминокислот от T313 до T376. [12] Некоторые из этих сайтов были предсказаны как сайты фосфорилирования и сайты O-гликозилирования. CCDC130 не был предсказан как сульфатированный , [13] ацетилированный , [14] миристоилированный , [15] N-гликозилированный , [16] C-маннозилированный , [17] или подвергшийся какой-либо модификации GPI . [18]
В CCDC130 предсказана длинная последовательность альфа-спирали , которая простирается от R121 до A211, предсказанная YASPIN. Другие программы для анализа вторичной структуры , такие как PELE, CHOFAS и SABLE, также предсказали альфа-спирали различной длины в этой области. [5] [19] Не было последовательных предсказаний для бета-слоев в CCDC130.
Перечислено несколько белков, которые взаимодействуют с CCDC130, включая EEF1A1 , NINL , TRAF2 , ZBTB16 , ZNF165 и ZNF24 . EEF1A1 — это эукариотический фактор удлинения, который участвует в связывании аминоацил-тРНК с A-сайтом рибосом во время трансляции. [20] NINL — это белок, подобный нинеину, который участвует в организации микротрубочек и обладает активностью связывания ионов кальция. [20] TRAF2, фактор 2, ассоциированный с рецептором фактора некроза опухоли (ФНО), является частью некоторых комплексов убиквитинлигазы E3 и участвует в убиквитинировании белков, чтобы они могли деградировать протеасомой . [ 20] ZBTB16, белок 16, содержащий цинковый палец и домен BTB, также является частью комплекса убиквитинлигазы E3 и, скорее всего, участвует в распознавании субстрата. Существует также альтернативная форма CCDC130, в которой транскрибируются только 803 основания вместо 1433 оснований, но дополнительная информация не предоставлена. [21] ZNF165 и ZNF24 являются белками с цинковыми пальцами, которые связывают ДНК и другие белки для регуляции транскрипции. Ниже приведена таблица взаимодействующих белков для CCDC130, собранная GeneCards. [21] Взаимодействия CCDC130 с NINL, ZNF24, TRAF2, JUP , GATA5 были проверены двухгибридным скринингом в соответствии с STRING, поэтому эти взаимодействия действительно происходят. JUP является бляшечным белком. GATA5 является фактором транскрипции, который помогает активировать промотор для лактазно-флоризингидролазы. [21] Взаимодействия с CDA , DERA , CDC40 , NAA25 , DGCR14 , NAA20 и PRPF19 не были подтверждены экспериментально, но взаимодействия между гомологами генов были задокументированы у других видов согласно STRING, поэтому эти взаимодействия потенциально могут иметь место. ZBTB16, EEF1A1 и ZNF165 были подтверждены по крайней мере одним двухгибридным скринингом согласно MINT. NAT9 был описан как известный взаимодействующий с I2D. В исследовании, проведенном в Университете округа Колумбия для характеристики CCDC130, они обнаружили, что он индуцируется посредством инсулиновой сигнализации, нацелен на три различные киназы ( GSK3 , CK1 и CK2 ) и является митохондриальным белком.5 Исследование также показывает, что CCDC130 потенциально может использоваться в качестве биомаркерадля некоторых типов рака из-за его дифференциальной экспрессии в раковых клетках. В исследовании особо упоминается, что CCDC130 подавляется в некоторых типах рака толстой кишки, что позволяет большему количеству раковых клеток не быть нацеленными на путь апоптоза .
CCDC130 — повсеместно экспрессируемый белок, показывающий определенный уровень экспрессии во всех проанализированных образцах тканей и клеток. Профиль AceView для CCDC130 показывает уровни экспрессии в 2,9 раза выше, чем у среднего белка. [6] Уровень экспрессии сильно различается между тканями, но в каждом образце есть по крайней мере определенный уровень экспрессии. Согласно профилям NCBI GEO и данным BioGPS, образцы щитовидной железы плода , коры надпочечников , матки , простаты , яичек , семенных канальцев , сердца , PB-CD4+ Т-клеток, PB-CD8+ Т-клеток, лимфатических узлов , легких , тимуса , щитовидной железы, лейкемии хронической миелоидной K562 и лейкемии лимфобластной molt4 имели уровни экспрессии выше 75-го процентиля для экспрессии гена по крайней мере в одном из двух образцов. Экспрессия генов была ниже 25-го процентиля по крайней мере в одном из двух образцов для ножек мозжечка, затылочной доли, моста, тройничного ганглия , субталамического ядра , верхнего шейного ганглия (резко разные уровни экспрессии), ганглия задних корешков , печени плода , тела матки, атриовентрикулярного узла , аппендикса , скелетных мышц, сердечных миоцитов , языка и слюнной железы . Клетки PB-CD8+ T имели самую высокую относительную экспрессию CCDC130, а язык имел самую низкую относительную экспрессию. Для получения дополнительной информации об экспрессии CCDC130 см. данные об экспрессии мозга мышей или данные микрочипов человеческого мозга из Allen Brain Atlas или дифференциальную экспрессию в профилях GEO из NCBI. [6]
Было показано, что CCDC130 дифференциально экспрессируется в нескольких видах рака, включая рак молочной железы, толстой кишки и поджелудочной железы, с помощью микрочиповых исследований раковых клеток. [22] Было показано, что он подавляется при раке толстой кишки, что предполагает, что он может быть биомаркером рака. На эту тему все еще проводятся исследования, чтобы подтвердить его функцию в качестве идентификатора рака. Многие веб-сайты также говорят, что он участвует в реакции клетки на вирусную инфекцию, но нет никакой конкретной информации по этому поводу или каких-либо подробностей.