CCDC130

Белок, обнаруженный в организме человека

YJU2B
Идентификаторы
ПсевдонимыYJU2B , домен с двойной спиралью, содержащий 130, CCDC130, гомолог B фактора сплайсинга YJU2
Внешние идентификаторыМГИ : 1914986; гомологен : 12183; Генные карты : YJU2B; OMA :YJU2B — ортологи
Ортологи
РазновидностьЧеловекМышь
Энтрез
Ансамбль
UniProt
РефСек (мРНК)

NM_001294281
NM_026350

RefSeq (белок)

NP_001281210
NP_080626

Местоположение (UCSC)Хр 19: 13.73 – 13.76 МбХр 8: 84.98 – 85 Мб
Поиск в PubMed[3][4]
Викиданные
Просмотр/редактирование человекаПросмотр/редактирование мыши

Спиральный домен, содержащий 130, является белком , который у людей кодируется геном CCDC130 . Он является частью три-snRNP U4/U5/U6 в части U5. Этот три- snRNP объединяется с другими белками, образуя комплекс B зрелой сплайсосомы . Зрелый белок имеет массу приблизительно 45 килодальтон (кДа) и является чрезвычайно гидрофильным из-за аномально большого количества заряженных и полярных аминокислот . [5] CCDC130 является высококонсервативным белком, он имеет ортологичные гены в некоторых дрожжах и растениях, которые были обнаружены с использованием нуклеотидных и белковых версий инструмента поиска базового локального выравнивания ( BLAST ) из Национального центра биотехнологической информации . [6] Профили GEO для CCDC130 показали, что этот белок экспрессируется повсеместно, но самые высокие уровни экспрессии обнаружены в Т-лимфоцитах . [6]

Функция

Хотя конкретная функция CCDC130 до сих пор неизвестна, было проведено несколько исследований и научных работ, в которых он был идентифицирован как компонент части U5 три-snRNP U4/U5/U6, который помогает формировать комплекс B человеческой сплайсосомы после соединения с комплексом A. Затем комплекс B претерпевает больше модификаций и конформационных изменений, прежде чем стать зрелой сплайсосомой. В одном исследовании консервация сплайсосомных компонентов обсуждается путем сравнения человеческой сплайсосомы со сплайсосомой дрожжей. В этом исследовании CCDC130 классифицируется как известный фактор сплайсинга, а его гомологом в дрожжах является Yju2. [7] Этот белок дрожжей является фактором сплайсинга, который помогает формировать полную активную сплайсосому и способствует первому этапу сплайсинга, который включает расщепление в 5'-сайте сплайсинга первого экзона. [7] На основании этой информации, вероятно, что CCDC130 играет аналогичную роль в человеческой сплайсосоме, но из-за более высокой сложности человеческой сплайсосомы этот белок может выполнять другие функции или совершенно иную функцию. Из-за большого количества участков фосфорилирования, вероятно, что этот белок активируется и привлекается в сплайсосомный комплекс через фосфорилирование или дефосфорилирование (см. Посттрансляционные модификации). Поскольку этот ген повсеместно экспрессируется и экспрессируется в 2,9 раза выше, чем средний ген, ясно, что этот белок играет неотъемлемую роль в правильном функционировании сплайсосомы. [6]

Ген

Псевдонимы

Домен спиральной спирали, содержащий 130, имеет несколько псевдонимов, включая CCDC130, SB115, LOC81576 и MGC10471.

Локус CCDC130 и соседи

Локус

CCDC130 расположен на коротком плече хромосомы 19 у людей. Точный локус — 19p13.2. Весь ген охватывает участок 13858753–13874106 на +-цепи хромосомы 19. [6] CCDC130 граничит выше по течению с CACNA1A на --цепи, glatobu, smagly и socho на +-цепи, а ниже по течению с MGC3207 , C19orf53, ZSWIM4 на +-цепи и joypaw, smeygly, floytobu, smawgly и wycho на --цепи. [6] Glatobu, smagly, socho, joypaw, smeygly, floytobu, smawgly и wycho были проверены только с помощью последовательностей кДНК в GenBank и не имеют доступной информации об их функции. В последовательности CCDC130 также обнаружено несколько небольших генов, при этом snugly, glytobu, stygly и glartobu находятся на +-цепи, а chacho, zoycho, spogly, glotobu, glutobu и sneygly — на --цепи. [6] Все эти небольшие гены имеют чрезвычайно низкие уровни экспрессии (менее 3% от экспрессии среднего гена), при этом stygly имеет самую высокую экспрессию — 2,8% от среднего. [6]

Промоутер

С помощью ElDorado из Genomatix было найдено несколько предсказанных промоторов для CCDC130, но промотор , который соответствует наиболее близкой к последовательности белка, состоит из 760 оснований и охватывает диапазон от 13858094 до 13858853 на хромосоме 19. [8]

Гомология и эволюция

Паралоги

Для CCDC130 идентифицирован только один паралог, которым является CCDC94, единственный другой известный человеческий член семейства белков CWC16. У этих двух белков примерно 27% идентичности, большая часть которой находится в домене COG5134 и на C-конце . CCDC94 имеет три предсказанных сайта фосфорилирования серина в положениях 213, 220 и 306, которые совпадают с серинами в CCDC130 в множественном выравнивании последовательностей, и сайт фосфорилирования треонина, который совпадает с фосфорилированным серином в CCDC130. [5] [9]

Неукорененное филогенетическое дерево человеческого CCDC130, близких ортологов и нескольких отдаленных гомологов.

Ортологи и гомологи

CCDC130 — высококонсервативный белок, истинные ортологи которого присутствуют у приматов, других млекопитающих, амфибий, рептилий, рыб и даже беспозвоночных, таких как насекомые и морские беспозвоночные. Ортологи птиц не были обнаружены в нуклеотидных или белковых BLAST [6]. Были задокументированы гомологичные гены у дрожжей и других грибов, а также у растений. Неясно, когда возник самый отдаленный гомолог CCDC130, но это было задолго до расхождения автотрофов и гетеротрофов

ПоследовательностьРодРазновидностьОбщее названиеДата расхождения (млн лет назад)Номер поступленияДлина последовательности (аа)% Личность
1ГомосапиенсЧеловекН/ДNP_110445396100
2СаймириболивийскийБеличья обезьяна42.6XP_00394175939694
3AiluropodaмеланолеукаГигантская панда94.2XP_00292106239288
4Песволчанка фамилиарисСобака94.2XP_54203139787
5БосТелецКорова94.2NP_00106981240086
6СусскрофаДикий кабан94.2XP_00312339339886
7Крицетулусгрисейкитайский хомяк92.3XP_00350197538379
8МусмускулусМышь92.3NP_08062638578
9СаркофилусхаррисииТасманийский дьявол162.6XP_00376071136777
10АнолискаролинскийЯщерица-анол296XP_00321644337362
11Ксенопуслаевисафриканская когтистая лягушка371.2NP_00108636538461
12ДаниорериоЗебрафиш400.1NP_99115839056
13ТакифугурубрипесРыба-собака400.1XP_00397231937965
14АмфимедонквинслендикаГубка716.5XP_00338867129946
15КулексквинкефасциатусКомар782.7XP_00184611832953
16БомбуснедотрогаШмель782.7XP_00348520231455
17КаэнорабдитисреманейНематода937,5XP_00309440236544
18ШизосахаромицетыпомбеДрожжи1215.8NP_595734.229427
19КукумиссативусОгурец1369XP_00413511731347

Охраняемые регионы

CCDC130 имеет два консервативных домена и область спиральной спирали. Первый — это домен COG5134, который, как обнаружено, сохраняется в огурцах и, вероятно, играет роль в функции белка, поскольку он всегда является наиболее высококонсервативной областью в любом множественном выравнивании последовательностей . [5] Он охватывает приблизительно первые 170 аминокислот белка. Другой домен — это домен DUF572, который является эукариотическим доменом неизвестной функции , который является общим для всех ортологов и большинства более отдаленных гомологов. Этот домен не имеет определенного диапазона, поскольку разные источники сообщают о разной длине, некоторые говорят, что это весь белок. Область спиральной спирали находится в диапазоне 182-214 в человеческом белке и богата заряженными аминокислотами. Модифицированные остатки также очень хорошо сохраняются.

Белок

Наиболее распространенный вариант CCDC130 кодируется второй по длине открытой рамкой считывания (ORF), соответствующей белку из 396 аминокислот с молекулярной массой 44,8 кДа и изоэлектрической точкой 8,252. [5] Белок CCDC130 богат заряженными аминокислотами и дефицитен по незаряженным, неполярным аминокислотам. [5] Mobyle @ Pasteur предсказал, что CCDC130 будет чрезвычайно гидрофильным из-за большого количества заряженных и полярных аминокислот, при этом ни один сайт не имеет оценки выше нуля на графике гидрофобности, а некоторые сайты достигают всего лишь -6 (F180). В домене спиральной спирали (182-214) есть область, в которой 14 из 18 аминокислот заряжены. Анализ SAPS предсказал, что этот белок будет нестабильным. [5] Из-за своей высокой гидрофильности этот белок определенно не содержит трансмембранных сегментов.

Последовательность белка для основной формы CCDC130. Этот пептид имеет длину 396 аминокислот, содержит спирально-спиральный участок от 182 до 214, домен неизвестной функции (DUF572) и домен COG5134 в N-концевой половине
Альтернативные варианты сплайсинга белка CCDC130, представленные на AceView из NCBI.

Вариация

Ген CCDC130 производит 17 различных мРНК. 13 из этих мРНК происходят из альтернативного сплайсинга, а остальные четыре не сплайсируются. [6] Было описано четыре альтернативных промотора, пять альтернативных сайтов полиаденилирования и четыре альтернативных последних экзона . [6] Было описано два случая удержания интрона . Из гена CCDC130 было идентифицировано 14 различных белков, все из которых содержат домен DUF572, но только пять, по-видимому, показывают спирально-спиральный участок. Остальные три мРНК были очень низкого качества и не были транслированы. Также было отмечено, что этот ген может кодировать несколько неперекрывающихся белков. 45 однонуклеотидных полиморфизмов были задокументированы для CCDC130 в NCBI: 29 миссенс-мутаций и 16 синонимичных мутаций, которые не изменяют аминокислоту. [6]

Концептуальная трансляция аминокислот 269-396 и 3' UTR CCDC130. Синие маркировки обозначают участки фосфорилирования, а розовые буквы обозначают заряженные аминокислоты.

Посттрансляционные модификации

CCDC130 — это сильно фосфорилированный белок, с 31 различным сайтом фосфорилирования, предсказанным NetPhos, и 26 из этих 31 расположены в C-концевой половине белка. [9] 17 из 22 серинов, 4 из 6 треонинов и 2 из 3 предсказанных тирозинов имели оценки вероятности более .800, что указывает на высокую вероятность того, что они являются истинными сайтами фосфорилирования. [9] Было предсказано шесть сайтов сумоилирования , но только один из этих сайтов (K177) имел оценку вероятности выше .500, при .640. [10] Физиологическая функция сумоилирования все еще относительно загадочна, но эта модификация может добавить значительное количество молекулярной массы к белку (11 кДа). Было предсказано 13 сайтов гликирования с оценками вероятности более .500, и 10 из 13 гликированных лизинов встречаются в N-концевой половине белка. [11] NetOGlyc предсказал 11 возможных сайтов O-гликозилирования с вероятностными оценками более .500, причем все 11 встречаются в диапазоне из 64 аминокислот от T313 до T376. [12] Некоторые из этих сайтов были предсказаны как сайты фосфорилирования и сайты O-гликозилирования. CCDC130 не был предсказан как сульфатированный , [13] ацетилированный , [14] миристоилированный , [15] N-гликозилированный , [16] C-маннозилированный , [17] или подвергшийся какой-либо модификации GPI . [18]

Вторичная структура

В CCDC130 предсказана длинная последовательность альфа-спирали , которая простирается от R121 до A211, предсказанная YASPIN. Другие программы для анализа вторичной структуры , такие как PELE, CHOFAS и SABLE, также предсказали альфа-спирали различной длины в этой области. [5] [19] Не было последовательных предсказаний для бета-слоев в CCDC130.

Информация о взаимодействии

Перечислено несколько белков, которые взаимодействуют с CCDC130, включая EEF1A1 , NINL , TRAF2 , ZBTB16 , ZNF165 и ZNF24 . EEF1A1 — это эукариотический фактор удлинения, который участвует в связывании аминоацил-тРНК с A-сайтом рибосом во время трансляции. [20] NINL — это белок, подобный нинеину, который участвует в организации микротрубочек и обладает активностью связывания ионов кальция. [20] TRAF2, фактор 2, ассоциированный с рецептором фактора некроза опухоли (ФНО), является частью некоторых комплексов убиквитинлигазы E3 и участвует в убиквитинировании белков, чтобы они могли деградировать протеасомой . [ 20] ZBTB16, белок 16, содержащий цинковый палец и домен BTB, также является частью комплекса убиквитинлигазы E3 и, скорее всего, участвует в распознавании субстрата. Существует также альтернативная форма CCDC130, в которой транскрибируются только 803 основания вместо 1433 оснований, но дополнительная информация не предоставлена. [21] ZNF165 и ZNF24 являются белками с цинковыми пальцами, которые связывают ДНК и другие белки для регуляции транскрипции. Ниже приведена таблица взаимодействующих белков для CCDC130, собранная GeneCards. [21] Взаимодействия CCDC130 с NINL, ZNF24, TRAF2, JUP , GATA5 были проверены двухгибридным скринингом в соответствии с STRING, поэтому эти взаимодействия действительно происходят. JUP является бляшечным белком. GATA5 является фактором транскрипции, который помогает активировать промотор для лактазно-флоризингидролазы. [21] Взаимодействия с CDA , DERA , CDC40 , NAA25 , DGCR14 , NAA20 и PRPF19 не были подтверждены экспериментально, но взаимодействия между гомологами генов были задокументированы у других видов согласно STRING, поэтому эти взаимодействия потенциально могут иметь место. ZBTB16, EEF1A1 и ZNF165 были подтверждены по крайней мере одним двухгибридным скринингом согласно MINT. NAT9 был описан как известный взаимодействующий с I2D. В исследовании, проведенном в Университете округа Колумбия для характеристики CCDC130, они обнаружили, что он индуцируется посредством инсулиновой сигнализации, нацелен на три различные киназы ( GSK3 , CK1 и CK2 ) и является митохондриальным белком.5 Исследование также показывает, что CCDC130 потенциально может использоваться в качестве биомаркерадля некоторых типов рака из-за его дифференциальной экспрессии в раковых клетках. В исследовании особо упоминается, что CCDC130 подавляется в некоторых типах рака толстой кишки, что позволяет большему количеству раковых клеток не быть нацеленными на путь апоптоза .

Выражение

CCDC130 — повсеместно экспрессируемый белок, показывающий определенный уровень экспрессии во всех проанализированных образцах тканей и клеток. Профиль AceView для CCDC130 показывает уровни экспрессии в 2,9 раза выше, чем у среднего белка. [6] Уровень экспрессии сильно различается между тканями, но в каждом образце есть по крайней мере определенный уровень экспрессии. Согласно профилям NCBI GEO и данным BioGPS, образцы щитовидной железы плода , коры надпочечников , матки , простаты , яичек , семенных канальцев , сердца , PB-CD4+ Т-клеток, PB-CD8+ Т-клеток, лимфатических узлов , легких , тимуса , щитовидной железы, лейкемии хронической миелоидной K562 и лейкемии лимфобластной molt4 имели уровни экспрессии выше 75-го процентиля для экспрессии гена по крайней мере в одном из двух образцов. Экспрессия генов была ниже 25-го процентиля по крайней мере в одном из двух образцов для ножек мозжечка, затылочной доли, моста, тройничного ганглия , субталамического ядра , верхнего шейного ганглия (резко разные уровни экспрессии), ганглия задних корешков , печени плода , тела матки, атриовентрикулярного узла , аппендикса , скелетных мышц, сердечных миоцитов , языка и слюнной железы . Клетки PB-CD8+ T имели самую высокую относительную экспрессию CCDC130, а язык имел самую низкую относительную экспрессию. Для получения дополнительной информации об экспрессии CCDC130 см. данные об экспрессии мозга мышей или данные микрочипов человеческого мозга из Allen Brain Atlas или дифференциальную экспрессию в профилях GEO из NCBI. [6]

Медицинская информация

Было показано, что CCDC130 дифференциально экспрессируется в нескольких видах рака, включая рак молочной железы, толстой кишки и поджелудочной железы, с помощью микрочиповых исследований раковых клеток. [22] Было показано, что он подавляется при раке толстой кишки, что предполагает, что он может быть биомаркером рака. На эту тему все еще проводятся исследования, чтобы подтвердить его функцию в качестве идентификатора рака. Многие веб-сайты также говорят, что он участвует в реакции клетки на вирусную инфекцию, но нет никакой конкретной информации по этому поводу или каких-либо подробностей.

Ссылки

  1. ^ abc GRCh38: Ensembl выпуск 89: ENSG00000104957 – Ensembl , май 2017 г.
  2. ^ abc GRCm38: Ensembl выпуск 89: ENSMUSG00000004994 – Ensembl , май 2017 г.
  3. ^ "Human PubMed Reference:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США .
  4. ^ "Mouse PubMed Reference:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США .
  5. ^ abcdefg "CCDC130 Analysis". Biology Workbench . San Diego Supercomputing Center - University of California San Diego . Получено 7 мая 2013 г.[ постоянная мертвая ссылка ‍ ]
  6. ^ abcdefghijklm "NCBI". Национальная медицинская библиотека . Получено 2 апреля 2013 г.
  7. ^ ab Fabrizio P, Dannenberg J, Dube P, Kastner B, Stark H, Urlaub H, Lührmann R (ноябрь 2009 г.). «Эволюционно консервативная конструкция ядра каталитического этапа активации сплайсосомы дрожжей». Molecular Cell . 36 (4): 593– 608. doi : 10.1016/j.molcel.2009.09.040 . hdl : 11858/00-001M-0000-0010-9378-C . PMID  19941820.
  8. ^ "El Dorado". Genomatix Software GmbH. Архивировано из оригинала 2 декабря 2021 г. Получено 11 апреля 2013 г.
  9. ^ abc Blom N, Gammeltoft S, Brunak S (1999). "Прогнозирование участков фосфорилирования эукариотических белков на основе последовательности и структуры". Журнал молекулярной биологии . 294 (5): 1351– 62. doi :10.1006/jmbi.1999.3310. PMID  10600390.
  10. ^ "Программа анализа SUMOplot". Abgent-a WuXi AppTec Company . Получено 14 мая 2013 г.
  11. ^ Йохансен МБ, Кимер Л, Брунак С (2006). «Анализ и прогнозирование гликирования белков млекопитающих». Гликобиология . 16 (9): 844–53 . CiteSeerX 10.1.1.128.831 . doi :10.1093/glycob/cwl009. PMID  16762979. 
  12. ^ Юлениус К, Молгаард А, Гупта Р, Брунак С (2005). «Прогнозирование, анализ сохранения и структурная характеристика участков O-гликозилирования муцинового типа млекопитающих». Гликобиология . 15 (2): 153–64 . doi :10.1093/glycob/cwh151. PMID  15385431.
  13. ^ Monigatti F, Gasteiger E, Bairoch A, Jung E (2002). «Сульфинатор: прогнозирование участков сульфатирования тирозина в последовательностях белков». Биоинформатика . 18 (5): 769–70 . doi : 10.1093/bioinformatics/18.5.769 . PMID  12050077.
  14. ^ Kiemer L, Bendtsen JD, Blom N (2005). "NetAcet: прогнозирование участков ацетилирования N-конца". Биоинформатика . 21 (7): 1269–70 . doi : 10.1093/bioinformatics/bti130 . PMID  15539450.
  15. ^ Bologna G, Yvon C, Duvaud S, Veuthey AL (2004). «Предсказания миристоилирования N-конца ансамблями нейронных сетей». Proteomics . 4 (6): 1626– 32. doi :10.1002/pmic.200300783. PMID  15174132. S2CID  20289352.
  16. ^ R. Gupta, E. Jung, S. Brunak (2004). "Предсказание участков N-гликозилирования в белках человека". NetNGlyc1.0 . Центр анализа биологических последовательностей - Датский университет . Получено 13 мая 2013 г. .
  17. ^ Юлениус К (2007). «NetCGlyc 1.0: прогнозирование участков C-маннозилирования млекопитающих». Гликобиология . 17 (8): 868–76 . doi : 10.1093/glycob/cwm050 . PMID  17494086.
  18. ^ "big-PI Predictor". GPI Lipid Anchor Project- IMP Bioinformatics. Архивировано из оригинала 21 июля 2020 г. Получено 14 мая 2013 г.
  19. ^ "SABLE Secondary Structure Prediction". Медицинский центр детской больницы Цинциннати . Получено 14 мая 2013 г.
  20. ^ abc "NextProt". CCDC130 взаимодействующие белки . Швейцарский институт биоинформатики . Получено 14 мая 2013 г.
  21. ^ abc "GeneCards". Институт науки Вейцмана . Получено 14 мая 2013 г.
  22. ^ Wang Y, Sun G, Ji Z, Xing C, Liang Y (20 января 2012 г.). "Метод взвешенных точек изменения для обнаружения дифференциальной экспрессии генов в данных микрочипов рака молочной железы". PLOS ONE . ​​7 (1): e29860. Bibcode :2012PLoSO...729860W. doi : 10.1371/journal.pone.0029860 . PMC 3262809 . PMID  22276133. 

Дальнейшее чтение

  • Сохранение сплайсосомы
  • Исследование микрочипов, содержащих CCDC130
  • Протеомный анализ сплайсосомы
  • Медиа, связанные с CCDC130 на Wikimedia Commons
  • Расположение генома человека CCDC130 и страница с подробностями гена CCDC130 в браузере геномов UCSC .
Retrieved from "https://en.wikipedia.org/w/index.php?title=CCDC130&oldid=1197676360"