Открытая рамка считывания 58 хромосомы 21 (C21orf58) — это белок, который у человека кодируется геном C21orf58. [3]
Ген
Локус
Ген расположен на минус-цепи дистальной половины длинного плеча хромосомы 21 в 21q22.3. [4] Транскрипт 1, включая UTR, составляет 22 740 п.н. и охватывает хромосомный локус 46 301 130–46 323 875. [4]
мРНК
Альтернативное сращивание
Варианты транскрипта мРНК 1-5 кодируют две подтвержденные изоформы белка C21orf58. [5] [4] Вариант транскрипта 1 кодирует более длинную первичную изоформу (1) (регистрационный номер: NP_470860). [3] Варианты транскрипта 2-5 кодируют более короткую изоформу (2). [4] Изоформа 2 имеет отличный N-конец по сравнению с изоформой 1 в результате использования альтернативного стартового кодона . [4] Домен неизвестной функции , DUF4587, сохраняется во всех вариантах. [4]
Транскрипт [4]
Белок [4]
Длина (п.н.) [4]
Длина (аа) [4]
Экзоны [4]
DUF4587 (аа) [4]
1
Изоформа 1
2975
322
8
234-291
2
Изоформа 2
1674
216
9
128-185
3
Изоформа 2
2900
216
7
128-185
4
Изоформа 2
2941
216
9
128-185
5
Изоформа 2
2624
216
9
128-185
Белок
Общие свойства
Первичный кодируемый белок состоит из 322 аминокислот , 8 экзонов и имеет молекулярную массу 39,0 кДа. [3] [6] [7] Предсказанная изоэлектрическая точка составляет 10,06, что подтверждает предсказанную ядерную локализацию. [7] [6]
Состав
Человеческий белок C21orf58 Изоформа 1 богат пролином и глутамином , и беден цистеином , фенилаланином и тирозином . [7] Белок особенно беден тирозином, содержащим ноль остатков тирозина. [7] Изоформа 1 содержит на 20 положительно заряженных остатков больше, чем отрицательно заряженных остатков, что обеспечивает дополнительную поддержку предсказанной изоэлектрической точки. [7]
Домены и мотивы
Изоформа 1 C21orf58 имеет три консервативных домена: домен, богатый пролином, домен, богатый гистидином, и DUF4587. Богатый пролином домен, Pro 175 -Pro 322 , как предполагается, опосредует белок-белковые взаимодействия. [8] Богатый гистидином повторяющийся домен, His 292 -His 299 , как предполагается, облегчает локализацию. [9] [10] Домен неизвестной функции , DUF4587 (Arg 234 - His 291) , является членом pfam15248, обнаруженным исключительно у эукариот . [11]
Вторичная структура C21orf58, как предполагается, состоит в основном из случайных спиральных доменов с четырьмя областями альфа-спиралей по всему белку. [14] [15] [16] Предсказания вторичной структуры ортологов C21orf58 показали схожие результаты: случайная спираль и четыре области альфа-спиралей с добавлением бета-слоев по всему белку. [14] [15] [16]
Иммуноцитохимия выявила локализацию C21orf58 в нуклеоплазме и ядерных тельцах. [21] Наличие последовательности ядерной локализации является дополнительным доказательством импорта белка в ядро клетки. [14]
Прогнозы субклеточной локализации для C21orf58, основанные на аминокислотной последовательности ( PSORTII ), предполагают ядерную локализацию. [22] Прогнозы по ортологам согласуются с ядерной локализацией. [22]
Анализ ДНК-микрочипов в различных экспериментах показал вариабельную экспрессию C21orf58 в уникальных физиологических условиях.
Повышенный уровень экспрессии C21orf58 наблюдался в астроцитах, обработанных гарманом , химическим соединением, связанным с эссенциальным тремором (ЭТ), по сравнению с контролем (GDS2919). [25]
Экспрессия C21orf58 повысилась, а затем снизилась в Т-лимфоцитах с течением времени после воздействия азаспирацида-1 (AZ-10), морского фикотоксина (GDS3429). [26]
Было обнаружено, что экспрессия C21orf58 повышена у лиц с тератозооспермией по сравнению с экспрессией у лиц с нормоспермией (GDS2697). [27] Тератозооспермия — это состояние, при котором сперматозоиды имеют аномальную морфологию, что влияет на мужскую фертильность . [28]
Было обнаружено, что C21orf58 экспрессируется на всех стадиях развития на одинаковом уровне. [29]
Гибридизация in situ
Было обнаружено, что ортолог C21orf58 у мыши 2610028H24Rik повсеместно экспрессируется на высоком уровне по всему мозгу мыши. [30]
Человеческих паралогов для C21orf58 не выявлено. [49]
Ортологи
Ортологи C21orf58 были идентифицированы у костных рыб , но не у хрящевых рыб . [50] Первые 35 оснований DUF4587, Arg 234 - Pro 265 , были сохранены во всех последовательностях ортологов. [51] Наиболее отдаленно родственным идентифицированным ортологом была данио-рерио. [50]
^ Lewitzky M, Kardinal C, Gehring NH, Schmidt EK, Konkol B, Eulitz M, Birchmeier W, Schaeper U, Feller SM (март 2001 г.). "C-концевой домен SH3 адаптерного белка Grb2 связывается с высокой аффинностью с последовательностями в Gab1 и SLP-76, в которых отсутствует типичный для SH3 основной мотив PxxP". Oncogene . 20 (9): 1052– 62. doi : 10.1038/sj.onc.1204202 . PMID 11314042.
^ Hernández-Sánchez IE, Maruri-López I, Ferrando A, Carbonell J, Graether SP, Jiménez-Bremont JF (2015-09-07). "Ядерная локализация дегидрина OpsDHN1 определяется богатым гистидином мотивом". Frontiers in Plant Science . 6 : 702. doi : 10.3389/fpls.2015.00702 . PMC 4561349 . PMID 26442018.
^ Seo YA, Lopez V, Kelleher SL (июнь 2011 г.). «Мотив, богатый гистидином, опосредует митохондриальную локализацию ZnT2 для модуляции митохондриальной функции». American Journal of Physiology. Cell Physiology . 300 (6): C1479–89. doi :10.1152/ajpcell.00420.2010. PMC 3118624. PMID 21289295 .
^ группа, NIH/NLM/NCBI/IEB/CDD. "NCBI CDD Conserved Protein Domain DUF4587". ncbi.nlm.nih.gov . Получено 27.04.2018 .{{cite web}}: |last=имеет общее название ( помощь )
^ Kosugi S, Hasebe M, Tomita M, Yanagawa H (июнь 2009 г.). «Систематическая идентификация зависящих от клеточного цикла дрожжевых ядерно-цитоплазматических челночных белков путем предсказания составных мотивов». Труды Национальной академии наук Соединенных Штатов Америки . 106 (25): 10171– 6. Bibcode : 2009PNAS..10610171K. doi : 10.1073/pnas.0900604106 . PMC 2695404. PMID 19520826 .
^ abc Combet C, Blanchet C, Geourjon C, Deléage G (март 2000 г.). "NPS@: сетевой анализ белковой последовательности". Trends in Biochemical Sciences . 25 (3): 147– 50. doi :10.1016/s0968-0004(99)01540-6. PMID 10694887.
^ ab Garnier J, Osguthorpe DJ, Robson B (март 1978). «Анализ точности и последствий простых методов прогнозирования вторичной структуры глобулярных белков». Журнал молекулярной биологии . 120 (1): 97– 120. doi :10.1016/0022-2836(78)90297-8. PMID 642007.
^ ab Chou, Peter Y.; Fasman, Gerald D. (1974-01-15). "Предсказание конформации белка". Биохимия . 13 (2): 222– 245. doi :10.1021/bi00699a002. ISSN 0006-2960. PMID 4358940.
^ Basu S, Plewczynski D (апрель 2010 г.). "AMS 3.0: прогнозирование посттрансляционных модификаций". BMC Bioinformatics . 11 : 210. doi : 10.1186/1471-2105-11-210 . PMC 2874555. PMID 20423529 .
^ Gupta R, Brunak S (2002). «Предсказание гликозилирования в человеческом протеоме и корреляция с функцией белка». Тихоокеанский симпозиум по биовычислениям. Тихоокеанский симпозиум по биовычислениям : 310– 22. doi :10.1142/9789812799623_0029. ISBN978-981-02-4777-5. PMID 11928486.
^ Hilgarth RS, Murphy LA, Skaggs HS, Wilkerson DC, Xing H, Sarge KD (декабрь 2004 г.). «Регулирование и функция модификации SUMO». Журнал биологической химии . 279 (52): 53899– 902. doi : 10.1074/jbc.R400021200 . PMID 15448161.