ИНАВА

Ген, кодирующий белок у вида Homo sapiens
ИНАВА
Идентификаторы
ПсевдонимыINAVA , открытая рамка считывания хромосомы 1 106, C1orf106, активатор врожденного иммунитета
Внешние идентификаторыОМИМ : 618051; МГИ : 1921579; Гомологен : 10103; GeneCards : ИНАВА; ОМА :ИНАВА - ортологи
Ортологи
РазновидностьЧеловекМышь
Энтрез
Ансамбль
UniProt
РефСек (мРНК)

NM_001142569
NM_018265
NM_001367289
NM_001367290

NM_028872

RefSeq (белок)

НП_001136041
НП_060735
НП_001354218
НП_001354219

НП_083148
НП_001392081
НП_001392082
НП_001392083

Местоположение (UCSC)Хр 1: 200,89 – 200,92 МбХр 1: 136.14 – 136.16 Мб
Поиск в PubMed[3][4]
Викиданные
Просмотр/редактирование человекаПросмотр/редактирование мыши

INAVA , иногда называемый гипотетическим белком LOC55765 , представляет собой белок с неизвестной функцией, который у людей кодируется геном INAVA . [5] Менее распространенные псевдонимы гена включают FLJ10901 и MGC125608.

Ген

Расположение

Расположение C1orf106 на хромосоме 1

У людей INAVA находится на длинном плече хромосомы 1 в локусе 1q32.1. Он охватывает от 200 891 499 до 200 915 736 (24,238 кб) на плюс-цепи. [5]

Джин соседство

Джин соседство

INAVA фланкирован рецептором 25, связанным с G-белком (выше по течению), и членом семейства повторов maestro heat-like 3 (MROH3P), предсказанным нижестоящим псевдогеном. Псевдоген 6 рибосомного белка L34 (RPL34P6) находится выше по течению, а член семейства кинезинов 21B — ниже по течению. [5]

Промоутер

Предсказанный участок промотора C1orf106 с предполагаемыми сайтами связывания факторов транскрипции

Существует семь предсказанных промоторов для INAVA, и экспериментальные данные свидетельствуют о том, что изоформы 1 и 2, наиболее распространенные изоформы, транскрибируются с использованием разных промоторов. [6] MatInspector, инструмент, доступный через Genomatix, использовался для прогнозирования участков связывания факторов транскрипции в потенциальных областях промотора. Факторы транскрипции, которые, как прогнозируется, нацелены на ожидаемый промотор для изоформы 1, экспрессируются в ряде тканей. Наиболее распространенными тканями экспрессии являются мочеполовая система, нервная система и костный мозг. Это совпадает с данными по экспрессии для белка INAVA, который высоко экспрессируется в почках и костном мозге. [7] Справа показана схема предсказанной области промотора с выделенными участками связывания факторов транскрипции. Факторы, которые, как прогнозируется, связываются с областью промотора изоформы 2, различаются, и двенадцать из двадцати лучших предсказанных факторов экспрессируются в клетках крови и/или тканях сердечно-сосудистой системы.

Выражение

C1orf106 экспрессируется в широком спектре тканей. Данные по экспрессии из профилей GEO показаны ниже. Места наибольшей экспрессии перечислены в таблице. Экспрессия умеренная в плаценте, простате, яичках, легких, слюнных железах и дендритных клетках. Она низкая в мозге, большинстве иммунных клеток, надпочечниках, матке, сердце и адипоцитах. [7] Данные по экспрессии, полученные в ходе различных экспериментов, обнаруженных в профилях GEO, свидетельствуют о том, что экспрессия INAVA повышается при нескольких видах рака, включая: рак легких, яичников, колоректальный рак и рак молочной железы.

Данные экспрессии C1orf106 из профилей GEO
СалфеткаПроцентильный ранг
В-лимфоциты90
Трахея89
Кожа88
Клетки эпителия бронхов человека88
Колоректальная аденокарцинома87
Почка87
Язык85
Поджелудочная железа84
Приложение82
Костный мозг80

мРНК

Изоформы

Ген INAVA производит девять предполагаемых изоформ, семь из которых, как предполагается, кодируют белки. [8] Изоформы 1 и 2, показанные ниже, являются наиболее распространенными изоформами.

Наиболее распространенные изоформы C1orf106

Изоформа 1, которая является самой длинной, принята в качестве канонической изоформы. Она содержит десять экзонов, которые кодируют белок длиной 677 аминокислот, в зависимости от источника. Некоторые источники сообщают, что белок состоит всего из 663 аминокислот из-за использования стартового кодона, который находится на сорок два нуклеотида ниже по течению. Согласно NCBI, эта изоформа была предсказана только вычислительным путем. [5] Это может быть связано с тем, что последовательность Козака , окружающая стартовый кодон ниже по течению, больше похожа на консенсусную последовательность Козака, как показано в таблице ниже. Softberry был использован для получения последовательности предсказанной изоформы. [9] Изоформа 2 короче из-за укороченного N-конца. Обе изоформы имеют альтернативный сайт полиаденилирования. [8]

Окружающая последовательность стартовых кодонов по сравнению с консенсусной последовательностью Козака
Окружающая последовательность стартовых кодонов по сравнению с консенсусной последовательностью Козака

регуляция miRNA

Предсказанная целевая последовательность miRNA

miRNA-24 была идентифицирована как микроРНК , которая потенциально может воздействовать на мРНК INAVA. [10] Показан сайт связывания, расположенный в 5'-нетранслируемой области .

Белок

Общие свойства

Белок C1of106 (изоформа 1)

Изоформа 1, представленная на схеме ниже, содержит домен DUF3338, два участка с низкой сложностью и участок, богатый пролином. Белок богат аргинином и пролином, а также содержит меньшее, чем в среднем, количество аспарагина и гидрофобных аминокислот, в частности фенилаланина и изолейцина. [11] Изоэлектрическая точка составляет 9,58, а молекулярная масса немодифицированного белка составляет 72,9 кдал. [12] Не предполагается, что у белка есть N-концевой сигнальный пептид, но есть предсказанные сигналы ядерной локализации (NLS) и богатый лейцином ядерный экспортный сигнал . [13] [14] [15]

Модификации

INAVA, как предполагается, будет сильно фосфорилирован. [16] [17] Сайты фосфорилирования, предсказанные PROSITE, показаны в таблице ниже. Прогнозы NETPhos проиллюстрированы на диаграмме. Каждая линия указывает на предсказанный сайт фосфорилирования и соединяется с буквой, которая представляет либо серин (S), либо треонин (T), либо тирозин (Y).

Сайты фосфорилирования, предсказанные PROSITE
Сайты фосфорилирования, предсказанные PROSITE
Сайты фосфорилирования, предсказанные NETPhos. Буква соответствует серину (S), треонину (T) или тирозину (Y).

Структура

Спиральные спирали, как прогнозируется, охватывают остатки 130-160 и 200-260. [18] Вторичный состав, как прогнозируется, будет включать около 60% случайных спиралей, 30% альфа-спиралей и 10% бета-слоев. [19]

Взаимодействия

Белки, с которыми взаимодействует белок INAVA, недостаточно хорошо охарактеризованы. Данные, полученные в результате анализа текста, свидетельствуют о том, что INAVA может взаимодействовать со следующими белками: DNAJC5G, SLC7A13, PIEZO2, MUC19. [20] Экспериментальные данные, полученные в результате скрининга двух гибридов дрожжей, свидетельствуют о том, что белок INAVA взаимодействует с белком 14-3-3 сигма, который является адаптерным белком. [21]

Гомология

INAVA хорошо сохраняется у позвоночных, как показано в таблице ниже. Последовательности были получены из BLAST [22] и BLAT . [23]

ПоследовательностьРод и видОбщее названиевступление в NCBIДлина(аа)Идентичность последовательностиВремя с момента расхождения (млн. лет)
*C1orf106Homo sapiensЧеловекNP_060735.3667100%NA
*C1orf106Macaca fascicularisМакака, поедающая крабовXP_005540414.170397%29.0
*LOC289399Rattus norvegicusНорвежская крысаNP_001178750.166786%92.3
*Предсказанный гомолог C1orf106Одобенус розмарус дивергенсМоржXP_004392787.167285%94.2
*C1orf106-подобныйLoxodonta африканскаяСлонXP_003410255.166384%98.7
*Предсказанный гомолог C1orf106Dasypus novemcinctusДевятипоясной броненосецXP_004478752.167681%104.2
*Предсказанный гомолог C1orf106Охотона принцепсАмериканская пищухаXP_004578841.168178%92.3
*Предсказанный гомолог C1orf106Монодельфис домашнийСерый короткохвостый опоссумXP_001367913.257876%162.2
*Предсказанный гомолог C1orf106Chrysemys picta belliiРасписная черепахаXP_005313167.160256%296.0
*Предсказанный гомолог C1orf106Geospiza fortisСредний земляной вьюрокXP_005426868.154250%296.0
*Предсказанный гомолог C1orf106Миссисипский аллигаторАллигаторXP_006278041.154749%296.0
*Предсказанный гомолог C1orf106Фицедула белаяМухоловка-воротничокXP_005059352.154249%296.0
Предсказанный гомолог C1orf106Латимерия лопастнаялатимерия западной части Индийского океанаXP_005988436.161346%414.9
*Предсказанный гомолог C1orf106Леписостеус глазчатыйПятнистый щукаXP_006628420.163744%400.1
*Домен FERM, содержащий 4AXenopus (Silurana) тропическийЗападная когтистая лягушкаXP_002935289.269543%371.2
*Предсказанный гомолог C1orf106Ореохромис нилотическийНильская тилапияXP_005478188.157640%400.1
Предсказанный гомолог C1orf106Haplochromis burtoniАстатотиляпия буртониXP_005914919.157640%400.1
Предсказанный гомолог C1orf106Пундамилия ньеререиHaplochromis nyerereiXP_005732720.157740%400.1
*LOC563192Данио рериоЗебрафишNP_001073474.161237%400.1
LOC101161145Оризиас латипесяпонская рисовая рыбаXP_004069287.161233%400.1

Ниже показан график идентичности последовательностей в зависимости от времени с момента расхождения для отмеченных звездочкой записей. Цвета соответствуют степени родства (зеленый = близкородственный, фиолетовый = отдаленнородственный).

Процент идентичности последовательностей по отношению к родству видов

Паралоги

Белки, которые считаются паралогами INAVA, не согласованы между базами данных. Было проведено множественное выравнивание последовательностей (MSA) потенциально паралогичных белков для определения вероятности действительно паралогичных отношений. [24] Последовательности были получены из поиска BLAST у людей с белком C1orf106. MSA предполагает, что белки имеют общий гомологичный домен, DUF3338, который обнаружен у эукариот. Часть множественного выравнивания последовательностей показана ниже. За исключением домена DUF (выделен зеленым), было мало консерватизма. Домен DUF3338 не обладает какими-либо необычными физическими свойствами, однако одним примечательным открытием является то, что каждый из белков в MSA, как предсказано, имеет два сигнала ядерной локализации. Все белки в MSA, как предсказано, локализуются в ядре. [13] Сравнение физических свойств белков также было проведено с использованием SAPS и показано в таблице. [11]

Сохранение домена DUF3338 у людей
Физические свойства потенциальных паралогов
Физические свойства потенциальных паралогов

Клиническое значение

В генной области INAVA было выявлено в общей сложности 556 однонуклеотидных полиморфизмов (SNP), 96 из которых связаны с клиническим источником. [25] Ривас и др. [26] выявили четыре SNP, показанные в таблице ниже, которые могут быть связаны с воспалительным заболеванием кишечника и болезнью Крона . Согласно GeneCards, другие ассоциации с заболеваниями могут включать рассеянный склероз и язвенный колит . [27]

ОстатокИзменятьПримечания
333 (rs41313912)Тирозин ⇒ фенилаланинФосфорилированный, умеренная консервация
376Аргинин ⇒ цистеинУмеренная охрана природы
397Аргинин ⇒ треонинНе сохраняется
554 (rs61745433)Аргинин ⇒ цистеинУмеренная охрана природы

Ссылки

  1. ^ abc GRCh38: Ensembl выпуск 89: ENSG00000163362 – Ensembl , май 2017 г.
  2. ^ abc GRCm38: Ensembl выпуск 89: ENSMUSG00000041605 – Ensembl , май 2017 г.
  3. ^ "Human PubMed Reference:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США .
  4. ^ "Mouse PubMed Reference:". Национальный центр биотехнологической информации, Национальная медицинская библиотека США .
  5. ^ abcd "NCBI Gene 55765" . Получено 10 февраля 2014 г.
  6. ^ "Genomatix: MatInspector". Архивировано из оригинала 2 декабря 2021 г. Получено 6 марта 2014 г.
  7. ^ ab "GEO Profiles" . Получено 6 марта 2014 г.
  8. ^ ab "Aceview" . Получено 6 марта 2014 г.
  9. ^ "Softberry" . Получено 20 апреля 2014 г.
  10. ^ "TargetScanHuman 6.2" . Получено 15 апреля 2014 г.
  11. ^ ab "Статистический анализ белковых последовательностей" . Получено 20 апреля 2014 г.
  12. ^ "Compute pI/Mw tool" . Получено 10 апреля 2014 г. .
  13. ^ ab "PSORTII" . Получено 20 апреля 2014 г.
  14. ^ "cNLS Mapper". Архивировано из оригинала 22 ноября 2021 г. Получено 20 апреля 2014 г.
  15. ^ "NetNES" . Получено 20 апреля 2014 г.
  16. ^ "NETPhos" . Получено 20 апреля 2014 г.
  17. ^ «Швейцарский институт биоинформатики: PROSITE».
  18. ^ "ExPASy COILS". Архивировано из оригинала 22 апреля 2014 года . Получено 20 апреля 2014 года .
  19. ^ "SOPMA" . Получено 27 апреля 2014 г.
  20. ^ "STRING" . Получено 15 апреля 2014 г.
  21. ^ "MINT" . Получено 15 апреля 2014 г.
  22. ^ "BLAST" . Получено 8 марта 2014 г.
  23. ^ "BLAT" . Получено 8 марта 2014 г.
  24. ^ "SDSC Biology Workbench: ClustalW" . Получено 12 марта 2014 г.
  25. ^ "dbSNP" . Получено 22 апреля 2014 г. .
  26. ^ Ривас МА; и др. (2011). «Глубокое повторное секвенирование локусов GWAS выявляет независимые редкие варианты, связанные с воспалительным заболеванием кишечника». Nature Genetics . 43 (11): 1066– 1073. doi :10.1038/ng.952. PMC 3378381 . PMID  21983784. 
  27. ^ "GeneCards" . Получено 1 мая 2014 г.
Взято с "https://en.wikipedia.org/w/index.php?title=INAVA&oldid=1212901450"