ТЕНТ5Б | |||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Идентификаторы | |||||||||||||||||||||||||||||||||||||||||||||||||||
Псевдонимы | TENT5B , семейство с последовательностью, схожей с 46 членом B, терминальная нуклеотидилтрансфераза 5B, FAM46B, FAM46 | ||||||||||||||||||||||||||||||||||||||||||||||||||
Внешние идентификаторы | MGI : 2140500; HomoloGene : 24928; GeneCards : TENT5B; OMA :TENT5B - ортологи | ||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
Викиданные | |||||||||||||||||||||||||||||||||||||||||||||||||||
|
Белок FAM46B, также известный как семейство с последовательностью сходства 46 член B, представляет собой белок , который у людей кодируется геном FAM46B . [5] FAM46B содержит один домен белка неизвестной функции, DUF1693. [6] Двугибридный скрининг дрожжей выявил три белка, которые физически взаимодействуют с FAM46B. Это ATX1 , PEPP2 (кодируется RHOXF2 ) и DAZAP2 . [7] [8]
FAM46B — наиболее распространенное название гена, кодирующего FAM46B. Для описания этого же гена также использовались псевдонимы MGC16491 и RP11-344H11. [7] FAM46B — ген из 7283 пар оснований, расположенный на антисмысловой цепи ДНК на коротком плече хромосомы 1 в определенном локусе 1p36.11. Поскольку он находится на антисмысловой цепи, направление транскрипции FAM46B противоположно стандартной нумерации нуклеотидов вдоль хромосомы. FAM46B начинается с основания 27 339 333 и заканчивается на 27 331 522.
Программа El Dorado через Genomatix предсказывает, что длина промоутерной области составит 1028 оснований, охватывая основания от 27 339 962 до 27 338 935. [9]
Ген FAM46B содержит два экзона, оба из которых обнаружены в белке FAM46B. Существует одна основная изоформа белка , указывающая на отсутствие альтернативного сплайсинга мРНК FAM46B . [10]
FAM46B имеет три паралога в Homo sapiens : FAM46A , FAM46C и FAM46D . [7] Многочисленные выравнивания последовательностей четырех членов FAM46 показывают высокий уровень консервативности, особенно в направлении C-конца . Аминокислоты, консервативные во всех четырех паралогах, указывают на остатки, которые составляют ядро семейства FAM46.
FAM46B присутствует у общего предка животных и встречается только у эукариот. Хотя строгие ортологи FAM46B встречаются только у относительно небольшого числа животных, таких как насекомые и позвоночные , ортологи паралогов FAM46 были выявлены у более широкого круга видов. Среди позвоночных FAM46B высококонсервативен у рыб, амфибий и млекопитающих. Распространенными модельными организмами, у которых был выявлен FAM46B, являются Danio rerio , Xenopus tropicalis и Mus musculus . Строгий ортолог FAM46B не встречается у рептилий или птиц; однако паралоги FAM46A и FAM46C встречаются у Anolis carolinensis , а паралог FAM46C встречается у птиц, таких как Gallus gallus . [6]
Отдаленные гомологи FAM46B присутствуют у Drosophila и нематод, таких как Caenorhabditis elegans . Ортологов FAM46B нет у растений, простейших или грибов. [11]
Филогенетическое дерево FAM46B отражает стандартное филогенетическое дерево. Как и следовало ожидать, млекопитающие сгруппированы вместе, а приматы сгруппированы наиболее плотно. Более отдаленные гомологи, такие как Drosophila и Caenorhabditis, находятся слева, представляя большую дивергенцию между последовательностями генов.
Функция FAM46B пока не определена. Информация ниже основана на биоинформатических анализах и прогнозах.
Человеческая форма FAM46B содержит 425 аминокислотных остатков, имеет изоэлектрическую точку 8,093 [12] и молекулярную массу 46 888 дальтон . [7] FAM46B — это растворимый белок, предположительно находящийся в цитозоле. [13] [14]
FAM46B содержит только один идентифицированный домен: домен неизвестной функции 1693 (DUF1693). DUF1693 был идентифицирован как часть суперсемейства нуклеотидилтрансфераз и содержит четыре белка, подобных прионам нематод , но точная функция остается неизвестной. [15] Анализ белка SAPS не предсказывает никаких необычных характеристик белка на основе аминокислотного состава, внутренних повторов, зарядовых кластеров или периодичности. [16]
FAM46B не содержит, как предполагается, сайт расщепления сигнального пептида , [17] якоря гликофосфатидилинозитола (GPI) или трансмембранные области. Отсутствие сигнального пептида подтверждает предположение, что FAM46B находится в цитозоле.
Инструменты ExPASy использовались для предсказания участков фосфорилирования , участков O-связанного гликозилирования и участков N-связанного гликозилирования . Хотя два участка в FAM46B предсказаны как потенциальные участки N-связанного гликозилирования, FAM46B не имеет сигнального пептида и, таким образом, не попадает в просвет эндоплазматического ретикулума , где происходит N-связанное гликозилирование. Пять участков были идентифицированы как возможные участки O-связанного гликозилирования. [18] Они отмечены в разделе «Концептуальный перевод» ниже.
Наиболее распространенной посттрансляционной модификацией, предсказанной в FAM46B, является фосфорилирование. Программа NetPhos 2.0 предсказывает 23 сайта фосфорилирования. Большинство предсказанных фосфорилирований предсказаны на остатках серина (14), но есть 6 предсказанных на треонине и 3 на тирозинах . [19] Они, как правило, группируются вместе в последовательности белка. Сравнение предсказанных сайтов фосфорилирования у человека, мыши и данио-рерио показывает, что все три вида имеют примерно одинаковое количество и распределение сайтов фосфорилирования (на серинах против треонинов против трирозинов).
Точная структура FAM46B не была охарактеризована. Для прогнозирования вторичной структуры использовались программы прогнозирования, доступные через Biology Workbench [20] , такие как GOR4, PELE, CHOFAS. Результаты, полученные с помощью программ в Biology Workbench, сравнивались с результатами, полученными с помощью Phyre2 . [21] Поскольку эти программы являются прогнозирующими и опираются на разные алгоритмы, каждая из них обеспечивает немного разные выходные данные. Консенсус между программами предполагает, что FAM46B содержит в основном альфа-спирали и случайные спирали. Хотя они присутствуют, FAM46B, по-видимому, содержит только несколько небольших участков, заранее предсказанных для формирования бета-листов . Аннотированные результаты прогнозирования вторичной структуры PELE и PHYRE2 представлены на рисунке ниже.
Экспрессию можно оценить различными способами. Как экспрессированные теги последовательностей , так и профили GEO показывают количество транскриптов гена, присутствующего в определенном типе ткани, и относительно общего количества транскриптов генов. Микрочипы также полезны для количественной оценки экспрессии генов. Гибридизация белка in-situ является более точным измерением экспрессии, чем методы на основе мРНК или кДНК, поскольку зонды могут быть напрямую слиты с белком.
Согласно некоторым доступным данным микрочипов, FAM46B высоко экспрессируется в языке (уровни в 10 раз выше среднего уровня экспрессии гена для ткани). [22] За пределами языка FAM46B, по-видимому, равномерно экспрессируется в большинстве тканей. В дополнение к экспрессии гена в здоровых тканях, данные EST также подчеркивают экспрессию гена в зависимости от состояния здоровья. Похоже, что экспрессия FAM46B повышается в случаях рака кожи и глиом . [23]
Программа El Dorado через Genomatix была использована для предсказания этого списка факторов транскрипции, которые, вероятно, будут связываться с промоторной областью FAM46B. Предсказаны многочисленные сайты E2F , в дополнение к многочисленным сайтам факторов транскрипции Zinc Finger, нескольким факторам связывания E-box и гомологам TWIST. Сайты связывания неравномерно распределены в промоторной области. Наибольшее скопление сайтов связывания было расположено вокруг основания 177 промотора, что составляет около 600 пар оснований выше начала транскрипции для FAM46B . [9] На изображении ниже показаны выбранные сайты связывания факторов транскрипции для двадцати лучших совпадений, идентифицированных El Dorado, которые находятся на антисмысловой цепи.
Скрининг гибридов дрожжей показывает, что FAM46B физически взаимодействует с белком атаксин-1, который кодируется ATXN1 . [8] Точная функция ATXN1 неизвестна, но считается, что он участвует в регуляции аспектов производства белка, в частности транскрипции . Поскольку FAM46B физически взаимодействует с ATXN1, возможно, что FAM46B также играет роль в регуляции производства белка и регуляции транскрипции. [24]
Второй белок, который, как было показано, физически взаимодействует с FAM46B, — это DAZAP2 , богатый пролином белок, экспрессируемый в мозге. [8] В сочетании с информацией об ATXN1 выше, похоже, что FAM46B взаимодействует с мозгоспецифичными белками. Третий белок, идентифицированный дрожжевым двухгибридным скринингом как физический взаимодействующий с FAM46B, — это PEPP2, [8] парный гомеобоксный белок. Если это взаимодействие значимо, то взаимодействие между FAM46B и PEPP2 может играть роль в развитии и морфогенезе.
Однако интерактом белков пока не очень хорошо изучен. Не каждая программа идентифицировала взаимодействующие белки одинаково. Например, STRING идентифицировала ATXN-1 как сильного партнера по взаимодействию с FAM46B, но не идентифицировала PEPP2 или DAZAP2 . Сеть предсказаний от STRING показана на соседнем изображении.