Эта статья может быть слишком технической для понимания большинства читателей . ( Август 2013 ) |
LSM-домен | |||||||||
---|---|---|---|---|---|---|---|---|---|
Идентификаторы | |||||||||
Символ | ЛСМ | ||||||||
Пфам | ПФ01423 | ||||||||
ИнтерПро | IPR001163 | ||||||||
СКОП2 | 1d3b / ОБЛАСТЬ ПРИМЕНЕНИЯ / SUPFAM | ||||||||
CDD | cd00600 | ||||||||
|
В молекулярной биологии белки LSm представляют собой семейство РНК -связывающих белков, обнаруженных практически в каждом клеточном организме . LSm — это сокращение от «like Sm», поскольку первыми идентифицированными членами семейства белков LSm были белки Sm . Белки LSm определяются характерной трехмерной структурой и их сборкой в кольца из шести или семи отдельных молекул белков LSm и играют большое количество различных ролей в процессинге и регуляции мРНК .
Белки Sm были впервые обнаружены как антигены, на которые нацелены так называемые анти-Sm антитела у пациента с формой системной красной волчанки (СКВ), изнурительного аутоиммунного заболевания . Они были названы белками Sm в честь Стефани Смит, пациентки, страдавшей от СКВ. [1] Впоследствии были обнаружены и названы другие белки с очень похожей структурой. Новые члены семейства белков LSm продолжают идентифицироваться и сообщаться.
Белки со схожими структурами группируются в иерархию семейств белков, суперсемейств и складок. Структура белка LSm является примером небольшого бета-слоя, свернутого в короткий ствол. Отдельные белки LSm собираются в кольцо-бублик из шести или семи членов (более правильно называемое торусом ), которое обычно связывается с небольшой молекулой РНК, образуя комплекс рибонуклеопротеинов . Тор LSm помогает молекуле РНК принимать и поддерживать свою правильную трехмерную структуру. В зависимости от того, какие белки LSm и молекула РНК задействованы, этот комплекс рибонуклеопротеинов облегчает широкий спектр обработки РНК, включая деградацию, редактирование, сплайсинг и регуляцию.
Альтернативными терминами для семейства LSm являются LSm-складка и Sm-подобная складка , а альтернативные стили написания заглавных букв, такие как lsm , LSM и Lsm , являются общепринятыми и одинаково приемлемыми.
История открытия первых белков LSm начинается с молодой женщины, Стефани Смит, у которой в 1959 году был диагностирован системный красный волчанка (СКВ) , и которая в конечном итоге скончалась от осложнений заболевания в 1969 году в возрасте 22 лет. [1] В этот период она лечилась в больнице Рокфеллеровского университета в Нью-Йорке под наблюдением доктора Генри Кункеля и доктора Энга Тана. Как и люди с аутоиммунным заболеванием , пациенты с СКВ вырабатывают антитела к антигенам в ядрах своих клеток , чаще всего к собственной ДНК . Однако Кункель и Тан обнаружили в 1966 году, что Смит вырабатывает антитела к набору ядерных белков, которые они назвали « антигеном Смита » ( Sm Ag ). [2] Около 30% пациентов с СКВ вырабатывают антитела к этим белкам, в отличие от двухцепочечной ДНК. Это открытие улучшило диагностическое тестирование на СКВ, но природа и функция этого антигена были неизвестны.
Исследования продолжались в 1970-х и начале 1980-х годов. Было обнаружено, что антиген Смита представляет собой комплекс молекул рибонуклеиновой кислоты ( РНК ) и нескольких белков. Набор богатых уридином малых ядерных молекул РНК ( мяРНК ) был частью этого комплекса и получил названия U1 , U2 , U4 , U5 и U6 . Было обнаружено, что четыре из этих мяРНК (U1, U2, U4 и U5) тесно связаны с несколькими небольшими белками, которые были названы SmB , SmD, SmE , SmF и SmG в порядке убывания размера. У SmB есть альтернативно сплайсированный вариант, SmB' , и очень похожий белок, SmN , заменяет SmB'/B в определенных (в основном нервных) тканях. Позже было обнаружено, что SmD представляет собой смесь трех белков, которые были названы SmD1 , SmD2 и SmD3 . Эти девять белков (SmB, SmB', SmN, SmD1, SmD2, SmD3, SmE, SmF и SmG) стали известны как основные белки Sm или просто белки Sm . МяРНК образуют комплексы с основными белками Sm и другими белками, образуя частицы в ядре клетки, называемые малыми ядерными рибонуклеопротеинами , или мяРНП . К середине 1980-х годов стало ясно, что эти мяРНП помогают формировать большой ( молекулярный вес 4,8 МД ) комплекс, называемый сплайсосомой , вокруг пре-мРНК , вырезая части пре-мРНК, называемые интронами , и соединяя кодирующие части ( экзоны ) вместе. [3] После еще нескольких модификаций сплайсированная пре-мРНК становится информационной РНК (мРНК), которая затем экспортируется из ядра и транслируется в белок рибосомами .
МРНК U6 (в отличие от U1, U2, U4 и U5) не ассоциируется с белками Sm, хотя МРНК U6 является центральным компонентом сплайсосомы . В 1999 году был обнаружен гетеромер белка, который специфически связывается с U6 и состоит из семи белков, явно гомологичных белкам Sm. Эти белки были обозначены как белки LSm (подобные Sm) ( LSm1 , LSm2 , LSm3 , LSm4 , LSm5 , LSm6 и LSm7 ), а похожий белок LSm8 был идентифицирован позже. В бактерии Escherichia coli белок HF-I , кодируемый геном hfq, был описан в 1968 году как существенный фактор хозяина для репликации РНК- бактериофага Q β . Геном Saccharomyces cerevisiae (пекарские дрожжи) был секвенирован в середине 1990-х годов, что предоставило богатый ресурс для идентификации гомологов этих человеческих белков. Впоследствии, по мере секвенирования большего количества геномов эукариот , стало ясно, что эукариоты, в целом, разделяют гомологи с одним и тем же набором из семи белков Sm и восьми белков LSm. [4] Вскоре после этого белки, гомологичные этим эукариотическим белкам LSm, были обнаружены у архей ( Sm1 и Sm2 ) и бактерий ( гомологи Hfq и YlxS ). [5] Архейные белки LSm более похожи на эукариотические белки LSm, чем любой из них на бактериальные белки LSm. Описанные до сих пор белки LSm были довольно небольшими белками, варьирующимися от 76 аминокислот ( молекулярная масса 8,7 кДа ) для человеческого SmG до 231 аминокислоты (молекулярная масса 29 кДа) для человеческого SmB. Но недавно были обнаружены более крупные белки, которые включают структурный домен LSm в дополнение к другим структурным доменам белков (таким как LSm10 , LSm11 , LSm12 , LSm13 , LSm14 , LSm15 , LSm16 , атаксин-2 , а также архейный Sm3 ).
Около 1995 года сравнения между различными гомологами LSm выявили два мотива последовательности , длиной в 32 нуклеиновые кислоты (14 аминокислот), которые были очень похожи в каждом гомологе LSm и были разделены неконсервативной областью переменной длины. Это указывало на важность этих двух мотивов последовательности (названных Sm1 и Sm2 ), и предполагало, что все гены белков LSm произошли от одного предкового гена. [6] В 1999 году были получены кристаллы рекомбинантных белков Sm, что позволило провести рентгеновскую кристаллографию и определить их атомную структуру в трех измерениях. [7] Это показало, что белки LSm имеют схожую трехмерную складку короткой альфа-спирали и пятицепочечного сложенного бета-слоя , впоследствии названного складкой LSm . Другие исследования показали, что белки LSm собираются в тор (кольцо в форме бублика) из шести или семи белков LSm, и что РНК связывается с внутренней частью тора, при этом с каждым белком LSm связывается один нуклеотид .
Уридинфосфат связывается в архейном Sm1 между петлей β2b/β3a и петлей β4b/β5. Урацил укладывается между остатками гистидина и аргинина , стабилизируется водородной связью с остатком аспарагина и водородной связью между остатком аспартата и рибозой . Белки LSm характеризуются бета-слоем ( вторичная структура ), сложенным в складку LSm ( третичная структура ), полимеризацией в шести- или семичленный тор ( четвертичная структура ) и связыванием с олигонуклеотидами РНК . [8] Современная парадигма классифицирует белки на основе структуры белка и в настоящее время является активной областью с тремя основными подходами: SCOP ( структурная классификация белков ) , CATH ( класс , архитектура , топология , гомологичное суперсемейство ) и FSSP /DALI ( семейства структурно схожих белков ) .
Вторичная структура белка LSm представляет собой небольшой пятицепочечный антипараллельный бета-лист , с цепями, идентифицированными от N-конца до C-конца как β1, β2, β3, β4, β5. Класс SCOP всех бета-белков и класс CATH в основном бета-белков определяются как белковые структуры, которые в основном являются бета-листами, таким образом, включая LSm. Мотив последовательности SM1 соответствует цепям β1, β2, β3, а мотив последовательности SM2 соответствует цепям β4 и β5. Первые четыре бета-цепи соседствуют друг с другом, но β5 соседствует с β1, превращая общую структуру в короткий ствол. Эта структурная топология описывается как 51234. Короткая (два-четыре витка) N-концевая альфа-спираль также присутствует в большинстве белков LSm. Нити β3 и β4 короткие в некоторых белках LSm и разделены неструктурированной спиралью переменной длины. Нити β2, β3 и β4 сильно изогнуты примерно на 120° градусов в своих средних точках. Изгибы в этих нитях часто представляют собой глицин , а боковые цепи, внутренние по отношению к бета-бочонку, часто представляют собой гидрофобные остатки валина , лейцина , изолейцина и метионина .
SCOP просто классифицирует структуру LSm как Sm-подобную складку , одну из 149 различных складок бета-белка, без каких-либо промежуточных группировок. Бета-лист LSm резко изогнут и описывается как архитектура Roll в CATH (одна из 20 различных архитектур бета-белка в CATH). Одна из бета-цепей (β5 в LSm) пересекает открытый край рулона, образуя небольшую топологию типа SH3-бочки (одна из 33 топологий бета-ролла в CATH). CATH перечисляет 23 гомологичных суперсемейства с топологией типа SH3-бочки, одним из которых является структура LSm ( РНК-связывающий белок в системе CATH). SCOP продолжает свою структурную классификацию после Fold до Superfamily, Family и Domain, в то время как CATH продолжает до Sequence Family, но эти подразделения более уместно описать в разделе «Эволюция и филогения».
Третичная структура бочкообразной структуры SH3-типа LSm-складки образована сильно изогнутыми (около 120°) β2, β3 и β4 нитями, при этом бочкообразная структура закрыта β5-нитью. Подчеркивая третичную структуру, каждую изогнутую бета-нить можно описать как две более короткие бета-нити. LSm-складку можно рассматривать как восьмицепочечный антипараллельный бета-сэндвич с пятью нитями в одной плоскости и тремя нитями в параллельной плоскости с углом наклона около 45° между двумя половинами бета-сэндвича. Короткая (два-четыре оборота) N-концевая альфа-спираль находится на одном краю бета-сэндвича. Эту альфа-спираль и бета-тяжи можно обозначить (от N-конца к C-концу ) как α, β1, β2a, β2b, β3a, β3b, β4a, β4b, β5, где a и b относятся либо к двум половинам изогнутой нити в пятинитевом описании, либо к отдельным нитям в восьминитевом описании. Каждая нить (в восьминитевом описании) образована из пяти аминокислотных остатков. Включая изгибы и петли между нитями и альфа-спираль, около 60 аминокислотных остатков вносят вклад в LSm-складку, но это варьируется между гомологами из-за различий в межнитевых петлях, альфа-спирали и даже длин нитей β3b и β4a.
Белки LSm обычно собираются в кольцо LSm , шести- или семичленный тор , диаметром около 7 нанометров с отверстием 2 нанометра. Предковым состоянием является гомогексамер или гомогептамер идентичных субъединиц LSm. Белки LSm у эукариот образуют гетерогептамеры из семи различных субъединиц LSm, таких как белки Sm. Связывание между белками LSm лучше всего понять с помощью восьмицепочечного описания складки LSm. Пятицепочечная половина бета-сэндвича одной субъединицы выравнивается с трехцепочечной половиной бета-сэндвича соседней субъединицы, образуя скрученный 8-цепочечный бета-лист Aβ4a/Aβ3b/Aβ2a/Aβ1/Aβ5/Bβ4b/Bβ3a/Bβ2b, где A и B относятся к двум различным субъединицам. Помимо водородных связей между бета-цепями Aβ5 и Bβ4b двух субъединиц белка LSm, существуют энергетически выгодные контакты между гидрофобными боковыми цепями аминокислот внутри контактной области и энергетически выгодные контакты между гидрофильными боковыми цепями аминокислот по периферии контактной области.
Кольца LSm образуют рибонуклеопротеиновые комплексы с олигонуклеотидами РНК , которые различаются по прочности связывания от очень стабильных комплексов (таких как snRNP класса Sm) до транзиторных комплексов. Олигонуклеотиды РНК обычно связываются внутри отверстия (люмена) тора LSm, один нуклеотид на субъединицу LSm, но сообщалось о дополнительных сайтах связывания нуклеотидов в верхней части ( сторона α-спирали ) кольца. Точная химическая природа этого связывания варьируется, но общие мотивы включают укладку гетероциклического основания (часто урацила ) между плоскими боковыми цепями двух аминокислот, водородную связь с гетероциклическим основанием и/или рибозой и солевые мостики с фосфатной группой.
Различные виды колец LSm выполняют функции каркасов или шаперонов для олигонуклеотидов РНК , помогая РНК принимать и поддерживать правильную трехмерную структуру. В некоторых случаях это позволяет олигонуклеотиду РНК функционировать каталитически как рибозим . В других случаях это облегчает модификацию или деградацию РНК или сборку, хранение и внутриклеточный транспорт комплексов рибонуклеопротеинов . [9]
Кольцо Sm обнаружено в ядре всех эукариот (около 2,5 × 10 6 копий на пролиферирующую клетку человека) и имеет наиболее изученные функции. Кольцо Sm является гетерогептамером . Молекула мяРНК класса Sm (в направлении от 5' до 3') входит в просвет (отверстие от бублика) в субъединице SmE и последовательно движется по часовой стрелке (если смотреть со стороны α-спирали) внутри просвета (отверстия от бублика) к субъединицам SmG, SmD3, SmB, SmD1, SmD2, выходя в субъединице SmF. [10] (SmB может быть заменен вариантом сплайсинга SmB' и SmN в нервных тканях.) Кольцо Sm постоянно связывается с мяРНК U1, U2, U4 и U5, которые образуют четыре из пяти мяРНП , составляющих основную сплайсосому . Кольцо Sm также постоянно связывается с мяРНК U11 , U12 и U4atac , которые образуют четыре из пяти мяРНП (включая мяРНП U5), составляющих малую сплайсосому . Обе эти сплайсосомы являются центральными комплексами РНК-процессинга в созревании информационной РНК из пре-мРНК . Сообщалось также, что белки Sm являются частью рибонуклеопротеинового компонента теломеразы . [11]
Два мяРНП Lsm2-8 (U6 и U6atac ) выполняют ключевую каталитическую функцию в основных и второстепенных сплайсосомах. Эти мяРНП не включают кольцо Sm, а вместо этого используют гетерогептамерное кольцо Lsm2-8 . Кольца LSm примерно в 20 раз менее распространены, чем кольца Sm. Порядок этих семи белков LSm в этом кольце неизвестен, но на основании гомологии аминокислотной последовательности с белками Sm предполагается, что мяРНК (в направлении от 5' до 3') может сначала связываться с LSm5 и последовательно по часовой стрелке предшествовать LSm7, LSm4, LSm8, LSm2, LSm3 и выходить на субъединице LSm6. Эксперименты с мутациями Saccharomyces cerevisiae (почковые дрожжи) показывают, что кольцо Lsm2-8 способствует реассоциации snRNP U4 и U6 в ди-snRNP U4/U6 . [12] (После завершения делеции экзона и сплайсинга интрона эти два snRNP должны реассоциироваться для сплайсосомы, чтобы инициировать другой цикл сплайсинга экзона/интрона. В этой роли кольцо Lsm2-8 действует как шаперон РНК , а не как каркас РНК.) Кольцо Lsm2-8 также образует snRNP с малой ядрышковой РНК U8 (snoRNA), которая локализуется в ядрышке . Этот рибонуклеопротеиновый комплекс необходим для процессинга рибосомальной РНК и переноса РНК в их зрелые формы. [13] Сообщается, что кольцо Lsm2-8 играет роль в обработке пре-P РНК в РНКазу P. В отличие от кольца Sm, кольцо Lsm2-8 не связывается постоянно со своими snRNA и snoRNA.
Второй тип кольца Sm существует, когда LSm10 заменяет SmD1, а LSm11 заменяет SmD2. LSm11 представляет собой двухдоменный белок, в котором C-концевой домен является доменом LSm. Это гетерогептамерное кольцо связывается с мяРНК U7 в мяРНП U7 . ЯРНП U7 опосредует процессинг 3'-петли ствола НТО мРНК гистонов в ядре. [14] Как и кольцо Sm, оно собирается в цитоплазме на мяРНК U7 специализированным комплексом SMN.
Вторым типом кольца Lsm является кольцо Lsm1-7 , которое имеет ту же структуру, что и кольцо Lsm2-8, за исключением того, что LSm1 заменяет LSm8. В отличие от кольца Lsm2-8, кольцо Lsm1-7 локализуется в цитоплазме , где оно помогает в деградации информационной РНК в рибонуклеопротеиновых комплексах. Этот процесс контролирует оборот информационной РНК, так что рибосомная трансляция мРНК в белок быстро реагирует на изменения в транскрипции ДНК в информационную РНК клеткой. Было показано, что LSM1-7 вместе с Pat1 играет роль в формировании P-телец после деаденилирования. [15]
Комплекс SMN (описанный в разделе «Биогенез мяРНП») состоит из белка SMN и Gemin2-8 . Было обнаружено, что два из них, Gemin 6 и Gemin7, имеют структуру LSm и образуют гетеродимер. Они могут выполнять функцию шаперона в комплексе SMN, способствуя формированию кольца Sm на мяРНК класса Sm . [16] Комплекс PRMT5 состоит из PRMT5 , pICln , WD45 (Mep50) . pICln помогает формировать открытое кольцо Sm на комплексе SMN. Комплекс SMN помогает в сборке мяРНП , где кольцо Sm находится в открытой конформации на комплексе SMN, и это кольцо Sm загружается на мяРНК комплексом SMN. [17]
Белки LSm12-16 были описаны совсем недавно. Это двухдоменные белки с N-концевым доменом LSm и C-концевым доменом метилтрансферазы. [18] Очень мало известно о функции этих белков, но, предположительно, они являются членами колец домена LSm, которые взаимодействуют с РНК. Есть некоторые доказательства того, что LSm12, возможно, участвует в деградации мРНК, а LSm13-16 может играть роль в регуляции митоза . Неожиданно, LSm12 недавно был вовлечен в сигнализацию кальция , выступая в качестве промежуточного связывающего белка для нуклеотидного вторичного мессенджера, NAADP ( никотиновая кислота адениндинуклеотидфосфат ), который активирует эндолизосомальные каналы Ca 2+ TPCs ( двухпоровые каналы ). [19] Это произошло путем связывания NAADP с доменом LSm, а не с доменом AD. [19] Крупный белок неизвестной функции, атаксин-2 , связанный с нейродегенеративным заболеванием спиноцеребеллярной атаксией типа 2 , также имеет N-концевой домен LSm.
Два белка LSm обнаружены во втором домене жизни, археях . Это белки Sm1 и Sm2 (не путать с мотивами последовательностей Sm1 и Sm2), и по этой причине их иногда идентифицируют как S m-подобные архейные белки SmAP1 и SmAP2 . [20] Sm1 и Sm2 обычно образуют гомогептамерные кольца, хотя наблюдались и гомогексамерные кольца. Кольца Sm1 похожи на кольца Lsm эукариот тем, что они образуются в отсутствие РНК, в то время как кольца Sm2 похожи на кольца Sm эукариот тем, что для их образования требуется богатая уридином РНК. Сообщалось, что они ассоциируются с РНК-азой P , что предполагает их роль в процессинге транспортной РНК , но их функция в археях в этом процессе (и, возможно, в процессинге других РНК, таких как рибосомальная РНК ) в основном неизвестна. Одна из двух основных ветвей архей, кренархеоты, имеют третий известный тип архейного белка LSm, Sm3 . Это двухдоменный белок с N-концевым доменом LSm, который образует гомогептамерное кольцо. Ничего не известно о функции этого белка LSm, но, предположительно, он взаимодействует с РНК в этих организмах и, вероятно, помогает в ее обработке.
Несколько белков LSm были зарегистрированы в третьем домене жизни, Бактериях . Белок Hfq образует гомогексамерные кольца и был первоначально обнаружен как необходимый для заражения бактериофагом Qβ , хотя это явно не является нативной функцией этого белка в бактериях. Он не присутствует повсеместно во всех бактериях, но был обнаружен в Pseudomonadota , Bacillota , Spirochaetota , Thermotogota , Aquificota и одном виде Archaea . (Этот последний случай, вероятно, является случаем горизонтального переноса генов .) Hfq является плейотропным с различными взаимодействиями, обычно связанными с регуляцией трансляции . К ним относятся блокирование связывания рибосомы с мРНК , маркировка мРНК для деградации путем связывания с их поли-А-хвостами и ассоциация с бактериальными малыми регуляторными РНК (такими как РНК DsrA), которые контролируют трансляцию путем связывания с определенными мРНК. [21] [22] Второй бактериальный белок LSm — это YlxS (иногда также называемый YhbC), который был впервые идентифицирован в почвенной бактерии Bacillus subtilis . Это двухдоменный белок с N-концевым доменом LSm. Его функция неизвестна, но гомологи аминокислотной последовательности обнаружены практически в каждом бактериальном геноме на сегодняшний день, и он может быть незаменимым белком. [23] Средний домен малого проводимого механочувствительного канала MscS в Escherichia coli образует гомогептамерное кольцо. [24] Этот домен LSm не имеет очевидной функции связывания РНК, но гомогептамерный тор является частью центрального канала этого мембранного белка.
Гомологи LSm обнаружены во всех трех доменах жизни и могут быть обнаружены даже в каждом отдельном организме . Для выведения филогенетических связей используются вычислительные филогенетические методы. Выравнивание последовательностей между различными гомологами LSm является подходящим инструментом для этого, например, множественное выравнивание последовательностей первичной структуры (аминокислотной последовательности) и структурное выравнивание третичной структуры (трехмерной структуры). Предполагается, что ген белка LSm присутствовал у последнего универсального предка всей жизни. [25] Основываясь на функциях известных белков LSm, этот исходный белок LSm мог помогать рибозимам в обработке РНК для синтеза белков в рамках гипотезы мира РНК ранней жизни. Согласно этой точке зрения, этот ген передавался от предка к потомку с частыми мутациями , дупликациями генов и случайными горизонтальными переносами генов . В принципе, этот процесс можно обобщить в виде филогенетического дерева с корнем в последнем универсальном предке (или более раннем), а его вершины представляют собой вселенную генов LSm, существующих сегодня.
На основе структуры известные белки LSm делятся на группу, состоящую из бактериальных белков LSm (Hfq, YlxS и MscS), и вторую группу всех других белков LSm, в соответствии с недавно опубликованными филогенетическими деревьями . [26] Три архейных белка LSm (Sm1, Sm2 и Sm3) также кластеризуются как группа, отличная от эукариотических белков LSm. Как бактериальные, так и архейные белки LSm полимеризуются в гомомерные кольца, что является предковым состоянием.
Серия генных дупликаций одного гена LSm эукариот привела к появлению большинства (если не всех) известных генов LSm эукариот. Каждый из семи белков Sm имеет большую гомологию аминокислотной последовательности с соответствующим белком Lsm, чем с другими белками Sm. Это говорит о том, что предковый ген LSm дуплицировался несколько раз, что привело к образованию семи паралогов . Впоследствии они разошлись друг от друга, так что предковое гомогептамерное кольцо LSm стало гетерогептамерным кольцом. Основываясь на известных функциях белков LSm у эукариот и архей, предковой функцией могла быть обработка прерибосомной РНК , претрансферной РНК и преРНКазы P. Затем, согласно этой гипотезе, семь предковых генов LSm эукариот снова дуплицировались до семи пар паралогов Sm/LSm; LSm1/SmB, LSm2/SmD1, LSm3/SmD2, LSm4/SmD3, LSm5/SmE, LSm6/SmF и LSm7/SmG. Эти две группы из семи генов LSm (и соответствующие два вида колец LSm) эволюционировали в кольцо Sm (требующее РНК) и кольцо Lsm (которое образуется без РНК). Паралоговая пара LSm1/LSm8 также, по-видимому, возникла до последнего общего предка эукариот, в общей сложности по меньшей мере 15 генов белков LSm. Паралоговая пара SmD1/LSm10 и пара паралогов SmD2/LSm11 существуют только у животных , грибов и амебозоа (иногда их называют кладой униконтов ) и, по-видимому, отсутствуют в кладе биконтов ( хромальвеоляты , экскаваты , растения и ризарии ). Следовательно, эти две дупликации генов предшествовали этому фундаментальному разделению в линии эукариот. Паралоговая пара SmB/SmN наблюдается только у плацентарных млекопитающих , что датирует эту дупликацию гена LSm.
Малые ядерные рибонуклеопротеины (мяРНП) собираются в ходе четко организованного и регулируемого процесса, в котором участвуют как ядро клетки , так и цитоплазма . [27]