1. Короткие ретропозоны: структура, эволюция, транскрипция и процессинг.

 

Короткие ретропозоны, или SINEs (Short Interspersed Elements) представляют собой рассеянные по геномам эукариот мобильные генетические элементы длиной от 80 до 400 п.н., амплификация которых происходит с помощью обратной транскрипции (см. обзор Kramerov and Vassetzky, 2005). Впервые они были обнаружены в геномах мыши (Kramerov et al., 1979; Krayev et al., 1980, 1982) и человека (Rubin et al., 1980; Deininger et al., 1981). SINEs делятся на семейства; нуклеотидные последовательности SINEs, входящих в одно семейство, как правило, обладают 65 – 90%-ным сходством. У  млекопитающих одного вида в геноме обычно имеется 2 – 4 семейства SINEs, каждое из которых содержит от 10 тысяч до миллиона  копий.  SINEs транскрибируются РНК-полимеразой III благодаря наличию в их 5’–концевой части промотора РНК-полимеразы III, состоящего обычно из двух боксов (А и В), которые разделены последовательностью длиной 30-40 п.н. SINEs относятся к неавтономным мобильным элементам, поскольку не кодируют собственных ферментов и используют для своего размножения обратную транскриптазу, закодированную в одном из видов длинных ретропозонов, или LINEs (Long Interspersed Elements). Большинство SINEs млекопитающих размножается с помощью так называемого LINE-1 (см. обзор Kramerov and Vassetzky, 2005).


Сотрудниками лаборатории описана приблизительно треть всех известных к настоящему времени семейств коротких ретропозонов млекопитающих. На филогенетическом древе млекопитающих такие короткие ретропозоны выделены красным.

Короткие ретропозоны млекопитающих
SINEs млекопитающих
 

 

Для обнаружения и клонирования новых семейств SINEs в лаборатории были разработаны методы, основанные на полимеразной цепной реакции (ПЦР) с использованием олигонуклеотидных праймеров, комплементарных боксам А и В промотора РНК-полимеразы III (Borodulina and Kramerov, 1999, 2001, 2005; Косушкин и др., 2006). Кроме того, для поиска и анализа  новых SINEs используются биоинформационные методы (Vassetzky and Kramerov, 2002; Vassetzky et al., 2003; Veniaminova et al., 2007). Полученные данные свидетельствуют о том, что SINEs имеются у всех млекопитающих, а также рептилий и широко распространены среди многоклеточных.


Известно, что большинство семейств SINEs ведет свое происхождение от тРНК: последовательность, сходная с одной из таких РНК, располагается на 5'-конце SINE. Далее в SINEs следует участок неизвестного происхождения, а затем «хвост», богатый адениловыми остатками. Мы заметили, что SINEs некоторых семейств состоят лишь из тРНК-родственной последовательности и А-богатого хвоста; они были названы простыми  SINEs (Borodulina and Kramerov, 2005, 2006). В эволюции такие генетические элементы могут порождать более сложно устроенные и «успешные» короткие ретропозоны. Один из распространенных путей эволюции SINEs – их димеризация, то есть образование новых SINEs путем соединения двух ранее существовавших (Vassetzky and Kramerov, 2002; Vassetzky et al., 2003; Gogolevsky and Kramerov, 2006; Veniaminova et al., 2007).


Значительно более редким по сравнению с тРНК источником  SINEs является 7SL РНК – компонент сигнал-узнающих частиц (SRP), которые участвуют в трансляции секретируемых и мембранных белков (Ullu and Tschudi, 1984). К таким семействам  SINEs относятся В1-элементы, свойственные всем грызунам (Krayev et al., 1980; Vassetzky et al., 2003; Veniaminova et al., 2007), Alu-элементы приматов (Deininger et al., 1981; Zietkiewicz et al., 1998) и низкокопийные SINEs тупай (Nishihara et al., 2002;  Vassetzky et al., 2003).


5S рРНК – третий тип РНК, синтезирующихся РНК-полимеразой III и дающих начало семействам SINEs. Активные семейства таких SINEs распространены среди рыб, хотя их фрагменты в небольшом числе встречаются также в геномах млекопитающих и птиц (Kapitonov and Jurka 2003; Nishihara et al., 2006). В геноме грызуна  капского долгонога мы обнаружили молодое активное семейство  SINE (Ped-1), содержащее на 5’-конце ретропозона последовательность, родственную 5S рРНК (Gogolevsky et al., 2008). Многочисленные 5S рРНК-родственные SINEs найдены нами и в геномах крыланов (Megachiroptera) (Gogolevsky et al., 2009). Однако, по-видимому, 5S рРНК генерировала  SINEs в ходе эволюции значительно реже, чем различные виды тРНК.


3'-концевая часть  SINEs не менее важна и интересна, чем 5'-концевая, несущая промотор для РНК-полимеразы III. В отличие от А-богатого хвоста, характерного для большинства SINEs млекопитающих, хвосты SINEs рыб и рептилий состоят из небольшого числа прямых коротких повторов. Такому хвосту предшествует участок длиной 50-100 п.н., гомологичный  3'-концевой части того или иного LINE, например, L2, L3 или CR1. Вся эта часть SINE очень важна для его ретропозиции, поскольку ответственна за узнавание и связывание РНК SINE обратной транскриптазой, закодированной в соответствующем LINE (Ohshima and Okada, 2005). У млекопитающих несколько семейств SINEs имеют такое же строение. Особо нужно отметить SINEs, ретропозиция которых связана с активностью LINE Bov-B. Мы  недавно обнаружили (Gogolevsky et al., 2008), что, помимо Bov-tA жвачных (Okada and Hamada, 1997) и Mar-1 сумчатых (Gilbert and Labuda, 2000), к ним относятся SINEs Ped-1 и Ped-2 капского долгонога, а также AfroSINE из геномов слонов, даманов, сирен, трубкозубов, прыгунчиков, тенреков и златокротов (надотряд Afrotheria). 3'-концевая половина всех этих SINEs имеет уникальное строение: она состоит из двух участков, гомологичных соответственно 5'- и 3'-районам LINE Bov-B.

Строение SINEs, мобилизуемых Bov-В LINE
Строение SINEs, мобилизуемых Bov-B LINE
 

 

Вероятно, оба эти участка важны для узнавания таких SINEs обратной транскриптазой Bov-B.


Особое внимание в наших исследованиях уделено А-богатым хвостам SINEs млекопитающих. Мы обнаружили, что все такие SINEs можно разделить на два класса: T+ и Т (Borodulina and Kramerov, 2001). SINEs класса T+ в своих А-богатом хвостах содержат гексануклеотид(ы) AATAAA и терминатор транскрипции (TTTT  или TCTTT). Такие последовательности отсутствуют у SINEs класса Т.  Было высказано предположение, что РНК, транскрибирующаяся с SINEs класса T+ РНК-полимеразой III, может полиаденилироваться благодаря наличию около ее 3'-конца гексануклеотида(ов) AAUAAA. (Как известно, AAUAAA служит сигналом полиаденирования в РНК, транскрибирующихся РНК-полимеразой II). При изучении транскриптов В2-элемента (первого из описанных SINEs класса T+) в клетках мыши были получены свидетельства о наличии длинных сегментов поли(А) на их 3'-концах (Kramerov et al., 1982, 1985, 1990). Используя трансфекцию клеток человека В2-элементом с мутациями и без них, мы однозначно доказали, что В2 РНК подвергается полиаденилированию (Borodulina and Kramerov, 2008). Позднее тем же способом было показано (Borodulina et al. 2016), что РНК транскрибированные РНК-полимеразой III c других семи SINEs класса Т+, также подвергаются полиаденилированию (см. рисунок). Напротив, даже искусственное введение гексамеров AATAAA и терминатора транскрипции в хостовую SINEs класса T не приводило к полиаденилированию их транскриптов (Borodulina et al. 2016). Было предположено, что у SINEs класса T+, имеются помимо гексамеров AATAAA и терминатора, какие-то другие участки важные для полиаденилирования. Действительно при изучении трех SINEs класса T+ (B2, Dip и Ves) были обнаружены два района (β и τ) нуклеотидные последовательности, каждого из который вносят вклад в эффективность полиаденилирования транскриптов этих SINEs (см. рисунок) (Borodulina et al. 2016) . Транскрипты SINEs класса Т+ представляют собой первый пример РНК, транскрибируемой РНК-полимеразой III, которые подвергаются полиаденилированию, зависящему от AAUAAA-сигнала. Описанное явление очень интересно, так как имевшиеся до настоящего времени данные указывали на тесную связь лишь между транскрипцией генов РНК-полимеразой II и полиаденилированием образующейся РНК. Изучение полиаденилирования транскриптов, образованных РНК-полимеразой III, является одной из наиболее актуальных тематик лаборатории.

Структура, транскрипция и полиаденилирование T+ SINE
 Полиаденилирование РНК B2
Схема, иллюстрирующая структуру SINE класса T+, его транскрипцию РНК-полимеразой III и полиаденилирование образующейся РНК. Дугообразные стрелки символизируют стимулирующее действие бета- и тау-районов на полиаденилирование транскрипта

 


Многолетнее изучение коротких ретропозонов позволило нам пересмотреть концепции, касающиеся SINE, и создать на их основе реляционную базу данных семейств коротких ретропозонов. Она представлена на веб-сервере, который также предлагает инструменты для идентификации и анализа последовательностей известных и неизвестных коротких ретропозонов (Vassetzky and Kramerov, 2013).

 

2. Использование коротких ретропозонов и сателлитных ДНК для изучения филогении.


Изучая таксономическое распространение семейств SINEs у млекопитающих, мы пришли к выводу, что они могут быть использованы для выяснения филогенетических связей между таксонами среднего уровня – семействами или отрядами (Serdobova and Kramerov, 1998). Однажды возникнув в геноме какого-то вида, семейство SINEs предается в эволюции всем видам, ведущим от него свое происхождение. Независимое возникновение одного и того же семейства SINEs в геномах двух разных видов представляется событием крайне маловероятным. Таким образом, виды, которые обладают SINEs, относящимися к одному семейству, ближе друг к другу, чем  прочим видам. Используя данный подход, мы подтвердили родственность отрядов грызунов, приматов и тупай (Vassetzky et al., 2003), изучили филогенетические связи между рядом семейств грызунов и, в частности, показали, что сони (Gliridae) родственны не миоморфным грызунам, как считалось ранее, а белкам (Sciuridae) (Kramerov et al., 1979).

Древо грызунов и распространение коротких ретропозонов
Древо грызунов и распространение коротких ретропозонов
Стрелками показаны моменты возникновения соответствующих коротких ретропозонов.

 

Изучение нуклеотидных последовательностей SINE В1 из различных семейств грызунов позволило нам проанализировать филогенез этого отряда и получить аргументы в пользу раннего отделения ветви Gliridae-Sciuridae-Aplodontia от древа остальных грызунов (Kramerov et al., 1999; Veniaminova et al., 2007; Вениаминова и др., 2007). Использование этого же подхода, а также исследования структуры 4.5SI РНК (см. ниже), позволило установить родство цокоров   (Myospalacinae) с слепышами и бамбуковыми крысами (Spalacidae), а не c хомяками (Cricitidae), как это традиционно считалось (Gogolevskaya, Veniaminova, Kramerov, 2010).


В лаборатории совместно с сотрудниками МГУ (А. Банниковой и В. Матвеевым) применяется также другой подход к изучению филогенетических связей, основанный на использовании SINEs.  Этот метод, называемый интер-SINE-ПЦР, заключается в проведении полимеразной цепной  реакции (ПЦР) геномной ДНК с использованием праймеров, комплементарных SINE одного из семейств, в ходе которой происходит амплификация  участков ДНК между близко (до 3000 п.н.)  расположенными копиями SINEs. Сравнение наборов амплифицированных фрагментов ДНК, выявляемых в результате электрофореза в полиакриламидном или агарозном геле, позволяет построить филогентическое древо исследуемой группы организмов. Метод применим для анализа низших таксонов – подвидов, видов и, в некоторых случаях, родов. С помощью интер-SINE-ПЦР изучались родственные связи среди летучих мышей семейства Vespertilinidae (Банникова и др. 2002; Matveev et al., 2005), ежей (Банникова и др., 2003), землероек (Bannikova et al., 2003, 2005, 2006),  обезьян старого Света и Homo sapiens (Рябинина и др., 2008). В настоящее время этот метод мы используем для изучения филогенетических связей между видами ящериц рода Darevskia и Lacerta (Гречко и др., 2006; Гречко и др., 2007). 


В лаборатории проводятся также исследования сателлитных повторов геномов чешуйчатых рептилий (отр. Squamata) – с целью выяснения молекулярно-генетических связей между таксонами. Из генома скальных ящериц Кавказа выделено, секвенировано и охарактеризовано четыре семейства сателлитных повторов (CLsatI-IV), обладающих специфическими свойствами на уровне родов семейства Lacertidae (Grechko et al., 1997; Fedorov et al., 1998; Чобану и др., 2002, 2003). Свойства, содержание и соотношение разных вариантов сателлитных повторов у видов и родов семейства оказались хорошими молекулярно-генетическими признаками, на основе которых изучено  родство множества видов, подвидов и популяций ящериц рода Darevskia, морфологическая таксономия которых чрезвычайно сложна и запутана (Ciobanu et al., 2004; Grechko et al., 2006). Использование сателлитных маркеров на низших уровнях таксономии полезно и перспективно и позволило выяснить некоторые спорные вопросы видообразования и биоразнообразия этих животных (Гречко, 2002).

 

3. Малые РНК, родственные коротким ретропозонам.

 

В клетках мышей и крыс существует две своеобразные малые РНК, обозначаемые как 4.5SH и 4.5SI (Ro-Choi et al., 1972; Harada and  Kato, 1980; Schoeniger and Jelinek, 1986). Обе эти РНК не обнаруживаются в клетках человека. 4.5SH РНК имеет явную гомологию с SINE B1 (Krayev et al., 1982; Kramerov et al., 1982), хотя и короче его (94 н. против 130 п.н.). 4.5SI РНК длиною в 98 н. обладает некоторым сходством нуклеотидной последовательности с другим SINE – B2 (Krayev et al., 1982; Serdobova and Kramerov, 1998). Обе РНК имеют преимущественно ядерную локализацию. Часть молекул 4.5SH нековалентно  связана с поли(А)-содержащими РНК (видимо, мРНК) (Schoeniger and Jelinek, 1986). Роль обеих малых РНК остается неясной.


Исследования, проводимые в нашей лаборатории (Gogolevskaya and Kramerov, 2002; Gogolevskaya et al., 2005), показали, что распространение 4.5SI и 4.5SH  РНК  ограничено соответственно четырьмя и шестью семействами грызунов (рис. 4). При этом распространение 4.5SI РНК и SINE B2 одинаково; это позволяет предположить, что они возникли в эволюции грызунов приблизительно в один и тот же период времени. Распространение  4.5SH  РНК  намного уже, чем распространение гомологичного ей SINE B1.

Гомология SINEs и малых РНК грызунов
Гомология SINEs и малых РНК грызунов
Т - терминатор РНК-полимеразы III.

 

Предполагается, что ген этой малой РНК произошел из одной из копий В1. Нуклеотидные последовательности каждой из двух малых РНК весьма консервативны, то есть они, видимо, обладают определенными функциями и подвержены отбору. Таким образом, 4.5SI и 4.5SH  РНК могут служить примерами приобретения функции  нефункциональными нуклеотидными последовательностями.


Также как в геномах мышей (Schoeniger and Jelinek, 1986), в геномах хомяков, слепышей и тушканчиков (Gogolevskaya et al., 2005) 4.5SH  РНК закодирована в сотнях генов, входящих в состав протяженных (4-5 тыс. п.н.) тандемных повторов (один ген в одном повторе). Нуклеотидные последовательности повторов (исключая сам ген) у грызунов разных семейств не имеют сходства, то есть они мало подвержены отбору (Gogolevskaya et al., 2005).

 

Мы показали что в геномах мышей и крыс имеется только по три гена 4.5SI РНК. Они расположены в одном локусе генома на расстоянии нескольких тысяч нуклеотидов друг от друга. Показана важность для транскрипции этих генов РНК-полимеразой III, не только внутреннего промотора, но и последовательностей, расположенных непосредственно перед геном (Gogolevskaya, Kramerov, 2010).

 

Исследуя транскрипцию РНК-полимеразой III гена 4.5SH РНК, мы пришли заключению, что различные последовательности ДНК, будучи вставленными непосредственно перед  геном могут по-разному влиять на его транскрипцию: от полной репрессии до очень эффективной активации (Koval, Kramerov, 2009).


4.5SI РНК подобно большинству изученных РНК стабильна в клетке (время полу-жизни: Т½=22 ч). В отличие от этого 4.5SH РНК – короткоживущая (Т½=18 мин). Создавая химеры этих двух малых РНК, а также изменяя их нуклеотидные последовательности, мы пришли к выводу о том, что комплементарность 16-нуклеоитидных концевых районов 4.5SI РНК определяет ее стабильность в клетке, тогда как отсутствие такой комплементарности в 4.5SH РНК вызывает ее быстрый распад после синтеза в ядре (Koval et al., 2012). Аналогичная работа, проведенная на короткоживущих транскриптах SINE B2 и Rhin-1, показала, что внесение в их структуру длинного концевого двуспирального стебля также приводит к увеличению времени жизни этих РНК в клетке (Koval et al. 2015).

Мы показали, что при воздействии теплового шока уровень 4.5SH РНК в клетке увеличивается в 3-10 раз (в зависимости от типа клеток), в то время как содержание 4.5SI РНК практически не меняется. Увеличение уровня 4.5SH РНК было обусловлено как активацией транскрипции ее генов, так и замедлением распада этой РНК (Tatosyan and Kramerov, 2016).

Была исследована представленность 4.5SH и 4.5SI РНК в органах мыши, крысы и хомяка (Татосян и др. 2017). Уровень 4.5SI РНК в различных органах варьируется незначительно, содержание 4.5SH РНК повышено в мозге и семенниках. Нами также показана преимущественно ядерная локализация в клетке как 4.5SH РНК (75-78%), так и 4.5SI РНК (67-78%). Оценка числа молекул 4.5SH и 4.5SI РНК в клетках различных линий показала, что обе эти РНК богато представлены (не менее 400 тыс. молекул 4.5SH РНК и не менее 900 тыс. молекул 4.5SI РНК на одну клетку).

Вторичная структура 4.5SI РНК

Вторичная структура 4.5SI РНК


Вторичная структура 4.5SH РНК

Вторичная структура 4.5SH РНК


 

4. Малые ядрышковые РНК и их гены хозяева.


Известно, что более 100 нуклеотидов в рРНК подвергаются метилированию по 2'-OH группе рибозы. Установлено, что направляют эту реакцию многочисленные малые ядрышковые РНК семейства C/D (см. обзор Макарова и Крамеров, 2007a). Каждая из этих РНК узнает определенный участок в рРНК, благодаря присутствию в них так называемых антисенс-элементов длиной 10-12 н.   Характерной особенностью этих малых ядрышковых РНК является наличие боксов C и C', а также D и D'. У позвоночных C/D РНК закодированы в интронах ряда генов, называемых генами-хозявами; малые РНК вырезаются из интронных участков после сплайсинга пре-мРНК (см. обзор Макарова и Крамеров, 2007b).


В клетках крысы мы обнаружили новую малую ядрышковую C/D РНК, названную U87, которая, судя по структуре ее антисенс-элемента, участвует в метилировании G 28S рРНК в позиции 3468 (Gogolevskaya et al., 2002; Макарова и Крамеров, 2005). 

U87 РНК направляет метилирование G-3468 в 28S рРНК
Строение SINEs, мобилизуемых Bov-B LINE
Рис. 6.
U87 РНК была обнаружена и в клетках млекопитающих других видов, включая человека. Далее мы установили, что эта РНК закодирована в интроне ранее неизвестного гена, который получил название U87HG (Makarova and Kramerov, 2005; Макарова и Крамеров, 2005). Этот ген-хозяин весьма необычен: его экзоны не содержат длинных открытых рамок считывания и, таким образом, не кодируют никаких белков. Кроме U87HG известно только четыре не кодирующих белки гена-хозяина малых ядрышковых РНК.


Поиск генов различных малых ядрышковых C/D РНК в секвенированных геномах позвоночных выявил, что у плацентарных млекопитающих, как правило, каждый такой ген представлен меньшим числом копий, чем в у других позвоночных (Makarova, Kramerov, 2009). Возможно, это связано с малыми размерами яйцеклеток у плацентарных млекопитающих.

 

в начало