Метилирование CpG островков: 5mC, DNMT и репрессия экспрессии

Метилирование CpG островков - основной эпигенетический способ выключения генов у млекопитающих. Цитозин в CpG-динуклеотиде ковалентно модифицируется в 5-метилцитозин, и плотное метилирование промоторного островка делает ген «молчащим» без изменения последовательности ДНК. На этом механизме держится X-инактивация, импринтинг и значительная часть онкогенеза.
Что такое CpG-островок
CpG-островок - это участок ДНК длиной более 200 пар нуклеотидов с высоким содержанием G и C (обычно более 50 процентов) и наблюдаемой частотой CpG-динуклеотидов, близкой к ожидаемой. В среднем по геному CpG встречается в 4–5 раз реже, чем должно быть статистически: за миллионы лет метилированные цитозины спонтанно дезаминировались в тимин, и геном «вычистил» большую часть таких пар. Островки уцелели именно потому, что обычно остаются неметилированными.
Островки сидят на промоторах примерно 60–70 процентов всех генов человека, включая почти все гены домашнего хозяйства. Их неметилированный статус - нормальное состояние; метилирование островка - почти всегда сигнал репрессии.
5-метилцитозин и его химия
5-метилцитозин (5mC) образуется присоединением метильной группы к 5-му атому пиримидинового кольца цитозина. Донор метила - S-аденозилметионин (SAM), который после реакции превращается в S-аденозилгомоцистеин. В геноме млекопитающих 5mC встречается почти исключительно в контексте CpG; в эмбриональных стволовых клетках есть и не-CpG метилирование (CpH), но в дифференцированных тканях его доля мала.
Важная особенность CpG: динуклеотид палиндромен - на комплементарной цепи тоже стоит CpG. Это и делает паттерн метилирования наследуемым через репликацию.
DNMT3A и DNMT3B - метилирование de novo
ДНК-метилтрансферазы семейства DNMT3 (3A и 3B) ставят метильные метки на ранее неметилированные CpG. Это работа de novo: во время раннего эмбрионального развития геном сначала почти полностью деметилируется, а затем DNMT3A/3B вместе с регуляторной субъединицей DNMT3L закладывают паттерн, специфичный для зародышевых клеток и зачатков тканей.
DNMT3A работает преимущественно в гемопоэтических стволовых клетках и в зародышевой линии. Соматические мутации в DNMT3A - одни из самых частых драйверов острого миелоидного лейкоза. DNMT3B отвечает за метилирование центромерных повторов и сателлитной ДНК; мутации DNMT3B вызывают синдром ICF (иммунодефицит, нестабильность центромер, лицевые аномалии).
DNMT1 - поддержание паттерна через репликацию
Когда ДНК реплицируется, дочерняя цепь синтезируется без меток. Получается гемиметилированный дуплекс: метил стоит только на материнской цепи. DNMT1 узнаёт такой субстрат с помощью адаптера UHRF1, который специфически связывает гемиметилированные CpG, и копирует метку на новую цепь. Без DNMT1 паттерн размывается за несколько делений, и клетка теряет идентичность.
DNMT1 локализована в репликативной вилке и работает котранскрипционно с PCNA. Полный нокаут DNMT1 у мышей летален на E9.5; кондиционные нокауты в опухолевых клетках вызывают глобальную деметиляцию и реактивацию молчащих генов.
TET и активное деметилирование
Долгое время метилирование считали односторонней реакцией: метил можно поставить, но снять нельзя. Семейство TET (TET1, TET2, TET3) изменило картину. TET - это диоксигеназы, зависимые от 2-оксоглутарата и Fe(II); они окисляют 5mC последовательно в 5-гидроксиметилцитозин (5hmC), затем в 5-формилцитозин (5fC) и 5-карбоксицитозин (5caC). Последние две формы распознаются тимин-ДНК-гликозилазой (TDG) и удаляются через base excision repair, возвращая обычный цитозин.
5hmC - не просто промежуточная форма, а самостоятельная метка: в нейронах его доля достигает 1 процента всех цитозинов, и он ассоциирован с активной транскрипцией. Мутации TET2 - частый драйвер миелодиспластических синдромов и Т-клеточных лимфом.
Как метилирование репрессирует экспрессию
Метилированный цитозин в промоторе мешает транскрипции двумя путями. Прямой путь: некоторые транскрипционные факторы (например, CTCF) не садятся на метилированную ДНК и теряют способность активировать ген или формировать петли хроматина. Косвенный путь - через белки с MBD-доменом (MeCP2, MBD1, MBD2, MBD4). MBD-белки садятся на 5mC и приводят за собой репрессивные комплексы: гистоновые деацетилазы (HDAC1/2), метилтрансферазу H3K9 (SETDB1, G9a), полирепрессивный комплекс PRC.
Получается каскад: метилирование ДНК запускает деацетилирование гистонов и метилирование H3K9, хроматин компактизуется, ген уходит в гетерохроматин. Связка «метил-ДНК - H3K9me - HP1» делает репрессию устойчивой и наследуемой.
X-инактивация, импринтинг и опухоли
Метилирование CpG-островков отвечает за три ключевых биологических явления у млекопитающих.
X-инактивация. У самок одна из двух X-хромосом случайно выключается на ранней стадии эмбриогенеза. Запускает процесс длинная некодирующая РНК XIST, которая «обволакивает» неактивную X-хромосому; затем CpG-островки её промоторов плотно метилируются и обеспечивают пожизненное молчание. На активной X островки XIST, наоборот, метилированы - поэтому XIST там не транскрибируется.
Геномный импринтинг. Около 100 генов человека экспрессируются только с одной родительской аллели; вторая аллель молчит из-за метилирования импринтинг-контролирующего региона (ICR), заложенного в гаметогенезе. Классический пример - локус Igf2/H19: материнский ICR метилирован, отцовский - нет, поэтому Igf2 экспрессируется только с отцовской аллели. Нарушения импринтинга вызывают синдромы Беквита - Видеманна, Прадера - Вилли и Ангельмана.
Опухоли. В раковых клетках метилом ломается по двум направлениям одновременно. Промоторы генов-супрессоров опухолей (BRCA1, CDKN2A/p16, MLH1, RASSF1A, VHL) гиперметилируются - клетка теряет тормоза. Глобально же геном опухоли гипометилирован: метил уходит с повторов и центромер, что повышает геномную нестабильность и реактивирует онкогены и ретротранспозоны. Эта комбинация - мишень для эпигенетической терапии азацитидином и децитабином.
Как измерить метилирование
Бисульфит-секвенирование - золотой стандарт. Обработка бисульфитом натрия превращает неметилированный цитозин в урацил (а после ПЦР - в тимин), а 5mC остаётся цитозином. После секвенирования C/T-замены на каждой позиции читаются как «было метилировано / не было».
Бисульфит не различает 5mC и 5hmC. Чтобы их развести, придумали окислительный бисульфит (oxBS): сначала KRuO4 окисляет 5hmC до 5fC, а уже потом бисульфит - обе формы конвертируются по-разному, и вычитанием получают чистую карту 5mC.
Микрочипы Illumina EPIC (850 тысяч CpG, версия EPIC v2 - около 935 тысяч) - практичный массовый инструмент, особенно для эпидемиологии и эпигенетических часов. Полное WGBS даёт разрешение на каждый CpG, но дорого.
Клиническая применимость
Метилирование циркулирующей опухолевой ДНК (цоДНК) в плазме - один из самых перспективных онкомаркеров. Тест Galleri (GRAIL) ищет рак более чем 50 локализаций по паттерну метилирования цоДНК и претендует на чувствительность около 51 процента при специфичности 99 процентов. Тест Epi proColon обнаруживает метилирование SEPT9 как маркер колоректального рака; COLVERA - гиперметилирование BCAT1 и IKZF1 для мониторинга рецидива.
Эпигенетические часы Хорвата и Хеннона по уровню метилирования сотен CpG предсказывают биологический возраст с точностью около 3 лет - отдельная область биомаркеров старения.
Частые ошибки
- Путать CpG-островок и любой CpG-динуклеотид. Островок - это плотная область с GC более 50 процентов и длиной более 200 пар нуклеотидов, обычно на промоторе.
- Считать, что метилирование всегда репрессирует. Метилирование тела гена (gene body) часто сопровождает активную транскрипцию; репрессирует именно метилирование промотора и первого экзона.
- Игнорировать 5hmC. Бисульфит-секвенирование без oxBS суммирует 5mC и 5hmC, и в нейронах это даёт ощутимое завышение «метилирования».
- Смешивать гипер- и гипометилирование в опухоли. Это не противоречие, а две стороны одного процесса: локальная гиперметиляция супрессоров плюс глобальная гипометиляция повторов.
FAQ
Как метилирование CpG передаётся по наследству? Внутри организма - через DNMT1, копирующую паттерн на новую цепь после репликации. Между поколениями паттерн в основном стирается дважды (в гаметогенезе и в зиготе) и закладывается заново, но импринтированные локусы и часть ретротранспозонов уходят от перепрограммирования и наследуются. Это и называют трансгенерационным эпигенетическим наследованием.
Чем 5mC отличается от 5hmC по функции? 5mC, особенно в промоторе, ассоциирован с репрессией и привлекает MBD-белки. 5hmC привлекает другой набор белков (среди прочих - MBD3, CHTOP) и чаще встречается в активно транскрибируемых регионах и энхансерах. Биологически 5hmC - не «недометиляция», а отдельная метка.
Можно ли терапевтически снять метилирование? Да, есть два одобренных гипометилирующих агента: 5-азацитидин (Vidaza) и 5-аза-2-дезоксицитидин (децитабин, Dacogen). Оба встраиваются в ДНК и ковалентно ловят DNMT1, что приводит к глобальной деметиляции. Используются при миелодиспластических синдромах и остром миелоидном лейкозе. Идут испытания таргетных ингибиторов DNMT3A и EZH2.
Коротко
Метилирование CpG-островков - это присоединение метила к цитозину в CpG-динуклеотиде с образованием 5-метилцитозина. DNMT3A и DNMT3B ставят метку de novo, DNMT1 поддерживает её через репликацию, а семейство TET окисляет 5mC в 5hmC и далее, запуская активное деметилирование. Метилированный промотор привлекает MBD-белки, HDAC и H3K9-метилтрансферазы, что компактизует хроматин и репрессирует ген. На этом механизме держатся X-инактивация, геномный импринтинг и существенная часть онкогенеза; бисульфит-секвенирование, EPIC-чипы и анализ метилирования цоДНК - основные инструменты для клинической диагностики и эпидемиологии.
Читайте также

Длинные некодирующие РНК (lncRNA): что это и зачем
Разбираем, что такое длинные некодирующие РНК (lncRNA): чем отличаются от мРНК, как регулируют гены и хроматин, и зачем нужны примеры XIST, HOTAIR и MALAT1.

Гем, железо и протопорфирин IX: строение и биосинтез
Гем — это комплекс железа Fe²⁺ с протопорфирином IX. Разбираем строение тетрапиррольного кольца, восемь ферментов биосинтеза от АЛК до феррохелатазы, регуляцию и порфирии.

Бактериальная эндоспора: структура оболочек послойно
Разбираем, из чего состоит бактериальная эндоспора: структура сердцевины, кортекса и оболочек, роль дипиколината кальция и SASP, почему спора выдерживает жар и высыхание.