Комплекс CRISPR Cas9: как работает геномный редактор

Комплекс CRISPR Cas9 - это белок-нуклеаза Cas9, заряженная короткой направляющей РНК (sgRNA), которая делает разрез двунитевой ДНК ровно там, куда указывает 20-нуклеотидная «адресная» часть РНК. На этой простой идее построена вся современная геномная инженерия: от нокаута гена в клетках мышей до одобренной FDA в 2023 году терапии серповидноклеточной анемии Casgevy. Ниже - устройство комплекса, биология PAM-сайта, развилка NHEJ/HDR и типовая логика дизайна эксперимента.
Откуда взялся CRISPR: бактериальный иммунитет
CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) - это не изобретение, а адаптивная иммунная система бактерий и архей против бактериофагов и плазмид. В геноме хозяина чередуются повторы (repeats) и «спейсеры» - куски ДНК ранее атаковавших фагов. При повторной атаке бактерия транскрибирует спейсер в crRNA, которая в комплексе с tracrRNA и белком Cas узнаёт чужую ДНК и режет её.
Дженнифер Дудна и Эмманюэль Шарпантье в работе 2012 года показали, что crRNA и tracrRNA можно слить в одну химерную направляющую РНК - single guide RNA, sgRNA - и заставить Cas9 из Streptococcus pyogenes (SpCas9) резать любую заданную последовательность in vitro. Через несколько месяцев Чжан и Чёрч независимо адаптировали систему для клеток млекопитающих. За это открытие Дудна и Шарпантье получили Нобелевскую премию по химии в 2020 году.
Что входит в комплекс: Cas9 + sgRNA
Активный комплекс - это рибонуклеопротеин (RNP). Cas9 SpCas9 - белок около 160 кДа с двумя нуклеазными доменами: HNH режет нить, комплементарную sgRNA, а RuvC - противоположную. Внутри Cas9 связана sgRNA длиной примерно 100 нт: первые 20 нт на 5'-конце - это спейсер, «программируемая» часть, остальное - scaffold, который сворачивается в петли и удерживается белком.
Без РНК Cas9 биологически неактивен - это машинка, которой нужна «адресная книга». Поменяв 20-нт спейсер, вы перепрограммируете комплекс на новую мишень за один синтез олигонуклеотида.
PAM-сайт и спаривание 20 нт
Cas9 не может резать произвольную последовательность. Сначала белок сканирует геном в поисках короткого мотива PAM (Protospacer Adjacent Motif) на не-целевой нити. Для SpCas9 это - то есть любой нуклеотид, потом два гуанина, расположенные непосредственно за 20-нт целевой последовательностью.
Найдя PAM, Cas9 локально расплетает дуплекс и пытается образовать RNA-DNA-гибрид со спейсером sgRNA. Если совпадение полное или почти полное (особенно в «seed»-области - 10–12 нт, ближайших к PAM), HNH и RuvC переходят в активную конформацию и одновременно режут обе нити. Получается двунитевой разрыв (DSB) на 3 нт выше PAM с тупыми концами.
Именно PAM объясняет, почему нельзя «отредактировать что угодно»: если рядом с нужным сайтом нет NGG, придётся брать другой Cas-вариант или менять стратегию.
Двунитевой разрыв и две дороги репарации
DSB для клетки - это тревога. Включается одна из двух систем репарации, и от того, какая именно сработает, зависит результат редактирования.
NHEJ (non-homologous end joining) - быстрый, доминирующий в большинстве типов клеток путь. Концы просто сшиваются обратно лигазой IV в комплексе с Ku70/80. Часто при этом теряются или вставляются 1–10 нуклеотидов - индел. Если индел сдвигает рамку считывания внутри экзона, белок становится нефункциональным - это и есть стандартный нокаут гена.
HDR (homology-directed repair) - точная репарация по гомологичной матрице. Если в клетку доставить донорную ДНК с нужной вставкой и плечами гомологии длиной 30–1000 нт, клетка использует её как шаблон и впишет в геном точечную мутацию, тэг или целый ген. Проблема в том, что HDR активен в основном в S/G2-фазах и даёт частоту 0,1–10%, тогда как NHEJ работает в любой фазе и достигает 50–90%.
Зоопарк Cas: не только Cas9
SpCas9 - самый изученный, но не единственный игрок.
- SaCas9 из Staphylococcus aureus - компактнее (3,2 кб против 4,2 кб у SpCas9), помещается в один AAV-вектор для генной терапии. PAM длиннее: .
- Cas12a (Cpf1) - режет ДНК со сдвинутыми (sticky) концами, использует T-богатый PAM , не требует tracrRNA и сама же процессит свой crRNA-массив.
- Cas13 - режет одноцепочечную РНК, а не ДНК. Применяется для нокдауна транскриптов без вмешательства в геном и в диагностике (SHERLOCK).
- dCas9 (dead Cas9) - каталитически мёртвый: оба нуклеазных домена убиты мутациями (D10A + H840A). Не режет, но прочно садится на ДНК по адресу sgRNA. Если к нему пришить активатор транскрипции (VP64, p65) - получаем CRISPRa, репрессор (KRAB) - CRISPRi.
- Base editors - dCas9 или Cas9-никаза, слитая с дезаминазой (APOBEC, ADAR), меняет одно основание без DSB: C→T или A→G.
- Prime editors - Cas9-никаза + обратная транскриптаза + pegRNA, вписывает произвольные мутации до 40 нт без донорной ДНК.
Применения: от лаборатории до клиники
Редактирование линий клеток - рутина с 2013 года. Из более серьёзных историй:
- Casgevy (exa-cel) - первая одобренная (FDA, ноябрь 2023; затем EMA) CRISPR-терапия. Лечит серповидноклеточную болезнь и β-талассемию: у пациента берут гемопоэтические стволовые клетки, ex vivo выключают репрессор BCL11A, возвращают клетки - у них снова синтезируется фетальный гемоглобин.
- Диагностика - SHERLOCK (Cas13) и DETECTR (Cas12) детектируют РНК/ДНК патогена с чувствительностью до одиночных молекул; использовались для тестов на SARS-CoV-2.
- Скрининги - библиотеки sgRNA на десятки тысяч генов (GeCKO, Brunello) позволяют за один эксперимент найти гены, нужные для выживания клетки, устойчивости к лекарству и т.д.
- Агробиотех - нокаут генов восприимчивости к патогенам у пшеницы, риса, томата. Регуляторно в США такие сорта приравнены к классической селекции, в ЕС - пока к ГМО.
- Генная драйв - sgRNA, кодируемая в самом геноме комара, копирует себя в гомологичную хромосому и распространяется в популяции; обсуждается для борьбы с малярией.
Этика и off-target
В 2018 году китайский биолог Хэ Цзянькуй заявил о рождении девочек с CRISPR-редактированным геном CCR5 - попытка дать устойчивость к ВИЧ. Эксперимент нарушил мораторий на редактирование зародышевой линии, был осуждён научным сообществом, а Хэ получил три года тюрьмы. С тех пор любая работа с человеческими эмбрионами требует особого регулирования.
Технический риск - off-target эффекты: Cas9 переносит несовпадения вне seed-области и режет похожие последовательности в других местах генома. Стратегии минимизации:
- выбирать sgRNA с уникальной seed-областью (инструменты CRISPOR, CHOPCHOP, Benchling);
- использовать high-fidelity варианты (eSpCas9, SpCas9-HF1, HypaCas9);
- работать через RNP, а не плазмиду - короче время экспозиции;
- валидировать редактирование GUIDE-seq, CIRCLE-seq или Digenome-seq.
Дизайн эксперимента: типовая логика
Алгоритм для типового нокаута в человеческих клетках:
- Выбрать ранний кодирующий экзон гена (лучше первый общий для всех изоформ).
- Найти 3–5 кандидатных sgRNA с PAM NGG и высоким on-target скором (например, в CRISPOR).
- Отсеять варианты с большим числом off-target в кодирующих областях.
- Заказать sgRNA как синтетическую РНК и собрать RNP с рекомбинантным Cas9.
- Доставить RNP электропорацией (Lonza, Neon), клонировать единичные клетки.
- Подтвердить редактирование Sanger-секвенированием и TIDE/ICE.
Для HDR-вставки добавьте ssODN-донор длиной 100–200 нт с симметричными плечами гомологии и используйте ингибиторы NHEJ (SCR7, M3814) или временно синхронизируйте клетки в S-фазе.
Частые ошибки
- Использовать sgRNA без проверки PAM - без рядом с мишенью SpCas9 просто не режет.
- Брать sgRNA с GC-составом ниже 30% или выше 80% - резко падает эффективность.
- Ожидать высокую частоту HDR без донора и без подавления NHEJ - будет 0,5%, а не 10%.
- Игнорировать off-target и оценивать редактирование только в целевом сайте.
- Доставлять Cas9 плазмидой в первичные клетки, чувствительные к иммунному ответу на CpG - лучше RNP.
FAQ
Чем отличается sgRNA от crRNA + tracrRNA? В природе это две отдельные молекулы. Для удобства их слили линкером в одну sgRNA - функционально эквивалентно, но проще синтезировать и доставлять.
Можно ли редактировать ген, если рядом нет PAM NGG? Да, через другой Cas: SaCas9 (NNGRRT), Cas12a (TTTV) или варианты SpCas9-NG/SpRY с релаксированным PAM. Альтернатива - base/prime editing, которым DSB и канонический PAM нужны не так строго.
Почему CRISPR не вылечил все генетические болезни сразу? Главная проблема - доставка в нужную ткань и точность HDR in vivo. AAV ограничен размером груза, LNP пока работают надёжно только для печени, а HDR в неделящихся клетках не идёт. Casgevy потому и стал первым - там клетки забирают и редактируют ex vivo.
Коротко
Комплекс CRISPR Cas9 - это белок Cas9, заряженный sgRNA: 20-нт спейсер ищет мишень рядом с PAM (NGG для SpCas9), белок делает двунитевой разрыв, а дальше клетка либо ломает ген через NHEJ, либо точечно правит его по донорной матрице через HDR. Вокруг этой схемы выстроена вся современная экосистема - Cas12, Cas13, dCas9-CRISPRa/i, base и prime editors - и от лабораторного нокаута до одобренной терапии серповидноклеточной болезни она остаётся одной и той же.
Читайте также

Эксцизионная репарация нуклеотидов (NER): механизм
Эксцизионная репарация нуклеотидов NER: как клетка распознаёт и вырезает объёмные повреждения ДНК, чем отличаются GG-NER и TC-NER, какие белки участвуют и при чём тут пигментная ксеродерма.

Гем, железо и протопорфирин IX: строение и биосинтез
Гем — это комплекс железа Fe²⁺ с протопорфирином IX. Разбираем строение тетрапиррольного кольца, восемь ферментов биосинтеза от АЛК до феррохелатазы, регуляцию и порфирии.

Бактериальная эндоспора: структура оболочек послойно
Разбираем, из чего состоит бактериальная эндоспора: структура сердцевины, кортекса и оболочек, роль дипиколината кальция и SASP, почему спора выдерживает жар и высыхание.