За открытиями следуют технологические прорывы и наоборот. Как наука и технологии взаимодействуют сегодня

От редактирования генов до определения структуры белка и квантовых вычислений — технологии, которые, вероятно, окажут влияние на науку в этом году.

Полностью сформированные геномы

Примерно десятая часть генома человека оставалась неизученной, когда исследователи в области геномики Карен Мига из Калифорнийского университета в Санта-Крус и Адам Филиппи из Национального исследовательского института генома человека в Бетесде, штат Мэриленд, сформировали консорциум «Теломера к теломере» (T2T) в 2019 году. Теперь это число равно нулю. В препринте, опубликованном в мае прошлого года, консорциум сообщил о первой сквозной последовательности генома человека, добавив почти 200 миллионов новых пар оснований к широко используемой консенсусной последовательности генома человека, известной как GRCh38, и написав заключительную главу Проекта Генома человека (1).

Впервые выпущенный в 2013 году, GRCh38 стал ценной основой для сопоставления последовательностей считывания. Но в нем было полно недоработок. Во многом это связано с тем фактом, что широко используемая технология секвенирования, разработанная компанией Illumina в Сан-Диего, Калифорния, обеспечивает точные, но короткие показания. Они недостаточно длинны, чтобы однозначно отобразить повторяющиеся геномные последовательности, включая теломеры, которые покрывают концы хромосом, и центромеры, которые координируют деление вновь реплицированной ДНК во время деления клетки.

Технологии секвенирования длинного чтения изменили правила игры. Разработанные Pacific Biosciences в Менло—Парке, Калифорния, и Oxford Nanopore Technologies (ONT) в Оксфорде, Великобритания, они могут упорядочивать десятки или даже сотни тысяч оснований за одно чтение, но не без ошибок, по крайней мере на начальном этапе. Однако к тому времени, когда команда T2T реконструировала (2, 3) свои первые одиночных хромосом — X и еще 8 в 2020 году, секвенирование Pacific Biosciences продвинулось до такой степени, что ученые T2T могли обнаруживать крошечные вариации в длинных участках повторяющихся последовательностей. Эти тонкие «отпечатки пальцев» сделали длинные повторяющиеся сегменты хромосом управляемыми, а остальная часть генома быстро выровнялась. Платформа ONT также фиксирует множество модификаций ДНК, которые модулируют экспрессию генов, и T2T также смогла отобразить эти “эпигенетические метки” по всему геному (4).

Решенный геном T2T был получен из клеточной линии, содержащей два идентичных набора хромосом. Нормальные диплоидные геномы человека содержат две версии каждой хромосомы, и в настоящее время исследователи работают над стратегиями «поэтапного фазирования», которые могут уверенно ассоциировать каждую последовательность с соответствующей копией хромосомы. “У нас уже есть несколько довольно феноменальных поэтапных сборок”, — говорит Мига.

Эта работа по диплоидной сборке проводится в сотрудничестве с партнерской организацией T2T, Human Pangenome Reference Consortium, целью которого является создание более репрезентативной карты генома на основе сотен доноров со всего мира. “Мы стремимся охватить в среднем 97% аллельного разнообразия человека”, — говорит Эрих Джарвис, один из ведущих исследователей консорциума и генетик из Рокфеллеровского университета в Нью-Йорке. Как председатель проекта «Геномы позвоночных», Джарвис также надеется использовать эти возможности полной сборки генома для создания последовательностей для всех видов позвоночных на Земле. “Я думаю, что в течение следующих 10 лет мы будем регулярно создавать геномы от теломеры к теломере”, — говорит он.

Решения для белковой структуры

Структура определяет функцию. Но это трудно измерить. Значительные экспериментальные и вычислительные достижения за последние два года предоставили исследователям дополнительные инструменты для определения структур белков с беспрецедентной скоростью и разрешением.

Алгоритм прогнозирования структуры AlphaFold2, разработанный DeepMind, лондонской дочерней компанией Alphabet, основан на стратегиях «глубокого обучения» для экстраполяции формы свернутого белка из последовательности его аминокислот (5). После решительной победы в конкурсе по критической оценке предсказания структуры белка 2020 года, в котором биологи тестируют свои алгоритмы прогнозирования структуры белка, репутация и популярность AlphaFold2 взлетели до небес. “Для некоторых структур прогнозы почти пугающе хороши”, — говорит Джанет Торнтон, старший научный сотрудник и бывший директор Европейского института биоинформатики в Хинкстоне, Великобритания.

С момента своего публичного появления в июле прошлого года AlphaFold2 применялся к протеомам для определения структур всех белков, экспрессируемых в организме человека (6) и в 20 модельных организмах (см. Nature 595, 635; 2021), а также почти к 440 000 белков в базе данных Swiss-Prot, что значительно увеличивает количество белков, для которых имеются данные моделирования с высокой степенью достоверности. Алгоритм AlphaFold был не менее работоспособен с многоцепочечными белковыми комплексами (7).

Параллельно достижения в области криогенной электронной микроскопии (крио-ЭМ) позволяют исследователям экспериментально решать даже самые сложные белки и комплексы. Крио-ЭМ сканирует мгновенно замороженные молекулы электронным лучом, создавая изображения белков в различных ориентациях, которые затем могут быть собраны компьютером в трехмерную структуру. В 2020 году усовершенствования аппаратного и программного обеспечения крио-ЭМ позволили двум командам создавать структуры с разрешением менее 1,5 ангстрем, фиксируя положение отдельных атомов (8, 9). До этого мы с дикой самозабвенностью обсуждали термин ”атомное разрешение», но оно было только близким к атомному, — говорит Бриджит Каррагер, содиректор Центра электронной микроскопии Саймонса Нью-Йоркского центра структурной биологии в Нью-Йорке. “Сейчас это действительно атомно”. И, хотя обе команды использовали особенно хорошо изученный модельный белок под названием апоферритин, говорит Каррагер, эти исследования показывают, что почти атомное разрешение возможно и для других, более сложных целей.

Плотность криоэлектронной микроскопии для апоферритина с разрешением до 1,2 ангстрема

Изображения, полученные с помощью криоэлектронной микроскопии, помогают решать сложные структуры. Пол Эмсли, Лаборатория молекулярной биологии MRC

Многие экспериментаторы, которые изначально скептически относились к AlphaFold2, теперь рассматривают его как явное дополнение к экспериментальным методам, таким как крио-ЭМ, где его вычислительные модели могут помочь в анализе и реконструкции данных. И крио-ЭМ может генерировать результаты, которые в настоящее время недоступны для компьютерного прогнозирования. Команда Каррагера, например, использует крио-ЭМ с временным разрешением для записи быстрых конформационных изменений, которые происходят, когда белки взаимодействуют с другими молекулами. “Мы можем фиксировать события и видеть, что происходит всего за сто миллисекунд”, — говорит она.

Существует также значительный интерес к смежной технике, криоэлектронной томографии (крио-ET), которая фиксирует естественное поведение белков в тонких срезах замороженных клеток. Но интерпретация этих переполненных, сложных изображений является трудной задачей, и Каррагер считает, что вычислительные достижения в мире машинного обучения будут иметь важное значение. “Как еще мы собираемся решать эти почти неразрешимые проблемы?” — спрашивает она.

Квантовое моделирование

Размер атома критично мал и не постоянен. Но при правильных условиях их можно привести в сильно возбужденное сверхразмерное состояние с диаметром порядка одного микрометра или более. Выполняя это возбуждение на тщательно расположенных массивах из сотен атомов контролируемым образом, физики продемонстрировали, что могут решать сложные физические задачи, которые доводят обычные компьютеры до предела.

Квантовые компьютеры управляют данными в форме кубитов. Вместе, используя явление квантовой физики, называемое запутанностью, кубиты могут влиять друг на друга на расстоянии. Эти кубиты могут значительно увеличить вычислительную мощность, которая может быть достигнута при заданном распределении кубитов по сравнению с эквивалентным количеством битов в классическом компьютере.

Несколько исследовательских групп успешно использовали одиночные ионы в качестве кубитов, но их электрические заряды затрудняют их сборку при высокой плотности. Физики, в том числе Антуан Бров из французского национального исследовательского агентства CNRS в Париже и Михаил Лукин из Гарвардского университета в Кембридже, штат Массачусетс, изучают альтернативный подход. Команды используют оптические пинцеты для точного позиционирования незаряженных атомов в плотно упакованных 2D и 3D массивах, а затем используют лазеры для возбуждения этих частиц в «Ридберговские атомы» большого диаметра, которые запутываются со своими соседями (10, 11). “Ридберговскими атомными системы можно управлять индивидуально, а их взаимодействие можно включать и выключать», — объясняет физик Джеук Ан из Корейского института науки и техники в Тэджоне, Южная Корея. Это, в свою очередь, обеспечивает программируемость.

Этот подход получил значительный импульс всего за несколько лет благодаря технологическим достижениям, которые повысили стабильность и производительность массивов атомов Ридберга, а также быстрому масштабированию с нескольких десятков кубитов до нескольких сотен. Ранние приложения были сосредоточены на конкретных задачах, таких как прогнозирование свойств материалов, но сейчас подход является универсальным. «На сегодня у любой теоретической модели, которую не придумали бы теоретики, есть способ ее реализовать», — говорит Бровейс.

Пионеры в этой области основали компании, разрабатывающие системы на основе ридберговских атомных решеток для лабораторного использования, и по оценкам Бровайса, такие квантовые симуляторы могут стать коммерчески доступными через год или два. Но эта работа также может проложить путь для квантовых компьютеров с более широкими приложениями, включая экономику, логистику и шифрование. Исследователи все еще пытаются точно определить место этой все еще зарождающейся технологии в компьютерном мире, но Ан проводит параллели с ранним продвижением братьев Райт в авиации. “У этого первого самолета не было никаких транспортных преимуществ, — говорит Ан, но в конце концов он изменил мир”.

Точная манипуляция геномом

Несмотря на все свои возможности редактирования генома, технология CRISPR-Cas9 больше подходит для инактивации генов, чем для восстановления. Это связано с тем, что, хотя нацеливание фермента Cas9 на геномную последовательность является относительно точным, клеточной репарации, полученного двухцепочечного разреза — нет. Опосредованная процессом, называемым негомологичным соединением концов, репарация CRISPR-Cas9 часто связана с небольшими вставками или удалениями.

Механизм репликации ДНК

Механизм репликации ДНК. Полуконсервативная репликация начинается с одной молекулы ДНК и производит две дочерние молекулы.

Большинство генетических заболеваний требуют восстановления генов, а не разрушения генов, говорит Дэвид Лю, биолог-химик из Гарвардского университета в Кембридже. Для этого Лю и его команда разработали два многообещающих подхода. Оба используют точное нацеливание CRISPR, а также ограничивают способность Cas9 реплицировать ДНК в этом месте. Первый, называемый редактированием оснований, связывает каталитически поврежденную форму Cas9 с ферментом, который облегчает химическое превращение одного нуклеотида в другой, такой как цитозин в тимин или аденин в гуанин. Но в настоящее время с помощью этого метода доступны только определенные межбазовые изменения. Основная правка, последняя разработка группы, связывает Cas9 с типом фермента, известного как обратная транскриптаза, и использует направляющую РНК, которая модифицирована для включения желаемой правки в геномную последовательность. Посредством многоступенчатого биохимического процесса эти компоненты копируют направляющую РНК в ДНК, которая в конечном итоге заменяет последовательность целевого генома. Важно отметить, что как базовое, так и основное редактирование реплицируют только одну нить ДНК, что является более безопасным и менее разрушительным процессом для клеток.

Впервые описанное в 2016 году базовое редактирование уже на пути в клинику: лучевая терапия, основанная Дэвидом Лю, получила одобрение Управления по контролю за продуктами питания и лекарствами США в ноябре, чтобы впервые протестировать подход на людях. Для восстановления будет использоваться ген, вызывающий серповидноклеточную анемию.

Основная правка в генах не так уж далека, но улучшенные итерации продолжают появляться, и перспективность метода очевидна. Хенбум Генри Ким, специалист по редактированию генома в Медицинском колледже Университета Йонсей в Сеуле, и его команда показали, что они могут достичь эффективности до 16%, используя первичное редактирование для исправления мутаций генов сетчатки у мышей (12). “Если бы мы использовали более продвинутые версии, о которых недавно сообщалось, эффективность была бы еще выше”, — говорит он. И группа Лю обнаружила, что основной механизм может способствовать введению последовательностей ДНК размером с ген в геном, потенциально предлагая более безопасную и более строго контролируемую стратегию генной терапии (13). Этот процесс относительно неэффективен, но иногда даже небольшая корректировка может оказаться значимой, отмечает Дэвид Лю. “В некоторых случаях известно, что если вы можете заменить ген на уровне 10% или даже 1%, вы можете вылечить болезнь”, — говорит он.

Целенаправленная генная терапия

Препараты нуклеиновых кислот могут оказать влияние на клиническую практику, но они все еще в значительной степени ограничены с точки зрения тканей, в которых они могут быть применены. Большинство методов лечения требуют либо местного введения, либо манипуляций с клетками вне организма, которые собирают и затем пересаживают обратно пациенту. Одним из заметных исключений является печень, которая фильтрует кровоток и, по-видимому, является надежной мишенью для селективной доставки лекарств. В этом случае может помочь внутривенное или даже подкожное введение.

“Если вы подумаете об этой проблеме, то просто доставить ее в любую ткань будет сложно”, — говорит Дэниел Андерсон, инженер-химик Массачусетского технологического института (MIT) в Кембридже. «Наши тела созданы для того, чтобы использовать имеющуюся у нас генетическую информацию, а не для того, чтобы принимать новичков». Но исследователи неуклонно продвигаются в разработке стратегий, которые могут помочь нацелить эти препараты на конкретные системы органов, не затрагивая другие нецелевые ткани.

Адено-ассоциированные вирусы являются целевым агентом выбора для многих попыток генной терапии, и исследования на животных показали, что тщательный отбор правильного вируса в сочетании с тканеспецифичными промоторами генов может обеспечить эффективную доставку с ограниченным доступом к органам (14). Однако вирусы иногда трудно производить в больших масштабах, и они могут вызывать иммунные реакции, которые снижают эффективность или вызывают побочные эффекты.

Липидные наночастицы представляют собой невирусную альтернативу, и несколько исследований, опубликованных за последние несколько лет, подчеркивают возможность настройки их специфичности. Например, подход селективного нацеливания на органы, разработанный биохимиком Дэниелом Сигвартом и коллегами из Юго-Западного медицинского центра Университета Техаса в Далласе, позволяет быстро генерировать и тестировать липидные наночастицы для выявления тех, которые могут эффективно воздействовать на клетки в легочных тканях легкое или селезенке (15). “Это было одно из первых исследований, которое показало, что если систематически проверять эти липидные наночастицы и изменять их состав, вы можете исказить биораспределение”, — говорит Рой ван дер Меел, инженер-биомедицин из Технологического университета Эйндховена в Нидерландах. Андерсон отмечает, что несколько групп также изучают, как белковые компоненты, такие как специфичные для клеток антитела, которые могут помочь процессу нацеливания.

Андерсона особенно воодушевляет доклинический прогресс в нацеливании на клетки при гемопоэзе и клетки иммунной системы в костном мозге, продемонстрированный такими компаниями, как Beam Therapeutics и Intellia в Кембридже, которые используют специально разработанные составы липидных наночастиц. Успех в нацеливании на эти ткани может избавить пациентов от изнурительного процесса, связанного с современными методами генной терапии ex vivo (манипуляция с клетками вне организма), которые включают химиотерапию для уничтожения существующего костного мозга перед трансплантацией, говорит он. “Выполнение этих задач in vivo (внутри организма) действительно может изменить подход к терапии”, — говорит Андерсон.

Пространственная мультиомика

Прорыв в развитии одноклеточной омики означает, что исследователи теперь могут регулярно получать генетические, транскриптомные, эпигенетические и протеомные данные из отдельных клеток, иногда одновременно. Но одноклеточные методы также жертвуют важной информацией, вырывая эти клетки из их родной среды.

Трехмерная структура комплекса редактирования генов CRISPR-CAS9 из Streptococcus pyogenes

Комплекс редактирования генов CRISPR-Ca9 использует направляющую РНК (красная) для репликации ДНК (синяя).

В 2016 году исследователи во главе с Йоакимом Лундебергом из Королевского технологического института в Стокгольме разработали стратегию решения этой проблемы. Команда подготовила слайды со штрих—кодированными олигонуклеотидами — короткими нитями РНК или ДНК, которые могут захватывать мРНК из неповрежденного участка ткани, чтобы каждый транскрипт мог быть отнесен к определенной позиции в образце в соответствии с его штрих-кодом. “Никто на самом деле не верил, что мы сможем провести транскриптомный анализ из среза ткани”, — говорит Лундеберг. Но это оказалось на удивление легко.

С тех пор область пространственной транскриптомики сильно продвиулась. В настоящее время доступно несколько коммерческих систем, в том числе платформа пространственной экспрессии генов Visium от 10x Genomics, основанная на технологии Лундеберга. Научные группы продолжают разрабатывать инновационные методы, которые позволяют отображать экспрессию генов с постоянно увеличивающейся глубиной и пространственным разрешением.

Теперь исследователи накладывают дополнительные идеи поверх своих пространственных карт. Например, Ронг Фан, из Йельского университета в Нью-Хейвене, штат Коннектикут, разработал платформу, известную как DBIT-seq (16), которая использует микрофлюидную систему, которая может одновременно генерировать штрих-коды для тысяч транскриптов мРНК и сотен белков, меченных антителами с использованием олигонуклеотидов. Это может дать гораздо более точную оценку того, как экспрессия клеточных генов влияет на выработку и активность белка, чем можно было бы получить только из транскриптомных данных, и команда Фенга использовала ее для исследования таких процессов, как активация иммунных клеток.

Тем временем группа Лундеберга усовершенствовала свой метод пространственной транскриптомики для одновременного сбора данных о последовательности ДНК. Это позволило его команде начать картирование пространственно-временных событий, лежащих в основе онкогенеза. “Мы могли бы проследить за этими генетическими изменениями, как они развиваются в дополнительные генетические варианты, которые в конечном итоге приводят к опухоли”, — говорит он.

Команда Фана продемонстрировала пространственное картирование модификаций хроматина в образцах тканей, которое может выявить регуляторные ландшафты клеточных генов, влияющих на такие процессы, как развитие, дифференцировка и межклеточная коммуникация (17). Фенг уверен, что этот метод можно сочетать с пространственным анализом РНК и даже белков. “У нас есть предварительные данные, показывающие, что это вполне осуществимо”, — говорит он.

Ридберговские атомы. Водородоподобные атомы и атомы щелочных металлов, у которых внешний электрон находится в сильно возбужденном состоянии. Чтобы перевести атом из основного состояния в возбужденное, его облучают резонансным лазерным излучением или инициируют радиочастотный разряд. Размер атома Ридберга может превышать размер того же атома в основном состоянии почти в 10⁶ раз при n = 1000.

Использованная литература

  1. Нурк, С. и др. Препринт на сайте bioRxiv https://doi.org/10.1101 /2021.05.26.445798 (2021 г.)
  2. Мига, К.Х. и соавт. Nature  585 , 79–84 (2020) Pubmed Google Scholar
  3. Логсдон, Г.А. и соавт. Nature  593 , 101–107 (2021) Pubmed
  4. Гершман А. и соавт. Препринт на сайте bioRxiv https://doi.org/10.1 101 /2021.05.26.443420 (2021 г.).
  5. Джампер, Дж. и др. Nature  596 , 583–589 (2021) Pubmed
  6. Tunyasuvunakool, K. et al. Nature  596 , 590–596 (2021) Pubmed Google Scholar
  7. Эванс, Р. и др. Препринт на сайте bioRxiv https://doi.org/10.1101/2021 .10.04.463034 (2021 г.).
  8. Накане, Т. и др. Nature  587 , 152–156 (2020) Pubmed
  9. Йип, К.М., Фишер, Н., Пакния, Э., Чари, А. и Старк, Х. Nature 587 , 157–161 (2020) Pubmed
  10. Берниен, Х. и др. Nature  551 , 579–584 (2017) Pubmed Статья Google Scholar
  11. Барредо, Д., Линхард, В., де Лезелёк, С., Лахайе, Т. и Бровайс. А. Nature  561 , 79–82 (2018) Pubmed
  12. Джанг, Х. и др. Nature Биомед. англ . https://doi.org/10.1038/ s41551-021-00788-9 (2021 г.) Google Scholar
  13. Анзалон, А.В. и соавт. Препринт на сайте bioRxiv https://doi.org/10.1101/ 2021.11.01.466790 (2021 г.).
  14. Леви, Дж . М. и соавт. Nature Биомед. англ. 4 , 97–110 (2020) Pubmed
  15. Ченг, К. и др. Nature Нанотехнологии. 15 , 313–320 (2020) Pubmed
  16. Лю, Ю. и др. Ячейка 183 , 1665–1681 (2020) Pubmed
  17. Дэн, Ю. и др. Препринт на сайте bioRxiv https://doi.org/10.1101/ 2021.06.06.447244 (2021 г.).

Читайте также: