Искусственный интеллект моделируя структуру белков, открывает возможности для новых терапевтических препаратов

Иллюстрация двух переплетенных белков

Эти два белка образуют комплекс, участвующий в восстановлении ДНК дрожжей. Программное обеспечение искусственного интеллекта предсказало структуры обоих белков.

Достижения искусственного интеллекта (ИИ) в моделировании структуры белка продолжается. Всего год назад программы были первыми, кто смоделировал трехмерные формы отдельных белков настолько точно, насколько их можно было определить с помощью экспериментальных методов десять лет назад. Этим летом исследователи использовали эти алгоритмы искусственного интеллекта для составления почти полного каталога белковых структур человека. Теперь ученые снова повысили ставки, введя комбинацию программ, которые могут определять, какие белки могут взаимодействовать друг с другом и как выглядят результирующие комплексы — наиболее важные механизмы клетки.

«Это действительно классный результат», — говорит Майкл Снайдер, биолог из Стэнфордского университета. В биологии все работает сложным образом. Поэтому очень важно знать, что с чем взаимодействует. Этих результатов было трудно достичь с помощью предыдущих методов. Новая способность предсказывать подобные взаимодействия должна привести к более глубокому пониманию клеточной биологии и, возможно, выявить новые цели для следующего поколения терапевтических препаратов, сказал он.

Отображение форм белков на атомные масштабы до недавнего времени требовало дорогостоящих и медленных экспериментальных методов, таких как рентгеновская кристаллография и спектроскопия ядерного магнитного резонанса. Эти экспериментальные методы, если они вообще работают, обычно производят только дискретные белковые структуры.

Компьютерные симуляторы десятилетиями работали над ускорением этого процесса. Их недавний успех зависел от алгоритмов глубокого обучения, которые используют базы данных экспериментально решенных структур белка, чтобы научить программы предсказывать структуры белка на основе их аминокислотных последовательностей.

В прошлом году две группы, одна из британского DeepMind, а другая во главе с Дэвидом Бейкером из Вашингтонского университета в Сиэтле, создали программы искусственного интеллекта, которые в настоящее время производят тысячи предсказанных белковых структур. Программа также создала структуры для нескольких известных белковых комплексов, в основном в бактериях. Но у эукариот организмов от дрожжей до людей, взаимодействующие партнеры часто неизвестны. Идентификация их и прогнозирование того, как они объединяются в комплекс, были слишком высокой планкой для вычислительных программ.

Искусственный интеллект моделирует структуру белков

Новая программа искусственного интеллекта легко предсказывает структуру белковых комплексов, таких как иммунный сигнальный интерлейкин 12 (синий), связанный с его рецептором

Теперь обе исследовательские группы настроили свои программы таким образом, чтобы они могли изучать структуры белковых комплексов сотнями. Бейкер и его коллеги используют комбинацию методов искусственного интеллекта для решения структуры 712 комплексов у эукариот.

Чтобы найти белки, которые могут объединяться вместе, команда начала с сравнения аминокислотной последовательности всех 6000 дрожжевых белков с последовательностями 2026 других грибов и 4325 других эукариот. Сравнение позволило исследователям отследить, как эти белки изменились в ходе эволюции, и идентифицировать последовательности, которые, по-видимому, изменились в тандеме в разных белках. Исследователи предположили, что эти белки могут образовывать комплексы и что они постепенно изменяются, чтобы поддерживать свои взаимодействия. Затем команда использовала свою программу искусственного интеллекта RoseTTAFold, а также программу с открытым исходным кодом DeepMind AlphaFold, чтобы попытаться решить трехмерные структуры каждого набора кандидатов из 8,3 миллионов идентифицированных пар дрожжевых белков, которые одновременно эволюционируют.

«Эти взаимодействия охватывают все процессы, происходящие в эукариотических клетках«, — сказал член команды Цянь Конг, эксперт по биомедицинской информатике в Юго-Западном медицинском центре Техасского университета. Среди основных моментов, по словам Конга и Бейкера, являются структуры белковых комплексов, которые позволяют клеткам восстанавливать повреждения своей ДНК, переводить РНК в белки в рибосомах, расщеплять хромосомы во время размножения клеток и перемещать молекулы через клеточную мембрану.

Это отличный пример перспективности 3D-структур, — говорит Джон Джампер из DeepMind, один из ведущих разработчиков AlphaFold. Раскрывая точно, как белки взаимодействуют друг с другом, модели должны помочь биологам визуализировать, как ранее неизвестные комплексы выполняют многие функции внутри клетки.

“Эти модели дают экспериментаторам возможность проверять гипотезы», — говорит Конг. И поскольку нарушение этих взаимодействий может предложить новые способы лечения широкого спектра заболеваний, она добавляет, что это также дает множество потенциально новых целей для лекарств.

Возможно, скоро будет еще больше новостей. В прошлом месяце Джампер и его коллеги опубликовали препринт на сервере bioRxiv, описывающий новую версию их ИИ, получившую название AlphaFold-Multimer, которая отображала структуры 4433 белковых комплексов. Анализ ИИ, который измеряет уровень достоверности каждого сгиба, показывает, что структуры были точными до 69% времени. В конце концов, Бейкер говорит: «Это действительно захватывающее время для структурной биологии».

Роберт Ф. Сервис

Боб — репортер журнала Science в Портленде, штат Орегон, освещающий статьи о химии, материаловедении и энергетике.