Алгоритм машинного обучения предсказывает свойства материала используя электронную плотность
Группа ученых, лондонской компании DeepMind, разработала модель машинного обучения искусственного интеллекта, которая рассчитывает характеристики молекулы, предсказывая распределение электронов в ней. Подход, описанный в выпуске журнала Science от 10 декабря, позволяет рассчитать свойства некоторых молекул более точно, чем существующие на сегодня методы.
“То, что мы видим, можно смело назвать подвигом”, — говорит Анатоль фон Лилиенфельд, ученый-материаловед из Венского университета.
По словам Катажины Перналь, специалиста в области вычислительной химии Лодзинского технологического университета в Польше, эта статья представляет собой очень важную работу. Но так же добавляет, что моделям машинного обучения предстоит пройти ещё, возможно, долгий путь, прежде чем они станут полезными для химиков.
Прогнозирование свойств молекул
В принципе, структура материалов и молекул полностью определяется квантовой механикой и, в частности, уравнением Шредингера, которое определяет поведение электронных волновых функций. Это математические принципы, которые описывают вероятность нахождения определенного электрона в определенном месте в пространстве. Но поскольку все электроны взаимодействуют друг с другом, вычисление структуры или молекулярных орбиталей на основе таких начальных принципов, является вычислительным кошмаром и может быть выполнено только для простейших молекул, таких как бензол, говорит Джеймс Киркпатрик, физик из DeepMind.
Чтобы обойти эту проблему, исследователи, чья работа основана на открытии или разработке новых молекул, десятилетиями полагались на набор методов, называемых теорией функционала плотности (DFT), для прогнозирования физических свойств молекул. Теория не пытается моделировать отдельные электроны, а вместо этого стремится вычислить общее распределение отрицательного электрического заряда электронов по молекуле. «DFT смотрит на среднюю плотность заряда, поэтому не знает, что такое отдельные электроны», — говорит Киркпатрик. Большинство свойств материи можно легко вычислить по этой плотности.
За последние 30 лет теория функционала плотности (DFT) стала широко используемым методом электронной структуры для прогнозирования свойств различных систем в химии, биологии и материаловедении. Несмотря на долгую историю становления, современные функционалы DFT имеют серьезные ограничения. В частности, значительные систематические ошибки наблюдаются для плотностей зарядов, включающих подвижные заряды и спины.
С момента своего создания в 1960-х годах DFT стала одним из наиболее широко используемых методов в физических науках: исследование, проведенное в 2014 году, показало, что из 100 наиболее цитируемых работ, 12 были посвящены DFT. Современные базы данных свойств материалов, такие как проект Materials, в значительной степени состоят из расчетов DFT.
Но этот подход имеет ограничения и дает неверные результаты для определенных типов молекул, даже таких простых, как хлорид натрия. Хотя вычисления DFT намного эффективнее, чем вычисления, начинающиеся с базовой квантовой теории, они все еще громоздки и часто требуют суперкомпьютеров. Так, в последнее десятилетие химики-теоретики все чаще начали экспериментировать с машинным обучением, в частности, для изучения таких свойств, как химическая реакционная способность материалов или их способность проводить тепло.
Идеальная проблема искусственного интеллекта
Команда DeepMind предприняла, пожалуй, самую амбициозную попытку внедрить искусственный интеллект для расчета электронной плотности, конечного результата расчетов DFT. “Это своего рода идеальная проблема машинного обучения: вы знаете ответ, но не формулу, которую хотите применить”, — говорит Арон Коэн, химик-теоретик, который долгое время работал над DFT и сейчас работает в DeepMind.
Команда обучила искусственную нейронную сеть, используя данные из 1161 точного решения, полученного из уравнений Шредингера. Чтобы повысить точность, они также встроили в алгоритм некоторые известные законы физики. Затем протестировали обученную систему на наборе молекул, которые часто используются в качестве эталона для DFT, и результаты были впечатляющими, говорит фон Лилиенфельд. “Это лучшее, что придумало сообщество, и превосходит его с большим отрывом”, — говорит он.
Фон Лилиенфельд добавляет, что одним из преимуществ машинного обучения является то, что, хотя для обучения моделей требуется огромная вычислительная мощность, это нужно сделать только один раз. Затем отдельные прогнозы могут быть рассчитаны на обычном ноутбуке, что значительно снижает их стоимость и совокупный углеродный след, по сравнению с тем, когда каждый раз приходится выполнять вычисления с нуля.
Киркпатрик и Коэн говорят, что DeepMind выпускает свою обученную систему для всех. На данный момент модель применима в основном к молекулам, а не к кристаллическим структурам материалов, но, по мнению авторов, будущие версии могут работать и с материалами.
Дополнительные ссылки
1. https://doi.org/10.1038/d41586 -021-03697-8
2. Kirkpatrick, J. et al. Science 374, 1385–1389 (2021)