Drug Discovery, Development & Docking Tool – open-source платформа для разработки лекарств с использованием нейронных сетей

Drug Discovery, Development & Docking Tool – open-source платформа для разработки лекарств с использованием нейронных сетей
Даты проведения
с 2023-06-01 по 2023-10-27

Работу выполнил: Вернер Никита Олегович Класс: 11 124482, тел.: +7 (964) 760-99-03; E-mail: nikita-happy@mail.ru Научный руководитель: Давиденко Анастасия Владимировна, учитель информатики ГБОУ Школы 1557 имени П. Л. Капицы

Актуальность работы.

Разработка новых лекарственных препаратов – чрезвычайно долгий процесс, требующий значительных денежных инвестиций в работу исследовательских команд и последующего многоэтапного тестирования препаратов. В среднем лишь 12% созданных лекарств получают патент и разрешение на производство, остальные же не проходят клинические тестирования, что делает задачу поиска более точного, дешевого и эффективного подхода к разработке лекарств важной проблемой для современной науки.
Последние несколько лет машинное обучение и нейронные находят все большее применение в фармацевтике, поскольку упрощают процесс разработки лекарств. Так, в мире уже существует по меньшей мере 30 крупных проектов в этой сфере (например, IBM
Один из способов поиска новых лекарственных препаратов – модификация молекул с уже известной фармацевтической активностью, введение различных радикалов и прочих замен для улучшения селективности, растворимости, биодоступности или снижения вероятности побочных эффектов. Несмотря на относительную простоту и дешевизну подхода, данный способ позволяет значительно повысить эффективность и безопасность уже существующих лекарств. В частности, именно таким способом были разработаны несколько противораковых препаратов, например – Циклофосфамид и Паклитаксел.
Исходя из этого, задача создания инструментария и цифровой платформы для разработки модификаций малых молекул сейчас как никогда актуальна.

Целью данной работы была поставлена разработка отечественной open-sourse платформы для использования ИИ в сфере исследования лекарств.

Ход работы.

Для реализации цели проекта были взяты 3 библиотеки Python – CreM, eToxPred и библиотека CReM (Chemically Reasonable Mutations). Алгоритм CReM работает на основе набора из заранее отобранных молекул из базы данных ChEMBL. С помощью алгоритма согласованных молекулярных пар библиотеки RDKit, программа вырезает до 4 нециклических одинарных связей. Далее, для каждого полученного фрагмента определяется контекстный радиус присоединения, каждый фрагмент кодируется в канонизированную SMILES-строку. Для генерации новой молекулы на основе заданной производится поиск идентичного контекстного радиуса, после чего происходит замена фрагментов. Для определения потенциальной токсичности и доступности синтеза сгенерированных посредством CReM молекул в данной работе был использован модуль eToxPred. eToxPred использует методы ограниченной машины Больцмана, глубокой сети доверия и алгоритм сверхслучайных деревьев для предсказания критериев SAscore (Synthetic Accessibility доступности молекул, список потенциальных кандидатов, для которых будет проведен молекулярный докинг, может быть существенно сокращен, что положительно отразится на эффективности и времени работы программы. Молекулярный докинг - это метод молекулярного моделирования, позволяющий предсказать наиболее выгодную для образования устойчивого комплекса ориентацию и конформацию одной молекулы (лиганда) в сайте связывания другой (рецептора). Данные о положении и конформации партнеров используются для предсказания силы взаимодействия посредством так называемых оценочных функций. Для реализации молекулярного докинга предложенных соединений с уже известным белком был взят отличии от других моделей докинга на основе машинного обучения, DiffDock использует не регрессионный анализ, а генеративный подход. В своей статье авторы сообщают о более высокой точности и меньшем времени работы по сравнению с существующими методами.


Результаты. В результате работы был представлен Drug Discovery, Development & Docking Tool молекулярного докинга. Инструментарий программы позволяет изменять параметры генерации молекул для более узких задач, а интерфейс интуитивно понятен. На данный момент весь код проекта, совместно с датасетами, находится в открытом доступе на GitHub, прилагается и версия в виде блокнота Google Colaboratory в файле расширения


О проекте

Проект опубликовал

Целевая аудитория

школьники 8-11 класс абитуриенты студенты преподаватели

Специализации

Исследование

Области знаний

Биология и науки о Жизни Общественные науки Химия и нанотехнологии