Как искусственный интеллект помогает в создании лекарств
Создание нового лекарства – долгий и сложный процесс, который может длиться несколько лет и стоить несколько миллиардов долларов. Но компании Insilico Medicine удалось с помощью нейронных сетей пройти путь от постановки задачи до тестирования нового лекарства на животных всего за 46 дней, и обошлось это в $150 тыс. Результаты были опубликованы в престижном научном журнале Nature.
Nature оценивает расходы крупных фармацевтических компаний на открытие, клинические испытания и патентование одного лекарственного средства в $0,5–2,6 млрд и 10–20 лет исследований. Большая часть этих денег, по сути, выбрасывается на ветер — всего несколько десятков, а то и сотен тестовых молекул находят свое применение в новых препаратах. Поэтому фармацевтические гиганты и сотни стартапов вкладываются в разработку компьютерных алгоритмов, способных ускорить и удешевить этот процесс.
Компания Insilico Medicine, базирующаяся в Балтиморе и Гонконге, может стать революционером в области компьютерного предсказания структуры лекарственных молекул: ее алгоритм GENTRL только через 21 день нашел ингибитор для белка DDR1 (см. «На разных скоростях»), связанного с возникновением фиброза. Дискодиновый доменный рецептор DDR1 вовлечен в процессы клеточного роста, клеточной дифференциации и метаболизма. Он содержится в клетках эпителия и, как считается, играет важную роль в появлении фиброза — уплотнения соединительной ткани, возникающей для изоляции источника воспаления от других органов и кровотока. Например, при фиброзе легких, который может быть вызван воспалением, бронхи и легкие увеличиваются в размере, вокруг кровеносных и лимфатических сосудов образуется плотная соединительная ткань. Угнетение работы DDR1 считается потенциальным способом предотвращения фиброза и его лечения.
Нейронная сеть в качестве входных данных использовала открытую базу ZINC, состоящую из 230 млн химических соединений, пригодных для коммерческого использования, а также базу известных ингибиторов DDR1, обычных ингибиторов киназы, фармацевтическую базу данных известных биологически активных молекул. Программа сгенерировала 30 тыс. молекул, автоматически проверивших на наличие в базе запатентованных веществ среди всех известных ингибиторов киназы и специфически среди ингибиторов DDR1. Осталось шесть молекул, из которых одна дошла до испытания на мышах.
«Киназы – это тип ферментов, фосфорелирующих белки, то есть переносят на них фосфатные группы. В клеточке они работают практически как молекулярные переключатели для приема внешнеклеточных сигналов и передачи их дальше прямо до ядра и активации определенных генов. В одном сигнальном пути могут быть задействованы десятки киназ: одна фосфорелирует одну цель, другая следующую и так далее. Белок DDR1 – это тирозиновая киназа, то есть она фосфорелирует аминокислоту тирозин, а это внешнеклеточный рецептор коллагена, «выключение» которого – перспективная модель борьбы с фиброзом.
Активация DDR1 приводит к воспалению, которое напрямую связано с развитием фиброза. Задача авторов исследования – остановить действие DDR1, чтобы он не фосфорелировался. И сделать это cелективно, то есть не задев какие-либо другие белки, что с очень большой вероятностью будет опасным», — объясняет Федор Боховчук, Ph.D по биохимии и научный сотрудник одной из крупных фармкомпаний.
Согласно исследованию Insilico Medicine, найденная молекула должна действовать именно на белок DDR1, не затрагивая других соединений. Это немаловажный результат, что уменьшает вероятность токсического воздействия на другие системы организма.
«Искусственный интеллект может быстро проверить взаимодействие новой молекулы со всеми возможными белковыми структурами, просканировать, не действует ли она на другие цели, не предусмотренные для этого. Это тяжело сделать экспериментально. Ведь количество мишеней, находящихся на лабораторном столе исследователей, всегда ограничено. И нельзя быть уверенным, что экспериментаторы перебрали все возможные варианты.
В то время как программа способна перебрать даже недавно открытые соединения или белки из организмов рыб или мышей, экспериментальных данных по которым немного. И найти возможное токсическое действие, анализируя взаимодействие с похожим белком уже у человека. Сложность этой задачи связана с нашим неполным пониманием биологии, ограниченным пониманием роли каждого гена и белка. Если активируется ген А, что будет с геном B? Как мутация в гене А отзовется на уровне экспрессии других генов? На сегодняшний день есть огромные массивы генетических и эпигенетических данных, полученных с помощью секвенирования ДНК и РНК тысяч людей. Искусственный интеллект кажется перспективным инструментом для того, чтобы выявить все эти взаимодействия», — комментирует Федор Боховчук.
Проблемы, возникающие из-за отсутствия знаний в области взаимодействия лекарств с разными системами организма, можно проиллюстрировать скандалом с тербинафином. В 1996 году австралийские медики отметили, что популярное лекарство от грибковых инфекций приводит к воспалению печени. После трех смертей, причиненных употреблением тербинафина, препараты стали проверять. В 2001-м канадские ученые нашли в печени пострадавших людей соединение TBF-A, которое могло оказать токсическое действие. ЛиЕще в 2018-м загадку тербинафина разгадали с помощью нейронных сетей. Исследователи просканировали все возможные пути метаболизма тербинафина в печени и поняли, каким образом лекарство превращается в токсическую TBF-A. Метаболитический процесс состоял из двух шагов, и предсказать подобное в клинических испытаниях врачи не могли. С этой задачей справился искусственный интеллект.
Компанию Insilico Medicine основал в 2014 году биоинформатик Александр Жаворонков, он же главный автор недавнего исследования. За пять лет она привлекла более $50 млн. инвестиций, преимущественно на исследование процессов старения методами искусственного интеллекта. В частности, в январе 2019 была опубликована статья о влиянии курения на старение организма. По биохимическому составу крови было установлено, что по некоторым показателям, например уровень холестерола и уровень глюкозы, курильщики примерно вдвое старше своего биологического возраста. В 2016-м компания представила программу GeroScope для поиска геропротекторов – «лекарства от старения». Логика состоит в том, чтобы сравнить состояние клеток людей от 15 до 30 лет с клетками людей старше 60 и найти молекулярные путь превращения молодых клеток в старые. Правда, ни один из геропротекторов, которые дают результаты на животных, не разрешен для использования людьми.
Биоинформатика из Кембриджского университета доктор Андреас Бендер в своем блоге, посвященном поиску химических соединений с помощью искусственного интеллекта, призывает относиться к исследованию Insilico Medicine с осторожностью. По его словам, новая молекула на 75% совпадает с уже известными ингибиторами DDR1, поэтому она не является "совершенно новой". К тому же большинство потенциальных лекарств проваливают клинические исследования, поэтому говорить, что искусственный интеллект создал новое лекарство, некорректно. Бендер выражает сомнение, что программа Insilico Medicine сработала так же хорошо без базы известных ингибиторов киназы для открытия действительно новой молекулы, однако отметил, что исследование компании все же является важным этапом становления искусственного интеллекта в поиске новых лекарственных соединений.
Источник: myc.news