165 новых генов рака идентифицированы с помощью машинного обучения

165 новых генов рака идентифицированы с помощью машинного обучения

Увидеть рак «насквозь» с помощью анализа данных стало возможно с помощью искусственного интеллекта благодаря работе исследователей Общества Макса Планка. Результаты работы публикует Nature Machine Intelligence.

Ранее неизвестные гены

Новый алгоритм может предсказать, какие гены вызовут рак, даже если последовательность ДНК не изменилась. Команда исследователей в Берлине объединила различные данные и проанализировала их с помощью «искусственного интеллекта», чтобы выявить большое количество онкогенов. Это открывает новые перспективы в разработке целевых методов лечения рака и биомаркеров в персонализированной медицине.

При раке клетки размножаются и проникают в ткани, разрушая органы и тем самым нарушая их жизненно важные функции. Неограниченный рост обычно вызван накоплением изменений ДНК в онкогенах, мутациях в этих генах, которые и управляют развитием клеток. Однако у некоторых видов рака очень мало мутировавших генов. Это значит, что другие причины приводят к опасному заболеванию.

Группа исследователей из Института молекулярной генетики Макса Планка (MPIMG) в Берлине и Института вычислительной биологии в Гельмгольце, использует методы машинного обучения для идентификации 165 ранее неизвестных генов рака. Для анализа данных исследователи специальный алгоритм.

Последовательности этих генов не обязательно изменяются. Очевидно, что нарушение их регуляции уже может привести к раку. Все недавно идентифицированные гены тесно взаимодействуют с хорошо известными онкогенами. Они необходимы для выживания опухолевых клеток, показали эксперименты на клеточных культурах показали.

Дополнительные цели для персонализированной медицины

Алгоритм под названием EMOGI в Explainable Multi-Omics Graph Integration может также объяснить взаимосвязь между клеточными механизмами, которые превращают ген в онкоген. Как объясняет группа исследователей во главе с Анналисой Марсико в журнале Nature Machine Intelligence, программное обеспечение объединяет десятки тысяч наборов данных, созданных из образцов пациентов. Сюда входит информация о метилировании ДНК, активности отдельных генов и взаимодействиях белков внутри клеточного пути, а также данные о последовательностях с мутациями. В этих данных алгоритмы глубокого обучения обнаруживают закономерности и молекулярные принципы, которые и приводят к развитию рака.

В отличие от традиционных методов лечения рака, таких как химиотерапия, индивидуальные методы лечения адаптированы к конкретному типу опухоли. «Наша цель — выбрать лучшее лечение для каждого пациента, наиболее эффективное лечение с наименьшими побочными эффектами. Кроме того, молекулярные свойства можно использовать для выявления рака, который уже находится на ранних стадиях», — объясняет Марсико, глава исследовательской группы MPIMG.

«Только зная причину болезни, мы сможем эффективно противодействовать или исправить ее, — пишут исследователи. — Вот почему так важно определить как можно больше механизмов, вызывающих рак».

Лучшие результаты с комбинацией

«На сегодняшний день большинство исследований сосредоточено на патогенных изменениях последовательности или клеточных схемах, — сказал Роман Шульте-Сассе, докторант в команде Марсико и первый автор публикации. — В то же время недавно стало ясно, что эпигенетические нарушения или дисрегуляция активности генов также могут привести к раку».

Вот почему исследователи объединили данные последовательности, отражающие сбои схемы, с информацией, которая представляет события в ячейках. Первоначально ученые подтвердили, что мутации или разрастание геномных сегментов на самом деле являются основной причиной рака. Затем, на втором этапе, мы определили гены-кандидаты, которые не очень напрямую связаны с генами, на самом деле вызывающими рак.

«Например, мы обнаружили ген при раке, у которого мало изменена последовательность, но он регулирует подачу энергии и необходим для опухолей, — говорит Шульте-Засс. — Эти гены нельзя контролировать другими способами. Например, это вызвано химическими изменениями в ДНК, такими как метилирование. Эти изменения не затрагивают информацию о последовательности, но доминируют над активностью гена. Такие гены — многообещающие цели для открытия новых лекарств, но, поскольку они работают в фоновом режиме, их можно найти только с помощью сложных алгоритмов».

Дальнейшие исследования

Новая программа исследователей добавляет немало новых записей в список подозрительных онкогенов. Только за последние годы он вырос с 700 до 1 000. Исследователи отслеживали скрытые гены только с помощью комбинации биоинформатического анализа и современных методов искусственного интеллекта (ИИ).

В данных скрыто еще много интересных деталей. «Мы видим много закономерностей, характерные для рака, — говорит Марсико. — Я думаю, это доказательство того, что опухоли вызываются разными молекулярными механизмами в разных органах».

Исследователи подчеркивают, что программа EMOGI не ограничивается раком. Теоретически его можно использовать для интеграции различных наборов биологических данных и поиска закономерностей. Алгоритмы применимы к аналогичным сложным заболеваниям.

Источник: hightech.fm