Новые возможности: ученые наделили ИИ фантазией и воображением

22 июля 2021 10:51

Ученые из США научили систему искусственный интеллект "воображать" объекты, которые она ранее никогда не видела.

Подробнее об исследовании написал сайт Университета Южной Калифорнии (USC).

Пытаясь вообразить различные предметы или явления, человек вызывает в своем мозгу цепочку активаций нейронов и представляет некое изображение, основываясь на уже имеющемся жизненном опыте. Человеку легко придумать объект с разными свойствами: размерами, расцветкой, положением и так далее, даже если раньше он никогда не видел такой комбинации. Но вот даже продвинутая нейросеть не справлялась с такой задачей… до недавнего времени.

Команда из Калифорнийского университета во главе с профессором компьютерных наук Лоуреном Итти впервые разработала ИИ-систему, которая продемонстрировала способность проявлять воображение, почти так же, как это делают люди. Исследователи научили нейросеть комбинировать различные характеристики для получения нового изображения.

Одна из главных проблем заключалась в том, чтобы заставить ИИ самостоятельно определять ключевые атрибуты и переносить их на различные объекты, ведь, как правило, нейросети выделяют в образцах пиксели, а не отдельные свойства. Для этого ученые использовали метод, который называют "распутыванием". Он применяется для создания дипфейков, когда лицо человека и движения его тела переносятся на другого, но сохраняют исходную анимацию — в итоге получаются новые видео и картинки. По этому же принципу авторы загрузили в систему группу образцов из 1,56 млн изображений, а не по одному за раз, как это обычно делают при создании нейросетей.

6f9cd211a-e26bd9c4485b8254247bddf74c2a34c5.jpg (289 KB)

7fa469d5-3fede354dfb6f3a673e36b54bee8426c.jpg (121 KB)

813373c50-2256953ddf271d652929217cc7506c41.jpg (138 KB)

"Возьмем в качестве примера фильм "Трансформеры". Изображение может содержать нечто похожее на автомобиль Мегатрон, в качестве основного объекта, цвет желтого автомобиля Бамблби в качестве дополнительного объекта и Таймс-сквер в Нью-Йорке в качестве фона. В результате ИИ выдаст такой результат: по Таймс-сквер едет автомобиль-Мегатрон цвета Бамблби. Интересно, что система распознает все эти объекты, несмотря на то, что увидела их впервые", — объяснил один из ведущих авторов проекта Юньхао Гэ.

Американские разработчики утверждают, что их нейросеть совместима почти с любыми данными или знаниями и может расширить возможности приложений. К примеру, разделить информацию, связанную с национальностью и полом людей, или рекомбинировать свойства препаратов для создания новых лекарств.

"Технология глубокого обучения уже продемонстрировала непревзойденную производительность и перспективность во многих областях, но часто она лишь поверхностно имитировала то, что мы называем фантазией, — без глубокого анализа отдельных атрибутов, которые делают каждый объект уникальным", — отметил профессор Итти. "Новый подход, который мы назвали "распутыванием" впервые по-настоящему раскрыл потенциал ИИ-систем, приблизив их к человеческому пониманию мира".

Источник: focus.ua