Искусственный интеллект обучили распознавать эмоции, вызываемые картинами

Романов Роман 27 марта 2021 11:30

Исследователи создали новый алгоритм искусственного интеллекта, который может распознавать эмоции, вызываемые рассматриванием картин.

Эксперты в области искусственного интеллекта довольно хорошо умеют создавать компьютеры, которые могут «видеть» окружающий мир - распознавать объекты, животных и действия в пределах их компетенции. Они стали основополагающими технологиями для автономных автомобилей, самолетов и систем безопасности будущего.

Теперь группа ученых работает над тем, чтобы научить компьютеры распознавать не только объекты на изображении, но и то, какие эти изображения вызывают у людей чувства, то есть алгоритмы с эмоциональным интеллектом.

«Эта способность будет ключом к тому, чтобы сделать искусственный интеллект не просто более интеллектуальным, но и более человечным», - говорит Панос Ахлиоптас, докторант компьютерных наук в Стэнфордском университете, который работал с сотрудниками во Франции и Саудовской Аравии.

Чтобы достичь этой цели, Ахлиоптас и его команда собрали новый набор данных под названием ArtEmis, который недавно был опубликован в виде препринта в формате arXiv. Набор данных основан на 81 000 картин WIkiArt и состоит из 440 000 письменных ответов от более чем 6 500 человек, показывающих, какие эмоции вызывает у них определенная картина, включая объяснения того, почему они выбрали данную эмоцию. Используя эти ответы, Ахлиоптас и команда, возглавляемая профессором инженерии Стэнфордского университета Леонидасом Гибасом, обучили нейронных дикторов - ИИ, отвечающий письменно, - которые позволяют компьютерам генерировать эмоциональные отклики на визуальное искусство и выражать эти эмоции языком.

Исследователи выбрали именно искусство, поскольку цель художника - вызвать эмоции у зрителя. ArtEmis работает независимо от сюжета, от натюрмортов до человеческих портретов и абстракций.

«Эта работа представляет собой новый подход к компьютерному зрению», - отмечает Гибас, преподаватель лаборатории искусственного интеллекта и Стэнфордского института искусственного интеллекта, ориентированного на человека. «Классическая работа по захвату компьютерного зрения была связана с буквальным содержанием», - говорит он. «На изображении три собаки или кто-то пьет кофе из чашки. Вместо этого нам потребовались описания, определяющие эмоциональное содержание».

1-artistsinten.jpg (53 KB)

Захват эмоций

Алгоритм классифицирует работы художника по одной из восьми эмоциональных категорий - от трепета до радости, от страха до печали - а затем объясняет в письменном тексте, что именно в изображении оправдывает эмоциональное прочтение.

«Это делает компьютер», - говорит Ахлиоптас. «Мы можем показать ему новый образ, которого он никогда не видел, и он расскажет нам, что может чувствовать человек».

Примечательно, что, по словам исследователей, подписи точно отражают абстрактное содержание изображения способами, которые выходят далеко за рамки возможностей существующих алгоритмов компьютерного зрения, полученных из наборов документальных фотографических данных, таких как Коко.

Более того, алгоритм не просто фиксирует широкий эмоциональный опыт полного изображения, но может расшифровать различные эмоции в рамках данной картины. Например, на знаменитой картине Рембрандта об обезглавливании Иоанна Крестителя ArtEmis выделяет не только боль на отрубленной голове Иоанна Крестителя, но и «удовлетворение» на лице Саломеи, женщины, которой эта голова представлена.

Ахлиоптас отмечает, что даже несмотря на то, что ArtEmis достаточно сложен, чтобы оценить, что намерения художника могут отличаться в контексте одного изображения, этот инструмент также учитывает субъективность и вариативность человеческих реакций.

«Не каждый человек видит и чувствует то же самое, когда видит произведение искусства», - добавляет он. Например: «Я чувствую себя счастливым, увидев Мону Лизу, но профессор Гибас может расстроиться. ArtEmis может различить эти различия».

Инструмент художника

Исследователи ожидают, что в ближайшем будущем ArtEmis может стать для художников инструментом оценки своих работ в процессе создания, чтобы убедиться, что их работа оказывает желаемое влияние.

«Это могло бы послужить руководством и вдохновением для того, чтобы «направить» работу художника по своему желанию», - говорит Ахлиоптас. Художник-график, работающий над новым логотипом, может использовать ArtEmis, например, чтобы гарантировать ожидаемый эмоциональный эффект.

В будущем, после дополнительных исследований и уточнений, Ахлиоптас сможет предвидеть алгоритмы, основанные на эмоциях, которые помогут донести эмоциональную осведомленность до приложений искусственного интеллекта, таких как чат-боты и разговорные агенты ИИ.

«Я вижу, что ArtEmis привносит идеи из психологии человека в искусственный интеллект», - говорит Ахлиоптас. «Я хочу сделать ИИ более личным и сделать его более удобным для людей».

По материалам: Techexplore