OpenAI представляє новий генератор зображень DALL-E 3

OpenAI у середу розпочав попередній перегляд нової версії свого інструменту DALL-E , який створює зображення з письмових підказок, і оголосив про плани інтегрувати його в свій популярний чат-бот ChatGPT, збільшуючи охоплення суперечливої технології в той час, коли законодавці вимагають більшу стриманість.

Новий інструмент під назвою DALL-E 3 пропонує краще розуміння команд користувачів і краще передає розбірливий і зв’язний текст у зображення, що є загальновідомим недоліком генераторів зображень штучного інтелекту. Удосконалення мови дозволяють DALL-E 3 аналізувати складні інструкції, а не плутати елементи детального запиту, повідомили дослідники у вівторок під час короткої демонстрації.

«Звичайні користувачі можуть увійти в [чат-бот] і запитати щось досить розпливчасте», — сказав Адітя Рамеш, керівник команди DALL-E 3, який поділився демонстрацією власника бізнесу, який тестує різні логотипи для підприємства під назвою Mountain Ramen.

Хоча новий інструмент доступний для невеликої групи користувачів для раннього тестування, він буде випущений для передплатників популярного чат-бота компанії ChatGPT у жовтні, що потенційно збільшить кількість людей, які взаємодіють із технологією.

Випуск стався на тлі викликів для стартапу в Сан-Франциско, оскільки конкурентний тиск зростає. Трафік і щомісячний трафік до флагманського чат-бота DALL-E і OpenAI сповільнився , оскільки Google швидко надає користувачам парк продуктів на основі ШІ. Але, інтегрувавши свій новий генератор зображень у ChatGPT, OpenAI розширює свій ринок і пропонує цю технологію як функцію для турбонаддуву свого чат-бота, а не представляє інструмент як окремий продукт.

Журналісти не змогли перевірити цю функцію під час брифінгу, оскільки DALL-E 3 був «трохи збоями», сказав керівник PR OpenAI Ліндсі Хед Болтон, але пізніше компанія написала, що вона буде стабільною до запуску в середу.