OpenAI запускає агента загального призначення в ChatGPT

OpenAI запускає нового універсального агента штучного інтелекту в ChatGPT, який, за словами компанії, може виконувати широкий спектр комп'ютерних завдань від імені користувачів. OpenAI стверджує, що агент може автоматично переміщатися по календарю користувача, створювати редаговані презентації та слайд-шоу, а також запускати код.

Інструмент під назвою ChatGPT agent поєднує в собі кілька можливостей попередніх агентних інструментів OpenAI, включаючи здатність Operator клікати по вебсайтах , а також здатність Deep Research синтезувати інформацію з десятків вебсайтів у стислий дослідницький звіт. OpenAI стверджує, що користувачі зможуть взаємодіяти з агентом, просто вводячи запити ChatGPT природною мовою.

Агент ChatGPT буде доступний у четвер для передплатників планів Pro, Plus та Team від OpenAI. Щоб активувати інструмент, користувачі можуть вибрати «режим агента» у випадаючому меню інструментів ChatGPT.

Запуск агента ChatGPT є найсміливішою спробою OpenAI перетворити ChatGPT на агентний продукт, який може виконувати дії та розвантажувати завдання для користувачів, а не просто відповідати на запитання. В останні роки компанії Кремнієвої долини, включаючи OpenAI, Google та Perplexity, представили десятки агентів штучного інтелекту, які обіцяли робити саме це. Однак ці ранні версії агентів штучного інтелекту виявилися не в змозі зі складними завданнями , і вони здаються менш привабливими як продукти, ніж ті, що пропонують керівники найкращих технічних компаній з обробки зору, про агенти штучного інтелекту.

З усім тим, OpenAI стверджує, що агент ChatGPT набагато потужніший, ніж попередні пропозиції.

Новий агент компанії може отримати доступ до конекторів ChatGPT , що дозволяє користувачам підключатися до таких програм, як Gmail та GitHub, щоб агент міг знаходити відповідну інформацію для ваших запитів. OpenAI стверджує, що агент ChatGPT має доступ до термінала та може використовувати API для доступу до певних програм.

OpenAI пропонує користувачам скористатися агентом ChatGPT, щоб «планувати та купувати інгредієнти для приготування японського сніданку на чотирьох», а також «аналізувати трьох конкурентів та створювати презентацію». Такі можливості вимагають від агента ChatGPT аналізу веб-сайтів, планування дій та використання інструментів — набагато складніших завдань, ніж ті, з якими OpenAI раніше намагався вирішувати за допомогою агентів.

Модель, що лежить в основі агента ChatGPT, пропонує найсучаснішу продуктивність за кількома тестами, згідно з OpenAI.

Компанія стверджує, що модель агента ChatGPT набирає 41,6% на останньому іспиті людства (склав 1 бал) – складному тесті, що складається з тисяч питань з більш ніж ста предметів. Це приблизно вдвічі більше, ніж набрали o3 та o4-mini від OpenAI.

У FrontierMath, одному з найскладніших відомих математичних бенчмарків, OpenAI стверджує, що агент ChatGPT набирає 27,4%, коли має доступ до інструментів, таких як термінал для виконання коду. Попередній найсучасніший бал отримав o4-mini, який набрав лише 6,3%.

OpenAI зазначає, що розробила агента ChatGPT з урахуванням безпеки, значною мірою тому, що продукт пропонує деякі нові можливості, які можуть зробити його більш небезпечним у руках зловмисників. OpenAI раніше попереджала, що агентні моделі можуть мати більш небезпечні можливості.

У звіті про безпеку агента ChatGPT, OpenAI зазначає, що модель визначена як «високопродуктивна» в сферах біологічної та хімічної зброї, що визначено в Структурі готовності OpenAI як модель зі здатністю «посилювати існуючі шляхи до серйозної шкоди». OpenAI зазначає, що не має прямих доказів цього, але вирішила застосувати запобіжний підхід та активувати нові запобіжні заходи для зменшення цих ризиків.

Нові засоби безпеки для агента ChatGPT включають моніторинг, який працює в режимі реального часу, коли користувачі взаємодіють із продуктом. OpenAI стверджує, що запускає класифікатор для кожного запиту, введеного в агент ChatGPT, визначаючи, чи пов'язаний запит з біологією. Якщо так, OpenAI запускає відповідь агента ChatGPT через другий монітор, який визначає, чи може контент бути використаний для створення біологічної загрози.

OpenAI також стверджує, що вимкнула функцію пам'яті ChatGPT для цього агента, щоб запобігти зловживанню. В інших частинах ChatGPT функція пам'яті OpenAI дозволяє чат-боту звертатися до інформації з попередніх чатів користувачів. Однак, OpenAI стверджує, що зловмисники можуть використовувати цю функцію в агенті ChatGPT для вилучення конфіденційних даних за допомогою атак швидкого впровадження. Компанія заявляє, що може повернутися до додавання цієї функції в майбутньому.

Хоча агент ChatGPT звучить вражаюче, ще належить побачити, наскільки він справді здатний у реальному світі. Досі технологія агентів виявилася відносно крихкою при взаємодії з реальним світом. Проте, OpenAI стверджує, що розробила більш потужну модель, яка здатна виконати обіцянки агентів ШІ.