Експерти кажуть, що Інтернет перебудовується для машин
Хмарна інфраструктура вже давно розроблена для людей, які шукають, клікають, прокручують та транслюють інформацію стабільним та передбачуваним чином. Агенти штучного інтелекту поводяться по-іншому. Вони можуть розкрити величезну кількість активності, запускаючи кілька субагентів, які запитують сотні баз даних, шукають документи та викликають API за лічені секунди, а потім зникають так само швидко, як і з'являються.
Відповідно до цієї передумови, Amazon переробляє ключовий елемент своєї хмарної інфраструктури. У четвер AWS запустила OpenSearch Serverless наступного покоління , повністю керовану пошукову та векторну базу даних — по суті, систему для зберігання та отримання інформації в великих масштабах — розроблену спеціально для агентських навантажень. AWS стверджує, що нова система може миттєво масштабуватися, коли агенти запускають завдання, і масштабуватися до нуля, коли вона не працює.
Цей запуск відображає зростаюче усвідомлення в технологічній галузі: інфраструктура, спочатку розроблена для інтернету, керованого людиною, не працює так добре у світі, де все більше людей перебувають у стані спокою.
Хоча агенти ШІ все ще становлять відносно невелику частину інтернет-активності, трафік, згенерований машинами, вже є значним і має всі шанси зростати. Cloudflare стверджує, що боти становили 31% загального HTTP-трафіку за останні шість місяців. ШІ-сканери, пошукові системи та помічники становили приблизно чверть усіх запитів ботів протягом цього періоду.
«Нелюдський трафік перевищить людський десь у першій половині 2027 року», – сказав Лай Ї Олсен , старший менеджер з продуктів Cloudflare, в інтерв’ю TechCrunch.
На конференції розробників Google I/O минулого тижня компанія заявила, що користувачі зможуть делегувати завдання системам штучного інтелекту, такі як пошук покупок, бронювання подорожей, перегляд веб-сторінок та взаємодія з додатками. Але відповідальність не обмежується лише орієнтованими на споживача агентами штучного інтелекту. Підприємства все частіше розгортають агентів внутрішньо та для своїх клієнтів, створюючи нові види машинно-генерованого трафіку за лаштунками.
В результаті, постачальники хмарних послуг та інфраструктурні компанії почали розмірковувати над тим, як адаптувати системи, створені для людей, до світу агентів, які постійно та автономно отримують інформацію, викликають інструменти та генерують міжмашинний трафік. Саме тут і з'являється новий OpenSearch Serverless від AWS.
«Час визначається однозначно. Агенти переходять від експериментального режиму до виробничого, і вони створюють моделі трафіку, для яких попередня інфраструктура просто не була розрахована», – сказала TechCrunch Тіа Вайт, генеральний менеджер Amazon OpenSearch Service. «Вони різко зростають без попередження, вони без попередження простоюють, і підприємству потрібен пошук, який підтримується без оплати за порожні або простоюючі обчислення».
Ключова технічна зміна цього нового покоління полягає в тому, що воно відокремлює обчислення від сховища, що дозволяє масштабувати обчислення за лічені секунди для врахування пікових навантажень трафіку агентів та масштабуватися до нуля, тому клієнти не платять, коли агенти простоюють.
«Раніше, навіть у нашій попередній безсерверній версії, потрібно було мати хоча б один робочий екземпляр, оскільки сховище та обчислення були пов’язані», – сказав Вайт. «Ви не могли просто автоматично розганятися [обчислення] з потрібною швидкістю, тому у вас завжди були зарезервовані простої обчислення для вашого робочого навантаження, незалежно від того, чи використовували ви їх, чи ні».
Уявіть собі, що ви постійно платите за паркувальне місце, навіть коли ви ним не користуєтеся. З оновленою версією Serverless від AWS це більше схоже на плату за паркувальне місце з лічильником.
Після запуску OpenSearch Serverless буде інтегруватися з платформами розробки штучного інтелекту, такими як Vercel та Kiro, що дозволить розробникам розгортати готові до роботи пошукові та векторні серверні частини для агентів без необхідності керувати інфраструктурою.
Зрушення відбуваються в усьому хмарному секторі. Databricks та Snowflake перепозиціонують себе як системи штучного інтелекту для пам'яті та пошуку корпоративних даних. Microsoft випустила оновлення Azure , розроблені для обробки пакетів даних агентів ШІ та спільного використання пам'яті між ними. Cloudflare, подібно до Amazon, минулого місяця представила інфраструктуру, спрямовану на забезпечення агентів стійкими середовищами та миттєвою масштабованістю.
Чим більше компаній розгортають агенти штучного інтелекту, тим більший буде тиск на переробку інфраструктури з урахуванням робочих навантажень, що генеруються машинами, що, у свою чергу, може зробити агентів дешевшими та простішими для розгортання у більших масштабах.