OpenAI робить ставку на аудіо, оскільки Кремнієва долина оголошує війну екранам

Дмитро Сизов

OpenAI робить велику ставку на аудіо ШІ, і справа не лише в тому, щоб покращити звучання ChatGPT. Згідно з новим повідомленням The Information, протягом останніх двох місяців компанія об'єднала кілька інженерних, продуктових та дослідницьких команд, щоб переглянути свої аудіомоделі, і все це в рамках підготовки до персонального аудіопристрою, який, як очікується, буде запущено приблизно через рік.

Цей крок відображає напрямок руху всієї технологічної індустрії — до майбутнього, де екрани стають фоновим шумом, а аудіо займає центральне місце. Розумні колонки вже зробили голосових помічників невід'ємною частиною понад третини будинків у США. Meta щойно запустила функцію для своїх розумних окулярів Ray-Ban, яка використовує масив із п'яти мікрофонів, щоб допомогти вам чути розмови в галасливих кімнатах — по суті, перетворюючи ваше обличчя на спрямований пристрій для прослуховування. Тим часом Google у червні почав експериментувати з « Аудіооглядами », які перетворюють результати пошуку на розмовні зведення, а Tesla інтегрує чат -бота Grok від xAI у свої автомобілі, щоб створити розмовного голосового помічника, який обробляє все, від навігації до клімат-контролю, за допомогою природного діалогу.

Не лише технологічні гіганти роблять цю ставку. Різноманітні стартапи виникли з тією ж переконаністю, хоча й з різним ступенем успіху. Творці шпильки Humane AI Pin витратили сотні мільйонів, перш ніж їхній безекранний носимий пристрій став повчальною історією . Кулон Friend AI, намисто, яке стверджує, що воно записуватиме ваше життя та пропонуватиме товариство, викликало побоювання щодо конфіденційності та екзистенційний страх в рівній мірі . А тепер щонайменше дві компанії, включаючи Sandbar та одну, очолювану засновником Pebble Еріком Мігіковським , створюють кільця зі штучним інтелектом, які, як очікується, дебютують у 2026 році, дозволяючи своїм власникам буквально розмовляти з рукою.

Форм-фактори можуть відрізнятися, але теза одна: аудіо – це інтерфейс майбутнього. Кожен простір – ваш дім, ваш автомобіль, навіть ваше обличчя – стає поверхнею керування.

Нова аудіомодель OpenAI, запланована на початок 2026 року, як повідомляється, звучатиме природніше, справлятиметься з перериваннями, як справжній співрозмовник, і навіть розмовлятиме під час вашої розмови, що є тим, з чим сучасні моделі не можуть впоратися. Також кажуть, що компанія уявляє собі сімейство пристроїв, можливо, включаючи окуляри або безекранні розумні колонки, які діятимуть не стільки як інструменти, скільки як компаньйони.

Нічого з цього не є надзвичайно дивним. Як зазначає The Information, колишній керівник відділу дизайну Apple Джоні Айв, який приєднався до апаратних зусиль OpenAI через придбання компанією своєї фірми io за 6,5 мільярда доларів у травні, зробив зменшення залежності від пристроїв пріоритетом, розглядаючи дизайн, орієнтований на звук, як шанс «виправити помилки» минулих споживчих гаджетів.