OpenAI міняє голос ChatGPT AI через його схожість з голосом Скарлетт Йоханссон

Дмитро Сизов 21 мая 2024 09:14

OpenAI оголосила, що вилучить один із голосів ChatGPT під назвою «Sky» після того, як він викликав суперечки через його схожість із голосом актриси Скарлетт Йоханссон у «Вона», фільмі про штучний інтелект.

«Ми чули запитання про те, як ми вибирали голоси в ChatGPT, особливо Sky», — повідомляє Microsoftкомпанія, яку підтримує компанія, опублікувала на X. «Ми працюємо над тим, щоб призупинити використання Sky, поки ми вирішуємо їх».

Науково-фантастичний фільм «Вона» 2013 року розповідає про чоловіка, який закохується в систему штучного інтелекту на ім’я Саманта, яку озвучує Йоханссон.

Ця новина з’явилася через тиждень після того, як OpenAI представила низку аудіо голосів для ChatGPT, свого вірусного чат-бота, нової моделі AI під назвою GPT-4o та версії ChatGPT для настільних комп’ютерів.

Користувачі, які спостерігали за живою демонстрацією аудіоможливостей ChatGPT, одразу почали писати в соціальних мережах, що голос «Sky» звучить як Йоханссон у фільмі. Генеральний директор OpenAI Сем Альтман , здається, посилався на фільм у дописі на X, просто написавши «вона».

У недільній публікації в блозі OpenAI написав , що п’ять голосів чат-бота — Breeze, Cove, Ember, Juniper і Sky — були відібрані в процесі кастингу та запису, який тривав п’ять місяців. Професіонали кастингу отримали близько 400 пропозицій від акторів голосу та екрану та скоротили це число до 14, за даними компанії. Потім внутрішня команда визначила фінальну п’ятірку.

«Голос Скай не є імітацією Скарлетт Йоханссон, а належить іншій професійній актрисі, яка використовує свій власний природний голос», — написали в компанії. «Щоб захистити їх конфіденційність, ми не можемо розголошувати імена наших голосових талантів».

OpenAI планує протестувати голосовий режим найближчими тижнями з раннім доступом для платних передплатників до ChatGPT Plus, згідно з останніми публікаціями в блозі, а також планує додати нові голоси. OpenAI також сказав, що нова модель може відповідати на звукові підказки користувачів «всього за 232 мілісекунди, в середньому 320 мілісекунд, що подібно до часу реакції людини під час розмови».

Компанію, засновану в 2015 році, інвестори оцінили в понад 80 мільярдів доларів. Вона знаходиться під тиском лідерства на ринку генеративного штучного інтелекту, одночасно знаходячи шляхи заробітку, оскільки витрачає величезні суми на процесори та інфраструктуру для створення та навчання своїх моделей.

OpenAI, Microsoft і Google очолюють генеруючу золоту лихоманку штучного інтелекту , оскільки компанії, здавалося б, у кожній галузі змагаються за додавання чат-ботів і агентів на основі штучного інтелекту, щоб не залишитися позаду конкурентів. Раніше цього місяця конкурент OpenAI Anthropic оголосив про свою першу корпоративну пропозицію та безкоштовний додаток для iPhone.

За даними PitchBook, у 2023 році рекордні 29,1 мільярда доларів США було інвестовано в майже 700 генеративних угод зі штучним інтелектом, що на понад 260% більше, ніж у попередньому році. Прогнозується, що дохід ринку досягне 1 трильйона доларів протягом десяти років.

Минулого тижня в живій презентації члени команди OpenAI продемонстрували аудіоможливості ChatGPT. Наприклад, чат-бота попросили допомогти заспокоїти когось перед публічним виступом.

Дослідник OpenAI Марк Чен продемонстрував здатність моделі розповідати казку перед сном і попросив її змінити тон свого голосу на більш драматичний або роботизований. Він навіть попросив його заспівати історію. Команда також попросила його проаналізувати вираз обличчя користувача, щоб прокоментувати емоції, які людина може відчувати.

«Привіт, що трапилося? Як я можу скрасити твій день сьогодні?» Звуковий режим ChatGPT повідомляє, коли користувач вітається.