Speechify додає голосовий ввід та голосового помічника до свого розширення Chrome

Speechify здебільшого був інструментом, який допомагає прослуховувати статті, PDF-файли та документи. Тепер компанія додає функції розпізнавання голосу до свого розширення Chrome , включаючи голосовий ввід та голосового помічника, який відповідає на запитання.
За останні 12 місяців спостерігається поширення інструментів для розпізнавання голосу завдяки загальному покращенню якості моделей розпізнавання мовлення. Speechify приєднується до цього потяга та запускає власний інструмент диктування з підтримкою англійської мови. Як і інші інструменти диктування, голосовий ввід Speechify виправляє помилки та видаляє слова-заповнювачі.
Під час мого короткого тестування, яке тривало трохи понад день, я відчув, що інструмент Speechify потребує значного вдосконалення. Наприклад, інструменти добре працюють з Gmail та Google Docs, але на таких сайтах, як WordPress, у мене виникли труднощі з активацією голосового диктування та його належною роботою. Компанія заявила, що поступово додає оптимізацію для популярних сайтів.
Що стосується точності, рівень помилок у словах був вищим, ніж у деяких інших інструментів, таких як Wispr Flow , Willow та Monologue . Speechify зазначив, що його модель навчається швидше, чим більше ви її використовуєте, а рівень помилок поступово знижується.
Стартап також запускає голосового помічника для розмов, який знаходиться в бічній панелі вашого браузера. Ви можете поставити йому запитання про вебсайт, наприклад, «які три ключові ідеї?» або «поясніть це простіше».
Хоча ChatGPT та Gemini мають розмовні режими, аргумент Speechify полягає в тому, що вони розглядаються як другорядна думка в їхніх додатках, а власний інструмент стартапу має голосове керування в центрі уваги.
«Ми вважаємо, що чат завжди буде стандартним користувацьким інтерфейсом у ChatGPT та Gemini під час відкриття додатків. Саме цього очікують їхні користувачі. Голос завжди буде другорядним – а в багатьох випадках – другорядним для ChatGPT та Gemini. За кілька років розробки Speechify ми знаємо, що значна частина ринку, включаючи наших користувачів, хоче використовувати голос як основний, стандартний параметр щоразу, коли вони відкривають додаток та спілкуються зі штучним інтелектом», – сказав Рохан Павулурі, головний бізнес-директор компанії, TechCrunch електронною поштою.
Одна помітна проблема полягає в тому, що помічник Speechify наразі не працює з браузерами з вбудованими помічниками бічної панелі, такими як Atlas від OpenAI, Comet від Perplexity та Dia. Стартап не дуже хвилюється з цього приводу, оскільки розширення здебільшого призначене для Chrome та його величезної бази користувачів.
Speechify заявила, що планує поступово включати голосовий ввід та голосового помічника у всі свої додатки для комп’ютерів та мобільних пристроїв.
Стартап також хоче розробити агентів, які виконуватимуть завдання від вашого імені. Стартап не розкрив повного плану розвитку, але навів один приклад: здійснення дзвінків для запису на прийом або очікування на лінії підтримки клієнтів компанії. Інші компанії, такі як Truecaller та Cloacked, переслідували аналогічні цілі.