Google додає диктування на базі Gemini до Gboard

Дмитро Сизов

 Google анонсував Rambler, нову функцію голосового диктування на базі штучного інтелекту для Gboard — свого широко використовуваного додатка для клавіатури Android. 

Цей запуск ставить Google у пряму конкуренцію з такими програмами, як Wispr Flow та Typeless , зростаючою кількістю додатків для диктування на базі штучного інтелекту, які в останні роки завоювали аудиторію на комп’ютерах та мобільних пристроях, більшість з яких ще не закріпилися на Android.

Як і інші програми для диктування, Rambler видаляє слова-заповнювачі, такі як «ум» та «а». Він також розпізнає виправлення в середині речення, наприклад, «Я збираюся зустрітися з тобою в середу в нашій звичайній кав’ярні о 15:00… хм, 14:00».

Google заявила, що використовує багатомовні моделі на базі Gemini, які також підтримують перемикання коду. Перемикання коду означає, що користувачі можуть перемикатися між мовами посеред речення — скажімо, з англійської на хінді — і Rambler стежитиме за ними, не втрачаючи контексту. Ця функція відображає, скільки багатомовних носіїв насправді спілкуються, і більшість західних програм для диктування повільно її підтримують.

Компанія заявила, що Gboard чітко повідомить своїм користувачам, що функція Rambler використовується. Він не зберігає жодних голосових записів і використовує аудіо лише для транскрипції того, що говорять користувачі. Під час брифінгу Google зазначив, що, оскільки функцію Rambler можна використовувати в усіх додатках, це як «винаходити клавіатуру заново».

Щодо конфіденційності, Бен Грінвуд, директор Android Core Experiences, сказав, що Google використовує комбінацію обробки даних на пристрої та в хмарі, і «протягом багатьох років значно інвестував», щоб забезпечити «безпеку та конфіденційність» функцій — продуманий сигнал для користувачів, які порівнюють Rambler зі сторонніми програмами для диктування, які можуть обробляти дані по-різному.

За останні кілька років з’явилося безліч програм для диктування — Wispr Flow, Willow, Superwhisper, Monologue, Handy та Typeless. Але досі більша частина цієї активності була на комп’ютерах та iOS, що залишало Android відносно недостатньо забезпеченим. Минулого місяця Google випустив на iOS AI Edge Eloquent , програму для диктування, яка працює в першу чергу офлайн, на базі своїх вбудованих моделей Gemma AI.

Rambler – це найчіткіший крок Google, спрямований на подолання цієї прогалини. Ці нові функції будуть обмежені телефонами Samsung Galaxy та Google Pixel для початкового літнього запуску, але згодом вони досягнуть інших пристроїв Android. Основна перевага тут полягає в поширенні: Gboard є клавіатурою за замовчуванням для переважної більшості користувачів Android у всьому світі, а це означає, що Rambler постачається попередньо встановленим для сотень мільйонів людей. Коли гравець платформи виходить на ринок на рівні операційної системи, окремим додаткам потрібна переконлива причина – краща точність, глибші функції або сильніші гарантії конфіденційності – щоб виправдати окреме завантаження.

Для стартапів, що займаються диктуванням, питання вже не в тому, чи можуть вони створити щось хороше, а в тому, чи можуть вони створити щось достатньо хороше, щоб користувачі активно це шукали.