Cohere запускає сімейство відкритих багатомовних моделей

Компанія Cohere, що займається корпоративним штучним інтелектом, запустила нове сімейство багатомовних моделей на полях Індійського саміту зі штучного інтелекту. Моделі, що отримали назву Tiny Aya, є відкритими, тобто їхній базовий код доступний для використання та модифікації будь-ким, підтримують понад 70 мов і можуть працювати на повсякденних пристроях, таких як ноутбуки, без необхідності підключення до Інтернету.
Модель, запущена дослідницьким підрозділом компанії Cohere Labs, підтримує південноазійські мови, такі як бенгальська, хінді, панджабі, урду, гуджараті, тамільська, телугу та маратхі.
Базова модель містить 3,35 мільярда параметрів — міру її розміру та складності. Cohere також випустила TinyAya-Global, версію, налаштовану для кращого виконання команд користувача, для програм, що потребують широкої мовної підтримки. Регіональні варіанти доповнюють сімейство: TinyAya-Earth для африканських мов; TinyAya-Fire для південноазіатських мов; та TinyAya-Water для Азіатсько-Тихоокеанського регіону, Західної Азії та Європи.
«Такий підхід дозволяє кожній моделі розвивати міцнішу лінгвістичну основу та культурні нюанси, створюючи системи, які здаються більш природними та надійними для спільнот, яким вони призначені служити. Водночас усі моделі Tiny Aya зберігають широке багатомовне охоплення, що робить їх гнучкими відправними точками для подальшої адаптації та досліджень», – йдеться у заяві компанії.
Cohere зазначила, що ці моделі, які були навчені на одному кластері з 64 графічних процесорів H100 (тип потужного чіпа від Nvidia) з використанням відносно скромних обчислювальних ресурсів, ідеально підходять для дослідників та розробників, які створюють додатки для аудиторії, яка розмовляє рідними мовами. Моделі можуть працювати безпосередньо на пристроях, тому розробники можуть використовувати їх для забезпечення офлайн-перекладу. Компанія зазначила, що вона створила своє базове програмне забезпечення з урахуванням використання на пристрої, вимагаючи менше обчислювальної потужності, ніж більшість порівнянних моделей.
У лінгвістично різноманітних країнах, таких як Індія, така можливість працювати офлайн може відкрити різноманітний набір застосувань та варіантів використання без необхідності постійного доступу до Інтернету.
Моделі доступні на HuggingFace, популярній платформі для обміну та тестування моделей штучного інтелекту, а також на платформі Cohere. Розробники можуть завантажити їх на HuggingFace, Kaggle та Ollama для локального розгортання. Компанія також публікує набори даних для навчання та оцінки на HuggingFace та планує опублікувати технічний звіт з детальним описом методології навчання.
Генеральний директор стартапу Айдан Гомес минулого року заявив, що компанія планує вийти на біржу «незабаром». За даними CNBC , компанія завершила 2025 рік на високій ноті, опублікувавши річний постійний дохід у розмірі 240 мільйонів доларів, зі зростанням на 50% у порівнянні з попереднім кварталом протягом року.