Поглинач Інтернету. Названо найагресивніший інструмент збирання даних для штучного інтелекту

Поглинач Інтернету. Названо найагресивніший інструмент збирання даних для штучного інтелекту

Материнська компанія TikTok ByteDance поки не здається найпотужнішим гравцем на ринку штучного інтелекту, але її вебсканер Bytespider збирає навчальні дані у всьому Інтернеті у 25 разів швидше, ніж сканер OpenAI.

Виробники продуктів зі штучним інтелектом використовують вебсканери, щоб збирати навчальні дані для своїх моделей. ByteDance, яка, ймовірно, планує випустити власну велику мовну модель на кшталт GPT від OpenAI, робить це шаленими темами.

Як повідомляє Fortune, вебсканер компанії Bytespider, який з’явився у квітні, вже обігнав за обсягами збирання інформації сканери лідерів ринку ШІ - OpenAI, Google, Meta та Anthropic. За оцінкою Сема Кроутера, генерального директора компанії з управління ботами Kasada, швидкість сканування Bytespider у 25 разів більша, ніж у GPTbot OpenAI, і в 3000 разів більша, ніж у ClaudeBot, який є вебсканером Anthropic. Кроутер також сказав, що за останні шість тижнів Kasada спостерігала величезні сплески активності збирання даних з боку Bytespider.

Станом на літо 2024 року вебсканер Bytespider був лідером не лише за кількістю запитів, але й за ступенем сканування Інтернет-ресурсу та частотою, з якою його блокують. Що ByteDance планує робити з усіма цими отриманими даними, ще невідомо. Раніше з’являлася інформація про те, що китайська компанія ByteDance планує розробити модель штучного інтелекту, навчену за допомогою чипів, створених її земляком Huawei. Сама компанія не оголошувала про такі плани.

Источник: techno.nv.ua