Financial Times тестує чат-бота штучного інтелекту, навченого на десятиліттях власних статей

Дмитро Сизов 25 марта 2024 08:45

The Financial Times має новий генеративний чат-бот зі штучним інтелектом під назвою Ask FT, який може відповідати на запитання передплатників. Подібно до узагальнених ботів зі штучним інтелектом (наприклад, ChatGPT, Copilot або Gemini), користувачі можуть очікувати відповіді природною мовою на все, що вони хочуть знати, але з відповідями, отриманими з десятиліть опублікованої інформації, а не з джерел, які важче пояснити чи є предметом триваючого судового позову . Тому не очікуйте, що він дасть вам відповідь щодо найкращого рецепта фетучіні Альфредо.

Коли ми запитали: «Хто керує продуктами штучного інтелекту Microsoft?» інструмент повернув актуальну відповідь і посилався на новини, що виникли цього тижня, про те, що Microsoft найняла співзасновника DeepMind Мустафу Сулеймана на посаду голови своєї нової команди ШІ: Наразі Мустафа Сулейман керує продуктами Microsoft AI, орієнтованими на споживачів, і підрозділом Microsoft AI, підпорядковуючись безпосередньо Сатьї Наделлі [1,2,3]. Він був залучений з Inflection AI, щоб розширити фокус Microsoft на розробці генеративного ШІ для особистого споживчого використання [1,2,3,4,6].

Цифри в дужках відповідають статтям FT , з яких він витягнув інформацію, які він перелічує під відповіддю. Тут також зазначено період часу, коли ці статті були написані. У випадку з цим питанням Microsoft сказано, що вона вилучила інформацію за період з 1 березня 2023 року до 20 березня 2024 року.

Однак ми виявили невідповідності з деякими відповідями. Під час нашого тестування інструмент включив Ніккі Гейлі у відповідь на наше запитання про те, хто зараз балотується на президентських виборах у США 2024 року, хоча вона вже вибула з перегонів.

Скріншот Емми Рот / The Verge

Він доступний кільком сотням платних підписників на рівні FT Professional, який орієнтований на бізнес-професіоналів та установи. Зараз Ask FT працює на базі Claude, великої мовної моделі (LLM), розробленої Anthropic, але це може змінитися. В інтерв’ю The Verge головний менеджер із продуктів FT Ліндсі Джейн каже , що торгова точка «підходить до цього як до «незалежного від моделі» та дивиться, яка з них найкраще відповідає нашим потребам».

Gif із генеруючою AI-функцією Financial Times

GIF: Financial Times

Він може надавати відповіді на запитання про поточні події, наприклад, скільки фінансування Intel отримала від уряду США відповідно до закону CHIPS, а також на ширші запити, як-от вплив криптовалюти на навколишнє середовище. Потім інструмент збирає архіви FT і узагальнює відповідну інформацію з цитатами.

Ask FT також відповість на запитання, які вимагають глибшого копання в архівах FT. Коли його запитали, як розпочався YouTube, він правильно відповів, що його заснували Чад Герлі, Стів Чен і Джавід Карім у лютому 2005 року.

«Ми провели цілу низку внутрішніх тестувань і використали це, щоб уточнити, як ми навчаємо моделі та як створюємо код», — каже Джейн. «У цій першій групі з 500 ми відстежуємо кожне запитання та відповідь, а також відгуки користувачів».

Минулого року ми випробували подібний інструмент, застосований цифровими торговими точками, що належать маркетинговій компанії Foundry, зокрема Macworld , PCWorld і Tech Advisor . Однак на той час це було не так корисно, як Ask FT; моя колега Мія Сато виявила, що він надає неточні результати на прості запитання, наприклад, коли було випущено останній iPod Nano.

«Я не думаю, що ви станете закладом із 135-річною історією, якщо ви постійно не розвиватиметеся й не зустрічатиметеся з цими моментами», — каже Джейн. «Але ви повинні бути розумними, а не просто сісти на потяг ажіотажу... інакше люди просто пограються з цим заради новизни, а потім продовжать своє життя».

Більшість передплатників поки що не зможуть випробувати чат-бота. Ask FT поки що залишиться в бета-версії, оскільки FT продовжує тестувати та оцінювати його.