Мета запускає найпотужніній інструмент ШІ Llama 3.1 405B у вільний доступ

Дмитро Сизов
Мета запускає найпотужніній інструмент ШІ Llama 3.1 405B у вільний доступ

Llama 3.1 405B компанії Meta є найпотужнішим на сьогодні та одним із найпотужніших у світі. Хоча технологічна компанія не розкрила, скільки коштує навчання, Цукерберг, її співзасновник і виконавчий директор, раніше оприлюднив інвестиції в розмірі 10,5 мільярдів доларів (8,9 мільярда фунтів стерлінгів) лише в чіпи, необхідні для живлення центрів обробки даних зі штучним інтелектом. решта електроніки, сама електрика та фізична будівля додатково коштують.

Проте, попри непомірні витрати, батьківська компанія Facebook і Instagram нічого не стягуватиме з вас за це. Якщо ви можете отримати комп’ютер, достатньо потужний, щоб його запустити, вам не доведеться платити Цукербергу ні цента.

Однак те, чи окупиться ця азартна гра, має значення не тільки для Meta: велика ставка інвесторів і технічних колег Meta залежить від того самого питання.

У червні аналітики Goldman Sachs опублікували замітку зі скептичною назвою: «ШІ покоління: занадто багато витрат, занадто мало вигоди?» Він вказує на інвестиції в 1 трильйон доларів США в ШІ протягом наступних кількох років технологічними галузями, іншими компаніями та комунальними підприємствами в інфраструктуру, включаючи мікросхеми та електромережі. Це наштовхнуло на запитання: «Чи окупляться ці великі витрати?»

Замітка охоплює низку поглядів щодо того, чи принесе цей розгул прийнятну віддачу, включно з професором економіки Массачусетського технологічного інституту Дароном Ацемоглу, який стверджує, що «справді трансформаційні зміни», викликані ШІ, «не відбудуться швидко». Іншими словами, сприятлива економічна віддача від цього буму може зайняти більше часу, ніж очікують інвестори.

Дослідження також ставить під сумнів, чи зможе джерело живлення відповідати попиту, пов’язаному з навчанням і роботою систем штучного інтелекту, і те ж саме запитує про чіпи, необхідні для живлення цих моделей.

Існують також більш оптимістичні погляди аналітиків Goldman, які стверджують, що штучний інтелект зрештою автоматизує 25% усіх робочих завдань у США (що зробить економіку продуктивнішою, але також створить нові завдання та продукти) і що бум витрат не є результатом вдарити з попередніми інвестиціями в технології.

Однак Sequoia Capital, один із перших інвесторів у розробника ChatGPT OpenAI, ясно дав зрозуміти, що компаніям зі штучним інтелектом потрібно наполегливо працювати, щоб окупити всі інвестиції в інфраструктуру, таку як чіпи та центри обробки даних. Попередня оцінка того, що компаніям ШІ потрібно буде заробити 200 мільярдів доларів, щоб окупити свої інвестиції, зросла до 600 мільярдів доларів, написав партнер Sequoia Девід Кан .

Кан підкреслив, що така сильна підтримка штучного інтелекту «майже напевно» буде доцільною, але «шлях попереду буде довгим».

Бенедикт Еванс, технічний аналітик, запитав у примітці цього місяця, чи великі мовні моделі – технологічні інструменти, такі як ChatGPT – також можуть бути пасткою, тому що хоча ChatGPT може виглядати як повноцінний продукт, він таким не є. .

Еванс проводить аналогію між LLM та першими iPhone та появою Інтернету – потенціал є, але мають відбутися й інші речі.

«Коли більшість технологій з’являються вперше, вони ще не готові, і незрозуміло, чому вони корисні, і вони потребують ще багато роботи», — каже він. «У iPhone не було 3G і не було програм. Інтернет з’явився на початку 90-х, але ні в кого не було модему, не кажучи вже про широкосмуговий зв’язок. Ціла купа речей мала відбутися, перш ніж мережа злетіла».

Еванс додає, що чат-боти добре працювали для людей, яким потрібні виправлення для кодування та маркетингу, які заощадили час, але вони ще не принесли виправлень в інших сферах.

«Є дуже конкретні випадки, коли це вже економить величезну кількість часу, але це ще не загально для всіх». Він додає: «Відчуття, яке, на мою думку, у більшості людей, дивлячись на ChatGPT, таке: гаразд, це неймовірно круто… але що я маю з цим робити?»

Цього тижня OpenAI оголосила, що тестує пошукову систему в США, що може стати прямим викликом пошуковому гіганту Google, який також запустив пошукові відповіді, створені за допомогою ШІ . OpenAI також найняв колишнього керівника Meta та Twitter, Кевіна Вейла, як свого головного спеціаліста з продуктів, щоб допомогти відповісти на запитання: «Що я маю з цим робити?»

Цього тижня сайт технічних новин The Information повідомив, що цього року OpenAI може втратити до 5 мільярдів доларів , виходячи з аналізу внутрішніх фінансових показників та інтерв’ю з джерелами, оскільки він накопичує 8,5 мільярдів доларів операційних витрат, включаючи 4 мільярди доларів на рік на оренду. серверів від Microsoft і 3 мільярди доларів на рік на моделях навчання.

Дохід за весь рік може становити від 3,5 до 4,5 мільярдів доларів на рік, згідно з інформацією, що передбачає збитки до 5 мільярдів доларів. OpenAI, що базується в Сан-Франциско, заробляє гроші на тому, що стягує з компаній плату за створення споживчих продуктів за допомогою своїх моделей або дозволяє компаніям створювати власні чат-боти за допомогою своєї технології, а також отримує дохід, стягуючи з користувачів 20 доларів на місяць за доступ до більш потужної версії ChatGPT. Google і Anthropic також продають підписки на системи штучного інтелекту за 20 доларів на місяць, тоді як Cohere продає свої моделі бізнес-клієнтам для таких завдань, як кодування або аналіз даних.

Інформація визнала, що її розрахунки OpenAI були «припущеннями», але якщо вони правильні, компанія повинна зібрати готівку протягом наступних 12 місяців. OpenAI відмовився від коментарів, хоча, маючи Microsoft як головного фінансового спонсора, він міг би звернутися до багатого благодійника – хоча й з регуляторними органами .

Але попри те, що технологічні компанії борються за панування на «кордоні» штучного інтелекту, інвестуючи мільярди в створення більших і кращих систем, другий фронт відкрився в більш традиційній битві: вартість. Останній випуск OpenAI — це не GPT-4o, «мультимодальна» система, яка привернула заголовки, яка настільки нагадувала Скарлетт Йоханссон, що викликала судовий процес .

Натомість це GPT-4o mini, скорочена версія того ж штучного інтелекту, яку компанія пропонує стороннім розробникам за менш ніж 5% вартості своєї прикордонної системи – підриваючи попередні найдешевші моделі, Gemini 1.5 Flash і Google від Google. Хайку Клода 3 від Anthropic.

У вівторок Meta випустила останню версію своєї системи Llama, яка підірвала OpenAI. Знову ж таки, в той час, як увага була прикута до передової версії моделі, яка отримала назву 405B, компанія так само прагнула проштовхнути свою найменшу LLM, 8B. На відміну від своїх конкурентів, Llama доступна для завантаження та запуску на власних системах, а хмарні постачальники, такі як Groq, пропонують її за третину ціни конкурентних систем OpenAI. Llama 3.1 8B поступається еквівалентам OpenAI згідно з тестами Artificial Analysis, але хто може скаржитися за таку ціну?

Meta називає Llama «відкритим вихідним кодом», хоча критики заперечують це твердження: можна завантажити модель і використовувати її з досить безплатною ліцензією, але навчальні дані залишаються повністю закритими, і модель не є безплатною для будь-кого для використання з будь-якою метою. Деякі з обмежень є практичними: статус авторських прав на навчальні дані для великих мовних моделей є, у кращому випадку, суперечливим. Meta зберігає в секреті конкретні дані, на яких навчила Llama 3.1, і майже напевно не має ліцензії на їх безплатне поширення.

Інші обмеження мають більшу комерційну вагу. Зберігаючи обмеження на використання Llama 3.1, Meta займає середину будь-якого майбутнього сектору, який розвиватиметься навколо її ШІ: навіть якщо вона не стягуватиме плату безпосередньо за доступ до моделі, вона отримує контроль над напрямком розвитку , і завжди може закрити майбутні шляхи, якщо конкуренти виростуть занадто великими за допомогою його технологій.

У вівторок Цукерберг сказав: «Я вважаю, що випуск Llama 3.1 стане переломним моментом у галузі... Сподіваюся, ви приєднаєтеся до нас у цій подорожі, щоб надати переваги ШІ всім у світі». Для інвесторів та інших технологічних компаній ці переваги мають принести значний прибуток.