У світі терміново наймають досвідчених викладачів для чат-ботів

Дмитро Сизов 11 апреля 2024 09:50

Після народження другої дитини Челсі Беккер взяла неоплачувану річну відпустку зі своєї постійної роботи стюардесою. Переглянувши відео в TikTok, вона знайшла побічну суєту: навчання моделей штучного інтелекту для веб-сайту під назвою Data Annotation Tech.

Протягом кількох годин щодня 33-річна пані Беккер, яка живе в Швенксвіллі, штат Пенсильванія, сиділа за своїм ноутбуком і спілкувалася з чат-ботом на основі штучного інтелекту. За кожну годину роботи їй платили від 20 до 40 доларів. З грудня по березень вона заробила понад 10 тисяч доларів.

Бум технологій штучного інтелекту зробив більш витончений вид роботи, яка не потребує виходу з дому. Зростання великих мовних моделей, таких як технологія OpenAI's ChatGPT, викликала потребу в інструкторах, таких як пані Беккер, які вільно розмовляють англійською мовою і можуть якісно писати.

Пані Беккер сидить на дивані з немовлям і малюком. — Пані Беккер грається з сином і дочкою в їхньому домі в Швенксвіллі, Пенсільванія.Ханна Юн для The New York Times

Ні для кого не секрет, що моделі ШІ вчаться у людей. Протягом багатьох років виробники систем штучного інтелекту, таких як Google і OpenAI, покладалися на низькооплачуваних працівників, зазвичай підрядників, найнятих через інші компанії, щоб допомогти комп’ютерам візуально ідентифікувати об’єкти. (The New York Times подала до суду на OpenAI та його партнера, Microsoft, за позовами про порушення авторських прав.) Вони можуть позначати транспортні засоби та пішоходів як безпілотні автомобілі або ідентифікувати зображення на фотографіях, які використовуються для навчання систем ШІ.

Але оскільки технологія штучного інтелекту стала складнішою, змінилася й робота людей, які повинні старанно її навчати. Вчорашній тегер на фото – сьогоднішній автор есеїв.

Зазвичай для цих інструкторів є два типи роботи: навчання під наглядом, коли штучний інтелект навчається на написаному людиною тексті, і навчання з підкріпленням на основі зворотного зв’язку людини , коли чат-бот навчається на основі того, як люди оцінюють їхні відповіді.

Компанії, які спеціалізуються на обробці даних, зокрема стартапи Scale AI і Surge AI із Сан-Франциско, наймають підрядників і продають свої навчальні дані більшим розробникам. Розробники моделей штучного інтелекту, такі як стартап Cohere з Торонто, також наймають внутрішніх анотаторів даних.

Важко оцінити загальну кількість цих працівників, кажуть дослідники. Але Scale AI, яка наймає підрядників через свої дочірні компанії Remotasks і Outlier, каже, що десятки тисяч людей працюють на платформі одночасно.

Але, як і в інших видах концертної роботи, легкість гнучкого графіка супроводжується своїми труднощами. Деякі працівники сказали, що вони ніколи не спілкувалися з адміністраторами, які стояли за сайтами найму, а інших відсторонили від роботи без пояснення причин. Дослідники також висловлюють занепокоєння з приводу відсутності стандартів, оскільки працівники зазвичай не проходять навчання щодо відповідей чат-бота.

Щоб стати одним із цих підрядників, працівники мають пройти оцінку, яка включає такі запитання, як те, чи слід вважати публікацію в соціальних мережах ненавистю та чому. Інший вимагає більш творчого підходу, попросивши потенційних клієнтів написати вигадану коротку історію про зеленого танцюючого восьминога, дія якого відбувається в офісі Сема Бенкмана-Фріда FTX 8 листопада 2022 року. (Це був день, коли Binance, конкурент FTX , сказав він купив би компанію пана Бенкмана-Фріда, а потім швидко відмовився від угоди.)

Іноді компанії шукають експертів у відповідній галузі. Scale AI опублікував вакансії для контрактних авторів, які мають ступінь магістра або доктора хінді та японської мови. Outlier містить списки вакансій, у яких згадуються такі вимоги, як наукові ступені з математики, хімії та фізики.

«Що дійсно робить штучний інтелект корисним для його користувачів, так це людський рівень даних, і це справді повинні робити розумні люди та кваліфіковані люди та люди з певним ступенем досвіду та творчими нахилами», — сказала Віллоу Прімак, віце-президент. операцій з даними в Scale AI. «У результаті ми зосередилися на підрядниках, особливо в Північній Америці».

Алінзія Фенске, письменниця-фантаст, яка публікується самостійно, ніколи не спілкувалася з чат-ботом зі штучним інтелектом, перш ніж багато чула від колег-письменників, які вважали ШІ загрозою. Тож коли вона натрапила на відео в TikTok про Data Annotation Tech, частково її мотивацією було просто дізнатися якомога більше про штучний інтелект та переконатися на власні очі, чи виправдані страхи щодо штучного інтелекту.

«Це дає мені зовсім інший погляд на це тепер, коли я з цим працюю, — сказала 28-річна пані Фенске, яка живе в Оклі, Вісконсін. — Мені приємно знати, що за цим стоять люди». З лютого вона прагне 15 годин анотації даних щотижня, щоб мати можливість підтримувати себе під час письменницької кар’єри.

28-річна Есе Агбох, студентка магістратури, яка вивчає інформатику в Університеті Арканзасу, отримала завдання писати проекти, за що платили від 40 до 45 доларів на годину. Вона попросила б чат-бота розробити програму датчика руху, яка допомагає відвідувачам тренажерного залу підраховувати їхні повторення, а потім оцінити комп’ютерні коди, написані штучним інтелектом. В іншому випадку вона завантажила б набір даних про продукти в програму та попросила чат-бота розробити місячний бюджет. Іноді вона навіть оцінювала коди інших анотаторів, які, за словами експертів, використовуються для забезпечення якості даних.

Вона заробила 2500 доларів. Але платформа назавжди призупинила її обліковий запис за порушення кодексу поведінки. Вона не отримала пояснень, але підозрювала, що це тому, що вона працювала в Нігерії, оскільки сайт шукав працівників лише з певних країн.

Це фундаментальна проблема роботи онлайн коучів: вона може зникнути будь-коли. Оскільки ніхто не міг допомогти, розчаровані підрядники звернулися до соціальних мереж, поділившись своїм досвідом на Reddit і TikTok. 26-річна Джекі Мітчелл здобула велику кількість прихильників у TikTok завдяки своєму вмісту про побічні дії, зокрема роботу з анотаціями даних.

«Я сприймаю привабливість», — сказала вона, називаючи побічну суєту «нещасливою необхідністю» в цій економіці та «відмітною ознакою мого покоління та покоління вище мене».

Загальнодоступні записи показують, що Surge AI володіє Data Annotation Tech. Ні компанія, ні її виконавчий директор Едвін Чен не відповіли на запити про коментарі.

Для компаній зазвичай наймають підрядників через дочірні компанії. Вони роблять це, щоб захистити особистість своїх клієнтів, і це допомагає їм уникнути поганої преси, пов’язаної з умовами праці низькооплачуваних контрактників, сказав Джеймс Малдун, професор менеджменту Університету Ессекса, чиї дослідження зосереджені на роботі з даними ШІ.

Більшість сучасних працівників даних залежать від заробітної плати за роботу в концертах. Мілагрос Міцелі, соціолог і комп’ютерний науковець, який досліджує умови праці в роботі з даними, сказав, що хоча «багато людей роблять це заради розваги через гейміфікацію, яка з цим пов’язана», основна частина роботи все ще «виконується працівниками». які дійсно потребують грошей і роблять це основним заробітком».

Дослідники також стурбовані відсутністю стандартів безпеки в маркуванні даних. Працівників іноді просять розв'язати делікатні питання, як-от те, чи слід вважати певні події чи дії геноцидом або яка стать має з’являтися на створеному штучним інтелектом зображенні футбольної команди, але вони не навчені, як робити таку оцінку.

«Передавати на аутсорсинг або краудсорсинг питання про безпеку та етику в принципі не дуже гарна ідея», — сказав професор Малдун. «Ви повинні керуватися принципами та цінностями, а також тим, що ваша компанія насправді вирішує як правильну дію щодо певного питання».