Google вбудовує нечутні "водяні знаки" прямо в музику, згенеровану штучним інтелектом

Дмитро Сизов
Google вбудовує нечутні "водяні знаки" прямо в музику, згенеровану штучним інтелектом

Аудіо, створене за допомогою моделі AI Lyria від Google DeepMind, як-от доріжки, створені за допомогою нових функцій генерації аудіо YouTube , буде позначено водяним знаком SynthID, щоб люди могли ідентифікувати своє походження, згенероване штучним інтелектом. У дописі в блозі DeepMind сказав, що водяний знак не повинен розпізнаватися людським вухом і «не погіршує враження від прослуховування», і додав, що його все одно слід розпізнавати, навіть якщо звукову доріжку стиснуто, пришвидшено або зменшено, або має додатковий шум.

Інструменти водяних знаків, такі як SynthID, розглядаються як важливий запобіжний засіб проти певної шкоди генеративного ШІ. Виконавчий указ президента Джо Байдена щодо штучного інтелекту , наприклад, закликає до нового набору державних стандартів для позначення водяних знаків на контенті, створеному ШІ. Це багатообіцяюча сфера, але сучасні технології – далеко не ідеальний засіб для захисту від підробок.

Згідно з DeepMind, аудіореалізація SynthID працює шляхом «перетворення аудіохвилі в двовимірну візуалізацію, яка показує, як спектр частот у звукі змінюється з часом». У ньому стверджується, що цей підхід «не схожий ні на що, що існує сьогодні».

Новина про те, що Google вбудовує функцію водяних знаків у аудіо, створене штучним інтелектом, з’явилася лише через кілька місяців після того, як компанія випустила бета-версію SynthID для зображень, створених Imagen на Vertex AI Google Cloud. Водяний знак стійкий до редагування, наприклад обрізання або зміни розміру, хоча DeepMind попереджає, що він не захищений від « екстремальних маніпуляцій із зображеннями». »