Искусственный интеллект научился эффективно разделять аудиозаписи на музыку и вокал
Очень часто при создании музыки требуется изолировать один из каналов, к примеру, убрать вокал или басы. Однако, по большей части это дорого и неэффективно. Разработчики популярного стримингового сервиса Deezer представили обучающуюся нейросеть, способную совершить революцию в музыкальной индустрии.
Программисты выпустили в свободный доступ программу Spleeter с открытым исходным кодом. Она построена на Python и TensorFlow и использует машинное обучение для быстрого разделения музыки на различные каналы.
Скачав полностью готовое к работе ПО, пользователь получит доступ к библиотеке, которая на данный момент предоставляет следующие возможности:
-Разделение двух каналов аудио — вокал и любое другое сопровождение.
-Разделение четырёх каналов аудио — вокал, ударные, бас, другие.
-Разделение пяти каналов аудио — вокал, ударные, бас, фортепиано, другие.
Как сообщают уже установившие эту программу пользователи, обработка аудио происходит очень быстро. Так, для разделения 5,5-минутного трека на пять каналов требуется порядка трёх минут. Что до результатов, то по мнению экспертов, уже сейчас они превосходят всё, что было создано другими разработчиками. Даже если сравнивать программу с платными инструментами, которые берут по 4 доллара за обработку одной песни, у Spleeter выходит гораздо лучше.
Что интересно, разработчики не планируют брать за своё приложение денег. Тем не менее, они просят каждого кто будет ей пользоваться, подходить к этому делу ответственно, понимая и ценя чужой труд и интеллектуальную собственность. По ссылке можно послушать больше примеров разделения треков.