редакция 8 октября 2024.

Suno, как аранжировщик. Тест #3

В своей статье "Suno prompt (стиль) = рыбалка. Альтернатива?" на Хабре (8 авг. 2024), я рассматривал режим Audio Input (загрузку "исходника"), как способ "непосредственного" задания стиля. Параллельно провел несколько экспериментов с целью выяснить насколько точно Suno воспринимает (т.е. "отрабатывает"), темп, тип ритмики, тональность, гармонию, мелодии.

Итоги (Autotune и, по сути, автоаккомпанемент), на мой взгляд, интересные, даже многообещающие. Так родилась идея протестировать Suno в качестве аранжировщика. Пояснение задач, используемые подходы и общие соображения я изложил в статье на Хабре ...

Здесь же в разделах привожу результаты этих тестов и краткие выводы:

Тест #1 / от спетой мелодии, текста... ("По-Гру-Гла-Но ...").
Тест #2 / от спетой мелодии, текста... ("Красота в глазах ...")
Тест #4 / backing track от гармонии...
Тест #5 / инструментальные вставки от исходника...

Мой каталог Suno песен.
Мой Suno дневник.
Раздел Suno: Гармонизация и Autotune. Invite User

Тест #3 / от реальной песни и текста...

... Сделал около 20 разных DS (Dataset, "исходников") из реальных песен (М/Ж). Для 3-х DS использовал песни из своих прошлых проектов. Также попробовал хиты известных* исполнителей, как наших, так и зарубежных. Цель - проверить, воспроизведет ли Suno при генерации тембр, манеру певца и стиль** исходной песни, причем, и при смене языка. DS состоят из основных фрагментов конкретной песни, а длительность не превышает 60 сек.

В основном использовал тексты свои (или коллег), а когда нужен был др. язык - генерацию Lyrics в Suno. Для известных, исключительно в ознакомительных целях, привожу нарезку из отдельных фраз, для своих - полные треки.

* С известными композициями Suno напрямую не работает, выводится сообщение "Uploaded audio matches existing work of art". Как я понимаю, у юристов еще нет четких законов, регулирующих эту новую область авторского права. Скорее всего, для использования чужого голоса нужно согласие его обладателя.
** При генерации поле Style оставалось пустым, т.е. "no style".


Фразы с генерацией голосов известных исполнителей

"Redhead Girl"

"Hot Stuff Dreams", Ravalex CD, 2004, Canada / En


Исходник (104RHGrl1) 0:48 / Д.Мухачёв

"Красота в глазах..."

"Désolé vieux Paris" / на французском

"Если веришь, это просто!"

"Солдат любви"

"То, что мне нравится"

~2010, Новосибирск / Ru


Исходник (140MnNr1) 0:55 / Н.Михайленко

"Красота в глазах..."

"Naranjas y azúcar en ritual" / на испанском

"Если веришь, это просто!"

"Солдат любви"

"Зритель с 10-го ряда..."

"Черноморская роза"

~2016, Новосибирск / Ru


Исходник (130IZ1) 0:59 / И.Зозуля

"Truck driver story" / на английском

"Бледно-розовый оттенок"

"Если веришь, это просто!"

Краткие выводы.

1. Стиль "исходника" везде сохраняется, но может обогащаться усложнением формы, фактуры, гармонии, отсутствующими в нем инструментами. Темп сохраняется в целом, но есть случаи постепенного ускорения на 5-10% - скорее всего это баг.

2. Тембр и манера голоса сохраняется не всегда, бывают смены гендера и дуэты. Выполняется генерация на др. языке.

3. Качество звука чаще ниже "исходника" - есть определенная "зашумленность", в то же время некоторые генерации, с музыкальной точки зрения, интереснее исходника.

4. Сольные инструменты (при правильности самих нот) звучат порой неестественно: неверный регистр, микс разных инструментов, интонация/манера др. инструмента.

Дополнительные выводы в статье на Хабре.

© 2009-2024 Alexey Ustinov