В своей статье "Suno prompt (стиль) = рыбалка. Альтернатива?"
на Хабре (8 авг. 2024), я рассматривал режим Audio Input (загрузку "исходника"), как способ "непосредственного" задания стиля.
Параллельно провел несколько экспериментов с целью выяснить насколько точно Suno воспринимает (т.е. "отрабатывает"),
темп, тип ритмики, тональность, гармонию, мелодии.
Итоги (Autotune и, по сути, автоаккомпанемент), на мой взгляд, интересные, даже многообещающие.
Так родилась идея протестировать Suno в качестве аранжировщика.
Здесь же в разделах привожу результаты этих тестов и краткие выводы:
Тест #1 / от спетой мелодии, текста... ("По-Гру-Гла-Но ..."). Тест #3 / от реальной песни и текста... Тест #4 / backing track от гармонии... Тест #5 / инструментальные вставки от DS
Тест #2 / от спетой мелодии, текста... ("Красота в глазах ..."* ).
Сделал 6 разных DS** (Dataset, "исходников"): вокал (М/Ж) одинаковый, но разные доп. инструменты - фортепиано (Ch.), Hi-Hat.
Тесты для 3 DS приведены ниже. Цель - проверить, как Suno отрабатывает темп, ритмику, мелодию, гармонию (сохраняет, варьирует).
Для удобства анализа "на слух" здесь приведены отдельные фрагменты - Verse1, Chorus каждого теста, а также DS.
Полные треки для всех тестов см. в каталоге.
Для всех сгенерированных фрагментов указаны заданный в Suno стиль, а также тональность и темп (определены автоматически).
* Песня-шутка. Для экспериментов нужны тексты, с чужими "издеваться" не очень правильно, вот сочиняю свои ...
** Вокал - мужской (b3CBHAu, b4PHAu) и женский (b5CBHTk), все в темпе 70(140)bpm.
Каждый DS это 1-й куплет и припев. В общей сложности для данного теста я сделал более 20-ти генераций, тут представлены 16.
Генерации: это две нарезки первых строк фрагментов из всех тестов (всего 16) - хорошо воспринимаются отличия как в мелодии, так и манере.
Генерации из М. и из Ж. разделены тоном (в Ж. - часть мужские голоса 😄 ).
1. Здесь гармония сложнее, чем в Тесте#1 и она отработана Suno хуже.
Но в большинстве генераций, аранжировка сделана правильно, согласно выбранному стилю.
2. С женским DS (v5.n) не везде получилась генерация Ж., голоса,
где-то голоса (М/Ж) менялись в самой песне. (v5.5).
3. Интересным представляется v5.7, где голос "морфированный", он не похож ни на DS, ни на дефолтные голоса.
Дополнительные выводы в статье на Хабре.