В своей статье "Suno prompt (стиль) = рыбалка. Альтернатива?"
на Хабре (8 авг. 2024), я рассматривал режим Audio Input (загрузку "исходника"), как способ "непосредственного" задания стиля.
Параллельно провел несколько экспериментов с целью выяснить насколько точно Suno воспринимает (т.е. "отрабатывает"),
темп, тип ритмики, тональность, гармонию, мелодии.
Итоги (Autotune и, по сути, автоаккомпанемент), на мой взгляд, интересные, даже многообещающие.
Так родилась идея протестировать Suno в качестве аранжировщика.
Здесь же в разделах привожу результаты этих тестов и краткие выводы:
Тест #2 / от спетой мелодии, текста... ("Красота в глазах ...") Тест #3 / от реальной песни и текста... Тест #4 / backing track от гармонии... Тест #5 / инструментальные вставки от DS
Тест #1 / от спетой мелодии, текста... ("По-Гру-Гла-Но ..."* ).
Сделал 10 разных DS** (Dataset, "исходников"): вокал одинаковый, но разные доп. инструменты - фортепиано (Ch.), ударные и пр.
Тесты для 8 DS приведены ниже. Цель - проверить, как Suno отрабатывает темп, ритмику, мелодию, гармонию (сохраняет, варьирует).
Для удобства анализа "на слух" здесь приведены отдельные фрагменты - Bridge, Verse1, Chorus каждого теста, а также DS.
Полные треки для всех тестов см. в каталоге.
Для всех сгенерированных фрагментов указаны заданный в Suno стиль, а также тональность и темп (определены автоматически).
* Песня-шутка. Для экспериментов нужны тексты, с чужими "издеваться" не очень правильно, вот сочиняю свои ...
** Вокал везде одинаковый, но в начальных тестах (1-4 с темпом 90bpm)
были отдельные DS для Verse и Chorus - иначе не укладывался в лимит 1 мин (с конца сентября 2024 он увеличен до 2 мин).
Остальные DS с 102bpm (Verse + Chorus), но не включают Bridge. В общей сложности для данного теста я сделал около
40 генераций. Здесь представлена 21.
Генерации: это три нарезки первых строк фрагментов из всех тестов (всего 21) -
хорошо воспринимаются отличия как в мелодии, так и манере.
190bpm. Отдельные DS (0:56), pV0PH - Verse1, Verse2 + Bridge, pR0PH - Chorus + Bridge,
Cmaj в начале, Hi-Hat по 1/4. Исходники:
v1.2
V: reggae, trumpet solo, positive. C: no style
290bpm. Отдельные DS (0:56), pV2CH - Verse1, Verse2 + Bridge, pR2CH - Chorus + Bridge,
Ch. каждый такт, Hi-Hat по 1/4. Исходники:
v2.2
V,C: Chill Wave
390bpm. Отдельные DS (0:56), pV3CHT - Verse1, Verse2 + Bridge, pR3CHT - Chorus + Bridge,
Ch. каждый такт, мелодия, Hi-Hat по 1/4. Исходники:
v3.2
V,C: reggae
490bpm. Отдельные DS (0:57), pV4CBDT - Verse1, Verse2 + Bridge, pR4CBDT - Chorus + Bridge,
Ch. на слабые доли, Bass & DrLoop, Hi-Hat по 1/4. Исходники:
v4.2
V: Latin jazz, Trumpet solo, Ironic, C: Latin jazz, Brass hits, Strings
5102bpm. Один DS pVR5CHD - Verse1, Chorus (0:59) без Bridge, Ch. каждый такт,
Hi-Hat по 1/4. Исходники:
v5.1
Rock & roll, rhythm & blues, Distortion Guitar Solo
v5.2
Country band, Acoustic guitar, harmonica
v5.3
Funk, Brass hits, Distortion guitar solo
v5.4
Heavy Metal, Distortion Guitar, Lead Synthesizer
v5.5
Small Jazz band, Grand-piano, Acoustic bass, Saxophone, Drums
v5.6
Bass-driven hip-hop, Rap
v5.7
Big Band
v5.8
Baroque orchestra
7102bpm. Один DS pVR7PHx - Verse1, Chorus (0:59) без Bridge, Cmaj в начале, голос Wet,
Hi-Hat по 1/4. Исходники:
v7.1
Baroque orchestra
8102bpm. Один DS pVR8CHx - Verse1, Chorus (0:59) без Bridge, Ch. каждый такт, голос Wet,
Hi-Hat по 1/4. Исходники:
v8.1
Roots reggae
v8.2
Depressive Russian Post-punk
v8.3
Latin jazz, Bossa nova, Acostic guitar solo
v8.4
Chill wave
9102bpm. Исходники:Один DS pVR9Hx - Verse1, Chorus (0:59) без Bridge, без Ch., голос Wet,
Hi-Hat по 1/4.
v9.1
No style
v9.2
1950s rock & roll, rhythm & blues, rockabilly
v9.3
Synth-pop, electronic, new wave
v9.4
Dixieland jazz
Краткие выводы.
1. При обычной гармонии, простом тексте, типовом темпе Suno в целом воспринимает и отрабатывает все основные параметры,
внося в них изменения, видимо, согласно заданному Style и выбранной модели.
В подавляющем большинстве генераций, аранжировка в музыкальном смысле делается правильно, примерно так,
как это мог бы сделать человек.
2. Отдельного внимания требуют генерации, где тональность/гармония "задавалась" лишь самой мелодией (v9.n).
3. Интересным представляется v9.1, где стиль не задавался.
Скорее всего, здесь Suno делает выбор исключительно из ритмической организации и содержания текста.
Дополнительные выводы в статье на Хабре.