редакция 25 сентября 2024.

Suno, как аранжировщик. Тест #1

В своей статье "Suno prompt (стиль) = рыбалка. Альтернатива?" на Хабре (8 авг. 2024), я рассматривал режим Audio Input (загрузку "исходника"), как способ "непосредственного" задания стиля. Параллельно провел несколько экспериментов с целью выяснить насколько точно Suno воспринимает (т.е. "отрабатывает"), темп, тип ритмики, тональность, гармонию, мелодии.

Итоги (Autotune и, по сути, автоаккомпанемент), на мой взгляд, интересные, даже многообещающие. Так родилась идея протестировать Suno в качестве аранжировщика. Пояснение задач, используемые подходы и общие соображения я изложил в статье на Хабре ...

Здесь же в разделах привожу результаты этих тестов и краткие выводы:

Тест #2 / от спетой мелодии, текста... ("Красота в глазах ...")
Тест #3 / от реальной песни и текста...
Тест #4 / backing track от гармонии...
Тест #5 / инструментальные вставки от исходника...

Мой каталог Suno песен.
Мой Suno дневник.
Раздел Suno: Гармонизация и Autotune. Invite User

Тест #1 / от спетой мелодии, текста... ("По-Гру-Гла-Но ..."* ).

... Сделал 10 разных DS** (Dataset, "исходников"): вокал одинаковый, но разные доп. инструменты - фортепиано (Ch.), ударные и пр. Тесты для 8 DS приведены ниже. Цель - проверить, как Suno отрабатывает темп, ритмику, мелодию, гармонию (сохраняет, варьирует).

Для удобства анализа "на слух" здесь приведены отдельные фрагменты - Bridge, Verse1, Chorus каждого теста, а также DS. Полные треки для всех тестов см. в каталоге. Для всех сгенерированных фрагментов указаны заданный в Suno стиль, а также тональность и темп (определены автоматически).
* Песня-шутка. Для экспериментов нужны тексты, с чужими "издеваться" не очень правильно, вот сочиняю свои ...

** Вокал везде одинаковый, но в начальных тестах (1-4 с темпом 90bpm) были отдельные DS для Verse и Chorus - иначе не укладывался в лимит 1 мин (с конца сентября 2024 он увеличен до 2 мин). Остальные DS с 102bpm (Verse + Chorus), но не включают Bridge. В общей сложности для данного теста я сделал около 40-ти генераций. Здесь представлены 21.
Здесь три нарезки первых строк фрагментов из всех тестов (всего 21) - хорошо воспринимаются отличия как в мелодии, так и манере.

Bridge 1.2 ... 9.4

Verse 1.2 ... 9.4

Chorus 1.2 ... 9.4

PoGru_Score
...
1 90bpm. Отдельные DS (0:56), pV0PH - Verse1,Verse2 + Bridge, pR0PH - Chorus + Bridge, Cmaj в начале, Hi-Hat по 1/4.
v1.2 V: reggae, trumpet solo, positive. C: no style
2 90bpm. Отдельные DS (0:56), pV2CH - Verse1,Verse2 + Bridge, pR2CH - Chorus + Bridge, Ch. каждый такт, Hi-Hat по 1/4.
v2.2 V,C: Chill Wave
...
3 90bpm. Отдельные DS (0:56), pV3CHT - Verse1,Verse2 + Bridge, pR3CHT - Chorus + Bridge, Ch. каждый такт, мелодия, Hi-Hat по 1/4.
v3.2 V,C: reggae
4 90bpm. Отдельные DS (0:57), pV4CBDT - Verse1,Verse2 + Bridge, pR4CBDT - Chorus + Bridge, Ch. на слабые доли, Bass & DrLoop, Hi-Hat по 1/4.
v4.2 V: Latin jazz, Trumpet solo, Ironic, C: Latin jazz, Brass hits, Strings
...
5 102bpm. Один DS pVR5CHD - Verse1,Chorus (0:59) без Bridge, Ch. каждый такт, Hi-Hat по 1/4.
v5.1 Rock & roll, rhythm & blues, Distortion Guitar Solo
v5.2 Country band, Acoustic guitar, harmonica
v5.3 Funk, Brass hits, Distortion guitar solo
...
v5.4 Heavy Metal, Distortion Guitar, Lead Synthesizer
v5.5 Small Jazz band, Grand-piano, Acoustic bass, Saxophone, Drums
v5.6 Bass-driven hip-hop, Rap
v5.7 Big Band
v5.8 Baroque orchestra
...
7 102bpm. Один DS pVR7PHx - Verse1,Chorus (0:59) без Bridge, Cmaj в начале, голос Wet, Hi-Hat по 1/4.
v7.1 Baroque orchestra
8 102bpm. Один DS pVR8CHx - Verse1,Chorus (0:59) без Bridge, Ch. каждый такт, голос Wet, Hi-Hat по 1/4.

v8.1 Roots reggae
v8.2 Depressive Russian Post-punk
v8.3 Latin jazz, Bossa nova, Acostic guitar solo
v8.4 Chill wave
...
9 102bpm. Один DS pVR9Hx - Verse1,Chorus (0:59) без Bridge, без Ch., голос Wet, Hi-Hat по 1/4.

v9.1 No style
v9.2 1950s rock & roll, rhythm & blues, rockabilly
v9.3 Synth-pop, electronic, new wave
v9.4 Dixieland jazz
Краткие выводы.

1. При обычной гармонии, простом тексте, типовом темпе Suno в целом воспринимает и отрабатывает все основные параметры, внося в них изменения, видимо, согласно заданному Style и выбранной модели. В подавляющем большинстве генераций, аранжировка в музыкальном смысле делается правильно, примерно так, как это мог бы сделать человек.

2. Отдельного внимания требуют генерации, где тональность/гармония "задавалась" лишь самой мелодией (v9.n).

3. Интересным представляется v9.1, где стиль не задавался. Скорее всего, здесь Suno делает выбор исключительно из ритмической организации и содержания текста.

Дополнительные выводы в статье на Хабре ...

© 2009-2024 Alexey Ustinov