В своей статье "Suno prompt (стиль) = рыбалка. Альтернатива?"
на Хабре (8 авг. 2024), я рассматривал режим Audio Input (загрузку "исходника"), как способ "непосредственного" задания стиля.
Параллельно провел несколько экспериментов с целью выяснить насколько точно Suno воспринимает (т.е. "отрабатывает"),
темп, тип ритмики, тональность, гармонию, мелодии.
Итоги (Autotune и, по сути, автоаккомпанемент), на мой взгляд, интересные, даже многообещающие.
Так родилась идея протестировать Suno в качестве аранжировщика. Пояснение задач, используемые подходы и
общие соображения я изложил в статье на Хабре ...
Здесь же в разделах привожу результаты этих тестов и краткие выводы:
Тест #1 / от спетой мелодии, текста... ("По-Гру-Гла-Но ..."). Тест #2 / от спетой мелодии, текста... ("Красота в глазах ...") Тест #3 / от реальной песни и текста... Тест #5 / инструментальные вставки от исходника...
В этом разделе я сделал несколько тестов, чтобы ответить на вопрос, можно ли в Suno сделать аранжировку песни.
Под аранжировкой ("минусовкой", backing track) обычно понимается инструментальный трек под который можно спеть песню.
"На входе" мелодия (+, иногда гармония), примерный стиль / темп, форма*.
Собственно мелодия нам не интересна - главное гармония, темп и стиль.
Я выбрал простую гармонию: Am,Am,G,Am, Am,Am,G,E7, в самой употребимой тональности (A минор), а также средний темп - 102bpm.
Перепробовал разные DS (Dataset, "исходники") - везде присутствовал Hi-Hat по 1/4, + аккорды (фортепиано, Sin Synth и пр.).
Также экспериментировал с полями Style и Lyrics.
* Относительно формы (т.е. структуры песни - Вступление, Куплет, Припев и т.д.). Эту часть я решил "оставить за кадром"
- если получится сгенерировать Куплет, Припев в нужном стиле, то Вступление, Проигрыш, Окончание можно сделать в режиме Extended и(или) "нарезать"
нужное в DAW.
Исходник 102bgmTst1
...
18 тактов. Am,Am,G,Am, Am,Am,G,E7. Piano (chords + Bass), Hi-Hat по 1/4.
В генерациях (первые 60 сек.) указаны темп и присутствующие аккорды (определено автоматически).
Lyrics:
Pop ballad, backing track, no any solo, sololess track
Am,G,E,A / 102
Am,G,E,D,Eaug / 102
Funk, backing track, no any solo, sololess track
Am,G,E / 102
Am,G,Em,A,E,D / 102
EDM, backing track, bass, drums, synthesizer, no any solo, sololess track
Am,G,E,A / 102
Am,G,Em,D,E,F / 102
Hard Rock, backing track, bass, drums, no any solo, sololess track
Am,E,A,G,D,Gm / 102
Am,C,A,E,D,G / 102
Bossa Nova, backing track, bass, drums, no any solo, sololess track
Am,G,E / 102
Am,G,E / 102
Краткие выводы.
1. Темп и тональность соблюдаются во всех генерациях, гармония - не везде, но намного лучше, чем с исходником 102bgmTst1.
2. Сольные / мелодические партии немного слабее - видимо, команды [backing track, no any solo, sololess track]
в некоторой степени отрабатываются.
3. Очевидный минус - заметное звучание исходника.
4. Отрабатывается ли команда [16 bars] в Lyrics непонятно.
Другие исходники (3,4,5)
...
3102bgmTst3 (16 тактов) - такой же, как 102bgmTst2, но Sin Synth и Hi-Hat ослаблены на 12dB
с целью снизить их уровень в генерациях. Style и Lyrics - такие же, как с 102bgmTst2.
Вывод: Звучание в генерациях менее заметно, но и гармония отрабатывается хуже.
4102bgmTst4 (16 тактов) - такой же, как 102bgmTst2, но Sin Synth играет по 1/2 и на октаву выше
с целью сделать менее заметным в генерациях. Style и Lyrics - такие же, как с 102bgmTst2.
Вывод: Гармония отрабатывается как и с 102bgmTst2, но аккорды более заметны в генерации.
5102bgmTst5 (8 тактов) - один аккорд Sin Synth Am вначале, а секвенция прописана в Lyrics в 2-х вариантах.
Style - как с 102bgmTst2.