Продолжение тестирования опции "Your Voice" (см. ч.1). Учитывая опыт, собрал 4 новых DS, чтобы добиться большей схожести с реальным голосом. Обнаружил, что максимальная длина загружаемого трека — 4 мин.
Голосовые наборы *
8. Breathy — удалось получить DS "с придыхом", правда, диапазон узок, а низкие пришлось сильно резать.
9. RVC DS — свой набор для RVC (> 20 мин.) сократил до 4 мин., оставляя самые разные по характеру фрагменты (вокал и речь).
10. One Song — DS из вокала одной песни, где присутствует (как бы) Breathy, Norm, Power. Причём, трек с тьюнингом, главное — "прибрал" своё чрезмерное и неправильное вибрато.
11. Song Set — набор из фрагментов 8 песен с разной подачей, большинство с тьюнингом (без уменьшения вибрато) и НЕ включающих речитатив, "театр", смех и др. нетипичное для обычных песен.
Генерации
Для каждого DS сделал 5 генераций (с теми же параметрами, Styles и Lyrics) — почти все, что были в ч.1.
Для RVC DS и Song Set сделал дополнительные на разных текстах для тестирования команд в Lyrics. Также пару примеров применения Breathy.
Примечания: а) повторюсь, я не обучался вокалу; б) мне не стыдно за примеры, поступаю, как изобретатель лекарства, который испытывает его на себе; в) здесь DS укорочены до 30 сек, полные: ~4 мин.
Style
PAR
LYR
Breathy
RVC DS
One Song
Song Set
1. DataSet
--
--
2. NoStyle
0,0,100
4lng
3. Corp.
0,50,90
День
4. Funk
0,50,90
Пой
5. Trap
0,50,90
Луна
6. R'n'R
0,90,50
4lng
7. Comand
0,50,90
Diff
--
--
Влияние "голосовых" команд в Lyrics
Этот момент я протестировал не очень тщательно, но первые результаты для "своих голосов" есть. Набор "голосовых" команд достаточно большой, близок к набору инструкций музыкальной партитуры и, по идее, должен служить настройке исполнения с точностью до фразы и даже отдельного слова. В моих опытах команды, включенные в Lyrics, отрабатывались* не все и не всегда вовремя.
* это выглядит так, как будто опытный оркестр и исполнитель следуют замыслу, игнорируя жесты молодого дирижера.
Тесты сделал для RVC DS и Song Set. Для первого на тексте "4lng", второго — имитации музкомедии (см. ниже).
Точно работают [Spoken Word] и [Whispering], причём круглые скобки (), кажется, не работают. Понятно, что на своём голосе команды будут исполняться хуже, чем на дефолтных, т.к. вряд ли в своём присутствуют все компоненты (подачи). Кстати, в этом, очевидно, и причина подмены своего голоса дефолтным в части фразы и даже слова.
Не сразу понял, где может пригодиться Breathy, но вот — сказка для внука или медитация (реклама).
Краткие выводы **
Эти DS дают намного большее приближение к моему голосу. Song Set — очень похож, правда, мне бы хотелось, чтобы манера была более правильная (как это работало в v3.5).
1. Разумно использовать максимальное время — 4 мин., постараться включить максимально возможный диапазон по высоте, также все возможные подачи (Breathy, Norm, Power).
2. Нежелательно нарушать "стиль" DS, т.е. если он для лирики, то смех, выкрики будут неуместны. Если нужен речитатив, то он тоже должен быть лирическим.
3. DS для обычной песни лучше собирать из нескольких похожих вокалов (у меня это Song Set). Разные тональности, ритмика, темпы делают DS универсальнее - система не будет пытаться копировать материал, как это происходит с DS из одной песни.
4. "Сборная солянка", RVC DS — в целом рабочий вариант, но не для всех песен. В моём случае это что-то из комедии, театра, что вряд ли на практике востребовано.
5. Уже отмечал: много вольностей — опеваний и пр. Надо пробовать скомпенсировать это в Style. Пока не знаю, как в стиле ограничивать систему в вариациях в вокале.
6. Однако, уже ясно: даже с этим уровнем опции "Your Voice" намного легче создавать себя виртуального, отличающегося от дефолтного голоса.
7. Более глубокое тестирование стоило бы проводить на другом, более ярком голосовом материале. Такие знакомые у меня есть, но верификация материала и удалённость носителей осложняют дело.
** более полный анализ сделаю позже, как выполню новые тесты.
4lng (Song Set)
Промпт: A song (simple musical accompaniment) in middle-tempo; minimalist instruments set; neutral mood, calm reflection; with a variety of singing and speaking techniques
Lyrics
[Verse 1]
[soft] This is just a song of none,
[calm] Эта песня ни о чём,
[loud] Esta voz no dice nada,
[emotional] C'est un chant de rien du tout,
[whisper] Words are here for only fun.
[whisper] И слова здесь ни при чём.
[powerful] Sin palabra, sin mirada.
[powerful] Les paroles sont floues partout.
[Chorus]
[staccato] This is Suno five and five,
[staccato] How to feel the process live.
[legato] Это сУно пять и пять,
[legato] Хочется процесс понять.
[playful] C'est le cinq et cinq Suno,
[playful] Le processus est nouveau.
[dramatic] Este Suno cinco cinco,
[dramatic] Quiero ver el laberinto.
[Verse 2]
[breathy] We just need to do a test,
[breathy] Надо просто сделать тест,
[raspy] Solo hay que hacer el test,
[raspy] Il faut juste faire un test,
[Spoken Word]
Better all without a rest.
Лучше всё в один присест.
Todo junto, sin estrés.
Sans attendre tout le reste.
Музкомедия. RVC DS
Промпт: Light operetta, 19th century European style, cheerful piano accompaniment, light orchestral arrangement (strings and woodwinds), comedic timing, theatrical male vocal, vaudeville influence, moderate tempo (100 BPM), clear diction, slight reverb for stage feel
Lyrics
[Intro]
[piano intro, cheerful, legato]
[Scene 1 - Morning Routine]
[spoken word, slightly sleepy] Ещё пять минут... Нет, вставать пора...
[soft, yawning] Какой сегодня день? Ах да, опять дела...
[Verse 1 - The Worries of Everyday Life]
[light tenor, playful] В магазин нужно сходить, оплатить счета,
[staccato] Позвонить тёте Вере — она ждёт всегда!
[breathy, worried] А ещё мастер обещал починить шкаф...
[suddenly cheerful] Но главное — выпить кофе, это мой ритуал!
[Bridge - Sudden Realization]
[dramatic, loud] О нет! Я забыл про встречу в десять!
[fast, panicked] Где мой галстук? Где блокнот? Где портфель, скажите?
[slow, calming down] Подожди, успокойся... Всё в порядке, друг.
[soft, reassuring] Просто день начинается — это не вдруг.
[Chorus - The Philosophy of Life]
[melodic, legato, optimistic] Жизнь — это череда маленьких дел,
[harmonized slightly] И радостей простых, что душу согрели.
[warm, emotional] Не стоит волноваться из-за пустяков,
[bright, cheerful] Ведь счастье — в чашке кофе, в паре добрых слов!
[Scene 2 - Coffee Break]
[spoken word, relaxed] Так, кофе готов... Вдохну аромат...
[content sigh] Вот теперь можно и день начинать подряд.
[Verse 2 - Planning the Day]
[rhythmic, confident] Сначала магазин, потом почта, возможно, парк,
[whisper] Если успею — загляну в тот новый ларёк.
[playful] А вечером — книга, плед и тёплый чай,
[softly] И день завершится, как добрый, светлый край.
[Final Chorus - Acceptance]
[fuller sound, more instruments join] Жизнь — это череда маленьких дел,
[stronger, powerful] И радостей простых, что душу согрели.
[heartfelt] Не стоит волноваться из-за пустяков,
[triumphant, crescendo] Ведь счастье — здесь и сейчас, в этих простых шагах!
[Outro]
[fade out with piano, diminuendo]
[spoken, wistful] Да, пожалуй, так... Пожалуй, так...