Suno v5.5 Your Voice ч.1

Ваш голос с Suno v5.5 (ч.1)

Процедура

По этой ссылке можно посмотреть описание (PDF) на русском опции "Your Voice" в разделе Help на сайте Suno.

Тестирование ч.1

Как только стала доступна версия 5.5, начал тестировать опцию "Your Voice", опираясь на опыт с RVC и Suno v3.5. Собрал 7 DS (голосовых наборов) с разной манерой. Цель — проверить реакцию системы на разный исходный материал, стили и параметры генерации.

Первые результаты поместил в постах на Telegram и MAX. Здесь привожу более полный набор генераций, позволяющий оценить "поведение" Suno при тех или иных условиях.

Голосовые наборы

1. Pwr (Rower) — "с опорой".

2. Nrm (Normal) — обычный. Действительно "с придыхом" (Breathy) в спешке сделать не получилось — попробую позже.

3. Thr (Theater) — "театральный" — речь (Spoken Word).

4. Cry (Crying) — "плачь, стон".
5. Mix (Mixed) — сборка из 1,2,3,4. Поправил уровень и АЧХ. Разбил на фрагменты, поставил по возрастанию экспрессии. Хрип, смех не включал. Crying — минимум.

6. SpE (Speech Expressive) — речь, прочитал стих с выражением.

7. SpI (Speech Inexpressive) — речь, прочитал стих монотонно.

Генерации

Для каждого DS сделано 9 генераций (без стиля — NoStyle и со стилями, см. табл.). Гендер везде был выбран Male. Параметры (Weirdness, Style/ Audio influence) изменялись от 0,0,100 до 0,90,50. Т.е от максимального влияния DS до его ослабления и усиления действия Style.

Lyrics

Для части генераций использовал специальный текст — четыре языка (англ., русс., исп., франц.) и минимум смысла (см. ниже "4lng"). Это тоже для уменьшения влияния на генерацию.

Для другой части генераций использовал тексты более соответствующие Style: "Идеальный день", "Чип под кожей", "Бери и пой!", "Лицо луны", также En/Ru текст для Овна (см. промпты "Знаки зодиака").
Style PAR LYR Pwr Nrm Thr Cry Mix SpE SpI
1. DataSet -- --
2. NoStyle 0,0,100 4lng
3. Corp. 0,50,90 День
4. Jazz 0,50,90 4lng
5. Funk 0,50,90 Пой
6. EDM 0,50,90 Чип
7. Rock 0,50,90 Овен
8. Trap 0,50,90 Луна
9. Ballad 0,50,50 4lng
10. R'n'R 0,90,50 4lng
Примечания:
а) я не обучался вокалу;
б) DS без тьюнинга, записаны "так" специально, и для тестирования это плюс;
в) здесь DS укорочены, полные: 1—1,5 мин.

Краткие выводы *

! Потрясающая опция, позволяющая заметно оживить вокал в сравнении с дефолтным Suno. При этом:

1. Сборка DS требует определенных усилий и должна учитывать стиль/ манеру пения в планируемой песне.

2. При отсутствии "манер" (типов "подачи") в DS и невозможности трансформации исходного материала Suno "подставляет" сторонние/ дефолтные семплы, в итоге окраска может изменяться даже в пределах одного слога.
3. Исходный диапазон расширяется, исходная манера сохраняется, а порой и усиливается.

4. Тембр сохраняется не всегда, многое зависит от условий генерации (Style, Lyrics, параметры).

* более полный анализ сделаю позже, как выполню новые тесты.

Использованные стили

3. Corporate. Corporate anthem for a successful company, uplifting and professional mode, 110 BPM, warm piano, light strings, subtle synth pads, acoustic guitar solo inserts, airy production, positive and welcoming mood, Major key.

4. Jazz. A smooth jazz track with rich basslines, saxophone melodies and piano chords — luxurious, steady and deeply relaxing.

5. Funk. 80s traditional funk, 100 BPM, Major key, Saxophone, Dance, Positive.
6. EDM. A middle-energy modern EDM track with a sad, lost mood that builds to a powerful one. Set at 128 BPM in E minor, it features a driving four-on-the-floor rhythm with subtle swing on the hi-hats for added groove. The lead synths are bright and resonant, layered with lush pads for depth. Vocals are heavily processed with long reverb tails, moderate delay, and light distortion, creating a dreamy yet punchy presence. Crisp, punchy kicks and snappy snares form the backbone, complemented by shimmering arpeggios and soaring synth leads. The overall tone is clean, polished, and radio-ready, with a wide stereo image and dynamic compression to maintain energy throughout.
7. Rock. An energetic rock anthem with powerful drums and electric guitar riffs, fast tempo, conveying boldness and determination.

8. Trap. A cozy lo-fi trap piece feels like a quiet moment of reflection in a dimly lit room with city lights outside, Delivery is conversational and understated, treated with tape hiss, light delay, and vintage reverb, Tempo is 82 BPM, swing-influenced groove with shuffling hi-hats, Tonality is minor, Crackling vinyl samples, jazzy piano chords, sliding bass, and soft percussion build a nostalgic, homemade intimacy.
9. Ballad. Slow acoustic ballad, minor key, warm, atmosphere, 75 BPM, gentle percussion.

10. R'n'R. 1950s rock and roll, rhythm & blues, 12 bar blues, rockabilly.

"4lng"

[verse 1]
This is just a song of none,
Words are here for only fun.
We just need to do a test,
Better all without a rest.
Эта песня ни о чём,
И слова здесь ни при чём.
Надо просто сделать тест,
Лучше всё в один присест.
[chorus]
This is Suno five and five,
How to feel the process live.
Это сУно пять и пять,
Хочется процесс понять.
C'est le cinq et cinq Suno,
Le processus est nouveau.
Este Suno cinco cinco,
Quiero ver el laberinto.

[verse 2]
Esta voz no dice nada,
Sin palabra, sin mirada.
Solo hay que hacer el test,
Todo junto, sin estrés.
C'est un chant de rien du tout,
Les paroles sont floues partout.
Il faut juste faire un test,
Sans attendre tout le reste.
3 апреля 2026 г.
Style, DS
© 2009-2026 Alexey Ustinov