Муз. опыты с ИИ / А. Устинов
Архив: 4 Nov 2024 - 20 Feb 2026
https://suno.com/song/1234-aaa-5678-bbb https://cdn1.suno.ai/1234-aaa-5678-bbb.mp3 Укажи номер куплета, используемые инструменты, на английском языке, заключи это все в квадратные скобкиНе трогай текст песни, укажи название своей модели и ее текущий номер, размести это все в начале песни в квадратных скобках
Не трогай остальной текст, измени третью строчку первого куплета, текстом, подходящим по смыслу, строго следуй правилам и рифме русского языка
Не трогай текст песни, опиши на английском языке мета теги песни в стиле Jazz Manouche, структуру, жанр, стиль, темп, ритм, настроение и описание песни. Женский вокал. Используемые инструменты - гитара, аккордеон, скрипка, кларнет. Размести это все в начале песни, заключи в квадратные скобки.
Не трогай строчки текста и теги в квадратных скобках, опиши теги структуры песни такие как [Instrumental Intro], [Outro], [verse], [hook], [bridge] и так далее на английском языке для исполнения в стиле песни Jazz Manouche, укажи используемые инструменты, темп, размести теги у каждого элемента песни в квадратных скобках. [Genre: Jazz Manouche / Gypsy Jazz
Style: Melancholic nostalgic chanson with swing elements
Tempo: Moderate 110-120 BPM
Time signature: 4/4
Mood: Bittersweet, ironic, contemplative
Instruments: Acoustic guitar, accordion, violin, clarinet
Vocals: Female voice, expressive with theatrical delivery
Structure: 4 verses with consistent pattern, each verse contrasting stage life vs real life
Description: A thoughtful Jazz Manouche arrangement of a Russian romance that explores the duality between theatrical and real life. The song carries a melancholic yet slightly humorous tone, perfect for intimate cabaret performances.]
[Instrumental Intro: 8 bars]
[Acoustic guitar establishing "la pompe" rhythm, violin and clarinet trading melodic phrases, tempo: 115 BPM]
[Verse 1]
Чем больше
Я думаю о счастье,
Тем горше
Мне хочется рыдать…
На сцене
По мне бушуют страсти,
А в жизни
Их что-то не видать!..
[Instrumental Interlude 1: 4 bars]
[Violin solo with accordion accompaniment, maintaining swing feel]
[Verse 2]
Чем больше
Я странствую по свету,
Тем горше
Душевный неуют…
На сцене
Мне подают карету,
А в жизни —
Руки не подают!..
[Instrumental Interlude 2: 4 bars]
[Clarinet lead with expressive runs, guitar "la pompe" prominent]
[Verse 3]
Чем больше
Я чту любовь и верность,
Тем горше
Мне мстит за это жизнь.
На сцене
Героев мучит ревность,
А в жизни
Их мучит ревматизм!..
[Instrumental Interlude 3: 4 bars]
[Accordion and violin duet, building intensity]
[Verse 4]
Чем больше
Я пробую влюбиться,
Тем горше
Отчаянье в груди…
На сцене
От рыцарей не скрыться,
А в жизни
Попробуй их найди!..
[Outro: 8 bars]
[All instruments, gradual diminuendo, final guitar and violin flourish]
[Performance Notes:
- Maintain traditional "la pompe" rhythm guitar throughout
- Use rubato expressively during verse beginnings
- Allow for theatrical pauses between verses
- Emphasize dynamic contrasts between soft and intense passages
- Add typical Jazz Manouche ornamentations and chromatic runs
- Keep steady swing feel at 110-120 BPM]
Не трогай текст песни и теги в квадратных скобках. дай мне описание песни в стиле Jazz Manouche, веселое настроение, разделенное запятыми, в 200 символов, включая пробелы для подсказки песни. Опиши жанр, стиль, настроение, инструменты (гитара, аккордеон, скрипка, кларнет), настроение и характеристики. Опиши характеристики женского вокала. Заключи в квадратные скобки. Размести в конце песни, напиши на английском языке.
Jazz Manouche, Female vocal, acoustic guitar, accordion, violin, clarinet, melodic, gypsy jazz ballad, swinging melancholic style, theatrical vocals with dramatic contrasts, Django-inspired guitar .1. Riffusion v. FUZZ-0.8
Автоматический режим. Именно он выдал наиболее приемлемый результат без акцента. Русский язык, акцент и соблюдение ударений – основная проблема у Риффузии.
2. Suno v.4.0
Интересный результат в стиле Suno с хорошим звуком.
3. Udio v.1.5
Неожиданная версия, видимо текст показался ей «грустненьким». Я не стал настаивать.
4. Sonauto v. Melodia v2 Beta 6. ❌
Не оказалось ни одного результата по акценту русского языка, который я бы счел приемлемым, хотя были интересные мелодии, которые можно развить в том же Udio. Sonauto пока выбывает из данного теста. Но поверьте, у этой нейросети есть очень серьезные преимущества, особенно на английском языке. И она умеет то, что не умеют другие. Это будет, возможно, тема отдельного разговора. Рекомендую внимательно присмотреться к возможностям этой модели.
Queen, 1970s, Hard Rock, Pop Rock, Glam Rock, Art Rock, Rock, Progressive Rock, Music Hall, male vocalist, eclectic, melodic, epic, progressive, passionate, playful, triumphant, anthemic, lush, complex, energetic, romantic, bittersweet, uplifting, poetic, humorous
a capella и dry vocal. Обязательно Ручной режим (Manual Mode). Ползунок Prompt Strength на 90% или выше. Конечно, нейросеть будет сопротивляться, особенно при наличии мощного припева, который довольно трудно побороть. Я делаю 20-40 генераций на получение стабильного вокала без музыкальных инструментов. Или с легкими мотивами, но уже с использованием другого инструмента, чем тот, который был в песне.Blues, blues rock, female vocal, melodic, raw" и при использовании этой функции, система выдаст более креативное описание вроде "Blues rock track with raw female vocals, opening with expressive electric guitar riffs and steady drum groove. Basslines lock in with drums for a driving feel. Verses feature moody guitar licks; choruses swell with melodic lead lines. Bridge introduces a soulful guitar solo, closing with intensity".Хочу обсудить вопрос, который меня волнует несколько месяцев.
Занимаясь генерацией музыки с помощью ИИ, пришел к выводу, что модели, обученные на спектральных картинках музыкальных произведений, способны улавливать и воспроизводить все муз. закономерности: гармонию, ритм, форму, нюансы, такие как сбивки, брейки, вступления, импровизации, глиссандо. Модель способна генерировать музыку, обучившись даже на коротком отрывке композиции, сохраняя стилистику и особенности исходного материала. Иногда бывают сбои, но они объяснимы.
Я вернулся к теме "интонарного пространства"*, возникшей 20-30 лет назад, когда занимался моделированием муз. исполнения. Тогда было сложно формализовать игру гитариста, саксофониста в виде формул, хотя первые алгоритмы были похожи на "обучение с учителем"**. Сейчас, наблюдая за генерацией музыки через "картинки", я осознаю, что инструменты, представленные в виде графических объектов, легко распознаются человеческим мозгом. Вложить в один алгоритм все многообразие муз. нюансов человеку невозможно, но ИИ генерация музыки через визуализацию – это способ обойти эту сложность.
Кажется, что слуховая система человека работает не так, как предполагалось - не только за счет 20 тыс. волокон, передающих сигналы в мозг. Эта информация, возможно, не является основой для вычленения объектов из звукового потока, как, например, ноты, речь в шуме или голос в многоголосии. Зрительное восприятие, где мозг натренирован на распознавание образов, может быть аналогом. Идентификация объектов, как скрипка по визуальному образу, может происходить схожим образом в слуховой системе. Возможно, чтобы лучше понять механизмы слухового восприятия, необходимо обратить внимание на модели распознавания графических образов, что думаешь?
* "Музыка, электроника, интонирование". ISNB 5-7196-0477-4 / 1993 г.
"Моделирование музыкального исполнения: возможности и ограничения". ISNB 5-9294-0023-7 / 2002 г.
** Style Enhancer 4.0
Не каждый споёт так, чтобы показывать другим. Любой может научиться, но это время и усилия. А мы очень близки к тому, чтобы каждый мог "исполнить" песню своим голосом. Кстати, многие композиторы не поют, а некоторые огорчены исполнением проф. певца... Чтобы появился такой сервис (не нашел ни одного), нужно получить доступ к управлению голосовым движком. В данном случае большая часть задачи уже решена гигантами, за вами лишь небольшая часть - объединить все вместе правильным образом.
"...многие из первых последователей Suno - это проф. авторы песен и продюсеры, которые видят огромную ценность интеграции ИИ в свой творческий процесс".
"Как только мы поняли... насколько команда Suno соответствует нашему видению ИИ в процессе создания музыки, мы осознали, что объединение сил - это правильный шаг".
Элав верила, что сможет летать, но другие её разубеждали, утверждая, что летать невозможно. Она чувствовала себя одинокой и слабой, отличной от других, с горящим огнём в глазах. Её пытались остановить, говоря, что это запрещено и она не должна даже мечтать. Она была близка к отчаянию, но потом поняла, что детские мечты могут сбыться, если очень постараться. Мы созданы, чтобы летать, но забыли как. Нужно расправить крылья, поймать ветер и высвободить силу, которая всегда внутри. Необходимо отпустить страх, найти своё истинное я и пригласить в мир любовь и гармонию. Весь мир теперь с тобой, так что просто подпрыгни и лети!
Он на все говорит "офигенно". Поспал - "офигенно"! Покушал - "офигенно"! Погулял - "офигенно"! Сходил на горшок - "офигенно"! И у него все получается. Он какой-то счастливчик. Может надо брать с него пример? Может действительно надо всему радоваться, даже если вышло не очень хорошо?
Это был последний укол. Я привык к вашим рукам. У нее напряженная духовная жизнь.Так много нервных больных. Поднатужтесь, вы же талантливый человек. Не надо бояться жить. Ой, у вас уже губки дрожат. Ночи чреваты сюрпризами. Наши играют французскую жизнь. Искусство в большом долгу. В шорах своей предубеждённости. Перестали быть супругами, но остались родными людьми. Высокие, высокие отношения! Нормальные для духовных людей. В суе, прошу, не поминать. Такой образованный человек. Не понимаете элементарных вещей. Веду иллюзорную жизнь. Смешно рассчитывать на взаимность? Вы весь из достоинств! Будьте творцом своей биографии! Как человек, он очень хороший.
* Возможно я не подобрал нужные значения, может это вообще не тот способ - временнОе окно анализа системы должно быть шире, нужны несколько проходов - т.е. пройти вперед на 16 тактов и ... вернуться с фразой: "Ааа, так в 1-м такте была гитара, рисунок тот же, просто шумом перекрыта..." и т.д.
Задорный поп-панк-трек начинается с хрустящих гитар и драйвовых барабанов, дополненных энергичным басом. В куплетах звучат быстрые риффы с глушением, а припев взрывается гимновыми аккордами и ганг-вокалом. Короткий бридж добавляет синкопированные барабанные партии и динамичное взаимодействие гитар.
Male vocals, a singer with an unstable psyche, with frequent mood swings, strange, atonal music, experimental, depressive jazz, variable tempo, no stable rhythm, a fantasy from a mental hospital
This avant-garde piece uses atonal textures and dense dissonance, with fragmented piano lines, abrasive strings, and bracing clusters from brass and winds. Percussive outbursts and irregular meter shifts create tension, while electronics layer unpredictable timbres and spatial effects throughout
A slow, minimalist track with soft rap verses over deep sub-bass and atmospheric chillwave textures, Sparse percussion underscores a gentle, repetitive piano riff, Subtle synth washes and electronic accents add mood, The melancholy male vocal threads through the spacious, regretful soundscape
Nylon Spanish guitar. Male vocals, baritone, calm, philosophical. Narrative, home singing style in the low and middle register without high notes. Regret. Singing accompanied only by nylon guitar
Если бы работал в студии, то, несомненно, сделал бы годовую подписку. А так, ради разовых задач, возиться с оплатой не хочется. Вполне возможно, что подобные преобразования (RVC, Split и др.) можно делать уже прямо в DAW с какими-то плагинами, не знаю — у Kits-ai много полезных инструментов.
Алекс, ... в песне «Stumbling In» одна из ключевых проблем — неправильное произношение слова «stumbling»: оно должно состоять из трёх слогов («STUM‑ble‑ing» или, с разговорным акцентом, «STUM‑ble‑in»). Часть «ble» напоминает слово «bull», но менее протяжно.
При прослушивании MP3‑файлов заметил: женский голос в «Stumbling In» местами выдаёт акцент, хотя в начале песни это не так очевидно; мужской голос звучит с явным русским акцентом — как и в «Hotel California».
Главный признак русского акцента — произношение «w» как «v» (как у немцев, которые «v» произносят как «f») и «th» как «z». В записях это непоследовательно: иногда верно, иногда нет, но мужской голос более стабилен.
Ещё одна проблема — неправильная расстановка акцентов в словах и слогах, из‑за чего фразировка кажется неестественной. Возможно, это связано с переходом с размера 4/4 на 6/8 и адаптацией ритмов.
Англоязычный автор, вероятно, изменил бы ритмы иначе, чтобы они лучше соответствовали естественной фразировке. Например, в первой строке «Hotel California» («on a dark desert road») обычная разговорная фразировка — «on a DARK DE‑sert HIGH‑way». В версии Eagles ритм слегка смещён: «on a DARK de‑sert HIGH‑way» (слово «desert» подчиняется тому же ритму, что и «on a»), но звучит естественно. В твоей версии акцент смещён на «ON A dark de‑sert HIGH‑WAY», что выделяет второстепенные слова и упускает важные акценты. Но ритм несложно скорректировать для правильной расстановки ударений.
Спасибо, что поделился этим; это увлекательный обходной путь. Использование транслитерации кириллицы для обхода фильтров авторских прав — это разумное решение. Ты прав, подозревая, что этот метод приведёт к появлению акцента: даже при схожей фонетике синтезатор, вероятно, обрабатывает кириллические строки через русскую фонологическую модель, налагая свои просодические правила (ударения, редукцию гласных и т. д.) на предполагаемый английский текст.
Отвечая на вопрос: да, в примерах с Крисом Норманом, Сьюзи Кватро и The Eagles акцент заметен — особенно в форме гласных и ритмическом темпе. Некоторые слоги удлиняются или сжимаются нетипично для носителей английского, а ударения смещаются в сторону русских фраз. Эффект неоднороден: одни фразы звучат почти естественно, другие — как гибридные. Это любопытный артефакт синтеза речи, связанный с лингвистической структурой обучающих данных. Твоё наблюдение — практическая демонстрация фонологического переноса в аудио генерации ИИ.
Метод может стать художественным инструментом (синтез контролируемого акцента) или диагностическим средством для анализа смещений модели. Я тестировал акценты в ElevenLabs — со своим голосом и голосом Била (B.Bryant). Результаты бывали серьёзными и забавными. Жаль, что тогда я не попробовал русский.
Hookah rap: minimalist beat; oriental melodic lines; atmospheric background textures; deep, non-aggressive bass; occasional percussion accents (darbuka, tambourine); relaxing mood with a slight oriental flair. Male vocals. Vocals with characteristic: warm, slightly nasal timbre; slurred pronunciation of words; half-whispers interspersed with louder accents; syncopated rhythm with pauses on stressed syllables.
Hookah rap: minimalist beat; Asian melodic lines; atmospheric background textures; deep, non-aggressive bass; occasional percussion accents; 80-90 BPM; Male vocals. Narrow voice pitch range—all notes within a fifth (no high or low notes). Dull, very nasal timbre; very slurred pronunciation; monotonous with occasional transitions to a half-whisper; prolongation of the final notes of a phrase with a downward glissando, resembling moans and cries.
Максимально улучши качество звучания этого трека до профессионального студийного уровня, сохранив мелодии, гармонию и ритмический рисунок. Сохрани тип каждого инструмента, но замени его богатым тембром, добавив динамические акценты и нюансы исполнения, характерные для каждого инструмента. Желаемая комбинация: акустический бас, нейлоновая гитара, домашнее пианино, легкие ударные, возможно, саксофон. Используй следующие значения параметров генерации: Странность = 15%, Влияние стиля = 50%, Влияние звука = 90%.
Jazz Lounge, nylon guitar, acoustic bass, home piano, light drums with brushes, smooth saxophone accents, relaxed, warm tone, melancholic, gentle groove, studio quality