SymFormerX
В составе SymFormerX — каскад моделей разных типов: большие языковые модели (LLM), диффузионные модели (Diffusion) и вариационные автоэнкодеры (VAE). Такая архитектура позволяет пользователю сочинять тексты песен и генерировать на их основе композиции в разных жанрах, получая результат в виде готового трека (mp3‑файла) менее чем за минуту
Анализирует музыкальный промпт и текст песни
Определяет жанр, темп, структуру и другие характеристики будущего музыкального трека
Методом обратной диффузии создаёт из «белого шума» музыкальный трек. В итоге получается уникальное музыкальное произведение
Треки распространяются по публичной открытой лицензии ПАО СберБанк: их можно копировать и распространять на любом носителе, в любом формате и в любых целях, включая коммерческие. Например, использовать в качестве фоновой музыки в своих приложениях для ассистентов Салют
