Разметка синтеза речи SSML

Обновлено 19 мая 2025

Использовать речевые технологии можно отдельно от инструментария Studio. Подробнее об этом в разделе SaluteSpeech.

SSML (Speech Synthesis Markup Language) — язык разметки синтеза речи. Позволяет разработчикам настраивать преобразование текста в речь и делает речь ассистента более естественной и выразительной.

SSML базируется на спецификации от W3C .

Также для синтезируемого текста внутри SSML-разметки поддерживаются различные символы. Подробнее в разделе Символы и междометия.

Если при использовании тегов SSML вы получили ошибку, проверьте корректность написания тегов в любом онлайн-валидаторе XML-файлов.

Доступные функции:

Добавление паузы в текст — тег break.
Замена произношения на более привычное — тег sub.
Добавление звуков и междометий — тег audio.
Добавление фонового звука — тег extra.background-audio.
Правильное произнесение аббревиатур, дат и числительных – тег say-as.
Изменение настроения и настройка шепота тег voice.
Управление тоном, интонацией, скоростью и громкостью – тег paint.
Полное произнесение года — тег extra.fulldate.
Выделение слова интонацией.
Ударения в словах.
Обработка букв е и ё.