Разметка синтеза речи SSML
Обновлено 27 марта 2024
Использовать речевые технологии можно отдельно от инструментария Studio. Подробнее об этом в разделе SaluteSpeech.
SSML (Speech Synthesis Markup Language) — язык разметки синтеза речи. Позволяет разработчикам настраивать преобразование текста в речь и делает речь ассистента более естественной и выразительной.
SSML базируется на спецификации от W3C.
Также для синтезируемого текста внутри SSML-разметки поддерживаются различные символы. Подробнее в разделе Символы и междометия.
Если при использовании тегов SSML вы получили ошибку, проверьте корректность написания тегов в любом онлайн-валидаторе XML-файлов.
Доступные функции:
- Добавление паузы в текст — тег break.
- Замена произношения на более привычное — тег sub.
- Добавление звуков и междометий — тег audio.
- Добавление фонового звука — тег extra.background-audio.
- Правильное произнесение аббревиатур, дат и числительных – тег say-as.
- Изменение настроения и настройка шепота тег voice.
- Управление тоном, интонацией, скоростью и громкостью – тег paint.
- Полное произнесение года — тег extra.fulldate.
- Выделение слова интонацией.
- Ударения в словах.
- Обработка букв е и е.