Синхронный синтез речи
Синхронный синтез речи — технология преобразования текста в голосовую речь (TTS) в режиме реального времени. В отличие от асинхронного (где обработка занимает время), синхронный TTS мгновенно возвращает аудиоответ на запрос.
Как использовать синхронный синтез речи
Для преобразования текста в речь отправьте POST-запрос к SaluteSpeech API по адресу: https://smartspeech.sber.ru/rest/v1/text:synthesize
.
В запросе укажите:
-
токен авторизации для доступа к сервису;
-
текст для синтеза (максимум 4 000 символов, включая пробелы и разметку).
Параметры синтеза
Текст можно передавать как в обычном формате UTF-8, так и с использованием SSML-разметки, которая позволяет управлять интонацией, паузами и другими характеристиками речи. После успешной обработки сервис вернет бинарные данные синтезированного аудио в запрошенном формате.
Для тестирования и работы с API удобно использовать Postman. Подробнее — в разделе Синтез речи с Postman.