Синхронный синтез речи

Обновлено 23 июля 2025

Синхронный синтез речи — технология преобразования текста в голосовую речь (TTS) в режиме реального времени. В отличие от асинхронного (где обработка занимает время), синхронный TTS мгновенно возвращает аудиоответ на запрос.

Как использовать синхронный синтез речи

Для преобразования текста в речь отправьте POST-запрос к SaluteSpeech API по адресу: https://smartspeech.sber.ru/rest/v1/text:synthesize.

В запросе укажите:

токен авторизации для доступа к сервису;
текст для синтеза (максимум 4 000 символов, включая пробелы и разметку).

Параметры синтеза

Текст можно передавать как в обычном формате UTF-8, так и с использованием SSML-разметки, которая позволяет управлять интонацией, паузами и другими характеристиками речи. После успешной обработки сервис вернет бинарные данные синтезированного аудио в запрошенном формате.

Для тестирования и работы с API удобно использовать Postman. Подробнее — в разделе Синтез речи с Postman.

Как использовать синхронный синтез речи﻿

Параметры синтеза﻿

Как использовать синхронный синтез речи

Параметры синтеза