Синтезировать речь
/text:synthesize
Возвращает бинарное представление синтезированного звука в запрошенном формате.
Запрос
Query Parameters
Возможные значения: [wav16
, pcm16
, opus
, pcm16
]
По умолчанию: wav16
Формат синтезируемого аудио.
Код голоса, первая часть означает диктора, вторая - частоту дискретизации аудио.
Модели с частотой 8000 Гц предназначены для использования в телефонии.
Вы можете выбрать голос из раздела Примеры голосов для синтеза или использовать уникальный брендированный голос с помощью сервиса YourVoice.
Пересоздать кэш. Если true, то сервис перегенерит запись и перезапишет по ней кэш даже если кэш был. По умолчанию false
Запрет использования кэша. Если true, то сервис не будет использовать существующих кэш. По умолчанию false
Header Parameters
Возможные значения: Value must match regular expression (([0-9a-fA-F-])36)
Уникальный ID запроса, который используется для поиска запроса в логах. Если ID не задан явно, то сервер сгенерирует его автоматически.
- application/text
- application/ssml
Body
- string
Possible values:
<= 4000 characters
Текст для синтеза в формате UTF-8.
Body
- string
Possible values:
<= 4000 characters
Текст для синтеза с SSML-разметкой.
Подробнее о разметке — в разделе Как улучшить синтез.
Возвращает бинарное представление синтезированного звука
- audio/x-wav
- audio/x-pcm;bit=16;rate=8000
- audio/x-pcm;bit=16;rate=24000
- audio/ogg; codecs=opus
- Схема
Schema
- string binary
- Схема
Schema
- string binary
- Схема
Schema
- string binary
- Схема
Schema
- string binary
Bad request format
Unauthorized
Internal Server Error