Создание шаблона для аудиозаписи

Обновлено 13 июля 2025

Поддерживается только на русском языке.

Создание шаблона — это возможность добавить в готовую аудиозапись определенные вставки с синтезированным голосом.

Например, в фразе: «Вы подтверждаете запись на [day][month]?» то, что указано словами — это предзаписанный диктором текст с конкретным голосом, а параметры [day] и [month] — это синтезируемый текст.

Шаблон создается вручную с явным указанием, какие слова являются переменными (т.е. какие именно значения необходимо синтезировать).

Добавление шаблона в базу шаблонов

Для каждого пользователя формируется свой список доступных шаблонов. Этот список называется базой шаблонов.

Для добавления шаблона в базу:

Подготовьте аудио в формате wav, 24 кГц, 1 канал, 16 бит, little-endian. Удобнее всего это делать с помощью утилиты sox: sox input.mp3 --channels 1 --rate 24000 out.wav.
Переименуйте файл так, чтобы было понятно, о какой записи идет речь — название аудио будет использоваться в дальнейшем. Например, appointment_confirm.wav.
Подготовьте один json-файл с описанием всех шаблонов. У json-файла должна быть определенная структура:
- в качестве template id укажите название аудио без формата WAV;
- название переменных придумайте самостоятельно и перечислите их в объекте substitutions. Рекомендуем давать понятные названия, т.к. они будут использоваться в дальнейшем;
- проверьте все скобки и запятые, чтобы файл был собран корректно.
```
[{"template id": "appointment_confirm_1",
"text": "Вы подтверждаете запись на первое января?",
"substitutions":
    {"day": "первое",
    "month": "января"}
}
],
[{"template id": "appointment_confirm_2",
"text": "Вы подтверждаете запись на второе января?",
"substitutions":
    {"day": "второе",
    "month": "января"}
}
], ...
```
Создайте папку и добавьте туда оригинальную аудиозапись и json-файл с мета-информацией. Архивируйте папку в zip и пришлите файл на электронную почту SaluteSpeech@sberbank.ru, указав свой ClientID.

После этого файл пройдет через сервис: он автоматически заменит переменные слова на то, что было указано в файле и сохранит интонацию из статичной части предложения.

Использование шаблона

После отправки файла дождитесь на почте подтверждения, что необходимые шаблоны и модель стали доступны. Далее отправьте ssml-запрос и проверьте работу шаблона:

<speak><template id="appointment_confirm_1" day="первое" month="января"/></speak>

При необходимости вы можете совместить использование шаблона и полноценного синтеза. Например:

<speak>Добрый день! <template id="appointment_confirm_1" day="первое" month="января"/> Спасибо, до свидания!</speak>

Примеры аудиозаписей

Описание	Звучание
Оригинальный файл
Измененный файл

Добавление шаблона в базу шаблонов﻿

Использование шаблона﻿

Примеры аудиозаписей﻿

Добавление шаблона в базу шаблонов

Использование шаблона

Примеры аудиозаписей