ym88659208ym87991671
Создание шаблона для аудиозаписи | Документация для разработчиков

Создание шаблона для аудиозаписи

Обновлено 30 сентября 2024

Создание шаблона это возможность добавить в готовую аудиозапись определенные вставки с синтезированным голосом.

Например, в фразе: «Вы подтверждаете запись на [day][month]?» то, что указано словами это предзаписанный диктором текст с конкретным голосом, а параметры [day] и [month] это синтезируемый текст.

Шаблон создается вручную с явным указанием, какие слова являются переменными (т.е. какие именно значения необходимо синтезировать).

Добавление шаблона в базу шаблонов

Для каждого пользователя формируется свой список доступных шаблонов. Этот список называется базой шаблонов.

Для добавления шаблона в базу:

  1. Подготовьте аудио в формате wav, 24 кГц, 1 канал, 16 бит, little-endian. Удобнее всего это делать с помощью утилиты sox: sox input.mp3 --channels 1 --rate 24000 out.wav.

  2. Переименуйте файл так, чтобы было понятно, о какой записи идет речь название аудио будет использоваться в дальнейшем. Например, appointment_confirm.wav.

  3. Подготовьте один json-файл с описанием всех шаблонов. У json-файла должна быть определенная структура:

    • в качестве template_id укажите название аудио без формата WAV;
    • название переменных придумайте самостоятельно и перечислите их в объекте substitutions. Рекомендуем давать понятные названия, т.к. они будут использоваться в дальнейшем;
    • проверьте все скобки и запятые, чтобы файл был собран корректно.
    [{"template_id": "appointment_confirm_1",
    "text": "Вы подтверждаете запись на первое января?",
    "substitutions":
    {"day": "первое",
    "month": "января"}
    }
    ],
    [{"template_id": "appointment_confirm_2",
    "text": "Вы подтверждаете запись на второе января?",
    "substitutions":
    {"day": "второе",
    "month": "января"}
    }
    ], ...
  4. Создайте папку и добавьте туда оригинальную аудиозапись и json-файл с мета-информацией. Архивируйте папку в zip и пришлите файл на электронную почту SaluteSpeech@sberbank.ru

После этого файл пройдет через сервис: он автоматически заменит переменные слова на то, что было указано в файле и сохранит интонацию из статичной части предложения.

Использование шаблона

После отправки файла дождитесь на почте подтверждения, что необходимые шаблоны и модель стали доступны. Далее отправьте ssml-запрос и проверьте работу шаблона:

<speak><template_id="appointment_confirm_1" day="первое" month="января"/></speak>

При необходимости вы можете совместить использование шаблона и полноценного синтеза. Например:

<speak>Добрый день! <template_id="appointment_confirm_1" day="первое" month="января"/> Спасибо, до свидания!</speak>
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.