Создание шаблона для аудиозаписи
Создание шаблона — это возможность добавить в готовую аудиозапись определенные вставки с синтезированным голосом.
Например, в фразе: «Вы подтверждаете запись на [day][month]
?» то, что указано словами — это предзаписанный диктором текст с конкретным голосом, а параметры [day]
и [month]
— это синтезируемый текст.
Шаблон создается вручную с явным указанием, какие слова являются переменными (т.е. какие именно значения необходимо синтезировать).
Добавление шаблона в базу шаблонов
Для каждого пользователя формируется свой список доступных шаблонов. Этот список называется базой шаблонов.
Для добавления шаблона в базу:
-
Подготовьте аудио в формате wav, 24 кГц, 1 канал, 16 бит, little-endian. Удобнее всего это делать с помощью утилиты sox:
sox input.mp3 --channels 1 --rate 24000 out.wav
. -
Переименуйте файл так, чтобы было понятно, о какой записи идет речь — название аудио будет использоваться в дальнейшем. Например,
appointment_confirm.wav
. -
Подготовьте один json-файл с описанием всех шаблонов. У json-файла должна быть определенная структура:
- в качестве
template id
укажите название аудио без формата WAV; - название переменных придумайте самостоятельно и перечислите их в объекте
substitutions
. Рекомендуем давать понятные названия, т.к. они будут использоваться в дальнейшем; - проверьте все скобки и запятые, чтобы файл был собран корректно.
[{"template id": "appointment_confirm_1",
"text": "Вы подтверждаете запись на первое января?",
"substitutions":
{"day": "первое",
"month": "января"}
}
],
[{"template id": "appointment_confirm_2",
"text": "Вы подтверждаете запись на второе января?",
"substitutions":
{"day": "второе",
"month": "января"}
}
], ... - в качестве