ym88659208ym87991671
Создать задачу на распознавание | Документация для разработчиков

Создать задачу на распознавание

Обновлено 17 декабря 2024
Скачать спецификацию
POST
/speech:async_recognize

Возвращает идентификатор созданной задачи на распознавание. В запросе нужно передать идентификатор загруженного файла, а также параметры распознавания.

Подробнее — в разделе Асинхронное распознавание речи.

Запрос

Header Parameters

    X-Request-ID
    uuid

    Возможные значения: Value must match regular expression (([0-9a-fA-F-])36)

    Уникальный ID запроса, который используется для поиска запроса в логах. Если ID не задан явно, то сервер сгенерирует его автоматически.

Body

    options objectrequired
    model
    string

    Возможные значения: [general, media, ivr, callcenter]

    Название модели для распознавания речи

    audio_encoding
    string
    required

    Возможные значения: [PCM_S16LE, OPUS, MP3, FLAC, ALAW, MULAW]

    Аудио-кодек

    sample_rate
    integer

    Частота дискретизации. Зависит от значения audio_encodingNormalizationOptions.enable

    Подробнее о частоте дискретизации — в разделе Доступные форматы аудио.

    language
    string

    Возможные значения: [ru-RU, en-US, kk-KZ]

    По умолчанию: ru-RU

    Язык для распознавания речи.

    Доступные языки:

    • ru-RU — русский;
    • en-US — английский;
    • kk-KZ — казахский. Доступно по отдельной заявке, напишите на почту SaluteSpeech@sberbank.ru.
    enable_profanity_filter
    boolean

    По умолчанию: false

    Фильтр обсценной лексики.

    hypotheses_count
    integer

    Возможные значения: >= 0 и <= 10

    По умолчанию: 1

    Количество сообщаемых альтернативных гипотез распознанной речи.

    no_speech_timeout
    duration

    Возможные значения: >= 2 и <= 20

    По умолчанию: 7

    Интервал ожидания речи пользователя.

    max_speech_timeout
    duration

    Возможные значения: >= 0.5 и <= 20

    По умолчанию: 20

    Определение максимальной длины высказывания до форсированного EOU. По умолчанию стоит 20 секунд.

    hints object

    Подсказки

    words
    string[]

    Список слов или фраз, распознавание которых мы хотим усилить. Здесь можно перечислить слова, которые с высокой вероятностью будет произносить пользователь

    enable_letters
    boolean

    По умолчанию: false

    Модель коротких фраз, улучшающая распознавание отдельных букв и коротких слов.

    eou_timeout
    duration

    Возможные значения: >= 0.5 и <= 5

    По умолчанию: 1

    Настройка распознавания конца фразы (End of Utterance - eou). Такое распознавание будет ожидаться после конца фразы столько секунд, сколько установлено в этом параметре. По умолчанию распознавание конца фразы срабатывает после 1 секунды

    channels_count
    integer

    Возможные значения: >= 1 и <= 10

    По умолчанию: 1

    Количество каналов в многоканальном аудио. Подробнее об ограничениях — в разделе Доступные форматы аудио.

    speaker_separation_options object

    Параметры разделения спикеров для фрагментов одновременной речи.

    enable
    boolean

    По умолчанию: false

    Включение функции разделения спикеров.

    enable_only_main_speaker
    boolean

    По умолчанию: false

    Возвращение только главного спикера. Главный находится по max(main_speaker_confidence).

    count
    integer

    Возможные значения: >= 1 и <= 10

    Максимальное число спикеров.

    insight_models
    string[]

    Оценка удовлетворенности клиента по аудио с использованием моделей Insights.

    Работает только для двухканальных аудио.

    Возможные значения:

    • csi;
    • call_features;
    • csi, call_features.

    Подробнее — в разделе Insights модели.

    request_file_id
    uuid
    required

    Возможные значения: Value must match regular expression (([0-9a-fA-F-])36)

    Идентификатор загруженного файла.

Ответы

Возвращает идентификатор созданной задачи на распознавание.

Schema
    status
    integer
    required

    HTTP-код ответа.

    result objectrequired

    Результат создания задачи

    id
    string

    Идентификатор задачи

    created_at
    date-time

    Дата создания задачи

    updated_at
    date-time

    Дата обновления статуса задачи

    status
    string

    Возможные значения: [NEW, RUNNING, CANCELED, DONE, ERROR]

    Статус задачи

Loading...
Loading...
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.