ym88659208ym87991671
Описание распознавания речи с помощью сервиса SaluteSpeech | Документация для разработчиков

Распознавание речи

Обновлено 20 сентября 2023

Вы можете внедрить распознавание речи в свои приложения с помощью API сервиса SaluteSpeech.

При использовании SaluteSpeech максимальная нагрузка на сервис:

  • для юридических лиц — не более 10 параллельных потоков;
  • для физических лиц — не более 5 параллельных потоков.

Виды распознавания:

  • Синхронное (HTTP).
    Ответ выдается только после обработки всей аудиозаписи. Максимальный размер аудио — 2 Мб, максимальная длина — одна минута. Для многоканального аудио распознается только первый канал.

  • Потоковое (gRPC).
    Используется, если требуется распознавание речи в процессе ее записи: протоколы телефонии, запись аудио на мобильных устройствах и прочее. Возможно отображение промежуточных результатов и автоматическое определение конца фразы. Максимальный размер аудио — 1 Гб.

  • Потоковое двухканальное (gRPC).
    Используется, если требуется распознавание двухканальных аудио в процессе записи. Возможно отображение промежуточных результатов и автоматическое определение конца фразы. Максимальный размер аудио — 1 Гб.

  • Асинхронное (HTTP и gRPC).
    Подходит для распознавания многоканальных аудиозаписей. При работе стоит учитывать, что процесс асинхронного распознавания может быть дольше синхронного, поэтому этот тип подходит для случаев, когда длительность распознавания не важна. Максимальный размер аудио — 1 Гб.

ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.