ym88659208ym87991671
Описание распознавания речи с помощью сервиса SaluteSpeech | Документация для разработчиков

Распознавание речи

Обновлено 10 декабря 2024

Вы можете внедрить распознавание речи в свои приложения с помощью API сервиса SaluteSpeech.

При использовании SaluteSpeech максимальная нагрузка на сервис:

  • для юридических лиц — не более 20 параллельных потоков;
  • для физических лиц — не более 5 параллельных потоков.

Виды распознавания:

  • Синхронное (HTTP).
    Ответ выдается только после обработки всей аудиозаписи. Максимальный размер аудио — 2 Мб, максимальная длина — одна минута. Для многоканального аудио распознается только первый канал.

  • Потоковое (gRPC).
    Используется, если требуется распознавание речи в процессе ее записи: протоколы телефонии, запись аудио на мобильных устройствах и прочее. Возможно отображение промежуточных результатов и автоматическое определение конца фразы. Максимальный размер аудио — 1 Гб.

  • Потоковое двухканальное (gRPC).
    Используется, если требуется распознавание двухканальных аудио в процессе записи. Возможно отображение промежуточных результатов и автоматическое определение конца фразы. Максимальный размер аудио — 1 Гб.

  • Асинхронное (HTTP и gRPC).
    Подходит для распознавания многоканальных аудиозаписей. При работе стоит учитывать, что процесс асинхронного распознавания может быть дольше синхронного, поэтому этот тип подходит для случаев, когда длительность распознавания не важна. Максимальный размер аудио — 1 Гб.

О том, как воспользоваться технологией распознавания речи, читайте в разделе Способы распознавания речи.

ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.