Распознавание речи
Вы можете внедрить распознавание речи в свои приложения с помощью API сервиса SaluteSpeech.
При использовании SaluteSpeech максимальная нагрузка на сервис:
- для юридических лиц — не более 20 параллельных потоков;
- для физических лиц — не более 5 параллельных потоков.
Виды распознавания:
-
Синхронное (HTTP).
Ответ выдается только после обработки всей аудиозаписи. Максимальный размер аудио — 2 Мб, максимальная длина — одна минута. Для многоканального аудио распознается только первый канал. -
Потоковое (gRPC).
Используется, если требуется распознавание речи в процессе ее записи: протоколы телефонии, запись аудио на мобильных устройствах и прочее. Возможно отображение промежуточных результатов и автоматическое определение конца фразы. Максимальный размер аудио — 1 Гб. -
Потоковое двухканальное (gRPC).
Используется, если требуется распознавание двухканальных аудио в процессе записи. Возможно отображение промежуточных результатов и автоматическое определение конца фразы. Максимальный размер аудио — 1 Гб. -
Асинхронное (HTTP и gRPC).
Подходит для распознавания многоканальных аудиозаписей. При работе стоит учитывать, что процесс асинхронного распознавания может быть дольше синхронного, поэтому этот тип подходит для с лучаев, когда длительность распознавания не важна. Максимальный размер аудио — 1 Гб.
О том, как воспользоваться технологией распознавания речи, читайте в разделе Способы распознавания речи.