Распознавание речи
Вы можете внедрить распознавание речи в свои приложения с помощью API сервиса SaluteSpeech.
При использовании SaluteSpeech максимальная нагрузка на сервис:
- для юридических лиц — не более 20 параллельных потоков;
- для физических лиц — не более 5 параллельных потоков.
Виды распознавания:
Синхронное (HTTP).
Ответ выдается только после обработки всей аудиозаписи. Максимальный размер аудио — 2 Мб, максимальная длина — одна минута. Для многоканального аудио распознается только первый канал.Потоковое (gRPC).
Используется, если требуется распознавание речи в процессе ее записи: протоколы телефонии, запись аудио на мобильных устройствах и прочее. Возможно отображение промежуточных результатов и автоматическое определение конца фразы. Максимальный размер аудио — 1 Гб.Потоковое двухканальное (gRPC).
Используется, если требуется распознавание двухканальных аудио в процессе записи. Возможно отображение промежуточных результатов и автоматическое определение конца фразы. Максимальный размер аудио — 1 Гб.Асинхронное (HTTP и gRPC).
Подходит для распознавания многоканальных аудиозаписей. При работе стоит учитывать, что процесс асинхронного распознавания может быть дольше синхронного, поэтому этот тип подходит для случаев, когда длительность распознавания не важна. Максимальный размер аудио — 1 Гб.
О том, как воспользоваться технологией распознавания речи, читайте в разделе Способы распознавания речи.