Способы распознавания речи
Обновлено 30 мая 2025
Есть несколько способов воспользоваться технологией SaluteSpeech для распознавания речи:
-
Попробуйте сервис на нашем портале . Нажмите кнопку записи, продиктуйте текст и получите расшифровку.
-
Добавьте Telegram-бот . Пересылайте ему голосовые сообщения или добавьте его в чат.
-
Скачайте приложение для Windows или MacOS и распознавайте речь без навыков программирования. Подробнее — в разделе Пользовательский интерфейс.
-
Используйте SaluteSpeech API. Если у вас есть навыки разработчика, вам доступна полная функциональность сервиса:
- ответ выдается только после обработки всей аудиозаписи;
- максимальный размер аудио — 2 Мб, максимальная длина — одна минута;
- для многоканального аудио распознается только первый канал.
- используется, если требуется распознавание речи в процессе ее записи: протоколы телефонии, за пись аудио на мобильных устройствах и прочее;
- возможно отображение промежуточных результатов и автоматическое определение конца фразы;
- максимальный размер аудио — 1 Гб.
- используется, если требуется распознавание двухканальных аудио в процессе записи;
- возможно отображение промежуточных результатов и автоматическое определение конца фразы;
- максимальный размер аудио — 1 Гб.
- подходит для распознавания многоканальных аудиозаписей;
- асинхронное распознавание может быть дольше синхронного, поэтому этот тип подходит для случаев, когда длительность распознавания не важна;
- максимальный размер аудио — 1 Гб.
-
Используйте шаблоны Postman, если вы не готовы самостоятельно работать с API. Подробнее — в инструкции Распознавание речи с Postman.