3 августа 2021

SmartSpeech обновился

В сервисе речевых технологий SmartSpeech большое обновление: появилось асинхронное распознавание. Такой тип позволяет преобразовать длинные аудиозаписи в текст. Его можно использовать, когда у вас уже есть готовая аудиозапись, которую нужно распознать, например, запись фонограммы или разговора. Продолжительность записи может составлять до 480 минут, а размер файла — до 1 Гб. Но помните, что этот тип распознавания не подходит для онлайн-сценариев.

Процесс достаточно простой: отправьте файл на распознавание, создайте задачу, а потом скачайте файл с результатом — вы получите текст из аудио.

Асинхронное распознавание занимает больше времени, чем синхронное, это стоит учитывать в работе.

API асинхронного распознавания уже описан в документации.

Узнать больше о возможностях сервиса можно на странице SmartSpeech.