В сервисе речевых технологий SmartSpeech большое обновление: появилось асинхронное распознавание. Такой тип позволяет преобразовать длинные аудиозаписи в текст. Его можно использовать, когда у вас уже есть готовая аудиозапись, которую нужно распознать, например, запись фонограммы или разговора. Продолжительность записи может составлять до 480 минут, а размер файла — до 1 Гб. Но помните, что этот тип распознавания не подходит для онлайн-сценариев.
Процесс достаточно простой: отправьте файл на распознавание, создайте задачу, а потом скачайте файл с результатом — вы получите текст из аудио.
Асинхронное распознавание занимает больше времени, чем синхронное, это стоит учитывать в работе.
API асинхронного распознавания уже описан в документации.
Узнать больше о возможностях сервиса можно на странице SmartSpeech.