Как получить текст из аудио
Обновлено 25 января 2023
Для полноценной работы с распознаванием речи необходимо клиентское приложение, которое будет взаимодействовать с сервисом SaluteSpeech.
SDevices не предоставляет клиентское приложение для распознавания или синтеза речи.
При разработке клиентского приложения используйте описание API для распознавания речи.
Например, для потокового распознавания (gRPC) процесс в зависимости от настроек выглядит следующим образом:
- Приложение отправляет gRPC-запрос к методу
Recognize
сервиса SaluteSpeech. Запрос состоит из следующих элементов:- Заголовок с информацией для аутентификации.
- Первое сообщение
RecognitionOptions
с описанием параметров распознавания. - Последующие сообщения с чанками звука для распознавания.
- Аудиопоток передается в сообщениях
RecognitionRequest.audio_chunk
. - В ответ приходят сообщения
RecognitionResponse
, содержащие нормализованный и ненормализованный текст в поляхHypothesis.normalized_text
иHypothesis.text
.
Примеры клиентских приложений вы можете найти по ссылке.