ym88659208ym87991671
Как получить текст из аудио | Документация для разработчиков

Как получить текст из аудио

Обновлено 25 января 2023

Для полноценной работы с распознаванием речи необходимо клиентское приложение, которое будет взаимодействовать с сервисом SaluteSpeech.

SDevices не предоставляет клиентское приложение для распознавания или синтеза речи.

При разработке клиентского приложения используйте описание API для распознавания речи.

Например, для потокового распознавания (gRPC) процесс в зависимости от настроек выглядит следующим образом:

  1. Приложение отправляет gRPC-запрос к методу Recognize сервиса SaluteSpeech. Запрос состоит из следующих элементов:
    • Заголовок с информацией для аутентификации.
    • Первое сообщение RecognitionOptions с описанием параметров распознавания.
    • Последующие сообщения с чанками звука для распознавания.
  2. Аудиопоток передается в сообщениях RecognitionRequest.audio_chunk.
  3. В ответ приходят сообщения RecognitionResponse, содержащие нормализованный и ненормализованный текст в полях Hypothesis.normalized_text и Hypothesis.text.

Примеры клиентских приложений вы можете найти по ссылке.

Подключить сервис
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.