ym88659208ym87991671
Распознавание речи с помощью сервиса SaluteSpeech и коллекции запросов Postman | Документация для разработчиков

Распознавание речи с Postman

Обновлено 1 декабря 2023

Вы можете работать с API распознавания речи с помощью Postman.

Получение токена

Чтобы получить токен в Postman:

  1. Подключите сервис SaluteSpeech.
  2. В созданном проекте SaluteSpeech сгенерируйте Client Secret и сохраните данные из поля Авторизационные данные.
  3. Скопируйте коллекцию SaluteSpeech в Postman:
    1. Откройте пространство Postman.
    2. Авторизуйтесь с учетной записью Google.
    3. Нажмите на названии коллекции SaluteSpeech правой кнопкой мыши и выберите Create a fork.
    4. На открывшейся форме нажмите Fork Collection. Коллекция скопировалась в ваше пространство.
  4. В коллекции перейдите на вкладку Variables.
  5. Введите авторизационные данные (см. п. 2) в строке credentials в столбце Current value.
  6. Нажмите Save в верхней части экрана.
  7. В коллекции SaluteSpeech нажмите get access_token.
  8. Нажмите Send.

В результате на вкладке Body в нижней части экрана отобразится access_token. Токен действует 30 минут.

Получение токена в Postman

Распознавание речи

Вы можете асинхронно распознавать речь с помощью Postman.

Максимальный размер аудиофайла — 1 Гб.

Загружаем аудиофайл

Чтобы загрузить аудио, которое нужно распознать:

  1. Скопируйте коллекцию Postman и получите новый токен (подробнее — в разделе Получение токена). Токен действует 30 минут.
  2. В коллекции SaluteSpeech откройте папку Распознавание (до 1 Гб) и выберите запрос upload.
  3. На вкладке Body нажмите Select File и загрузите аудиофайл для распознавания. О подходящих форматах аудио читайте в разделе Доступные форматы аудио.
  4. Нажмите Send.

В случае успеха в ответе вам отобразится код со статусом 200 и идентификатором загруженного файла. Например:

{
"status": 200,
"result": {
"request_file_id": "2345200-abe8-4f60-90c8-0d43c5f6c0f6"
}
}

Создаем задачу на распознавание

Чтобы создать задачу на распознавание:

  1. В папке Распознавание (до 1 Гб) выберите запрос recognize.
  2. На вкладке Body отредактируйте параметры:
    1. model — значение callcenter, если частота аудиофайла — 8кГц, и general — для всех остальных.
    2. audio_encoding — кодировка аудиофайла.
    3. sample_rate — частота дискретизации аудио.
    4. channels_count — количество каналов в аудио.
  3. Нажмите Send.

В случае успеха в ответе вам отобразится код со статусом NEW. Например:

{
"status": 200,
"result": {
"id": "dafaf982-a32a-4e26-ae40-2bb9444906e1",
"created_at": "2021-07-15T17:35:17.182454861+03:00",
"updated_at": "2021-07-15T17:35:17.18245504+03:00",
"status": "NEW"
}
}

Проверяем статус задачи

Чтобы проверить статус задачи:

  1. В папке Распознавание (до 1 Гб) выберите запрос status.
  2. Нажмите Send.

В случае успеха в ответе вам отобразится код со статусом DONE и идентификатором файла с результатом распознавания. Например:

{
"status": 200,
"result": {
"id": "dafaf982-a32a-4e26-ae40-2bb9444906e1",
"created_at": "2021-07-15T17:35:17.182454861+03:00",
"updated_at": "2021-07-15T17:35:57.18245504+03:00",
"status": "DONE",
"response_file_id": "2d45b5dc-73fe-40b1-9c89-0eea703036e5"
}
}

Если статус задачи RUNNING, значит она еще обрабатывается, попробуйте проверить статус еще раз позже.

Скачиваем результат

Чтобы скачать результат распознавания:

  1. В папке Распознавание (до 1 Гб) выберите запрос download.
  2. Нажмите Send.
  3. Нажмите иконку меню над полем ответа и выберите Save response to file.

На вкладке Visualize можно посмотреть результаты распознавания в виде таблицы. Вы можете отредактировать представление на вкладке Test.

ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.