ym88659208ym87991671
Распознавание речи с помощью сервиса SaluteSpeech и коллекции запросов Postman | Документация для разработчиков

Распознавание речи с Postman

Обновлено 30 августа 2023

Вы можете работать с API распознавания речи с помощью Postman.

Получение токена

Чтобы получить токен в Postman:

  1. Подключите сервис SaluteSpeech.
  2. В созданном проекте SaluteSpeech сгенерируйте Client Secret и сохраните данные из поля Авторизационные данные.
  3. Скачайте Postman.
  4. Скопируйте коллекцию SaluteSpeech. Для этого откройте пространство Postman, нажмите на названии коллекции правой кнопкой мыши и выберите Create a fork.
  5. Перейдите на вкладку Variables и в поле Current value переменной credentials и введите авторизационные данные (см. п. 2).
  6. Нажмите Save.
  7. Откройте папку SaluteSpeech в Postman и выберите запрос get access_token.
  8. Нажмите Send.

В ответ на вкладке Body отобразится access_token. Токен действует 30 минут.

Получение токена в Postman

Распознавание речи

Вы можете асинхронно распознавать речь с помощью Postman.

Максимальный размер аудиофайла — 1 Гб.

Загружаем аудиофайл

Чтобы загрузить аудио, которое нужно распознать:

  1. Откройте Postman и получите новый токен с помощью запроса get access_token. Токен действует 30 минут.
  2. Откройте папку Распознавание (до 1 Гб) и выберите запрос upload.
  3. На вкладке Body нажмите Select File и загрузите аудиофайл для распознавания. О подходящих форматах аудио читайте в разделе Доступные кодировки.
  4. Нажмите Send.

В случае успеха в ответе вам отобразится код со статусом 200 и идентификатором загруженного файла. Например:

{
"status": 200,
"result": {
"request_file_id": "2345200-abe8-4f60-90c8-0d43c5f6c0f6"
}
}

Создаем задачу на распознавание

Чтобы создать задачу на распознавание:

  1. В папке Распознавание (до 1 Гб) выберите запрос recognize.
  2. На вкладке Body отредактируйте параметры:
    1. model — значение callcenter, если частота аудиофайла — 8кГц, и general — для всех остальных.
    2. audio_encoding — кодировка аудиофайла.
    3. sample_rate — частота дискретизации аудио.
    4. channels_count — количество каналов в аудио.
  3. Нажмите Send.

В случае успеха в ответе вам отобразится код со статусом NEW. Например:

{
"status": 200,
"result": {
"id": "dafaf982-a32a-4e26-ae40-2bb9444906e1",
"created_at": "2021-07-15T17:35:17.182454861+03:00",
"updated_at": "2021-07-15T17:35:17.18245504+03:00",
"status": "NEW"
}
}

Проверяем статус задачи

Чтобы проверить статус задачи:

  1. В папке Распознавание (до 1 Гб) выберите запрос status.
  2. Нажмите Send.

В случае успеха в ответе вам отобразится код со статусом DONE и идентификатором файла с результатом распознавания. Например:

{
"status": 200,
"result": {
"id": "dafaf982-a32a-4e26-ae40-2bb9444906e1",
"created_at": "2021-07-15T17:35:17.182454861+03:00",
"updated_at": "2021-07-15T17:35:57.18245504+03:00",
"status": "DONE",
"response_file_id": "2d45b5dc-73fe-40b1-9c89-0eea703036e5"
}
}

Скачиваем результат

Чтобы скачать результат распознавания:

  1. В папке Распознавание (до 1 Гб) выберите запрос download.
  2. Нажмите Send.
  3. Нажмите иконку меню над полем ответа и выберите Save response to file.

На вкладке Visualize можно посмотреть результаты распознавания в виде таблицы. Вы можете отредактировать представление на вкладке Test.

ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.