Распознавание речи с Postman
Вы можете работать с API распознавания речи с помощью Postman.
Получение токена
Чтобы получить токен в Postman:
- Подключите сервис SaluteSpeech.
- В созданном проекте SaluteSpeech сгенерируйте
Client Secret
и сохраните данные из поля Авторизационные данные. - Скопируйте коллекцию SaluteSpeech в Postman:
- Откройте пространство Postman.
- Авторизуйтесь с учетной записью Google.
- Нажмите на названии коллекции SaluteSpeech правой кнопкой мыши и выберите Create a fork.
- На открывшейся форме нажмите Fork Collection. Коллекция скопировалась в ваше пространство.
- В коллекции перейдите на вкладку Variables.
- Введите авторизационные данные (см. п. 2) в строке credentials в столбце Current value.
- Нажмите Save в верхней части экрана.
- В коллекции SaluteSpeech нажмите
get access_token
. - Нажмите Send.
В результате на вкладке Body в нижней части экрана отобразится access_token
. Токен действует 30 минут.
Распознавание речи
Вы можете асинхронно распознавать речь с помощью Postman.
Максимальный размер аудиофайла — 1 Гб.
Загружаем аудиофайл
Чтобы загрузить аудио, которое нужно распознать:
- Скопируйте коллекцию Postman и получите новый токен (подробнее — в разделе Получение токена). Токен действует 30 минут.
- В коллекции SaluteSpeech откройте папку Распознавание (до 1 Гб) и выберите запрос
upload
. - На вкладке Body нажмите Select File и загрузите аудиофайл для распознавания. О подходящих форматах аудио читайте в разделе Доступные форматы аудио.
- Нажмите Send.
В случае успеха в ответе вам отобразится код со статусом 200 и идентификатором загруженного файла. Например:
{
"status": 200,
"result": {
"request_file_id": "2345200-abe8-4f60-90c8-0d43c5f6c0f6"
}
}
Создаем задачу на распознавание
Чтобы создать задачу на распознавание:
- В папке Распознавание (до 1 Гб) выберите запрос
recognize
. - На вкладке Body отредактируйте параметры:
model
— значениеcallcenter
, если частота аудиофайла — 8кГц, иgeneral
— для всех остальных.audio_encoding
— кодировка аудиофайла.sample_rate
— частота дискретизации аудио.channels_count
— количество каналов в аудио.
- Нажмите Send.
В случае успеха в ответе вам отобразится код со статусом NEW. Например:
{
"status": 200,
"result": {
"id": "dafaf982-a32a-4e26-ae40-2bb9444906e1",
"created_at": "2021-07-15T17:35:17.182454861+03:00",
"updated_at": "2021-07-15T17:35:17.18245504+03:00",
"status": "NEW"
}
}
Проверяем статус задачи
Чтобы проверить статус задачи:
- В папке Распознавание (до 1 Гб) выберите запрос
status
. - Нажмите Send.
В случае успеха в ответе вам отобразится код со статусом DONE и идентификатором файла с результатом распознавания. Например:
{
"status": 200,
"result": {
"id": "dafaf982-a32a-4e26-ae40-2bb9444906e1",
"created_at": "2021-07-15T17:35:17.182454861+03:00",
"updated_at": "2021-07-15T17:35:57.18245504+03:00",
"status": "DONE",
"response_file_id": "2d45b5dc-73fe-40b1-9c89-0eea703036e5"
}
}
Если статус задачи RUNNING, значит она еще обрабатывается, попробуйте проверить статус еще раз позже.
Скачиваем результат
Чтобы скачать результат распознавания:
- В папке Распознавание (до 1 Гб) выберите запрос
download
. - Нажмите Send.
- Нажмите иконку меню над полем ответа и выберите Save response to file.
На вкладке Visualize можно посмотреть результаты распознавания в виде таблицы. Вы можете отредактировать представление на вкладке Test.