ym88659208ym87991671
Приложение SaluteSpeech App | Документация для разработчиков

Приложение SaluteSpeech App

Обновлено 10 февраля 2025

SaluteSpeech App — это приложение для Windows и MacOS, которое позволяет синтезировать и распознавать речь на базе технологии SaluteSpeech, а также генерировать текст с помощью GigaChat API.

Шаг 1: скачайте и установите приложение

Скачайте приложение SaluteSpeech App и установите его на компьютер:

Шаг 2: создайте личный кабинет

Для работы с приложением SaluteSpeech App нужно зарегистрироваться в личном кабинете Studio.

Подробнее о том, как зарегистрироваться в Studio — в разделе Регистрация и вход.

Шаг 3: создайте рабочий проект

Создайте рабочие проекты в личном кабинете Studio:

Шаг 4: выберите тариф

Вы можете бесплатно использовать сервис SaluteSpeech для распознавания и синтеза речи в рамках тарифа Freemium.

Количество токенов в пакете Freemium ограничено.

Тариф Freemium доступен только для физических лиц. Для юридических лиц действует пакетная тарификация с предоплатой, а также тариф с оплатой по факту потребления.

Вы можете приобрести дополнительные пакеты, чтобы получить больше возможностей.

Подробнее о платных тарифах:

Шаг 5: авторизуйтесь в приложении SaluteSpeech App

Для авторизации в приложении нужно получить и активировать специальные ключи — токены. Они предоставляют доступ к сервисам SaluteSpeech API и GigaChat API в SaluteSpeech App. Токен активен в течение 30 минут, затем его нужно перевыпустить.

Для работы с приложением надо получить:

  • токен SaluteSpeech API для синтеза и распознавания речи;
  • токен GigaChat API для генерации текста.

Авторизация доступна пользователям только с ролью в проекте Владелец или Администратор. Подробнее о ролях и их возможностях — в разделе Создание команды и управление доступами.

Токен SaluteSpeech API

Чтобы получить и активировать токен для SaluteSpeech API:

  1. Откройте проект SaluteSpeech в личном кабинете Studio.

  2. В левой панели выберите раздел Настройки API.

  3. Нажмите Получить ключ в блоке Данные для авторизации запросов к API.

  4. В открывшемся окне скопируйте значение из поля Authorization Key.

  5. Запустите приложение SaluteSpeech App на вашем компьютере.

  6. Нажмите иконку профиля в правом верхнем углу и выберите SaluteSpeech. Откроется окно авторизации:

    Получение токена
  7. Выберите тип использования (Scope). Узнать свой тип использования можно на главной странице проекта SaluteSpeech в личном кабинете Studio.

  • PERS — физическое лицо, проект SaluteSpeech создан в личном пространстве;
  • CORP — юридическое лицо, проект SaluteSpeech создан в корпоративном пространстве на условиях постоплаты;
  • B2B — юридическое лицо, проект SaluteSpeech создан в корпоративном пространстве на условиях предоплаты;
  • SPEECH — юридическое лицо, проект SaluteSpeech создан в корпоративном пространстве (устаревшее значение).
  1. Вставьте скопированные ранее авторизационные данные (значение из поля Authorization Key) и нажмите Сгенерировать токен.

Готово! Теперь вы можете распознавать и синтезировать речь в приложении SaluteSpeech App.

Токен GigaChat API

Токен GigaChat API необходим для генерации текста.

Чтобы получить и активировать токен для GigaChat API:

  1. Откройте проект GigaChat API в личном кабинете Studio.
  2. В левой панели выберите раздел Настройки API.
  3. Нажмите Получить ключ в блоке Данные для авторизации запросов к API.
  4. В открывшемся окне скопируйте значение из поля Authorization Key.
  5. Запустите приложение SaluteSpeech App на вашем компьютере.
  6. Нажмите иконку профиля в правом верхнем углу и выберите GigaChat.

Откроется окно авторизации:

Получение токена
  1. В открывшемся окне выберите тип использования (Scope). Узнать свой тип использования можно на главной странице проекта SaluteSpeech в личном кабинете Studio:
  • PERS — физическое лицо, проект GigaChat создан в личном пространстве;
  • CORP — юридическое лицо, проект GigaChat создан в корпоративном пространстве на условиях постоплаты;
  • B2B — юридическое лицо, проект GigaChat создан в корпоративном пространстве на условиях предоплаты.
  1. Вставьте скопированные ранее авторизационные данные (значение из поля Authorization Key) и нажмите Сгенерировать токен.

Готово! Теперь вы можете генерировать текст в приложении SaluteSpeech App

Подробнее о получении авторизационных данных и генерации токена доступа — в разделе Получаем доступ к API.

Работа с приложением SaluteSpeech App

После авторизации в системе вы можете пользоваться приложением SaluteSpeech App.

Распознаем речь

Чтобы распознать речь на русском языке в приложении SaluteSpeech App:

  1. Перейдите на вкладку Распознавание.
  2. Нажмите Выберите файл и загрузите нужный файл.

Отобразится распознанный текст. Чтобы его отредактировать, нажмите Использовать в генерации.

Поддерживается распознавание аудиофайлов любых форматов.

Синтезируем речь

Чтобы озвучить текст в приложении SaluteSpeech App:

  1. Перейдите на вкладку Синтез.
  2. Выберите голос, которым хотите озвучить текст.

Kira — голос для озвучивания на английском языке, остальные голоса — для русского языка.

  1. Если некоторые фразы надо произнести другим голосом, выберите дополнительный голос.
  2. Введите текст, который нужно озвучить.
  3. Если нужно, оформите текст SSML-тегами с помощью соответствующих кнопок:
  • Изменить ударение.
  • Сделать акцент.
  • Добавить паузу.
  • Произнести часть фразы дополнительным голосом.
  • Изменить интонацию
  1. Нажмите Синтезировать.

Новая аудиозапись появится в блоке История синтезов.

Вы можете прослушать запись в приложении или скачать ее на свое устройство в формате .wav.

Генерируем текст

Чтобы сгенерировать или отформатировать текст в приложении SaluteSpeech App:

  1. Перейдите на вкладку Генерация.
  2. Введите в поле запрос к модели GigaChat.
  3. Нажмите Сгенерировать.

Чтобы озвучить полученный текст, нажмите Использовать в синтезе.

Вопросы и ответы

Зачем нужен токен?

Получить токен SaluteSpeech API и GigaChat API необходимо для авторизации в системе. Генерация текста, а также синтез и распознавание речи недоступны для неавторизованных пользователей.

Какое количество потоков поддерживается единовременно?

Для физических лиц доступно:

  • 3 потока одновременных запросов в SaluteSpeech API;
  • 1 поток одновременных запросов в GigaChat API.

Чтобы получить больше потоков, зарегистрируйтесь как юридическое лицо.

Что поменялось в версии 3.2.0?
  1. В разделе Синтез добавлены новые голоса:
  • женский казахский «Асем (kz)»;
  • женский русский «Асем (ru)»;
  1. Небольшие исправления интерфейса.
Можно ли установить SaluteSpeech App на смартфон?

Приложение SaluteSpeech App доступно только для ПК на Windows и MacOS.

ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.