Приложение SaluteSpeech App
SaluteSpeech App — это приложение для Windows и MacOS, которое позволяет синтезировать и распознавать речь на базе технологии SaluteSpeech, а также генерировать текст с помощью GigaChat API.
Шаг 1: скачайте и установите приложение
Скачайте приложение SaluteSpeech App и установите его на компьютер:
- cкачать приложение для Windows;
- cкачать приложение для MacOS (Intel);
- cкачать приложение для MacOS (Apple M1 и М2).
Шаг 2: создайте личный кабинет
Для работы с приложением SaluteSpeech App нужно зарегистрироваться в личном кабинете Studio.
Подробнее о том, как зарегистрироваться в Studio — в разделе Регистрация и вход.
Шаг 3: создайте рабочий проект
Создайте рабочие проекты в личном кабинете Studio:
подключите проект SaluteSpeech, чтобы использовать функции синтеза и распознавания речи в приложении SaluteSpeech App. Подробнее — в разделах Подключение для физических лиц и Подключение для юридических лиц и ИП.
подключите проект GigaChat, чтобы использовать функции генерации текста в приложении SaluteSpeech App. Подробнее — в разделах Быстрый старт для физлиц и Быстрый старт для ИП и юрлиц документации GigaChat API.
Шаг 4: выберите тариф
Вы можете бесплатно использовать сервис SaluteSpeech для распознавания и синтеза речи в рамках тарифа Freemium.
Количество токенов в пакете Freemium ограничено.
Тариф Freemium доступен только для физических лиц. Для юридических лиц действует пакетная тарификация с предоплатой, а также тариф с оплатой по факту потребления.
Вы можете приобрести дополнительные пакеты, чтобы получить больше возможностей.
Подробнее о платных тарифах:
Шаг 5: авторизуйтесь в приложении SaluteSpeech App
Для авторизации в приложении нужно получить и активировать специальные ключи — токены. Они предоставляют доступ к сервисам SaluteSpeech API и GigaChat API в SaluteSpeech App. Токен активен в течение 30 минут, затем его нужно перевыпустить.
Для работы с приложением надо получить:
- токен SaluteSpeech API для синтеза и распознавания речи;
- токен GigaChat API для генерации текста.
Авторизация доступна пользователям только с ролью в проекте Владелец или Администратор. Подробнее о ролях и их возможностях — в разделе Создание команды и управление доступами.
Токен SaluteSpeech API
Чтобы получить и активировать токен для SaluteSpeech API:
Откройте проект SaluteSpeech в личном кабинете Studio.
В левой панели выберите раздел Настройки API.
Нажмите Получить ключ в блоке Данные для авторизации запросов к API.
В открывшемся окне скопируйте значение из поля
Authorization Key
.Запустите приложение SaluteSpeech App на вашем компьютере.
Нажмите иконку профиля в правом верхнем углу и выберите SaluteSpeech. Откроется окно авторизации:
Выберите тип использования (Scope). Узнать свой тип использования можно на главной странице проекта SaluteSpeech в личном кабинете Studio.
- PERS — физическое лицо, проект SaluteSpeech создан в личном пространстве;
- CORP — юридическое лицо, проект SaluteSpeech создан в корпоративном пространстве на условиях постоплаты;
- B2B — юридическое лицо, проект SaluteSpeech создан в корпоративном пространстве на условиях предоплаты;
- SPEECH — юридическое лицо, проект SaluteSpeech создан в корпоративном пространстве (устаревшее значение).
- Вставьте скопированные ранее авторизационные данные (значение из поля
Authorization Key
) и нажмите Сгенерировать токен.
Готово! Теперь вы можете распознавать и синтезировать речь в приложении SaluteSpeech App.
Токен GigaChat API
Токен GigaChat API необходим для генерации текста.
Чтобы получить и активировать токен для GigaChat API:
- Откройте проект GigaChat API в личном кабинете Studio.
- В левой панели выберите раздел Настройки API.
- Нажмите Получить ключ в блоке Данные для авторизации запросов к API.
- В открывшемся окне скопируйте значение из поля
Authorization Key
. - Запустите приложение SaluteSpeech App на вашем компьютере.
- Нажмите иконку профиля в правом верхнем углу и выберите GigaChat.
Откроется окно авторизации:
- В открывшемся окне выберите тип использования (Scope). Узнать свой тип использования можно на главной странице проекта SaluteSpeech в личном кабинете Studio:
- PERS — физическое лицо, проект GigaChat создан в личном пространстве;
- CORP — юридическое лицо, проект GigaChat создан в корпоративном пространстве на условиях постоплаты;
- B2B — юридическое лицо, проект GigaChat создан в корпоративном пространстве на условиях предоплаты.
- Вставьте скопированные ранее авторизационные данные (значение из поля
Authorization Key
) и нажмите Сгенерировать токен.
Готово! Теперь вы можете генерировать текст в приложении SaluteSpeech App
Подробнее о получении авторизационных данных и генерации токена доступа — в разделе Получаем доступ к API.
Работа с приложением SaluteSpeech App
После авторизации в системе вы можете пользоваться приложением SaluteSpeech App.
Распознаем речь
Чтобы распознать речь на русском языке в приложении SaluteSpeech App:
- Перейдите на вкладку Распознавание.
- Нажмите Выберите файл и загрузите нужный файл.
Отобразится распознанный текст. Чтобы его отредактировать, нажмите Использовать в генерации.
Поддерживается распознавание аудиофайлов любых форматов.
Синтезируем речь
Чтобы озвучить текст в приложении SaluteSpeech App:
- Перейдите на вкладку Синтез.
- Выберите голос, которым хотите озвучить текст.
Kira — голос для озвучивания на английском языке, остальные голоса — для русского языка.
- Если некоторые фразы надо произнести другим голосом, выберите дополнительный голос.
- Введите текст, который нужно озвучить.
- Если нужно, оформите текст SSML-тегами с помощью соответствующих кнопок:
- Изменить ударение.
- Сделать акцент.
- Добавить паузу.
- Произнести часть фразы дополнительным голосом.
- Изменить интонацию
- Нажмите Синтезировать.
Новая аудиозапись появится в блоке История синтезов.
Вы можете прослушать запись в приложении или скачать ее на свое устройство в формате .wav
.
Генерируем текст
Чтобы сгенерировать или отформатировать текст в приложении SaluteSpeech App:
- Перейдите на вкладку Генерация.
- Введите в поле запрос к модели GigaChat.
- Нажмите Сгенерировать.
Чтобы озвучить полученный текст, нажмите Использовать в синтезе.
Вопросы и ответы
Зачем нужен токен?
Получить токен SaluteSpeech API и GigaChat API необходимо для авторизации в системе. Генерация текста, а также синтез и распознавание речи недоступны для неавторизованных пользователей.
Какое количество потоков поддерживается единовременно?
Для физических лиц доступно:
- 3 потока одновременных запросов в SaluteSpeech API;
- 1 поток одновременных запросов в GigaChat API.
Чтобы получить больше потоков, зарегистрируйтесь как юридическое лицо.
Что поменялось в версии 3.2.0?
- В разделе Синтез добавлены новые голоса:
- женский казахский «Асем (kz)»;
- женский русский «Асем (ru)»;
- Небольшие исправления интерфейса.
Можно ли установить SaluteSpeech App на смартфон?
Приложение SaluteSpeech App доступно только для ПК на Windows и MacOS.