Пользовательское приложение SaluteSpeech App
Даже если у вас нет навыков программирования, вы можете синтезировать и распознавать речь, а также генерировать текст с помощью приложения SaluteSpeech App для Windows и MacOS.
Стоимость использования приложения зависит от сервиса:
Скачиваем приложение
Для начала скачайте приложение SaluteSpeech App и установите его на компьютер:
- Скачать приложение для Windows.
- Скачать приложение для MacOS (Intel).
- Скачать приложение для MacOS (Apple M1 и М2).
Что поменялось в версии 3.2.0:
в разделе Синтез добавлены новые голоса:
- женский казахский «Асем (kz)»;
- женский русский «Асем (ru)»;
небольшие исправления интерфейса.
Чтобы работать в приложении, вам нужно получить токен. Для синтеза и распознавания речи — токен SaluteSpeech API, а для генерации текста — токен GigaChat API.
Получаем токен
Токен SaluteSpeech API
Чтобы сгенерировать токен SaluteSpeech:
Подключите SaluteSpeech. Подробнее — в разделе Подключаем сервис.
В созданном проекте SaluteSpeech скопируйте авторизационные данные.
Подробнее об авторизационных данных
Авторизационные данные — строка, полученная в результате кодирования в Base64 клиентского идентификатора (Client ID) и ключа (Client Secret) API. Вы можете использовать готовые данные из личного кабинета или самостоятельно закодировать идентификатор и ключ.
Авторизационные данные нужны для получения токена доступа с помощью запроса
POST /api/v2/oauth
.Запустите приложение SaluteSpeech App на вашем компьютере.
Нажмите иконку профиля в правом верхнем углу и выберите SaluteSpeech. Откроется окно генерации токена:
В открывшемся окне выберите тип использования:
- Физическое лицо — если проект SaluteSpeech создан в личном пространстве и в поле Scope указано значение
SALUTE_SPEECH_PERS
. - Юридическое лицо — если проект SaluteSpeech создан в корпоративном пространстве и в поле Scope указано значение
SALUTE_SPEECH_CORP
. - Legacy — если проект SaluteSpeech создан в корпоративном пространстве и в поле Scope указано значение
SBER_SPEECH
.
- Физическое лицо — если проект SaluteSpeech создан в личном пространстве и в поле Scope указано значение
Вставьте скопированные ранее авторизационные данные.
Нажмите Сгенерировать токен.
Теперь вы можете распознавать и синтезировать речь в приложении SaluteSpeech App.
Токен GigaChat API
Чтобы сгенерировать токен GigaChat:
Подключите GigaChat. Подробнее — в разделах Быстрый старт для физлиц и Быстрый старт для ИП и юрлиц документации GigaChat API.
В созданном проекте GigaChat скопируйте авторизационные данные.
Запустите приложение SaluteSpeech App на вашем компьютере.
Нажмите иконку профиля в правом верхнем углу и выберите GigaChat. Откроется окно генерации токена:
В открывшемся окне выберите тип использования:
- Физическое лицо — если проект GigaChat создан в личном пространстве.
- Юридическое лицо — если проект GigaChat создан в корпоративном пространстве.
Вставьте скопированные ранее авторизационные данные.
Нажмите Сгенерировать токен.
Теперь вы можете генерировать тексты в приложении SaluteSpeech App.
Распознаем речь
Чтобы распознать речь на русском языке в приложении SaluteSpeech App:
- Получите токен SaluteSpeech.
- Перейдите на вкладку Распознавание.
- Нажмите Выберите файл и загрузите нужный файл.
Вам отобразится распознанный текст. Его можно изменить с помощью модели GigaChat в этом же приложении.
Распознавать можно аудио-файлы любых форматов.
Синтезируем речь
Чтобы озвучить текст в приложении SaluteSpeech App:
- Получите токен SaluteSpeech.
- Перейдите на вкладку Синтез.
- Выберите голос, которым хотите озвучить текст. Kira — голос для озвучивания на английском языке, остальные голоса — для русского языка.
- Если некоторые фразы надо произнести другим голосом, выберите дополнительный голос.
- Введите текст, который нужно озвучить.
- Если нужно, оформите текст SSML-тегами с помощью соответствующих кнопок:
- Изменить ударение.
- Сделать акцент.
- Добавить паузу.
- Произнести часть фразы дополнительным голосом.
- Изменить интонацию
- Нажмите Синтезировать.
Генерируем текст
Чтобы сгенерировать или отформатировать текст в приложении SaluteSpeech App:
- Получите токен GigaChat.
- Перейдите на вкладку Генерация.
- Введите в поле запрос к модели GigaChat.
- Нажмите Сгенерировать.
Далее вы можете озвучить полученный текст, нажав Использовать в синтезе.