Пользовательское приложение SaluteSpeech App
Даже если у вас нет навыков программирования, вы можете синтезировать и распознавать речь, а также генерировать текст с помощью приложения SaluteSpeech App для Windows и MacOS.
Стоимость использования приложения зависит от сервиса:
Скачиваем приложение
Для начала скачайте приложение SaluteSpeech App и установите его на компьютер:
- Скачать приложение для Windows.
- Скачать приложение для MacOS (Intel).
- Скачать приложение для MacOS (Apple M1).
Что поменялось в версии 3.0.0:
- Добавлена светлая тема приложения, которую можно включить с помощью кнопки в интерфейсе или комбинации клавиш Ctrl+T.
- Добавлены временные отметки при сохранении результатов распознавания.
- Теперь процесс распознавания файла можно прервать с помощью кнопки Отменить.
Чтобы работать в приложении, вам нужно получить токен. Для синтеза и распознавания речи — токен SaluteSpeech API, а для генерации текста — токен GigaChat API.
Получаем токен
Токен SaluteSpeech API
Чтобы сгенерировать токен SaluteSpeech:
Подключите SaluteSpeech. Подробнее — в разделе Подключаем сервис.
В созданном проекте SaluteSpeech скопируйте авторизационные данные.
Запустите приложение SaluteSpeech App на вашем компьютере.
Нажмите иконку профиля в правом верхнем углу и выберите SaluteSpeech. Откроется окно генерации токена:
В открывшемся окне выберите тип использования:
- Физическое лицо — если проект SaluteSpeech создан в личном пространстве и в поле Scope указано значение
SALUTE_SPEECH_PERS
. - Юридическое лицо — если проект SaluteSpeech создан в корпоративном пространстве и в поле Scope указано значение
SALUTE_SPEECH_CORP
. - Legacy — если проект SaluteSpeech создан в корпоративном пространстве и в поле Scope указано значение
SBER_SPEECH
.
- Физическое лицо — если проект SaluteSpeech создан в личном пространстве и в поле Scope указано значение
Вставьте скопированные ранее авторизационные данные.
Нажмите Сгенерировать токен.
Теперь вы можете распознавать и синтезировать речь в приложении SaluteSpeech App.
Токен GigaChat API
Чтобы сгенерировать токен GigaChat:
Подключите GigaChat. Подробнее — в разделах Быстрый старт для физлиц и Быстрый старт для ИП и юрлиц документации GigaChat API.
В созданном проекте GigaChat скопируйте авторизационные данные.
Запустите приложение SaluteSpeech App на вашем компьютере.
Нажмите иконку профиля в правом верхнем углу и выберите GigaChat. Откроется окно генерации токена:
В открывшемся окне выберите тип использования:
- Физическое лицо — если проект GigaChat создан в личном пространстве.
- Юридическое лицо — если проект GigaChat создан в корпоративном пространстве.
Вставьте скопированные ранее авторизационные данные.
Нажмите Сгенерировать токен.
Теперь вы можете генерировать тексты в приложении SaluteSpeech App.
Распознаем речь
Чтобы распознать речь на русском языке в приложении SaluteSpeech App:
- Получите токен SaluteSpeech.
- Перейдите на вкладку Распознавание.
- Нажмите Выберите файл и загрузите нужный файл.
Вам отобразится распознанный текст. Его можно изменить с помощью модели GigaChat в этом же приложении.
Распознавать можно аудио-файлы любых форматов.
Синтезируем речь
Чтобы озвучить текст в приложении SaluteSpeech App:
- Получите токен SaluteSpeech.
- Перейдите на вкладку Синтез.
- Выберите голос, которым хотите озвучить текст. Kira — голос для озвучивания на английском языке, остальные голоса — для русского языка.
- Если некоторые фразы надо произнести другим голосом, выберите дополнительный голос.
- Введите текст, который нужно озвучить.
- Если нужно, оформите текст SSML-тегами с помощью соответствующих кнопок:
- Изменить ударение.
- Сделать акцент.
- Добавить паузу.
- Произнести часть фразы дополнительным голосом.
- Изменить интонацию
- Нажмите Синтезировать.
Генерируем текст
Чтобы сгенерировать или отформатировать текст в приложении SaluteSpeech App:
- Получите токен GigaChat.
- Перейдите на вкладку Генерация.
- Введите в поле запрос к модели GigaChat.
- Нажмите Сгенерировать.
Далее вы можете озвучить полученный текст, нажав Использовать в синтезе.