Пользовательское приложение SaluteSpeech App
Даже если у вас нет навыков программирования, вы можете синтезировать и распознавать речь, а также генерировать текст с помощью приложения SaluteSpeech App для Windows и MacOS.
Стоимость использования приложения зависит от сервиса:
Скачиваем приложение
Для начала скачайте приложение SaluteSpeech App версии 2.3.1 и установите его на компьютер:
- Скачать приложение для Windows.
- Скачать приложение для MacOS (Intel).
- Скачать приложение для MacOS (Apple M1).
Что поменялось в версии 2.3.1:
- Можно распознавать новые форматы аудио и видео: M4A, MPGA, MPEG, MP4, WEBM и т. д.
- Результаты распознавания отображаются в потоковом режиме.
- Отображается статус распознавания.
- В результатах распознавания отображается имя файла.
- Можно кнопками перемещаться к началу и к концу распознавания.
Чтобы работать в приложении, вам нужно получить токен. Для синтеза и распознавания речи — токен SaluteSpeech API, а для генерации текста — токен GigaChat API.
Получаем токен
Токен SaluteSpeech API
Чтобы сгенерировать токен SaluteSpeech:
Подключите SaluteSpeech. Подробнее — в разделе Подключаем сервис.
В созданном проекте SaluteSpeech скопируйте авторизационные данные.
Запустите приложение SaluteSpeech App на вашем компьютере.
Нажмите иконку профиля в правом верхнем углу и выберите SaluteSpeech. Откроется окно генерации токена:
В открывшемся окне выберите тип использования:
- Физическое лицо — если проект SaluteSpeech создан в личном пространстве и в поле Scope указано значение
SALUTE_SPEECH_PERS
. - Юридическое лицо — если проект SaluteSpeech создан в корпоративном пространстве и в поле Scope указано значение
SALUTE_SPEECH_CORP
. - Legacy — если проект SaluteSpeech создан в корпоративном пространстве и в поле Scope указано значение
SBER_SPEECH
.
- Физическое лицо — если проект SaluteSpeech создан в личном пространстве и в поле Scope указано значение
Вставьте скопированные ранее авторизационные данные.
Нажмите Сгенерировать токен.
Теперь вы можете распознавать и синтезировать речь в приложении SaluteSpeech App.
Токен GigaChat API
Чтобы сгенерировать токен GigaChat:
Подключите GigaChat. Подробнее — в разделе Начало работы в GigaChat.
В созданном проекте GigaChat скопируйте авторизационные данные.
Запустите приложение SaluteSpeech App на вашем компьютере.
Нажмите иконку профиля в правом верхнем углу и выберите GigaChat. Откроется окно генерации токена:
В открывшемся окне выберите тип использования:
- Физическое лицо — если проект GigaChat создан в личном пространстве.
- Юридическое лицо — если проект GigaChat создан в корпоративном пространстве.
Вставьте скопированные ранее авторизационные данные.
Нажмите Сгенерировать токен.
Теперь вы можете генерировать тексты в приложении SaluteSpeech App.
Распознаем речь
Чтобы распознать речь на русском языке в приложении SaluteSpeech App:
- Получите токен SaluteSpeech.
- Перейдите на вкладку Распознавание.
- Нажмите Выберите файл и загрузите нужный файл.
Вам отобразится распознанный текст. Его можно изменить с помощью модели GigaChat в этом же приложении.
Распознавать можно аудио-файлы следующих форматов:
- PCM.
- OPUS.
- MP3.
- FLAC.
- ALAW.
- MULAW.
Подробнее — в разделе Доступные форматы аудио.
Синтезируем речь
Чтобы озвучить текст в приложении SaluteSpeech App:
- Получите токен SaluteSpeech.
- Перейдите на вкладку Синтез.
- Выберите голос, которым хотите озвучить текст. Kira — голос для озвучивания на английском языке, остальные голоса — для русского языка.
- Если некоторые фразы надо произнести другим голосом, выберите дополнительный голос.
- Введите текст, который нужно озвучить.
- Если нужно, оформите текст SSML-тегами с помощью соответствующих кнопок:
- Изменить ударение.
- Сделать акцент.
- Добавить паузу.
- Произнести часть фразы дополнительным голосом.
- Изменить интонацию
- Нажмите Синтезировать.
Генерируем текст
Чтобы сгенерировать или отформатировать текст в приложении SaluteSpeech App:
- Получите токен GigaChat.
- Перейдите на вкладку Генерация.
- Введите в поле запрос к модели GigaChat.
- Нажмите Сгенерировать.
Далее вы можете озвучить полученный текст, нажав Использовать в синтезе.