SaluteSpeechОзвучка текста и распознавание речи

Попробуйте технологию
SaluteSpeech прямо сейчас

Все возможности синтеза и распознавания речи,
включая SSML-разметку и хинты, доступны в личном кабинете
Сайт защищён reCAPTCHA. Применяются Политика конфиденциальности и Условия использования сервиса Google

Как это работает?

Корректные паузы в предложениях и выделение нужных слов
Технология считывает не только слова, но и смысл написанного — и задаёт вопросы с органичной интонацией.
Правильные ударения
Сервис понимает какое поставить ударение. Сервис не задумывается звóнишь или звони́шь, а всегда синтезирует правильно — звони́шь.
Нормализация текста
Сервис корректно произносит цифры, названия и адреса. Нейросети понимают, что «Кутузовский пр-т» — это Кутузовский проспект.
Буква ё, там где нужно
Если вы загрузите текст «Николай все решил и отправился в дом, где живут его сестры», система поймёт, что «все» читается как «всё», а вместо слова «сестры» надо произнести «сёстры».
Гибкая разметка синтеза
SaluteSpeech поддерживает SSML (Speech Synthesis Markup Language) — язык разметки синтеза речи. Позволяет настраивать синтез и делает речь ассистентов более естественной.
SaluteSpeech
YourVoice 
Создание своего уникального голоса
Распознавание без шума
Нейросеть игнорирует разговоры других людей или бормотание телевизора.
Ассистент не перебивает
Наши модели определяют, когда пользователь закончил реплику.
Эмоции клиентов
Сейчас наши технологии позволяют по голосу определить три эмоции: позитивную, нейтральную, негативную. Анализируйте динамику удовлетворённости клиентов.
Пунктуация
Упрощает понимание речи за счёт грамотной расстановки знаков препинания.
Протестируйте распознавание речи в Telegram-боте
SaluteSpeech
Insights 
Речевые метрики диалога

Как использовать?

Автоматизация телефонии
IVR — интерактивное
голосовое меню

Сократите время ожидания ответа оператора
Голосовой робот
для обзвона клиентов

Оптимизируйте расходы
Голосовые рассылки
Сообщайте клиентам о выгодных предложениях или распродажах
Анализ работы персонала и качества сервиса
Анализируйте, как сотрудники общаются с клиентами в офисах и по телефону, чтобы оценить качество сервиса, улучшить скрипты и повысить лояльность клиентов
Озвучивание контента
Превращайте текст в аудио — инструкции, аудиокниги и контент на сайте. Озвучивайте текстовый контент, ролики и презентации, чтобы сократить расходы на продакшн
SaluteSpeech озвучивает новости на устройствах Сбера
Транскрибация
Управляйте контентом с помощью аудио — без усилий и затрат создавайте субтитры, расшифровки лекций и протоколов совещаний, принимайте заказы и заполняйте CRM
Собственный голосовой помощник
Мощный маркетинговый инструмент и часть вашего бренда. Голосовой помощник в любое время на связи с клиентами
Голосовое управление
Голосом можно быстро сформировать корзину или оставить своё имя и контакты для связи. Это позволит повысить конверсию и улучшить UX
Озвучивание интерфейсов
Пункты меню, описания товаров и навигационные элементы на сайте или в приложении. Вашими пользователями смогут стать слабовидящие люди и даже дети

Приложение с удобным интерфейсом для Windows и MacOS

Переводите речь в текст
Переводите текст в аудио
Генерируйте тексты по заданным параметрам c GigaChat
На платформах
Windows и MacOS
Форматы поставки

Cloud

Freemium
Без дополнительной платы
Синтез речи
До 200 000 символов
Распознавание речи
До 100 минут (6000 секунд)
Лимиты возобновляются каждые 30 дней. Если не хватит — можно купить дополнительные пакеты
+1000 минут распознавания речи
Дополнительный пакет к Freemium за 1200 ₽. Время действия — 1 год
+1 000 000 символов синтеза речи
Дополнительный пакет к Freemium за 1000 ₽. Время действия — 1 год
Базовый тариф
Синтез речи
186 ₽ за миллион символов
Распознавание речи
1 копейка за секунду

On-Prem

Платформа будет работать в контуре вашей компании
Максимальная безопасность
Можно работать без интернета
Работаем на CPU без потери качества

Озвучка текста и распознавание речи

Публикации о сервисе

Вопросы и ответы

Как работает распознавание голоса?
SaluteSpeech использует технологию Automatic Speech Recognition (ASR).
Она позволяет:
  1. снижать фоновые шумы,
  2. определять конец высказывания,
  3. выявлять эмоции в диалоге,
  4. расставлять знаки препинания и букву ё.
Как работает озвучка текста?
Технология Text to speech (TTS) генерирует речь на русском и английском языке, которая звучит, как голос человека. В зависимости от бизнес-задач можно выбрать строгий или эмоциональный тембр, настроить скорость речи и паузы и озвучить текст любой сложности и стиля.
Технология TTS использует уникальные речевые ML модели расстановки ударений и произношения, это помогает сократить количество искажений слов. А ещё технология справляется с адресами, именами, цифрами и другими сложными словами за счёт комплекса нормализации текста.
Как SaluteSpeech может помочь бизнесу?
Сервис позволяет настраивать голосовых помощников, которые звучат естественно.
С их помощью можно сделать голосовое меню, озвучить контент и автоматизировать контактный центр. Можно создать собственный голос или использовать готовый из каталога.
Кто может пользоваться сервисом?
SaluteSpeech могут использовать как организации, так и физические лица.
Для некоммерческого использования сервис бесплатный, каждый месяц даётся 100 минут распознавания речи и 200 000 символов для озвучки.
Какие есть варианты внедрения решения?
Лёгкая интеграция по АПИ и On-prem установка на сервера компании. Всё зависит от задач и требований клиента.

Обсудим детали

Оставьте контактные данные, наши менеджеры с вами свяжутся
SmartSpeech = SaluteSpeech
C 13 сентября 2022 года мы поменяли название SmartSpeech на SaluteSpeech.
Бизнес там,
где вы
Видеовстречи
SberJazz
Без лимитов по времени. Без регистрации. До 100 участников
Jazz Composition
Без лимитов по времени
Без регистрации
До 100 участников
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.