Озвучка текста, синтез речи и распознавание голоса

Name: Сервис SaluteSpeech
Brand: Сбер
Rating: 9.8 (4567 reviews)

Как это работает?

Корректные паузы в предложениях и выделение нужных слов

Технология считывает не только слова, но и смысл написанного — и задаёт вопросы с органичной интонацией.

Правильные ударения

Сервис понимает какое поставить ударение. Сервис не задумывается звóнишь или звони́шь, а всегда синтезирует правильно — звони́шь.

Нормализация текста

Сервис корректно произносит цифры, названия и адреса. Нейросети понимают, что «Кутузовский пр-т» — это Кутузовский проспект.

Буква ё, там где нужно

Если вы загрузите текст «Николай все решил и отправился в дом, где живут его сестры», система поймёт, что «все» читается как «всё», а вместо слова «сестры» надо произнести «сёстры».

Гибкая разметка синтеза

SaluteSpeech поддерживает SSML (Speech Synthesis Markup Language) — язык разметки синтеза речи. Позволяет настраивать синтез и делает речь ассистентов более естественной.

SaluteSpeech

YourVoice

Создание своего уникального голоса

Распознавание без шума

Нейросеть игнорирует разговоры других людей или бормотание телевизора.

Ассистент не перебивает

Наши модели определяют, когда пользователь закончил реплику.

Эмоции клиентов

Сейчас наши технологии позволяют по голосу определить три эмоции: позитивную, нейтральную, негативную. Анализируйте динамику удовлетворённости клиентов.

Пунктуация

Упрощает понимание речи за счёт грамотной расстановки знаков препинания.

Протестируйте распознавание речи в Telegram-боте

SaluteSpeech

Insights

Речевые метрики диалога

Как использовать?

Автоматизация телефонии

IVR — интерактивное
голосовое меню
Сократите время ожидания ответа оператора

Голосовой робот
для обзвона клиентов
Оптимизируйте расходы

Голосовые рассылки
Сообщайте клиентам о выгодных предложениях или распродажах

Анализ работы персонала и качества сервиса

Анализируйте, как сотрудники общаются с клиентами в офисах и по телефону, чтобы оценить качество сервиса, улучшить скрипты и повысить лояльность клиентов

Озвучивание контента

Превращайте текст в аудио — инструкции, аудиокниги и контент на сайте. Озвучивайте текстовый контент, ролики и презентации, чтобы сократить расходы на продакшн

SaluteSpeech озвучивает новости на устройствах Сбера

Транскрибация

Управляйте контентом с помощью аудио — без усилий и затрат создавайте субтитры, расшифровки лекций и протоколов совещаний, принимайте заказы и заполняйте CRM

Собственный голосовой помощник

Мощный маркетинговый инструмент и часть вашего бренда. Голосовой помощник в любое время на связи с клиентами

Голосовое управление

Голосом можно быстро сформировать корзину или оставить своё имя и контакты для связи. Это позволит повысить конверсию и улучшить UX

Озвучивание интерфейсов

Пункты меню, описания товаров и навигационные элементы на сайте или в приложении. Вашими пользователями смогут стать слабовидящие люди и даже дети

Приложение с удобным интерфейсом для Windows и MacOS

Переводите речь в текст

Переводите текст в аудио

Генерируйте тексты по заданным параметрам c GigaChat

На платформах

Windows и MacOS

Озвучка текста и распознавание речи

Нам доверяют

Уже работают с нами

Just AI — один из лидеров рынка разговорного AI в России. Компания предлагает полный стек разговорных AI-решений и технологий для их создания, развёртывания и поддержки в облаке и on-premise. Just AI внимательно следит за трендами в области разговорного и генеративного AI, развивая продукты, которые помогают бизнесу эффективно взаимодействовать с передовыми AI-технологиями. Компания имеет свою NLU-платформу и собственную большую языковую модель JustGPT. Программное обеспечение Just AI входит в реестр отечественного ПО.

Компания «СиТиАй» — ведущий российский системный интегратор, поставщик IT‑решений и облачных услуг на территории России и стран СНГ. Компания работает по таким направлениям как бизнес‑коммуникации и контакт‑центры, телекоммуникационные и сетевые решения, информационная безопасность, цифровые вывески, центры обработки и хранения данных, интернет вещей и системы видеонаблюдения и аналитики. CTI проводят весь цикл работ от аудита, разработки стратегии развития и проектирования до полной интеграции с информационными системами Заказчиков.

Sitronics Group — российская IT‑компания, которая входит в Группу ПАО АФК «Система» и реализует цифровые проекты для бизнеса и государства. Занимается внедрением комплексных решений для «Умного города», цифровизацией стратегических отраслей экономики, судоходства и морской навигации. Также производит малые космические аппараты и IT‑оборудование под собственной маркой и оказывает услуги цифрового мониторинга.

Альтуэра — ведущий интегратор, разработчик и консультант, специализирующийся на решениях для контакт-центров крупного и среднего бизнеса. Основные направления деятельности: телекоммуникационные платформы, голосовые роботы и чат-боты, системы записи и контроля качества (QM), синтез и распознавание речи, системы планирования работы персонала (WFM), AI решения для контакт-центров, разработка приложений, систем и интерфейсов. Компания предлагает собственные продукты и решения от ведущих отечественных и зарубежных производителей.

Публикации о сервисе

«Россия находится на переднем крае развития генеративного ИИ»

CEO SberDevices Денис Филиппов о практическом применении ИИ сейчас и в будущем

Ведомости

Технологии и инновации

Речевые технологии SberDevices усовершенствовали голосовую платформу «МегаФона»

«МегаФон» внедрил технологии синтеза и распознавания речи SaluteSpeech от SberDevices для совершенствования своего виртуального помощника «Елена», которой доверено общаться с клиентами компании

CNews

Интернет-издание о высоких технологиях

Dusha: самый большой открытый датасет для распознавания эмоций в устной речи на русском языке

Мы развиваем технологии распознавания эмоций голоса для линейки наших умных устройств, а также для решений, позволяющих анализировать общение по телефону

Хабр

Как я сделал синтез своего голоса

Создать новый голос для синтеза — это долго и дорого. Мы постарались сделать этот процесс проще и доступнее

Хабр

О чём речь

Создание голосовых ассистентов, распознавание телефонных разговоров в контакт-центрах, озвучка контента и расшифровка голосовых файлов в текст — решать подобные задачи позволяют, в том числе, технологии синтеза (TTS) и распознавания речи (ASR)

Ведомости

Технологии и инновации

Вопросы и ответы

Как работает распознавание голоса?

SaluteSpeech использует технологию Automatic Speech Recognition (ASR).

Она позволяет:

снижать фоновые шумы,
определять конец высказывания,
выявлять эмоции в диалоге,
расставлять знаки препинания и букву ё.

Как работает озвучка текста?

Технология Text to speech (TTS) генерирует речь на русском, английском и казахском языках, которая звучит, как голос человека. В зависимости от бизнес-задач можно выбрать строгий или эмоциональный тембр, настроить скорость речи и паузы и озвучить текст любой сложности и стиля.

Технология TTS использует уникальные речевые ML модели расстановки ударений и произношения, это помогает сократить количество искажений слов. А ещё технология справляется с адресами, именами, цифрами и другими сложными словами за счёт комплекса нормализации текста.

Как SaluteSpeech может помочь бизнесу?

Сервис позволяет настраивать голосовых помощников, которые звучат естественно.
С их помощью можно сделать голосовое меню, озвучить контент и автоматизировать контактный центр. Можно создать собственный голос или использовать готовый из каталога.

Кто может пользоваться сервисом?

SaluteSpeech могут использовать как организации, так и физические лица.
Для некоммерческого использования сервис бесплатный, каждый месяц даётся 100 минут распознавания речи и 200 000 символов для озвучки.

Какие есть варианты внедрения решения?

Лёгкая интеграция по АПИ и On-prem установка на сервера компании. Всё зависит от задач и требований клиента.

Полезная информация

Что такое синтез речи

Как работает распознавание речи

SaluteSpeech

Как это работает?

Как использовать?

Приложение с удобным интерфейсом для Windows и MacOS

Озвучка текста и распознавание речиЕщё видео

Публикации о сервисе

Вопросы и ответы

Озвучка текста и распознавание речи