Клиент
РБК — один из крупнейших медиахолдингов России, который предоставляет аудитории возможность выбирать, как лучше вовлекаться в контент. Для этого команда работает с аналитикой, совершенствует свои приложения, подписные сервисы и алгоритмы фильтрации «информационного шума», создаёт персонализированный контент для каждого пользователя и распространяет его на различных платформах собственной экосистемы.
Задача
Перед командой РБК стояла задача найти технологическое решение, которое позволит озвучить текстовые материалы, чтобы обеспечить свою аудиторию возможностью не только читать, но и слушать новости. Кроме того, команде было важно, чтобы решение можно было легко внедрить в короткие сроки без затрат на изменение текущей вёрстки текстов.
Возможности
- Синтезированный голос приближен к естественной речи благодаря гибкой разметке SSML (Speech Synthesis Markup Language).
- Правильные ударения и корректное произношение цифр, названий и адресов.
- Библиотека из семи общедоступных женских и мужских голосов на русском и английском языках.
Результат
Теперь возле статей проектов РБК Тренды и РБК Life можно увидеть кнопку «Слушать», которая позволяет воспроизвести текстовый контент в аудиоформате. Благодаря синтезированию речи, редакция РБК получила новый способ общения с аудиторией, повысила лояльность и улучшила пользовательские метрики площадок.
Что для этого сделали
Рассказ от команды SaluteSpeech
При выборе вендора команда заказчика в первую очередь ориентировалась на качество технологии синтеза и её соответствие общему тренду на максимально живое и естественное общение. Технология синтеза речи SaluteSpeech отвечает этому запросу, так как умеет считывать не только слова, но и смысл того, что написано в тексте, понимает, где нужно поставить букву «ё» и ударения. Сервис корректно произносит цифры, названия и адреса. Например, нейросеть понимает, что «Профсоюзная ул.» — это Профсоюзная улица. Также сервис поддерживает SSML (Speech Synthesis Markup Language) — язык разметки, позволяющий делать речь естественной и живой.
Реализация функции озвучивания новостей заняла три месяца и состояла из нескольких этапов. В первую очередь была проведена оценка требующихся ресурсов и определение составных компонентов для построения масштабируемого, отказоустойчивого сервиса, который принимает и обрабатывает озвученные тексты новостей. После успешного завершения подготовительного этапа были созданы макеты виджета синтеза речи и разработан вспомогательный сервис для качественной интеграции. Завершающим этапом проекта стало тестирование корректности работы озвучки, которое показало, что решение полностью соответствует исходным требованиям и ожиданиям команды РБК. Сейчас прослушать новости РБК можно на всех устройствах, включая компьютеры, смартфоны и планшеты.
Данияр Булатов
Директор по развитию коммерческих продуктов РБК
Модель потребления новостного контента в Рунете продолжает быстро меняться, аудитория становится всё более требовательной к упаковке. Возможность озвучивания новостей — это дополнительный инструмент привлечения новых пользователей, для которых прослушать новость удобнее, чем её прочитать. При этом мы ориентировались на наиболее простые технологические решения, которые не предполагают изменения вёрстки и сложных надстроек кода. Наиболее продвинутым и одновременно простым решением для интеграции стала платформа SaluteSpeech от Сбера.
Планы на будущее
Уже сейчас в РБК отмечают, что синтез новостей интересен большой части аудитории, поэтому команда планирует расширять зону экспериментов с речевыми технологиями SaluteSpeech в рамках других проектов.