SaluteSpeech

Cокращает время посети­те­лей сайта на поиск правиль­­ного произно­­шения слов

  • Клиент
    Грамота.ру
  • Продукт
    SaluteSpeech
  • Задача
    Сокращение времени пользователей на поиски правильного произношения в орфоэпических словарях
  • Результат
    Озвучка слов с учётом орфоэпических нюансов и вариативности произношения
SaluteSpeech
Синтез и распознавание речи от Сбера
Клиент
Цифровой портал «Грамота.ру» — самый авторитетный ресурс в области русского языка. Портал аккумулирует разные виды справочных изданий (словари, справочники, учебники), на портале функционирует собственная экспертная справочная служба. Метрики фиксируют более 2 млн визитов на портал ежемесячно. Аудитория портала — все, кто хочет избежать орфографических и пунктуационных ошибок, проверить, где в слове ставится ударение, уточнить значение незнакомого слова или в целом развивать свои лингвистические компетенции.
Задача
Команда цифровизации словарей Грамоты сочла необходимым обогатить информацию о слове его живым звучанием, чтобы сократить время пользователей на поиски правильного произношения в орфоэпических словарях. Поскольку потребность в правильном звучании слов нередко возникает даже у носителей языка. Эту задачу невозможно было решить без использования технологии синтеза речи, так как объёмы словарей слишком велики.
Возможности
  • Естественное произношение за счёт гибкой разметки SSML (Speech Synthesis Markup Language).
  • Правильные ударения и паузы, наличие буквы ё там, где необходимо по смыслу.
  • Библиотека из шести общедоступных женских и мужских голосов.
  • Возможность синтезировать уникальный голос с помощью технологии YourVoice.
Результат
Пользователи часто ищут на портале информацию о звучании слов, и теперь каждый из них может услышать слово с правильным ударением. Воспроизведение аудио доступно и в результатах поиска, и при открытии словарной карточки слова.
Платформа SaluteSpeech позволила довольно точно и системно озвучить слова с учётом орфоэпических нюансов и вариативности произношения, а также решить многие повторяющиеся проблемы.
Эксперты справочно-информационного портала также отмечают, что звучание слов стало менее механическим и приблизилось к человеческой артикуляции, благодаря чему удалось предложить пользователям наиболее естественное произношение.
Что для этого сделали
Рассказ от команды SaluteSpeech
Сотрудники Грамоты передали команде SaluteSpeech списки слов с указанием верного ударения для озвучивания. Получившиеся аудиозаписи были тщательно проверены экспертами цифровой справочной службы с помощью орфоэпических словарей. Особенно важно было проверить корректность различения мягких и твёрдых согласных звуков перед буквой е, поскольку эта разница не всегда отражается на письме (сравните: тесто и тест), а также произношение удвоенных согласных, которое может совпадать с произношением одиночных.
Затем синтезированные аудиофайлы были интегрированы в метасловарь — инновационный лексикографический продукт Грамоты, который содержит сведения из разных словарей и источников. Так в поисковой выдаче появился виджет с иконкой звука. С его помощью пользователи одним нажатием могут воспроизвести звучание искомого слова.
Весь процесс внедрения технологии был синхронизирован с этапами глобального обновления портала и занял 5 месяцев.
Анастасия Бонч-Осмоловская
Руководитель группы цифровизации словарей портала Грамота.ру
Идея метасловаря состояла в том, чтобы «упаковать» полное представление о слове на одну страницу. У нашей аудитории очень мало времени на то, чтобы найти ответ на свой вопрос, поэтому удобство и компактность представления информации играют ключевую роль. В большинстве случаев, чтобы узнать, как слово произносится, проще не искать его в специальном словаре ударений или в орфоэпическом, а просто послушать. Платформа SaluteSpeech от Сбера стала интегральной частью метасловаря и расширила его функциональные возможности.
Планы на будущее
Команда Грамоты постоянно работает над доработками Метасловаря. В ближайших планах — добавление в него фразеологизмов и имён собственных. В более долгосрочных планах намечено озвучивание не только самих слов, но и примеров их употребления.
Синтез и распознавание речи от Сбера
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.