Транскрибация речиТранскрибация речиБыстроe и удобноe преобразование устной речи в текст с помощью сервиса SaluteSpeech

Транскрибация речи

Быстроe и удобноe преобразование устной речи в текст с помощью сервиса SaluteSpeech

Попробуйте сервис для транскрибации аудио в текст

Полная функциональность транскрибирования доступна при подключении в Studio
Сайт защищён reCAPTCHA. Применяются Политика конфиденциальности и Условия использования сервиса Google
Используйте транскрибацию аудиофайлов

Транскрибировать речевые данные в текст онлайн будет полезно для редакторов новостей, копирайтеров, учебных центров, отделов контроля качества. Используйте возможности транскрипции для своих целей:

  • преобразовывайте лекции длиной от нескольких минут до нескольких часов в конспекты;
  • конвертируйте подкасты, аудиозаписи совещаний или видеоролики в текст на понятном языке;
  • расшифровывайте файлы переговоров с клиентами для проверки качества консультаций;
  • создавайте субтитры на русском языке в презентациях, видеоконференциях, рекламных видео;
  • повышайте уровень доступности своих продуктов для различных категорий людей;
  • быстро распознавайте и заучивайте слова понравившихся песен;
  • переводите в транскрипции записи мероприятий и получайте основу для новостной колонки или статьи.
Попробуйте редактировать полученные данные и проводите анализ файлов по ключевым словам и меткам

О сервисе

SaluteSpeech распознаёт речь и создаёт транскрипцию, если при разработке использовать механизм «подсказок», помогающий максимально точно понимать язык пользователя в зависимости от конкретной ситуации.

Мы предоставим программный интерфейс (API) для быстрого подключения и использования сервисов преобразования голоса. Попробуйте использовать решение для получения транскрипций внутри корпоративной среды, внедрять его в собственные продукты, пользоваться сервисом на различных устройствах в любом месте

Подробнее о технологии распознавания речи

Транскрибирование аудио и видео в текст происходит благодаря технологии Automatic Speech Recognition (ASR). Она умеет:

  • делать расшифровку устной и записанной речи и переводить её в текст;
  • определять, кто именно сказал фразу;
  • фильтровать фоновые шумы;
  • определять конец высказывания;
  • определять эмоции спикера;
  • расставлять знаки препинания в транскрипции;
  • транскрибировать аудиозаписи в файлы удобного формата.

Глубокое обучение системы

Попробуйте возможности сервиса, полученные благодаря методам машинного обучения:

  • определение профессионального языка и терминов;
  • перевод сложных числовых значений;
  • точное распознавание редких наименований географических объектов, достопримечательностей;
  • считывание слов из неофициальной разговорной речи и иностранных заимствований.

Преобразование устной речи в текст
Чтобы внедрить технологии автоматического преобразования речевых данных в текст, оставьте заявку на подключение

Вопросы и ответы

Что такое преобразование речи в текст?
Это функция речевой платформы SaluteSpeech, которая позволяет уйти от ручного набора текста из голосовой записи или видео и сделать транскрипцию автоматической, в считаные минуты. С помощью специального софта надиктованное сообщение преобразуется в письменную форму на понятном языке, которую сможет легко прочитать любой человек. Преобразование может быть:
  • синхронным — с выводом текста после полной обработки всего аудио. Размер аудиофайла не должен превышать 2 Мб, а продолжительность — не более минуты;
  • потоковым — с распознаванием речи прямо в процессе её записи. Максимальный размер файла с записью — 1 Гб;
  • асинхронным — для работы с многоканальными аудиозаписями.
Возможности платформы интегрируются по API в любой продукт или сервис, например для быстрого ввода голосом в чатах, телемаркетинга, телефонии. Инструменты сервиса помогут лучше находить общий язык с аудиторией. Подробнее
Как защищены мои данные?
Платформа SaluteSpeech работает в соответствии с принципами безопасности крупнейшей экосистемы России и находится под контролем компании по управлению цифровыми рисками BI.ZONE. На каждом этапе соблюдается законодательство о защите персональных данных. Аутентификация в сервисе проводится через Access Token, а API защищает от несанкционированного доступа
Как перевести аудио в текст?
Для быстрого преобразования аудиозаписи в текстовый файл в своих продуктах необходимо разработать клиентское приложение. При разработке учитываются параметры API сервиса SaluteSpeech. Приложение через настройки API обращается к речевому сервису через программные запросы и сообщения, в которых передаётся аудиопоток. В ответ платформа отправляет транскрипцию на языке оригинала. Результат можно экспортировать в любом удобном формате. Для правильной транскрибации важны корректная загрузка аудиофайлов и верное указание их кодировки. Полный набор функций сервиса доступен при регистрации на платформе Studio от Сбера, предоставляющей широкий выбор инструментов для разработчиков.
Возможности платформы интегрируются по API в любой продукт или сервис, например для быстрого ввода голосом в чатах, телемаркетинга, телефонии. Инструменты сервиса помогут лучше находить общий язык с аудиторией. Подробнее
Какие возможности применения у SaluteSpeech?
Используйте сервис в соответствии с поставленными задачами. В полной версии можно не только получить точные транскрипции из аудио и видео, но и синтезировать речь из текста для озвучивания контента и интерфейсов, голосового управления и IVR-меню.
  • надиктовывать важные мысли и задачи;
  • делать расшифровки интервью и дискуссий;
  • вести голосовые заметки во время научной работы;
  • составлять стенограммы переговоров;
  • читать диалоги сотрудников с клиентами;
  • автоматически считывать через CRM запросы клиентов в голосовых сообщениях и многое другое.
SaluteSpeech умеет распознавать эмоции и конец высказывания, устранять фоновые шумы. Точно транскрибировать речевые данные при потоковом и асинхронном преобразовании помогают хинты — специально настроенные подсказки. Кроме того, инструменты платформы при подключении в Studio позволяют разделять спикеров, проводить анализ записей и использовать полную функциональность в телефонии. При генерации речи система правильно определяет букву Ё и ударения, воспроизводит даже сложные фразы, в том числе цифры и географические названия
Насколько точен сервис транскрибирования SaluteSpeech?
Точность расшифровки достигает 99%, но не менее 80%. Для повышения точности сервис позволяет выбрать тип акустической модели для общих задач или для телефонии
Как бесплатно перевести аудио в текст?
На странице сервиса в каталоге Sber представлена форма для онлайн-преобразования устной речи в текстовый формат. Голосовое сообщение до 20 секунд бесплатно переводится в текстовую транскрипцию, которую можно скопировать и использовать по назначению.
В течение первого месяца использования подписки пользователям доступна бесплатная транскрибация в пределах суммы предоставляемой скидки.
В мессенджере Telegram есть бот, способный бесплатно переводить голосовые сообщения, аудио или видео в читаемый текст. Его можно подключить в свой канал или пользоваться для решения частных задач
Сколько стоит использование SaluteSpeech?
Тарификация ведётся по количеству израсходованных ресурсов:
  • При распознавании речи оплачиваются секунды распознаваемых аудиозаписей.
  • При генерации речи — количество символов в исходных текстах.
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.