Транскрибация речиТранскрибация речиБыстроe и удобноe преобразование устной речи в текст с помощью сервиса SaluteSpeech

Транскрибация речи

Быстроe и удобноe преобразование устной речи в текст с помощью сервиса SaluteSpeech

Попробуйте сервис для транскрибации аудио в текст

Полная функциональность транскрибирования доступна при подключении в Studio
Сайт защищён reCAPTCHA. Применяются Политика конфиденциальности и Условия использования сервиса Google
Используйте транскрибацию аудиофайлов

Транскрибировать речевые данные в текст онлайн будет полезно для редакторов новостей, копирайтеров, учебных центров, отделов контроля качества. Используйте возможности транскрипции для своих целей:

  • преобразовывайте лекции длиной от нескольких минут до нескольких часов в конспекты;
  • конвертируйте подкасты, аудиозаписи совещаний или видеоролики в текст на понятном языке;
  • расшифровывайте файлы переговоров с клиентами для проверки качества консультаций;
  • создавайте субтитры на русском языке в презентациях, видеоконференциях, рекламных видео;
  • повышайте уровень доступности своих продуктов для различных категорий людей;
  • быстро распознавайте и заучивайте слова понравившихся песен;
  • переводите в транскрипции записи мероприятий и получайте основу для новостной колонки или статьи.
Попробуйте редактировать полученные данные и проводите анализ файлов по ключевым словам и меткам

О сервисе

SaluteSpeech распознаёт речь и создаёт транскрипцию, если при разработке использовать механизм «подсказок», помогающий максимально точно понимать язык пользователя в зависимости от конкретной ситуации.

Мы предоставим программный интерфейс (API) для быстрого подключения и использования сервисов преобразования голоса. Попробуйте использовать решение для получения транскрипций внутри корпоративной среды, внедрять его в собственные продукты, пользоваться сервисом на различных устройствах в любом месте

Подробнее о технологии распознавания речи

Транскрибирование аудио и видео в текст происходит благодаря технологии Automatic Speech Recognition (ASR). Она умеет:

  • делать расшифровку устной и записанной речи и переводить её в текст;
  • определять, кто именно сказал фразу;
  • фильтровать фоновые шумы;
  • определять конец высказывания;
  • определять эмоции спикера;
  • расставлять знаки препинания в транскрипции;
  • транскрибировать аудиозаписи в файлы удобного формата.

Глубокое обучение системы

Попробуйте возможности сервиса, полученные благодаря методам машинного обучения:

  • определение профессионального языка и терминов;
  • перевод сложных числовых значений;
  • точное распознавание редких наименований географических объектов, достопримечательностей;
  • считывание слов из неофициальной разговорной речи и иностранных заимствований.

Преобразование устной речи в текст
Чтобы внедрить технологии автоматического преобразования речевых данных в текст, оставьте заявку на подключение

Вопросы и ответы

Что такое преобразование речи в текст?
Это функция речевой платформы SaluteSpeech, которая позволяет уйти от ручного набора текста из голосовой записи или видео и сделать транскрипцию автоматической, в считаные минуты. С помощью специального софта надиктованное сообщение преобразуется в письменную форму на понятном языке, которую сможет легко прочитать любой человек. Преобразование может быть:
  • синхронным — с выводом текста после полной обработки всего аудио. Размер аудиофайла не должен превышать 2 Мб, а продолжительность — не более минуты;
  • потоковым — с распознаванием речи прямо в процессе её записи. Максимальный размер файла с записью — 1 Гб;
  • асинхронным — для работы с многоканальными аудиозаписями.
Возможности платформы интегрируются по API в любой продукт или сервис, например для быстрого ввода голосом в чатах, телемаркетинга, телефонии. Инструменты сервиса помогут лучше находить общий язык с аудиторией. Подробнее
Как защищены мои данные?
Платформа SaluteSpeech работает в соответствии с принципами безопасности крупнейшей экосистемы России и находится под контролем компании по управлению цифровыми рисками BI.ZONE. На каждом этапе соблюдается законодательство о защите персональных данных. Аутентификация в сервисе проводится через Access Token, а API защищает от несанкционированного доступа
Как перевести аудио в текст?
Для быстрого преобразования аудиозаписи в текстовый файл в своих продуктах необходимо разработать клиентское приложение. При разработке учитываются параметры API сервиса SaluteSpeech. Приложение через настройки API обращается к речевому сервису через программные запросы и сообщения, в которых передаётся аудиопоток. В ответ платформа отправляет транскрипцию на языке оригинала. Результат можно экспортировать в любом удобном формате. Для правильной транскрибации важны корректная загрузка аудиофайлов и верное указание их кодировки. Полный набор функций сервиса доступен при регистрации на платформе Studio от Сбера, предоставляющей широкий выбор инструментов для разработчиков.
Возможности платформы интегрируются по API в любой продукт или сервис, например для быстрого ввода голосом в чатах, телемаркетинга, телефонии. Инструменты сервиса помогут лучше находить общий язык с аудиторией. Подробнее
Какие возможности применения у SaluteSpeech?
Используйте сервис в соответствии с поставленными задачами. В полной версии можно не только получить точные транскрипции из аудио и видео, но и синтезировать речь из текста для озвучивания контента и интерфейсов, голосового управления и IVR-меню.
  • надиктовывать важные мысли и задачи;
  • делать расшифровки интервью и дискуссий;
  • вести голосовые заметки во время научной работы;
  • составлять стенограммы переговоров;
  • читать диалоги сотрудников с клиентами;
  • автоматически считывать через CRM запросы клиентов в голосовых сообщениях и многое другое.
SaluteSpeech умеет распознавать эмоции и конец высказывания, устранять фоновые шумы. Точно транскрибировать речевые данные при потоковом и асинхронном преобразовании помогают хинты — специально настроенные подсказки. Кроме того, инструменты платформы при подключении в Studio позволяют разделять спикеров, проводить анализ записей и использовать полную функциональность в телефонии. При генерации речи система правильно определяет букву Ё и ударения, воспроизводит даже сложные фразы, в том числе цифры и географические названия
Насколько точен сервис транскрибирования SaluteSpeech?
Точность расшифровки достигает 99%, но не менее 80%. Для повышения точности сервис позволяет выбрать тип акустической модели для общих задач или для телефонии
Как бесплатно перевести аудио в текст?
На странице сервиса в каталоге Sber представлена форма для онлайн-преобразования устной речи в текстовый формат. Голосовое сообщение до 20 секунд бесплатно переводится в текстовую транскрипцию, которую можно скопировать и использовать по назначению.
В течение первого месяца использования подписки пользователям доступна бесплатная транскрибация в пределах суммы предоставляемой скидки.
В мессенджере Telegram есть бот, способный бесплатно переводить голосовые сообщения, аудио или видео в читаемый текст. Его можно подключить в свой канал или пользоваться для решения частных задач
Сколько стоит использование SaluteSpeech?
Тарификация ведётся по количеству израсходованных ресурсов:
  • При распознавании речи оплачиваются секунды распознаваемых аудиозаписей.
  • При генерации речи — количество символов в исходных текстах.
Бизнес там,
где вы
Видеовстречи
SberJazz
Без лимитов по времени. Без регистрации. До 100 участников
Jazz Composition
Без лимитов по времени
Без регистрации
До 100 участников
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.