Датасет для распознавания эмоций — Dusha

Разработчикам

Зарегистрироваться Войти

О датасете

Dusha подходит для распознавания эмоций в устной речи на русском языке. Набор данных состоит из более 300 000 аудиозаписей с расшифровками и эмоциональными метками. Длительность составляет около 350 часов аудио. Команда выбрала четыре основных эмоции, которые обычно появляются в диалоге с голосыми помощником: радость, грусть, злость и нейтральную эмоцию.

Dusha подойдет как для серьёзных научных исследований, так и при написании курсовых работ или реализации небольших авторских проектов.

Также технология распознавания эмоций используется на платформе SaluteSpeech и в сервисе SaluteSpeech Insights.

Чем полезен датасет

Применяйте в исследованиях

Датасет подходит в качестве основы для решения исследовательских и бизнес-задач

Узнавайте эмоции

Научите ваши системы распознавать настроение клиентов

Скачивайте бесплатно

Используйте датасет бесплатно и без ограничений

Данные в архивах:

Неагрегированная разметка и аудиосемплы.
Предпосчитанные Mel-filterbank признаки для всех аудиосемплов.
Агрегированная разметка, разбитая на train и test.

Код и Docker-образ:

Чтобы воспроизвести предложенную агрегацию разметки или попробовать свою.
Чтобы обучить базовую модель или работать над собственной.

Публикации о датасете

Dusha: самый большой открытый датасет для распознавания эмоций в устной речи на русском языке

Подробная статья об истории создания датасета и принципах, на которых он построен

Коллективный блог

ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.

ym88659208

ym87991671

ym31643078