Dusha
Самый большой открытый датасет для распознавания эмоций в устной речи на русском языке
Бизнес там,
где вы
где вы

Без лимитов по времени
Без регистрации
До 100 участников
Без регистрации
До 100 участников
О датасете
Dusha подходит для распознавания эмоций в устной речи на русском языке. Набор данных состоит из более 300 000 аудиозаписей с расшифровками и эмоциональными метками. Длительность составляет около 350 часов аудио. Команда выбрала четыре основных эмоции, которые обычно появляются в диалоге с голосыми помощником: радость, грусть, злость и нейтральную эмоцию.
Dusha подойдет как для серьёзных научных исследований, так и при написании курсовых работ или реализации небольших авторских проектов.
Также технология распознавания эмоций используется на платформе SaluteSpeech и в сервисе SaluteSpeech Insights.
Чем полезен датасет
Применяйте в исследованиях
Датасет подходит в качестве основы для решения исследовательских и бизнес-задач
Узнавайте эмоции
Научите ваши системы распознавать настроение клиентов
Скачивайте бесплатно
Используйте датасет бесплатно и без ограничений
Данные в архивах:
- Неагрегированная разметка и аудиосемплы.
- Предпосчитанные Mel-filterbank признаки для всех аудиосемплов.
- Агрегированная разметка, разбитая на train и test.
Код и Docker-образ:
- Чтобы воспроизвести предложенную агрегацию разметки или попробовать свою.
- Чтобы обучить базовую модель или работать над собственной.