Dusha

Самый большой открытый датасет для распознавания эмоций в устной речи на русском языке
Бизнес там,
где вы
Видеовстречи
SberJazz
Без лимитов по времени. Без регистрации. До 100 участников
Jazz Composition
Без лимитов по времени
Без регистрации
До 100 участников

О датасете

Dusha подходит для распознавания эмоций в устной речи на русском языке. Набор данных состоит из более 300 000 аудиозаписей с расшифровками и эмоциональными метками. Длительность составляет около 350 часов аудио. Команда выбрала четыре основных эмоции, которые обычно появляются в диалоге с голосыми помощником: радость, грусть, злость и нейтральную эмоцию.
Dusha подойдет как для серьёзных научных исследований, так и при написании курсовых работ или реализации небольших авторских проектов.
Также технология распознавания эмоций используется на платформе SaluteSpeech и в сервисе SaluteSpeech Insights.

Чем полезен датасет

Применяйте в исследованиях
Датасет подходит в качестве основы для решения исследовательских и бизнес-задач
Узнавайте эмоции
Научите ваши системы распознавать настроение клиентов
Скачивайте бесплатно
Используйте датасет бесплатно и без ограничений
Данные в архивах:
  • Неагрегированная разметка и аудиосемплы.
  • Предпосчитанные Mel-filterbank признаки для всех аудиосемплов.
  • Агрегированная разметка, разбитая на train и test.
Код и Docker-образ:
  • Чтобы воспроизвести предложенную агрегацию разметки или попробовать свою.
  • Чтобы обучить базовую модель или работать над собственной.
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.