SDP Hadoop
Обновлено 09 марта 2023
Cервис хранения и обработки больших данных. Сбор, хранение и обработка данных доступна в любом виде (структурированном, неструктурированном, поточном или пакетном). Основные возможности:
- работа с распределенной файловой системой для хранения больших объемов данных, поблочно распределенных между узлами вычислительного кластера;
- репликация данных на уровне узлов кластера для повышения отказоустойчивости файловой системы;
- работа с распределенными параллельными вычислениями при обработке больших объемов данных;
- доступ к хранимым данным средствами SQL и NoSQL;
- поддержка пакетной и потоковой загрузки данных;
- настройка ограничения доступа к данным в распределенной файловой системе;
- использование инструментов для планирования заданий и управления вычислительными ресурсами кластеров;
- использование инструментов для разворачивания, управления и мониторинга вычислительных кластеров;
- хранение неструктурированных данных (изображения, видео файлы, аудио файлы, скан-копии документов, интернет-статьи, электронные письма, файлы всех типов).