IT Talk by Sber



Как это было
О чём поговорили
Павел расскажет про SRE-философию. Как создать SRE-команду с нуля? Какие у неё есть функции? Что получит OPS и бизнес на выходе? А также спикер познакомит с инструментами автоматизации и повышения надёжности, которые реализованы командой.
Поговорим про observability и предпосылки появления, про основы и принципы мониторинга. Обсудим прикладной, инфраструктурный и бизнес-мониторинг.
Рассмотрим инструменты и пайплайны построения мониторинга (Zabbix, Prometheus, Dynatrace, Ключ-Астром). Немного про лайфхаки создания алертов, а также зоны ответственности за мониторинг по ролям.
Расскажем про подходы работы с такими процессами как: управление проблемами, рисками, инцидентами. Поделимся лучшими практиками и покажем разработанные инструменты автоматизации и мониторинга: НЕРПА, LiDAR, дашборды, автоматическая рассылка отчётности, процесс управления согласованиями и др.