Data.Meetup: СУБД в эпоху AI‑трансформации. Вызовы и перспективы



О чём
- Мы стоим на пороге новой эры, где ИИ не просто дополняет, а трансформирует архитектуру систем управления базами данных, открывая возможности для инноваций и управления рисками в режиме реального времени. Приглашаем объединить усилия, обменяться лучшими практиками и обсудить вектор технологического прорыва
Кому будет полезно
- Data‑инженерам, ML‑инженерам, IT‑архитекторам, Java‑разработчикам, BI‑аналитикам, Data Scientist’ам и другим специалистам
О чём поговорили
Вступительное слово Ильи Позднякова
Классический PostgreSQL жёстко привязан к локальным дискам: хранилище и вычисления неразделимы. Это мешает эффективно масштабироваться в облаке.
В докладе разобрали архитектуру: как заменить стандартный слой хранения, реализовать MVCC и транзакции поверх SST-файлов, а главное — как динамически поднимать read‑only инстансы PostgreSQL с синхронизацией через S3 без предварительного копирования данных.
DataGrid (Apache Ignite) умеет работать в режиме Multi‑DC через асинхронную репликацию, однако это требует больших затрат.
Малым проектам тоже часто требуется подобная конфигурация, однако высокое TCO их отпугивает от подобного решения.
Таким проектам мы хотим предложить новый вариант Multi‑DC кластера, когда один кластер растягивается на несколько ЦОД, при этом MDC проблемы решаются автоматически.
В докладе мы обсуждаем новый алгоритм оптимизации на базе MCTS и стандартной стоимостной модели. Мы реализовали новую версию MCTS на базе экстремальных бандитов в виде расширения для PG. Алгоритм показывает стабильное E2E‑ускорение (планирование+исполнение) на бенчмарках JOB, JOB Complex, IMDb CEB для запросов с 12+ таблицами и выглядит как кандидат для замены GEQO.