Модели ruCLIP предназначены для ранжирования изображений и подписей к ним, а также оценки семантической близости изображений и текстов.
Четыре модели из линейки доступны на GitHub в открытом доступе с подробными характеристиками, а еще две опубликованы на платформе ML Space в хабе предобученных моделей, датасетов и контейнеров DataHub. Модели ruCLIP Base exclusive и ruCLIP Large exclusive отличаются максимальным качеством и наибольшим количеством параметров.
Обучение новых моделей строилось на самостоятельно собранном датасете из 240 млн пар «картинка — подпись» и заняло 12 полных дней на 256 Tesla GPU A100 Christofari Neo в платформе SberCloud ML Space.
Новые модели ruCLIP помогут эффективно решать задачи компьютерного зрения без затрат на дорогостоящее дообучение.
Для первых 100 клиентов-юридических лиц на SberCloud ML Space доступен грант в 180 000 ₽ на тестовый доступ и дообучение моделей.
Источник: SBER PRESS