ym88659208ym87991671
Обновления моделей | Документация для разработчиков

Обновления моделей

Обновлено 18 марта 2025

В этом разделе вы найдете информацию о качестве работы и возможностях новых версий моделей GigaChat.

Дата релиза: 13.03.2025
Статус: Доступна
Что нового

Добавлена новая линейка моделей GigaChat 2 в версиях Lite, Pro и Max, в которой:

  • увеличено большинство метрик по сравнению с предыдущими версиями;
  • добавлена поддержка контекста в 128 тыс. токенов;
  • улучшены механизмы RLHF и DPO для более стабильной работы в сложных сценариях.

Изменение метрик

В таблице представлены основные характеристики и возможности новой версии моделей.

ХарактеристикиGigaChat 2 LiteGigaChat 2 ProGigaChat 2 Max
Размер контекста в токенах128 тыс.128 тыс.128 тыс.
Поддержка функций
Генерация изображений
Анализ изображений

Результаты проверки моделей

В таблице представлены результаты проверки моделей с помощью разных бенчмарков.

МетрикаGigaChat 2 LiteGigaChat 2 ProGigaChat 2 Max
MMLU (5-shot) 
0.72 (+0.08)0.82 (+0.12)0.86 (+0.06)
MMLU PRO (5-shot) 
0.52 (+0.2)0.64 (+0.24)0.66 (+0.11)
ruMMLU (5-shot) 
0.66 (+0.07)0.77 (+0.12)0.80 (+0.05)
GSM8K (5-shot) 
0.89 (+0.23)0.95 (+0.1)0.95 (+0.02)
MATH (4-shot) 
0.62 (+0.28)0.76 (+0.31)0.74 (+0.21)
Human Eval (0-shot) 
0.70 (+0.25)0.91 (+0.4)0.87 (+0.08)
Human Eval Plus (0-shot) 
0.64 (+0.27)0.86 (+0.41)0.83 (+0.11)

(без фильтра безопасности)
0.55 (+0.31)0.74 (+0.32)0.83 (+0.16)
MBPP  
0.79 (+0.2)0.86 (+0.28)0.89 (+0.17)
IFEval(en) (0-shot) 
0.74 (+0.33)0.83 (+0.42)0.89 (+0.2)
IFEval(ru) (0-shot) 
0.65 (+0.27)0.78 (+0.33)0.83 (+0.39)
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей. Вы можете запретить сохранение cookie в настройках своего браузера.