Описание моделей GigaChat

Обновлено 17 июля 2025

Сервис GigaChat дает доступ к нескольким моделям для генерации и создания векторного представления текста.

Для решения задач вы можете использовать разные модели. При этом стоимость запросов будет зависеть от того, какую модель вы выберете.

Модели первого поколения (GigaChat, GigaChat-Pro, GigaChat-Max) теперь недоступны. Все запросы к этим моделям автоматически перенаправляются на их аналоги второго поколения (GigaChat-2, GigaChat-2-Pro, GigaChat-2-Max). Стоимость запросов остается прежней.

Информацию о тарифах, а также примеры расчетов ищите в разделе Тарифы и оплата.

Перед запуском в промышленном контуре новые версии моделей для генерации некоторое время работают в режиме раннего доступа.

Модели для генерации

Для получения списка моделей, доступных для генерации, используйте запрос GET /models.

Для генерации доступны модели:

Название модели	Значение поля `model`	Размер контекста в токенах	Поддержка функций	Описание
GigaChat 2 Lite	`GigaChat-2`	128 тыс.	да	Быстрая и легкая модель для простых повседневных задач
GigaChat 2 Pro	`GigaChat-2-Pro`	128 тыс.	да	Усовершенствованная модель для ресурсоемких задач, обеспечивающая максимальную эффективность в обработке данных, креативности и соблюдении инструкций
GigaChat 2 Max	`GigaChat-2-Max`	128 тыс.	да	Мощная модель для самых сложных и масштабных задач, требующих высочайшего уровня креативности и качества исполнения

Чтобы получить ответ определенной модели, ее название нужно передать в поле model запроса POST /chat/completions:

curl -L -X POST 'https://gigachat.devices.sberbank.ru/api/v1/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Accept: application/json' \
-H 'Authorization: Bearer <токен_доступа>' \
--data-raw '{
  "model": "GigaChat",
  "messages": [
    {
      "role": "system",
      "content": "Ты профессиональный переводчик на английский язык. Переведи точно сообщение пользователя."
    },
    {
      "role": "user",
      "content": "GigaChat — это сервис, который умеет взаимодействовать с пользователем в формате диалога, писать код, создавать тексты и картинки по запросу пользователя."
    }
  ],
  "stream": false,
  "update_interval": 0
}'

Модели для векторного представления текста

Для векторного представления текстов доступны модели Embeddings и EmbeddingsGigaR:

Название модели	Значение поля `model`	Размер контекста в токенах	Описание
Embeddings	`Embeddings`	512	Базовая модель, доступная по умолчанию для векторного представления текстов
EmbeddingsGigaR	`EmbeddingsGigaR`	4096	Продвинутая модель с большим размером контекста

Модели используются в запросах на создание эмбеддингов POST /embeddings:

{
  "model": "Embeddings",
  "input": [
    "Расскажи о современных технологиях"
  ]
}

Запросы на создание эмбеддингов тарифицируются одинаково, независимо от использованной модели.

Для улучшения результатов при работе с моделью EmbeddingsGigaR следуйте рекомендациям в разделе Векторное представление текста.

Смотрите также

POST /chat/completions

Описание запроса на генерацию

Тарифы и оплата

Информация о тарифах GigaChat API и способах оплаты

Выбор модели для генерации

Выбор модели при работе с GigaChat с помощью API и SDK

Векторное представление текстов

Создание эмбеддингов в GigaChat API

Модели для генерации﻿

Модели для векторного представления текста﻿

Модели для генерации

Модели для векторного представления текста