Модели GigaChat
Сервис GigaChat дает доступ к нескольким моделям для генерации и одной модели для создания векторного представления текста.
В зависимости от задач вы можете использовать разные модели. При этом стоимость запросов будет отличаться. Информацию о тарифах, а также примеры расчетов ищите в разделе Тарифы и оплата.
Модели для генерации
Для получения списка моделей, доступных для генерации, используйте запрос GET /models
.
Для генерации доступны модели:
Название модели | Значение поля model | Размер контекста в токенах | Поддержка функций | Описание |
---|---|---|---|---|
GigaChat Lite | GigaChat | Контекст: 8192 | да | Модель c поддержкой функций, которая подойдет для решения более простых задач, требующих при этом максимальной скорости работы. Подробнее про работу с функциями |
GigaChat Lite+ | GigaChat-Plus | Контекст: 32768 | да | Модель с поддержкой функций, которая подойдет для задач, в которых нужно обрабатывать большой объем данных. Например: суммаризация статьей или транскрибаций звонков, извлечение информации из документов Подробнее про работу с функциями |
GigaChat Pro | GigaChat-Pro | Контекст: 8192 | да | Модель с поддержкой функций. Подробнее про работу с функциями. GigaChat Pro лучше следует сложным инструкциям и может выполнять более комплексные задачи: значительно повышено качество суммаризации, переписывания и редактирования текстов, ответов на различные вопросы. Модель хорошо ориентируется во многих прикладных направлениях — в частности, в экономических и юридических вопросах |
Чтобы получить ответ определенной модели, ее название нужно передать в поле model
запроса POST /chat/completions
:
curl -L -X POST 'https://gigachat.devices.sberbank.ru/api/v1/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Accept: application/json' \
-H 'Authorization: Bearer <токен_доступа>' \
--data-raw '{
"model": "GigaChat",
"messages": [
{
"role": "system",
"content": "Ты профессиональный переводчик на английский язык. Переведи точно сообщение пользователя."
},
{
"role": "user",
"content": "GigaChat — это сервис, который умеет взаимодействовать с пользователем в формате диалога, писать код, создавать тексты и картинки по запросу пользователя."
}
],
"stream": false,
"update_interval": 0
}'
Обращение к моделям раннего доступа
Модели для генерации GigaChat регулярно обновляются и у них появляются новые возможности, например, вызов функций. В таких случаях новые версии моделей некоторое время доступны в раннем доступе.
Для обращения к таким моделям используйте адрес https://gigachat-preview.devices.sberbank.ru/
, а к названию модели, которое передается в поле model
, добавьте постфикс -preview
.
Например, запрос на генерацию будет выглядеть следующим образом:
curl -L -X POST 'https://gigachat-preview.devices.sberbank.ru/api/v1/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Accept: application/json' \
-H 'Authorization: Bearer <токен_доступа>' \
--data-raw '{
"model": "GigaChat-Pro-preview",
"messages": [
{
"role": "system",
"content": "Ты профессиональный переводчик на английский язык. Переведи точно сообщение пользователя."
},
{
"role": "user",
"content": "GigaChat — это сервис, который умеет взаимодействовать с пользователем в формате диалога, писать код, создавать тексты и картинки по запросу пользователя."
}
],
"stream": false,
"update_interval": 0
}'
После запуска обновленных моделей в промышленном контуре, все модели начинают вести себя одинаково, независимо от того по какому адресу вы передаете запросы.
Полный список моделей в раннем доступе, можно получить с помощью запроса GET /models
:
curl -L -X GET 'https://gigachat-preview.devices.sberbank.ru/api/v1/models' \
-H 'Accept: application/json' \
-H 'Authorization: Bearer <токен_доступа>'
Модель для векторного представления текста
Для векторного представления текстов доступна модель Embeddings:
Название модели | Значение поля model | Описание |
---|---|---|
Embeddings | Embeddings | Базовая модель, доступная по умолчанию для векторного представления текстов |
Модель используется в запросах на создание эмбеддингов POST /embeddings
:
{
"model": "Embeddings",
"input": [
"Расскажи о современных технологиях"
]
}