Модели GigaChat
Обновлено 24 апреля 2024
Сервис GigaChat дает доступ к нескольким моделям для генерации и одной модели для создания векторного представления текста.
В зависимости от задач вы можете использовать разные модели. При этом стоимость запросов будет отличаться. Информацию о тарифах, а также примеры расчетов ищите в разделе Тарифы и оплата.
Модели для генерации
Для получения списка моделей, доступных для генерации, используйте запрос GET /models
.
Для генерации доступны модели:
Название модели | Значение поля model | Кол-во параметров Размер контекста в токенах | Поддержка функций | Описание |
---|---|---|---|---|
GigaChat Lite | GigaChat | Параметры: 7 млрд Контекст: 8192 | нет | Модель подойдет для решения более простых задач, требующих при этом максимальной скорости работы |
GigaChat Lite | GigaChat-preview | Параметры: 7 млрд Контекст: 8192 | да | Модель с поддержкой функций, которая доступна для раннего тестирования до 30 апреля. Для доступа к модели передайте "model": "GigaChat-preview". С 30 апреля модель заменит предыдущую версию GigaChat Lite и будет доступна как GigaChat. Подробнее про работу с функциями |
GigaChat Lite+ | GigaChat-Plus | Параметры: 7 млрд Контекст: 32768 | нет | Модель подойдет для задач, в которых нужно обрабатывать большой объем данных. Например: суммаризация статьей или транскрибаций звонков, извлечение информации из документов |
GigaChat Lite+ | GigaChat-Plus-preview | Параметры: 7 млрд Контекст: 32768 | да | Модель с поддержкой функций, которая доступна для раннего тестирования до 30 апреля. Для доступа к модели передайте "model": "GigaChat-Plus-preview". С 30 апреля модель заменит предыдущую версию GigaChat Lite+ и будет доступна как GigaChat-Plus. Подробнее про работу с функциями |
GigaChat Pro | GigaChat-Pro | Параметры: 29 млрд Контекст: 8192 | нет | Модель с поддержкой функций. Подробнее про работу с функциями. GigaChat Pro лучше следует сложным инструкциям и может выполнять более комплексные задачи: значительно повышено качество суммаризации, переписывания и редактирования текстов, ответов на различные вопросы. Модель хорошо ориентируется во многих прикладных доменах — в частности, в экономических и юридических вопросах |
Чтобы получить ответ определенной модели, ее название нужно передать в поле model
запроса POST /chat/completions
:
{
"model": "GigaChat",
"messages": [
{
"role": "user",
"content": "Привет! Как дела?"
}
],
"temperature": 1.0,
"top_p": 0.1,
"n": 1,
"stream": false,
"max_tokens": 512,
"repetition_penalty": 1.0,
"update_interval": 0
}
Модель для векторного представления текста
Для векторного представления текстов доступна модель Embeddings:
Название модели | Значение поля model | Описание |
---|---|---|
Embeddings | Embeddings | Базовая модель, доступная по умолчанию для векторного представления текстов |
Модель используется в запросах на создание эмбеддингов POST /embeddings
:
{
"model": "Embeddings",
"input": [
"Расскажи о современных технологиях"
]
}