ym88659208ym87991671
Работа в режиме рассуждений | Документация для разработчиков

Работа в режиме рассуждений

Обновлено 2 июля 2026

Режим рассуждений повышает качество генерации, когда ответ на вопрос зависит от комбинации действий, порядка операций или неявных ограничений. Например:

  • в арифметических задачах с несколькими операциями:

    (34 + 67) * 2 - 15
  • в логических задачах с условиями:

    Если все А — Б, некоторые Б — В, то все ли А — В?
  • при составлении маршрута:

    Встреча в 14:00, дорога 45 минут, нужно прибыть за 10 минут

Генерация в режиме рассуждений расходует больше токенов. Токены, потраченные на рассуждения, оплачиваются согласно выбранному тарифу.

Функциональность доступна клиентам ООО «Салют для Бизнеса» при запросах к адресу https://api.giga.chat/.

В этом разделе вы узнаете как запускать модели GigaChat в режиме рассуждений в зависимости от версии эндпоинта /chat/completions.

Запуск модели в режиме рассуждений

Для запуска режима рассуждений, в запросе к эндпоинту /chat/completions задайте параметр effort, который отвечает за глубину рассуждений модели. Это можно сделать по-разному, в зависимости от версии эндпоинта.

Запрос формата v2

Чтобы запустить режим рассуждений в запросе POST /v2/chat/completions передайте параметр model_options.reasoning.effort:

curl --request POST \
--url https://api.giga.chat/v2/chat/completions \
--header 'Authorization: Bearer <токен_доступа>' \
--header 'Content-Type: application/json' \
--data '{
"model": "GigaChat-2-Max",
"messages": [
{
"role": "user",
"content": [
{
"text": "Сравни REST, GraphQL и gRPC для микросервисной архитектуры высоконагруженной системы. Учитывай производительность, удобство разработки и обратную совместимость."
}
]
}
],
"model_options": {
"reasoning": {
"effort": "medium"
}
}
}'

Ответ модели будет включать два сообщения. Описание рассуждений возвращается в отдельном сообщении с ролью reasoning.

{
"model": "GigaChat-2-Max:2.0.30.01",
"created_at": 1782481456,
"messages": [
{
"role": "reasoning",
"content": [
{
"text": "<Рассуждения>"
}
]
},
{
"role": "assistant",
"content": [
{
"text": "<Ответ модели>"
}
]
}
],
"finish_reason": "stop",
"usage": {
"input_tokens": 60,
"input_tokens_details": {
"prompt_tokens": 60,
"cached_tokens": 3
},
"output_tokens": 1287,
"total_tokens": 1347
}
}

Запрос формата v1

Чтобы запустить режим рассуждений в запросе POST /v1/chat/completions передайте параметр reasoning_effort в корне сообщения:

Для отправки запросов формата V1 используйте GigaChat SDK версии 0.2.1 и выше. Запрос можно сформировать в виде простого словаря или задать с помощью моделей.

from gigachat import GigaChat
from gigachat.models import Chat, Messages, MessagesRole

request_dict = {
"model": "GigaChat-2-Max",
"messages": [
{
"role": "user",
"content": "Как полететь на луну?",
}
],
"reasoning_effort": "medium",
}

# Использование моделей для запуска рассуждений
request_model = Chat(
model="GigaChat-2-Max",
messages=[Messages(role=MessagesRole.USER, content="Как полететь на луну?")],
reasoning_effort="medium",
)

with GigaChat(
base_url="https://api.giga.chat/v1",
credentials="<ключ_авторизации>",
scope="GIGACHAT_API_CORP",
verify_ssl_certs=False,
) as client:
response_dict = client.chat(request_dict)
response_model = client.chat(request_model)
print("Ответ на запрос со словарем:")
print(response_dict)
print("\nРассуждения:")
print(response_dict.choices[0].message.reasoning_content)
print("\n" + "="*50 + "\n")
print("Ответ на запрос с моделями:")
print(response_model)
print("\nРассуждения:")
print(response_model.choices[0].message.reasoning_content)

При запросе в формате V1 описание рассуждений возвращается в сообщении с ролью assistant в поле reasoning_content:

{
"choices": [
{
"message": {
"content": "<Ответ модели>",
"role": "assistant",
"reasoning_content": "<Рассуждения>"
},
"index": 0,
"finish_reason": "stop"
}
],
"created": 1782475405,
"model": "GigaChat-2-Max:2.0.30.01",
"object": "chat.completions",
"usage": {
"prompt_tokens": 31,
"completion_tokens": 974,
"total_tokens": 1005,
"precached_prompt_tokens": 4
}
}

Потоковая генерация в режиме рассуждений

Вы можете одновременно включить режим рассуждений и потоковую генерацию токенов. Для этого передайте в запросе параметр "stream": true.

При обработке ответа учитывайте, что формат потока событий отличается в разных версиях запроса.

Заметили ошибку?

Выделите текст и нажмите Ctrl + Enter, чтобы сообщить нам о ней

ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей. Вы можете запретить сохранение cookie в настройках своего браузера.