Дообучение модели
Пользователи GigaChat API могут дообучить модель с помощью API дообучения по методу
Дообучение позволит адаптировать базовую модель GigaChat под конкретные задачи бизнеса или специализированные области знаний.
Кому пригодится:
- Корпоративным клиентам – для внедрения отраслевой терминологии (медицина, юриспруденция, финансы).
- Разработчикам – для кастомизации стиля ответов (например, под бренд-голос компании).
- Исследователям – для экспериментов с узкоспециализированными датасетами.
Требования к датасету
Для дообучения модели необходим датасет в формате JSON-массива с диалогами между пользователем и ассистентом. Идеальный объем данных начинается от 600 диалогов — меньшее количество может повлиять на итоговое качество работы модели.
Пример сообщения
[
{
"role": "system",
"content": "",
"trainable": false,
"message_index": 0
},
{
"role": "user",
"content": "Опишите свой последний приключенче ский опыт (путешествие, экспедиция, занятие спортом). Нарисуйте одну из сцен из вашего приключения.",
"trainable": false,
"message_index": 1
},
{
"role": "assistant",
"content": "К сожалению, я не могу рисовать, так как я компьютерная программа. Но я могу описать свой последний приключенческий опыт.\n\nМой последний приключенческий опыт был в походе по горам в Кавказском заповеднике. Мы шли в группе из 10 человек и провели в горах три дня.\n\nВ первый день мы начали наш путь с небольшого подъема к хребту. Здесь мы увидели захватывающие виды на горные вершины и долины. Второй день был самым сложным, так как мы должны были преодолеть большое количество крутых склонов и спуститься по крутым склонам. Но это стоило того — вид на окружающую природу был потрясающим!\n\nВ третий день мы дошли до вершины и сделали фотографии для памятных альбомов. Затем мы начали спускаться к базовому лагерю, который находился у подножия гор.\n\nПоследний день путешествия был отличным — мы посетили местный рынок и попробовали местные блюда. Это была замечательная поездка с невероятными видами на горы и природу.",
"trainable": true,
"message_index": 2
}
]
Возможные значения: [system, user, assistant]
Роль отправителя: system — системный промпт, user — запрос пользователя, assistant — ответ модели.
Текст сообщения.
Пригодность сообщения для обучения: true — пригодно, false — непригодно.
Порядковый номер сообщения в диалоге (начинается с 0).
Этапы дообучения
Процесс дообучения проходит в не сколько этапов с помощью специальных API-методов:
-
Загрузите подготовленный датасет для дообучения в хранилище, используя метод POST /file.
-
Выберите одну из доступных для дообучения моделей:
GigaChat-2,GigaChat-2-ProилиGigaChat-2-Max.Подробнее о моделях — на странице Модели GigaChat.
-
Создайте задачу на дообучение. Для этого используйте метод POST /fine_tuning/jobs, указав:
- название базовой модели, которую планируется дообучить;
- ID датасета, загруженного в хранилище.
-
Для генерации с помощью дообученной модели используйте метод POST /chat/completions. В запросе укажите название дообученной модели в формате
ft:{base_model}:{suffix}:{ID}. Посмотреть названия дообученных моделей можно с помощью метода GET /fine_tuning/jobs или в ответе на создание задачи.
Отслеживание статуса задачи
Проверить состояние запущенной задачи дообучения можно с помощью метода GET /fine_tuning/job-id.
Пример запроса
{
"id": "string",
"model": "string",
"created_at": "2025-03-18T12:56:18.365Z",
"fine_tuned_model": null,
"status": "ready",
"training_file": "string"
}
Идентификатор задачи на дообучение.
Базовая модель для дообучения.
Дата и время создания сообщения.
Название дообученой модели.
Возможные значения: [in progress, ready, failed, cancelled, succeeded]
Статус задачи на дообучение.
Идентификатор файла, загруженного в хранилище, с данными для дообучения. Подробнее о работе с файлами – в разделе Хранилище файлов.
Также можно просмотреть статус всех созданных задач, используя метод GET /fine_tuning/jobs.
Отмена задачи
Для отмены задачи на дообучение используйте метод POST /fine_tuning/cancel-job. Задача переводится в статус cancelled.