Благодаря новой LLM GigaChat лучше следует инструкциям и может выполнять более сложные задания: улучшилось качество суммаризации, рерайтинга и редактирования текстов, а ответы на вопросы стали точнее.
По результатам тестов новый GigaChat уже превзошёл схожие по количеству параметров иностранные аналоги в бенчмарке MMLU.
Достичь таких результатов получилось за счёт множества экспериментов по улучшению модели и повышению эффективности её обучения. В частности, команда использовала фреймворк для обучения больших языковых моделей с возможностью шардирования весов нейросети по видеокартам, что позволило сократить потребление памяти на них.
В числе первых доступ к API новинки получат бизнес-клиенты Сбера и участники академического сообщества.
Узнать больше о возможностях GigaChat можно на странице сервиса, а примеры удачных запросов есть в базе знаний.
Источник: SBER PRESS