Сбер открыл доступ к моделям LLM ruGPT-3.5 13B и обновлённой mGPT 13B
21 июля 2023

Сбер открыл доступ к моделям LLM ruGPT-3.5 13B и обновлённой mGPT 13B

Модели, которые лежат в основе GigaChat, теперь опубликованы на HuggingFace и доступны всем разработчикам.

RuGPT-3.5 13B — это продвинутая модель генерации текста на русском языке, которая построена на архитектуре GPT-3 от OpenAI и обучена на корпусе текстов размером около 1 Тб.

mGPT 13B — это многоязычная модель, способная генерировать тексты на 61 языке, включая языки стран СНГ и малых народов России. Модель можно использовать для решения различных задач в области обработки естественного языка.

Источник: SBER PRESS

ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.