ym103884448ym88659208ym87991671
Ждём NLP Engineers
One Day Offer
Ждём NLP Engineers с опытом более 2 лет
Онлайн
22 ноября 2025 года
Приглашаем в проект

GigaChat Pretrain

Готовим претрейн-данные для GigaChat и GigaChat Vision. Наша задача — превратить 40+ ПБ сырых данных в качественный датасет для лучшей в России LLM, так как именно данные — фундамент итогового качества модели
GigaChat PretrainGigaChat Pretrain
Требования к кандидатам
Middle, Middle+ и Senior. Опыт более 2 лет

Технологии

NLP
Python
LLM

Что будешь делать

  • Генерировать синтетические данные: создавать математические задачи, программный код и произвольные синтетические данные на основе сидов‑документов из Интернета
  • Исследовать влияние токенизации на качество модели: проводить эксперименты и анализировать результаты, оформляя выводы в научные статьи
  • Решать задачи кластеризации миллиардов документов: разрабатывать и применять эффективные алгоритмы для группировки огромных массивов текстов
Этапы мероприятия
Команда может вносить изменения в расписание

Презентация команды

10:00

Техническое интервью

11:00

Обратная связь

18:00
Преимущества работы
Технологичный офис в Москве
Проекты масштаба всей страны, которыми можно гордиться
Конкурентная зарплата и ДМС с первого дня трудоустройства
Влияем на 100 млн клиентов каждый день
Влияем на 100 млн клиентов каждый день
Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБГибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
Технологичный офис в Москве
Конкурентная зарплата и ДМС с первого дня трудоустройства
Проекты масштаба всей страны, которыми можно гордиться
Влияем на 100 млн клиентов каждый день
Влияем на 100 млн клиентов каждый день
Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ

Откликнуться

Заполни заявку, и наш HR‑менеджер свяжется с тобой
Фамилия
Имя
Email
Телефон
Прикрепить резюме
PDF, DOCX
Файл до 4MB
ПАО Сбербанк использует cookie для персонализации сервисов и удобства пользователей.
Вы можете запретить сохранение cookie в настройках своего браузера.