One Day Offer
Ждём NLP Engineers с опытом более 2 лет
Онлайн
22 ноября 2025 года
Приглашаем в проект
GigaChat Pretrain
Готовим претрейн-данные для GigaChat и GigaChat Vision. Наша задача — превратить 40+ ПБ сырых данных в качественный датасет для лучшей в России LLM, так как именно данные — фундамент итогового качества модели
Требования к кандидатам
Middle, Middle+ и Senior. Опыт более 2 лет
Технологии
NLP
Python
LLM
Что будешь делать
- Генерировать синтетические данные: создавать математические задачи, программный код и произвольные синтетические данные на основе сидов‑документов из Интернета
- Исследовать влияние токенизации на качество модели: проводить эксперименты и анализировать результаты, оформляя выводы в научные статьи
- Решать задачи кластеризации миллиардов документов: разрабатывать и применять эффективные алгоритмы для группировки огромных массивов текстов
Узнать больше
Этапы мероприятия
Команда может вносить изменения в расписание
Презентация команды
10:00
Техническое интервью
11:00
Обратная связь
18:00
Преимущества работы
Технологичный офис в Москве
Проекты масштаба всей страны, которыми можно гордиться
Конкурентная зарплата и ДМС с первого дня трудоустройства
Влияем на 100 млн клиентов каждый день
Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
Технологичный офис в Москве
Конкурентная зарплата и ДМС с первого дня трудоустройства
Проекты масштаба всей страны, которыми можно гордиться
Влияем на 100 млн клиентов каждый день
Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
Откликнуться
Заполни заявку, и наш HR‑менеджер свяжется с тобой