Продукты из этой статьи:
LLMs / LLM модель (Large Language Model, большая языковая модель) — нейронная лингвистическая сеть, обученная на огромных корпусах данных для понимания и обработки текста. Искусственный интеллект умеет:
Известные языковые модели — GPT OpenAI (GPT-3.5 и GPT-4 в ChatGPT), PaLM и Gemini от Google (Bard), Copilot от Microsoft и другие.
Российский аналог — GigaChat. Он поддерживает более 100 языков, но фокусируется преимущественно на английском и русском. Точность ответа зависит от сложности задачи и качества пользовательских запросов (промптов).
GigaChat — генеративная нейросеть. Это значит, что она умеет создавать статьи и изображения. Генерация картинок и текста стала возможной благодаря ruGPT-3.5 с 29 млрд параметров, Kandinsky 3.0, ruCLIP и FRED-T5.
В будущем нейросети смогут:
Для сравнения используются метрики:
GigaChat сдал на 67 баллов ЕГЭ по обществознанию. Этого достаточно для поступления в ВШЭ.
Чтобы ИИ распознавал запрос и интент пользователя, а затем генерировал ответ, нужно обучить нейросеть с использованием Machine Learning, NLP Modeling и других.
Чтобы создать LLM, необходимо:
Принцип работы языковой модели прост — предсказывать следующее слово в предложении. Допустим, мы просканировали весь интернет и нашли все случаи, где встречается фраза «GigaChat используют для».
Дальше мы взяли все слова, которые следуют за строкой «GigaChat используют для» и вычислили, с какой вероятностью встречается каждое.
GigaChat используют для + | бизнеса | 10% |
---|---|---|
маркетинга | 10% | |
генерации | 10% | |
SEO | 10% | |
написания | 10% | |
создания | 10% | |
разработки | 10% | |
поиска | 10% |
В нашем случае искусственный интеллект, вероятно, добавит слово «бизнеса». Фраза будет звучать как «GigaChat используют для бизнеса». Искусственный интеллект может выбрать и другое продолжение ― всё зависит от настроек и сформулированного запроса.
Например, может появиться фраза «GigaChat используют для генерации». Дальше искусственный интеллект уже работает с ней: может добавить «картинок», и результат будет выглядеть как «GigaChat используют для генерации картинок».
Large Languages Models должны понимать смысл текста, чтобы давать естественный ответ. Поэтому их обучают на корпусах данных, а затем дообучают и настраивают.
Главные стадии обучения нейросети приведены в таблице ниже (на основе GigaChat).
Стадия | Предобучение (Pre-Training) | Alignment: Supervised- Finetuning (дообучение прошлой языковой модели) | Alignment: обучение с подкреплением |
---|---|---|---|
Данные | Книги и новости на русском и английском, публикации в СМИ и научных журналах, доклады, разговорная речь — чтобы получить чистые тексты нужно обработать петабайты исходных данных | Более 500 000 пар [инструкция, ответ] | 100 000+ пар [инструкция, N отранжированных ответов LLM] |
Для чего необходимо (цель) | Получить знания, изучить языки. На этапе предобучения развивают «ум» LLM-модели | Развить умение следования инструкциям, форматам, правильно использовать контекст диалога | Совершенствовать умение следовать инструкциям |
Для создания и обучения GigaChat потребовалось 7.50 Пт исходных данных — это как 50 Ленинских библиотек или вся мировая литература, увеличенная в 2,5 раза. Для подготовки нейросетевой языковой модели необходимы вычислительные мощности — тысячи GPU. Нужно столько же ресурсов, сколько уходит на электрообеспечение Лужников в течение четырёх месяцев.
Ограничения использования искусственного интеллекта в бизнесе и других сферах можно условно разделить на три группы:
Разработчики GigaChat позаботились о том, чтобы языковая модель была безопасной и удобной, но при этом использование и внедрение искусственного интеллекта было простым.
В частности, установлены тематические ограничения запросов. GigaChat может ответить: «Я не знаю». Например, когда его пытаются запутать или спровоцировать.
Основные кейсы | Возможности и настройки GigaChat | |
Качество генерации | Сложность работы с русским языком | Обучена на русском языке, учитывает национальный культурный код и особенности построения фраз лингвистически |
Запутывание контекста генерации (омонимы/омографы, переключение морфологических веток) | Предобучение, дообучение, обучение с подкреплением. Пользователи оценивают ответы GigaChat: каждая оценка делает нейросеть умнее и точнее | |
Недостоверность, генерация галлюцинаций | Нейросеть может уточнить запрос или попросить сформулировать его более корректно. Также искусственный интеллект может признаться, что не знает ответ (и тем самым сэкономит время пользователя) | |
Потеря контекста | GigaChat умеет работать с контекстом разной структуры (например, можно передавать историю взаимодействия). Нейросеть является stateless-сервисом и не хранит историю взаимодействия | |
Провокации, спорные этические вопросы, нецензурная лексика | Тематические ограничения запросов позволяют избегать спорных тем | |
Лимиты, квоты | Зарубежные сервисы сложно подключить и использовать | GigaChat — российское решение. Сервис доступен бесплатно. Бизнесу предлагают GigaChat API |
Ограничение размера запроса и ответа | Промпт с контекстом и ответом может содержать в среднем до 2000 слов или примерно шесть страниц A4, набранных шрифтом с кеглем 14 | |
Безопасность, защита пользовательских и корпоративных данных | Утечки данных, запреты на использование иностранных сервисов на рабочем месте | При разработке нейросети использованы банковские стандарты безопасности. По умолчанию пользовательские запросы и ответы не хранятся и не применяются для дообучения ИИ. Все данные шифруются и хранятся в конфиденциальной базе |
Сценарии внедрения искусственного интеллекта в бизнесе различны:
Внедрение GigaChat позволяет автоматизировать часть бизнес-процессов:
Бизнесу доступны сервисы:
Мультимодальность языковых моделей позволяет решать различные задачи. GigaChat можно попросить сгенерировать презентацию и нарисовать картинки к ней.
Возможности GigaChat можно оценить в виртуальных ассистентах Салют в приложениях и на умных устройствах Сбера (SberBoom, SberBox, SberBox Top, Салют ТВ, SberBoom Mini и других).
Бизнес может подключить GigaChat API и создать собственные сервисы с использованием искусственного интеллекта. Например, чат-ботов, SaaS по генерации текстов и картинок, решения для речевой аналитики.
Также можно подключить готовые решения Сбера, в которых внедрён GigaChat.
Продукты из этой статьи: