Вы можете научить чат-бот использовать для работы базу знаний - базу готовых документов. При этом вам будет не нужно разрабатывать описания интентов и ответов на них.
Для создания базы знаний чат-бота загрузите или предоставьте доступ к нужным документам (текстовым файлам). GigaChat в ходе выполнения сценария классифицирует вопрос и представит ответ на основании имеющихся документов.
В зависимости от объема документов и сложности вопроса время ответа может составлять 3 секунды и более.
Создание базы знаний
Для создания базы знаний документов чат-бота:
Откройте проект сценария.
Перейдите в раздел База знаний. В результате откроется окно Документы.
Загрузите нужный файл. Начнется процесс загрузки и разбора файла. В случае ошибки валидации файла будет отображено сообщение об ошибке в области загрузки файла. После загрузки вам будет доступна информация о его размере, дате добавления и статусе:
- Можно тестировать – документ используется для генерации ответа в тестовом виджете.
- Используется в каналах – документ используется для ответов чат-бота в опубликованных каналах.
- Ошибка – документ загружен с ошибкой, его можно только удалить. Этот статус также может быть присвоен документу не только после загрузки, но и в ходе обучения или публикации. Ошибка – это статус документа, который говорит о том, что после текущее действие с документом завершилось ошибкой. Статусы Загрузка и Парсинг – промежуточные статусы, отображающие процесс добавления документа в базу знаний. Документы в этом статусе нельзя удалить или отключить.
Для добавления нового файла нажмите Добавить.
Для загрузки доступны форматы pdf и txt (в кодировке UTF-8).
При формировании ответов на основании документов используется только их текстовое содержимое. Иллюстрации и любой и другой мультимедиа контент в ответах использоваться не будет.
Размер одного файла не должен превышать 50 Мб.
Ограничения
Размер базы знаний одного проекта ограничен: не более 300 000 слов.
Размер документа измеряется в словах и определяется после парсинга – распознавания текстового содержимого документа.
Управление документами базы знаний
Для гибкой настройки работы чат-бота вы можете управлять загруженными ранее документами, например:
- Отключить документ. Документ можно отключить в статусе Можно тестировать и Используется в каналах через контекстное меню файла. Отключенный документа не будет использоваться ни в тестировании, ни в опубликованном канале.
- Включить документ. Включение опубликованного документа делает его доступным для дальнейшей работы. После включения сохранится предыдущий статус документа. Например, если документ был в статусе Используется в каналах, после включения он так же будет сразу доступен в опубликованых каналах.
- Удалить документ. Удаление документа приводит к его безвозвратному удалению из базы знаний и для поиска он больше использоваться не будет. Документы в статусе Используется в каналах перед удалением необходимо отключить.
До момента публикации и запуска тестового виджета версии для тестирования основной считается опубликованная ранее версия.
Настройка приоритетов запроса
Вы можете настроить приоритет срабатывания ответов из документов относительно результатов классификации в сценарии (интентов, примеров и паттернов). Этот параметр определяет, в каких случаях должны срабатывать ответы из базы знаний.
Для этого в разделе Настройки базы знаний по документам выберите необходимый параметр Приоритет срабатывания:
- Низкий – найденные ответы из базы знаний по документам срабатывают только в том случае, если не найдено подходящих вариантов по интентам, примерам или паттернам.
- Высокий – найденные ответы из базы знаний по документам срабатывают в первую очередь, при этом если в документах не найдено ничего подходящего, должны проверяться варианты по интентам, примерам и паттернам.
Тестирование базы знаний и сценария
Тестирование базы знаний
Откройте проект сценария SaluteBot.
Перейдите в раздел База знаний.
Откройте раздел базы знаний на основе файла, куда ранее был успешно загружен файл. Будет представлена форма редактирования раздела базы знаний.
Нажмите Тестировать. В результате будет открыт тестовый виджет поиска по документам.
Напишите запрос и отправьте его. Начнется обработка запроса.
В этом случае будет тестироваться только база знаний по документам. Для тестового запроса используются все включенные документы в статусах Можно тестировать и Используется в каналах. В результатах будет отображен вариант ответа, найденный в добавленных документах, и фрагмент текста, на основании которого была выполнена классификация.
Тестирование сценария с базой знаний
Для тестирования сценария с учетом базы знаний по документам используйте тестовый виджет.
При запросе будет учитывается выставленный приоритет базы знаний по документам. Для тестового запроса по документам используются все включенные документы в статусах Можно тестировать и Используется в каналах.
Подробнее об тестировании чат-ботов.
Внедрение базы знаний на основе документа
Перед внедрением не забудьте добавить интеграцию с чат-платформой.
После успешного завершения тестирования чат-бота в подключенных каналах необходимо внедрить документ.
Для этого:
Откройте проект сценария SaluteBot.
Перейдите в раздел База знаний.
Откройте раздел базы знаний на основе файла, куда ранее был успешно загружен файл. Будет представлена форма редактирования раздела базы знаний.
Нажмите Внедрить. Обратите внимание: после обучения результаты будет использованы для бота в проме. Будет отображена публикация модели. Если в процессе обучения возникла ошибка, будет представлено сообщение об ошибке.
В результате внедрения все документы в статусе Можно тестировать будут опубликованы и получат статус Используется в каналах. На основании этих документов чат-бот будет отвечать клиентам в подключенных каналах интеграции SaluteBot. Загруженные файлы будут отображены в списке файлов раздела в статусе Актуальны (кроме файлов, отключенных вручную).
Экспорт и импорт базы знаний
Экспорт базы знаний
Чтобы экспортировать в архив базу знаний:
Откройте проект в личном кабинете.
Перейдите в настройки проекта.
Выберите вкладку Экспорт / Импорт.
Нажмите кнопку Экспорт базы знаний.
Браузер загрузит zip-архив базы знаний.
Обратите внимание: при экспорте файла не будут экспортированы документы, находящиеся в процессе загрузки и документы, загруженные с ошибкой.
При эспорте проекта документы будут экспортированы вместе с проектом в архив по умолчанию. Экспортируются только документы в статусе Можно тестировать и Используется в каналах. Документы, находящиеся в процессе загрузки и загруженные с ошибкой экспортированы не будут.
Также возможен экспорт проекта без документов. По умолчанию проект будет экспортироваться с документами базы знаний.
Импорт базы знаний
Перед импортом убедитесь, что все необходимые файлы упакованы в архив.
После импорта проекта документы в базе знаний будут загружены и обучены повторно. Для перехода в статус Используется в каналах нужно выполнить внедрение вручную.