Ниже перечислены шаги подключения классификатора к смартапу.
Настройка конфигурационного файла
Первый шаг – это за дание параметров в конфигурационном файле смартапа chatbot.yaml
.
morphology
Позволяет выбрать библиотеку для морфологического анализа слов. Используется при обработке паттернов ~
, $lemma
, $morph
, а так же в функции $nlp.parseMorph
.
Укажите одну из библиотек:
aot
— используется библиотека от AOT.ru;default
— используется стандартная библиотека, наиболее подходящий анализатор для русского языка;pyMorphy
— используется библиотека pyMorphy, наиболее качественный анализатор для русского языка.
tokenizer
Токенизатор позволяет задать правила, используемые для разбиения текста на слова.
Поддерживаемые типы токенизаторов:
regexp
— простой токенизатор на регулярных выражениях.srx
— конфигурируемый токенизатор на базе настраиваемых правил сегментации