Обучение и дообучение классификатора
<< Click to Display Table of Contents >> Интеллектуальные возможности > Сервисы Directum Ario > Описание API Ario > Отладка классификатора Обучение и дообучение классификатора |
Для начала работы с созданным классификатором его нужно обучить. В дальнейшем его можно дообучать, например, чтобы:
•распознать дополнительные классы документов или новые формы документов в уже существующих классах;
•повысить точность классификации, добавив к исходной выборке новые документы тех же классов.
Разница обучения и дообучения состоит в том, что:
•при дообучении к результатам первичного обучения модели добавляются результаты обучения на вновь подобранных документах. Такой механизм улучшает модель и повышает точность классификации документов;
•при дообучении существуют ограничения;
•при обучении нет исходных данных, модель обучается «с нуля»;
•обучение возможно при наличии минимум двух новых классов документов.
Время обучения и дообучения зависит от количества документов в подготовленной выборке.
Обучать или дообучать классификаторы можно с помощью асинхронного или синхронного метода. Асинхронный метод используется разработчиками для управляемого обучения за счет распараллеливания потоков. Синхронный метод используется администраторами для упрощенного обучения за счет минимального количества действий со стороны администратора.
Запросы на обучение и дообучение классификатора перечислены в таблице:
Запрос |
Описание |
В запросе указывается путь к папке с подготовленными для обучения документами. Запрос используется для обучения и дообучения многоклассового классификатора |
|
В запросе указывается путь до подготовленного CSV-файла. Запрос чаще используется для обучения и дообучения многозначного классификатора, но подходит и для многоклассового |
|
В запросе передается подготовленный CSV-файл. Запрос чаще используется для обучения и дообучения многозначного классификатора, но подходит и для многоклассового |
В результате обучения и дообучения формируется новая модель классификации.
© Компания Directum, 2024 |