Настройка классификации с помощью запросов к API
<< Click to Display Table of Contents >> Интеллектуальные возможности > Сервисы Directum Ario > Адаптация сервисов Ario под бизнес-задачи компании > Настройка классификации Настройка классификации с помощью запросов к API |
Для классификации документов обучается классификатор, в результате чего формируется модель классификации. В поставку сервисов Directum Ario входят обученные классификаторы по видам документов и первых страниц.
Иногда требуется создание и обучение нового классификатора по видам. Например, если:
•организация работает с видами документов, которые не входят в перечень классифицируемых;
•в организации принято оформление документов, отличное от общепринятых форматов.
В процессе работы также можно дообучать базовые модели классификации из поставки. Например, когда:
•нужно «научить» классификатор распознавать дополнительные классы документов;
•в организации появились новые формы документов для уже существующих классов;
•нужно повысить точность классификации, добавив к исходной выборке новые документы тех же классов.
Разница обучения и дообучения состоит в том, что:
•при обучении нет исходных данных, модель обучается «с нуля»;
•при дообучении к результатам обучения на первичных документах добавляются результаты обучения на вновь подобранных документах.
Как правило, классификатор содержит несколько моделей классификации, так как в результате каждого цикла обучения и дообучения формируется новая, улучшенная модель, но только одна из них может быть действующей.
Чтобы обучить или дообучить модель классификации, используйте один из способов:
•укажите путь к папке с документами. Используется для обучения многоклассового классификатора;
•передайте CSV-файла;
•укажите путь к папке с CSV-файлом.
Последние два способа чаще используются при обучении и дообучении многозначного классификатора, но подходят и для многоклассового.
ВАЖНО. Обучение классификатора возможно при наличии минимум двух новых классов документов. Время обучения зависит от количества документов.
Порядок обучения и дообучения классификатора с помощью запросов к API
1.Cоздайте классификатор. Если дообучаете существующий классификатор, пропустите шаг. Для каждого типа классификации, например по видам документов, по типу финансовой услуги или по предмету спора, нужно создавать и обучать свой классификатор. 2.Подготовьте набор документов. 3.Обучите или дообучите модель классификации. При дообучении учитывайте ограничения. 4.Проанализируйте результаты обучения или дообучения. 5.Протестируйте классификатор с помощью запроса на классификацию файла. ПРИМЕЧАНИЕ. Для объективной оценки работы классификатора выбирайте документ, относящийся к одному из видов, на которых обучен классификатор. При этом документ не должен входить в исходную выборку для обучения. 6.Перенесите модели в продуктивный контур и опубликуйте их. |
© Компания Directum, 2024 |