<< Click to Display Table of Contents >> Интеллектуальные возможности > Сервисы Directum Ario > Адаптация сервисов Ario под бизнес-задачи компании Настройка классификации |
Классификация документа – один из этапов обработки, на котором определяется, к какому классу относится документ. Например, в качестве классов могут использоваться виды документов: входящее письмо, договор, акт выполненных работ и т.д. Для классификации необходимо создать и обучить классификатор на выборке документов каждого класса. В результате обучения формируется модель классификации, на основании которой выполняется классификация документов.
Модели классификации – это совокупность файлов, которые содержат набор признаков, характерных для каждого класса, а также скрипты и алгоритмы, выполняющие классификацию. Для начала обработки документов с помощью сервисов Directum Ario можно использовать базовые модели классификации, которые входят в поставку:
•модель классификации по первым страницам (DocumentFirstPageClassifierModel.zip), которая определяет, является ли страница файла первой в документе. Модель обучена на примерах первых и не первых страниц документов. С ее помощью происходит разделение комплекта на отдельные документы;
•модель классификации по видам документов (DocumentKindClassifierModel.zip), которая по тексту документа определяет, к какому виду он относится. Модель обучена на примерах различных видов документов и позволяет классифицировать следующие документы, оформленные по правилам и рекомендациям российского законодательства:
•входящее письмо;
•договор;
•дополнительное соглашение;
•корректировочный счет-фактура;
•счет на оплату (в том числе англоязычный);
•счет-фактура;
•товарная накладная;
•универсальный передаточный документ;
•универсальный корректировочный документ.
Настройка классификации под бизнес-задачи
Чтобы адаптировать процесс классификации документов в Directum RX, определите потребности компании:
•необходимо повысить точность классификации реальных документов организации. Для этого в Directum RX включено автоматическое дообучение классификатора по типу документов. Оно выполняется с помощью фонового процесса «Интеллектуальные функции. Дообучение классификатора по типам документов»;
•появился новый вид документа, который нужно добавить в существующий классификатор. Для этого его нужно дообучить вручную с помощью утилиты RxCmd или с помощью HTTP-запросов к API Directum Smart Service;
•необходимо классифицировать документы по другому принципу. В этом случае нужно создать и обучить новый классификатор с помощью утилиты RxCmd или с помощью HTTP-запросов к API Directum Smart Service.
ВАЖНО. Классификатор по первым страницам нельзя обучить или дообучить самостоятельно из-за его особенностей. Если необходимо разделять комплекты документов по логике, отличающейся от стандартной, обратитесь в службу поддержки Directum RX.
© Компания Directum, 2024 |