<< Click to Display Table of Contents >> Интеллектуальные возможности > Сервисы Directum Ario > Практические рекомендации > Как настроить иерархическую классификацию Настройка иерархической классификации |
В прикладной системе реализуйте сопоставление классов верхнеуровневого классификатора и классификаторов последующих уровней. Это можно сделать одним из способов:
•с помощью дополнительных классификаторов;
•путем последовательной классификации.
В обоих случаях классификация выполняется в несколько запросов на обработку документов.
Рекомендации:
•рассчитывайте итоговую вероятность классификации как произведение вероятностей верхнеуровневого классификатора и выбранного классификатора подуровня;
•в первом запросе документ конвертируется в формат PDF с метаданными. В последующих запросах рекомендуется отправлять на обработку уже сконвертированный PDF-файл, полученный по идентификатору GUID. Обработка такого файла будет выполнена существенно быстрее, чем при отправке исходного документа.
1.Классифицируйте документы с помощью POST-запроса «Классификация файла несколькими классификаторами», передав классификаторы подуровней в качестве дополнительных. Для этого в теле запроса укажите параметры: •ClassifierId – идентификатор верхнеуровневого классификатора; •AdditionalClassifierIds – идентификаторы классификаторов подуровней. В результате для классификации документов будут использоваться все классификаторы. Результаты обработки возвращаются в параметрах: •classificationResult – для верхнеуровеного классификатора; •additionalClassificationResults – для классификаторов подуровней. 2.В прикладной системе реализуйте логику для сопоставления классов верхнеуровневого классификатора (classificationResult) с классификаторами подуровней (additionalClassificationResults). Для этого разработайте справочник соответствия. Подробнее см. руководство по разработке для прикладной системы. Класс документа определяется из ответов, вернувшихся в параметре additionalClassificationResults. 3.Для полученного класса определите необходимую грамматику и выполните запрос на извлечение фактов. Подробнее см. в описании методов API сервисов Directum Ario. Преимущества способа: •классификация файла выполняется одним запросом. Недостатки способа: •большое количество дополнительных классификаторов может замедлить работу; •увеличивается размер ответа на запрос. Он будет содержать результаты всех дополнительных классификаторов, из которых нужен только один. |
Последовательная классификация
1.Классифицируйте документы с помощью POST-запроса «Классификация файла одним классификатором». В строке запроса укажите идентификатор верхнеуровневого классификатора: Пример: http://smart:61100/api/Classifiers/1/predictfile 2.В прикладной системе реализуйте логику для сопоставления полученного класса верхнеуровненого классификатора (classificationResult) с классификаторами подуровня. Для этого разработайте справочник соответствия. Подробнее см. руководство по разработке для прикладной системы. 3.Выполните еще один POST-запрос «Классификация файла». В строке запроса укажите идентификатор классификатора подуровня, полученного при сопоставлении. В результате параметр classificationResult вернет класс документа. 4.Для полученного класса определите необходимую грамматику и выполните запрос на извлечение фактов. Подробнее см. в описании методов API сервисов Directum Ario. Преимущества способа: •при большом количестве классификаторов на втором и последующих уровнях классификация может выполняться быстрее, особенно для документов с большим (более 10) количеством страниц. Недостатки способа: •выполняется дополнительный запрос на классификацию файла. |
© Компания Directum, 2024 |