<< Click to Display Table of Contents >> Разработка > Примеры разработки Интеллектуальная обработка документов |
Стандартная версия Directum RX содержит базовые возможности интеллектуальной обработки документов. На текущий момент реализована обработка нескольких типов документов. Модель классификации по типам документов, которая предоставляется по запросу в службу поддержки Directum RX, также представляет собой стартовый пример работы. В зависимости от потребностей организации функциональность интеллектуальной обработки документов можно адаптировать под конкретные бизнес-задачи. Адаптация включает:
•обучение модели классификации на реальных документах организации для повышения точности классификации и извлечения фактов;
•дополнение базовых возможности интеллектуальной обработки документов. Например, есть возможность расширить состав обрабатываемых документов или изменить порядок обработки.
Важно. Перед адаптацией активируйте функциональность интеллектуальной обработки документов в своем контуре для разработки и тестирования, если еще не сделали это. Подробнее см. в справке Directum RX, раздел «Настройка интеллектуальной обработки».
Чтобы внести изменения в функциональность интеллектуальной обработки документов:
1.В среде разработки Directum RX адаптируйте разработку под необходимые бизнес-задачи. Например, добавьте интеллектуальную обработку для новых типов документов, доработайте задачу на обработку документов, измените логику заполнения полей карточек извлеченными фактами и т.д. Подробнее см. пример разработки «Как добавить обработку для нового типа документов».
2.Подготовьте документы для обучения. Потребуется минимум 100 документов каждого типа. Чем больше документов, тем выше точность классификации и дольше длится обучение.
На сервере, где установлены сервисы Directum Ario, в сетевой папке создайте структуру папок документов каждого типа.
Требования к размещению документов для обучения:
•путь до папок с документами для обучения должен состоять из латинских символов без пробелов, использование кириллицы не допускается;
•названия папок должны быть содержательными и написаны кириллицей. Типы документов, которые создаются при обучении, получают названия соответствующих папок. Например, если папка называется «Акт выполненных работ», то соответствующий тип документов будет назван «Акт выполненных работ»;
•размещайте в папках только документы соответствующего типа. Например, в папке «Входящее письмо» должны лежать только входящие письма. Если в папке содержатся документы других типов, точность классификации документов и распознавания фактов снижается.
3.Обучите классификатор по типам документов на подготовленных документах. Подробнее см. в руководстве администратора Directum RX, раздел «Обучение классификатора».
4.Проверьте захват документов. Подробнее см. в руководстве администратора Directum RX, раздел «Проверка захвата документов».
Если точность классификации документов и распознавания фактов недостаточно высокая:
1.Проверьте, что в каждой папке с документами для обучения находятся только документы нужного типа. Например, в папке «Входящее письмо» должны находиться только входящие письма, в папке «Накладная» только накладные и т.д.
2.Увеличьте количество документов каждого типа.
3.Повторите обучение классификатора.
4.Повторно проверьте захват документов.
Если при одном из прошлых обучений точность классификации документов и распознавания фактов была выше, чем при повторном обучении, можно откатить изменения и опубликовать в классификатор модель классификации с самыми высокими показателями. В результате данная модель будет использоваться для обработки документов.
Когда захват документов прошел успешно, а точность классификации и распознавания фактов вас устраивает, подготовьте комплект для переноса разработки в продуктивный контур. Для этого:
•экспортируйте пакет разработки с исходными кодами из среды разработки Directum RX;
•экспортируйте обученную модель классификации из сервисов Directum Ario.
Передайте комплект для переноса разработки администратору системы Directum RX.
Как добавить дополнительный классификатор Как изменить стиль подсветки выделенного факта в области предпросмотра |
© Компания Directum, 2024 |