<< Click to Display Table of Contents >> Интеллектуальные возможности > Сервисы Directum Ario Схема обработки документов в сервисах Ario |
1.Если используется облачная версия сервисов Ario, прикладная система отправляет управляющему сервису Directum Smart Service учетные данные пользователя. Directum Smart Service передает эти данные сервису Directum Identity Service, который выпускает токен для отправки запросов к сервисам Ario. После этого Directum Smart Service передает токен системе.
2.Служба ввода документов (Directum Capture Service) захватывает документы из выделенного ящика электронной почты или выделенной папки, после чего передает их в прикладную систему через утилиту RxCmd.
3.Утилита RxCmd отправляет сервису Directum Smart Service асинхронный запрос на обработку документов:
•если используется облачная версия сервисов Ario, утилита передает сервису документы и токен пользователя. Directum Smart Service выполняет валидацию полученного токена. Если он недействительный или истекший, возвращается сообщение с ошибкой;
•если сервисы Ario установлены локально или в частном облаке, утилита передает сервису только документы. При получении запроса Directum Smart Service использует токен анонимного пользователя.
В ответ на запрос Directum Smart Service возвращает ID задачи на обработку документов. В дальнейшем прикладная система использует этот ID для отслеживания состояния обработки.
4.Directum Smart Service передает полученные пакеты документов сервису Directum Document Disassembler Service, который при необходимости разделяет документы на отдельные страницы и отправляет результат в Directum Smart Service.
5.В Directum Smart Service страницы распределяются по очередям обработки: для маленьких (1-4 страницы), средних (5-20 страниц), больших (21-200 страниц) и очень больших (более 200 страниц) документов. Это нужно, чтобы документы с более 20 страницами не затягивали и не останавливали обработку маленьких и средних. Из каждой очереди страницы отбираются с помощью алгоритма round-robin. После этого они передаются сервису Directum Text Extractor Service, который выполняет их предварительную обработку:
•убирает фон страниц для более качественного извлечения текстового слоя. Например, удаляет изображения или специальные знаки;
•поворачивает страницы так, чтобы угол поворота был кратен 90 градусам;
•выполняет аффинные преобразования: исправляет вертикальные и горизонтальные искажения страницы.
ПРИМЕЧАНИЕ. Число одновременно обрабатываемых страниц настраивается в конфигурационном файле сервиса Directum Text Extractor Service.
6.Directum Text Extractor Service передает страницы сервису Directum Image Classifier Service, который определяет их поворот: 0, 90, 180 или 270 градусов. После этого Directum Text Extractor Service поворачивает страницы до корректного положения.
7.Directum Text Extractor Service:
•передает страницы сервису Directum Object Detection Service, который ищет на них подписи и возвращает их координаты;
•ищет на страницах печати и таблицы.
8.Directum Text Extractor Service извлекает из страниц объекты и текстовый слой, затем передает страницы сервису Directum Text Classifier Service. Он определяет, является ли страница первой в документе, и передает результаты обработки сервису Directum Smart Service.
9.После обработки всех страниц по признаку «первая/не первая страница» Directum Smart Service объединяет их в пакеты и отправляет сервису Directum Document Assembler Service. Directum Document Assembler Service объединяет страницы в PDF-файлы с извлеченным текстовым слоем и передает сервису Directum Smart Service.
10.Directum Smart Service передает пакет документов сервису Directum Text Classifier Service, который классифицирует каждый документ по виду.
11.Directum Smart Service передает документы на параллельное извлечение фактов сервисами:
•Directum Fact Extractor Rules Service (DFES-R), который извлекает факты на основе правил;
•Directum Fact Extractor Learn Service (DFES-L), который извлекает факты на основе обучаемых моделей.
12.Результаты извлечения фактов объединяются в Directum Smart Service и передаются сервису Directum Fact Extractor Base Service. Он форматирует факты и рассчитывает вероятности их корректного извлечения, затем передает эти данные обратно в Directum Smart Service.
13.Directum Text Extractor Service определяет позиции извлеченных фактов на страницах. Позиции используются для подсветки фактов при верификации в прикладной системе.
14.Если указаны дополнительные классификаторы, например виды договоров, Directum Smart Service передает документы сервису Directum Text Classifier Service для классификации.
15.Directum Smart Service передает обработанный пакет документов в прикладную систему.
© Компания Directum, 2024 |