Directum Document Disassembler Service
<< Click to Display Table of Contents >> Интеллектуальные возможности > Сервисы Directum Ario > Администрирование сервисов Ario (Windows) > Конфигурирование настроек Ario Directum Document Disassembler Service |
Сервис Directum Document Disassembler Service настраивается в конфигурационном файле appsettings.json.
Структура файла:
{
"Serilog": {
"MinimumLevel": {
"Default": "{Минимальный уровень логирования}",
"Override": {
"Microsoft": "Warning",
"Microsoft.AspNetCore": "Information",
"Microsoft.EntityFrameworkCore": "Error",
"System": "Error",
"Elastic.Apm": "Error"
}
},
"Properties": {
"Application": "DocumentDisassemblerService"
},
"WriteTo": [
{
"Name": "RollingFile",
"Args": {
"formatter": "Logger.SmartEcsTextFormatter, Logger",
"pathFormat": "{Путь до папки с логами}/{Date}.log"
}
}
]
},
"DocumentDisassemblerService": {
"OCRTextFromPdf": "{Всегда извлекать текстовый слой из PDF-документов}",
"OCRdpi": "{Разрешение для извлечения текста из PDF-документов без текстового слоя или из документов, у которых игнорируется существующий текстовый слой}",
"UseFixedForms": "{Использовать жесткие формы документов}",
"DetectOrientation": "{Определять ориентацию страниц}",
"FindObjects": "{Искать подписи}",
"FindStamps": "{Искать печати}",
"PrefetchCount": "{Максимальное количество одновременно обрабатываемых запросов}"
},
"ElasticApm": {
"ServerUrls": "{Адрес сервиса Elastic APM Service}",
"TransactionSampleRate": "{Регулярность отправки трейсов в сервис Directum Elastic APM Service}",
"SpanFramesMinDuration": "{Время, в течение которого в лог файл записывается подробная информация об ошибке обработки документа. Указывается в миллисекундах}",
"MetricsInterval": "{Интервал сбора метрик в секундах}",
"CaptureBody": "all",
"CaptureBodyContentTypes": "*"
},
"Queues": {
"MessageTTL": "{Время хранения сообщений об обработке в RabbitMQ в секундах}",
"QueueConnection": "{Строка подключения к RabbitMQ}",
"RetryConnectionCount": "{Количество повторных попыток подключения к RabbitMQ}"
}
}
Serilog – параметры ведения лог-файлов:
•MinimumLevel. Минимальный уровень логирования. Значение по умолчанию:
"Serilog": {
"MinimumLevel": {
"Default": "{Минимальный уровень логирования}",
"Override": {
"Microsoft": "Warning",
"Microsoft.AspNetCore": "Information",
"Microsoft.EntityFrameworkCore": "Error",
"System": "Error",
"Elastic.Apm": "Error"
}
},
При указанном значении параметра в лог-файл записываются сообщения о каждом этапе обработки документа, а также ошибки, возникающие при работе сервиса.
Подробнее об изменении значения параметра см. на сервисе GitHub в документации библиотеки Serilog;
•WriteTo. Формат хранения лог-файлов, где:
•pathFormat. Путь до папки с лог-файлами.
DocumentDisassemblerService – настройки сервиса.
ВАЖНО. Значения параметров в секции DocumentDisassemblerService должны совпадать со значениями аналогичных параметров в секции TextExtractor конфигурационного файла сервиса Directum Text Extractor Service. Это необходимо для корректной работы сервисов с метаданными.
•OCRTextFromPdf. Всегда извлекать текстовый слой из PDF-документов, даже если текстовый слой уже существует. Возможные значения: True, False. Значение по умолчанию True;
•OCRdpi. Разрешение, используемое для извлечения текста из PDF-документов без текстового слоя или из документов, у которых игнорируется существующий текстовый слой. Укажите целое число больше нуля. Значение по умолчанию 300;
•UseFixedForms. При обработке изображений применять жесткие формы документов, например, формы паспортов РФ. Возможные значения: True, False. Если нет необходимости в распознавании документов с жесткими формами, для ускорения обработки документов рекомендуется оставить значение по умолчанию False;
•DetectOrientation. Определять ориентацию страниц. Возможные значения: True, False. Значение по умолчанию True. Если нет необходимости в определении ориентации страниц, для ускорения обработки документов установите значение False;
•FindObjects. Искать подписи. Возможные значения: True, False. Значение по умолчанию True. Если нет необходимости в поиске, для ускорения обработки документов установите значение False;
•FindStamps. Искать печати. Возможные значения: True, False. Значение по умолчанию True. Если нет необходимости в поиске, для ускорения обработки документов установите значение False;
•PrefetchCount. Максимальное количество одновременно обрабатываемых сервисом запросов. Значение по умолчанию 0, при котором оптимальное количество одновременно обрабатываемых документов подбирается автоматически в зависимости от доступного ресурса системы.
Примечание. Доступный ресурс представляет собой число логических ядер процессора (за вычетом одного ядра на работу ОС). Формула для расчета: CPU-1. Значение самого параметра вычисляется как половина от доступного ресурса с округлением вниз. Формула для расчета: Floor((CPU-1)/2).
ElasticApm – настройка подключения к сервису Directum Elastic APM Service:
•ServerUrls. Адрес сервиса Elastic APM Service;
•TransactionSampleRate. Регулярность отправки трейсов в Elastic APM Service. Укажите значение 1.0, если необходимо отправлять все трейсы, 0.5 – если каждый второй. Значение по умолчанию 1.0;
•SpanFramesMinDuration. Если при обработке документа возникла ошибка и время обработки превышает значение параметра, в лог-файл записывается не только факт ошибки, но и подробная информация о ней. Значение по умолчанию 0ms, при котором подробная запись информации об ошибке в лог-файл отключена;
•MetricsInterval. Интервал сбора метрик о состоянии памяти и CPU. Значение по умолчанию 0s, при котором метрики не собираются;
•CaptureBody. Сообщения, которые передаются в сервис Elastic APM Service. Возможные значения:
•off – сообщения не передаются;
•errors – сообщения с ошибками;
•transactions – сообщения без ошибок;
•all – все сообщения.
Значение по умолчанию all.
Queues – настройка для очередей RabbitMQ:
•MessageTTL. Время хранения сообщений об обработке документов в RabbitMQ в секундах. Значение по умолчанию 86400;
•QueueConnection. Строка подключения к брокеру сообщений RabbitMQ в формате amqp://{Имя пользователя}:{Пароль}@{Адрес}:{Порт}/{Virtual Host}, где:
•Virtual Host – виртуальный тенант RabbitMQ. Подробнее см. в документации RabbitMQ статью Virtual Hosts.
Пример значения: amqp://ario:ario12345@localhost:5672/ario;
•RetryConnectionCount. Количество повторных попыток подключения к брокеру сообщений. Значение по умолчанию 5.
© Компания Directum, 2024 |