Настройки модуля упаковки
<< Click to Display Table of Contents >> Интеллектуальные возможности > Служба ввода документов > Настройка службы ввода Настройки модуля упаковки |
Для настройки модуля упаковки предназначены секции Packers и Workers в конфигурационном файле службы ввода appsettings.json.
ВАЖНО. В примерах указаны пути до папок по умолчанию. В appsettings.json пути указываются только из docker-контейнера службы ввода документов.
В секции SimplePacker указан подокументный модуль упаковки.
СОВЕТ. Рекомендуется использовать подокументый модуль упаковки для обработки документов в поставке Directum RX Intelligence.
В секции ImagePacker перечислены все модули упаковки изображений, которые позволяют работать только с изображениями страниц документов. Модули упаковки изображений рекомендуется использовать при поточном вводе, если в папку ввода поступают только файлы изображений. В остальных случаях рекомендуется использовать подокументный модуль упаковки.
Структура секций:
"Workers": {
"Count": 2,
"HangTimeoutInMinutes": 5
},
"Packers": {
// Настройки модулей подокументной упаковки.
"SimplePacker": {
"Instances": [
{
"Name": "SimplePacker"
}
]
},
// Настройки модулей поточной упаковки.
"ImagePacker": {
"Instances": [
{
"Name": "ImageWithTriggersPacker",
"PackageUnit": "CaptureInstance",
"OutputFileFormat": "Tiff",
"CompressionMethod": "Jpeg",
"Color": "Default",
"DeleteBlankPages": "False",
"ThresholdForBlank": 100,
"InputPdfRenderDpi": 300,
"InputPdfRenderType": "Render",
"MaxOutputDpi": -1,
"WorkersCount": 4,
"AddNotImagesToPackage": "False",
"JpegQuality": 50,
"PageWaitingTimeoutInMinutes": 1,
"WorkingFolder": "Packers/ImageWithTriggersPackerTemp",
"Triggers": [
{
"TriggerType": "Timeout",
"Name": "TimeoutTrigger",
"IntervalValueInSeconds": 10
},
{
"TriggerType": "Barcode",
"Name": "BarcodeTrigger",
"Action": "AddToCurrentDocument",
"BarcodeType": "Code128",
"BarcodeMask": "",
"BarcodeRegularExpression": "",
"DetectEncoding": "True",
"RecognitionMode": "MaxQuality"
"RecognitionSettings":
{
"AllowOneDWipedBarsRestoration": "False"
}
}
]
}
]
}
},
Workers – настройки обработчиков службы:
•Count. Количество обработчиков от 1 до 16. По умолчанию устанавливается в значение 50% от количества ядер процессора.
•HangTimeoutInMinutes. Тайм-аут в минутах, по истечении которого не отвечающий на запросы процесс поиска штрихкодов перезапускается. Значение по умолчанию 5.
SimplePacker – настройки модулей подокументной упаковки:
•Name. Уникальное имя модуля упаковки.
ImagePacker – настройки модулей поточной упаковки:
•Name. Уникальное имя модуля упаковки. Указывается в настройке Sender экземпляра линии из секции Lines.
•PackageUnit. Минимальный объем данных, на который может быть разделен поток. Возможные значения:
•Page – если поток делится на страницы;
•File – если поток делится на файлы;
•CaptureInstance – если поток делится на экземпляры захвата.
•OutputFileFormat. Формат выходного файла. Возможные значения: TIFF, PDF.
•CompressionMethod. Сжатие, которое будет использоваться при преобразовании в многостраничный TIFF-файл. Возможные значения: None, PackBits, Deflate, AdobeDeflate, Ccitt3, Ccitt4, Lzw и Jpeg. Все перечисленные значения являются стандартными параметрами сжатия TIFF-формата. Необязательный параметр. Значение по умолчанию Jpeg.
•Color. Глубина цвета, которая будет использована при преобразовании в многостраничный TIFF-файл. Преобразование может быть выполнено только в сторону уменьшения количества цветов. Необязательный параметр. Возможные значения:
•Default – изображение не преобразовывается. Установлено по умолчанию;
•Monochrome – монохромное изображение, 1-битный цвет;
•GrayScale4Bits – оттенки серого, 4-битный цвет;
•GrayScale8Bits – оттенки серого, 8-битный цвет;
•Color24Bits – цветное изображение, 24-битный цвет;
•Color32Bits – цветное изображение, 32-битный цвет.
Примечание. При изменении значений параметров CompressionMethod и Color необходимо учитывать:
•методы сжатия Ccitt3 и Ccitt4 поддерживают только глубину цвета Monochrome;
•метод сжатия Jpeg не поддерживает глубину цвета Monochrome.
•DeleteBlankPages. Признак удаления пустых страниц. Выполняется после срабатывания всех триггеров. Если параметр установлен и при этом используется триггер BlankPage, настроенный на удаление единиц упаковки, возникает конфликт. Упаковщик не сможет удалять только пустые страницы из потока. Пустые страницы будут удалены в составе единиц упаковки. При обнаружении конфликта в журнал событий записывается предупреждение: «Конфликт настройки «DeleteBlankPages» упаковщика <Название упаковщика> и настроек триггера <Название триггера>». Значение по умолчанию false.
•ThresholdForBlank. Порог определения пустой страницы. Позволяет определить, является ли данная страница пустой или нет. Значение параметра задается в условных единицах и может быть целым числом, большим либо равным 0. Чем больше значение параметра, тем больше вероятность, что листы будут считаться пустыми. Значение параметра подбирается:
•опытным путем;
•с помощью утилиты DcsBlankPageThresholdCalculator.exe, входящей в состав файлов службы ввода документов. Чтобы рассчитать значение параметра, отсканируйте пустую страницу и запустите утилиту с помощью консоли. Для корректного расчета значения запускайте утилиту в операционной системе, на которой установлена служба ввода:
DcsBlankPageThresholdCalculator.exe [-Target=]<Путь до файла> [-Silent]
•InputPdfRenderDpi. Разрешение при рендеринге захваченного PDF-документа. Для преобразования PDF-документов в изображение используется рендеринг страниц. Получаемое изображение имеет указанное разрешение. Укажите значение от 100 до 600. Значение по умолчанию 300.
•InputPdfRenderType. Метод преобразования страниц PDF-документов в изображения для поиска штрихкодов. Возможные значения:
•Render. Используется конвертация PDF-страниц в формат PNG;
•Extract. Рендеринг страниц не используется, для поиска используются существующие в PDF‑документе изображения страниц. В отличие от первого этот метод быстрее и эффективнее преобразовывает страницы PDF‑документов, в которых одна страница это одно изображение, например документы, занесенные со сканера.
Значение по умолчанию Render.
•MaxOutputDpi. Максимальное разрешение выходного файла. Если исходное изображение имеет меньшее разрешение, оно не меняется. Укажите значение от -1 до 600. Если указано значение -1, разрешение файла не меняется. Значение по умолчанию -1.
•WorkersCount. Количество потоков для работы модуля упаковки. Не рекомендуется превышать число физических ядер процессора. Укажите значение от 1 до 32. Значение по умолчанию 4.
•AddNotImagesToPackage. Признак добавления в пакет файлов, не являющихся изображениями. Возможные значения: true, false. Значение по умолчанию false.
•JpegQuality. Качество сжатия JPEG. Устанавливается для метода сжатия Jpeg и формата выходного файла PDF. Укажите значение от 1 до 100. Значение по умолчанию 50.
•PageWaitingTimeoutInMinutes. Время ожидания оставшихся страниц документа после обработки крайней из них. Настройка заполняется только для триггеров типа BarcodeDocumentInfo. После истечения таймаута собранные страницы будут перемещены в папку с ошибками упаковки.
•WorkingFolder. Полный или относительный путь до папки с временными файлами работы модуля упаковки. Во втором случае путь задается относительно папки, указанной в параметре RootWorkingFolder. Необязательный параметр. Значение по умолчанию – путь до временной папки текущего пользователя. Например, C:\Users\<Имя пользователя>\AppData\Local\Temp.
Triggers – настройки триггера:
•Name. Уникальное имя триггера.
•TriggerType. Тип триггера. Определяет способ разделения потока страниц на документы. Возможные значения:
•NewCaptureInstance. Разделение по новому экземпляру захвата. Формируется новый пакет, как только попадается единица упаковки, принадлежащая новому экземпляру захвата. Экземпляры захвата отличаются идентификаторами;
•Barcode. Разделение по штрихкоду определенного типа и содержания. Вместе с этим типом триггера могут быть указаны параметры BarcodeType, BarcodeMask, BarcodeRegularExpression;
•BlankPage. Разделение по пустому листу. Пустым листом считается последовательность нечетной и четной пустой страницы. Вместе с этим типом триггера указываются параметры Action и ThresholdForBlank;
•PackageUnitNumber. Разделение по количеству единиц упаковки. Такой способ разделения следует использовать, если все документы имеют одинаковое количество страниц. Вместе с этим типом триггера должен быть указан параметр Number;
•Timeout. Разделение по тайм-ауту. Формируется новый пакет, если после обработки единицы упаковки на вход упаковщика в течение заданного в настройках времени не поступают новые единицы упаковки. Вместе с этим типом триггера указывается параметр IntervalValueInSeconds. Значение задается в секундах.
Каждый поточный модуль упаковки может иметь несколько триггеров одного типа. Например, когда в потоке документов встречаются документы со штрихкодом на первой странице документа и на странице-разделителе, удобно настроить два разных триггера с разделением по штрихкоду.
•Action. Способ обработки страницы-разделителя. Страницей-разделителем называется страница, на которой сработал триггер модуля упаковки. Используется для триггеров Barcode и BlankPage. Например, если используем триггер Barcode, то страницей-разделителем будет страница со штрихкодом указанного типа и содержания. Возможные значения:
•AddToCurrentDocument. Страница-разделитель добавляется к текущему документу. Следующая за ней страница будет считаться началом нового документа;
•AddToNextDocument. Страница-разделитель считается началом нового документа;
•Delete. Страница-разделитель считается не относящейся ни к одному документу и удаляется. Использование этого значения параметра имеет смысл для пустых страниц.
•Number. Количество страниц в одном документе. Используется для разделения документов фиксированной длины вместе с параметром Number. Используется для триггера PackageUnitNumber.
•ThresholdForBlank. Порог определения пустой страницы. С помощью порога определения пустой страницы упаковщик определяет, является данная страница пустой или нет. Используется для триггера типа BlankPage. Значение параметра задается в условных единицах. Значением параметра может быть целое число, большее либо равное 0. Чем больше значение параметра, тем больше вероятность, что листы будут считаться пустыми. Значение параметра следует подбирать опытным путем.
•BarcodeType. Тип штрихкодов, обрабатываемых триггером Barcode. Необязательный параметр. Рекомендуется указывать только те типы штрихкодов, которые используются в организации. Это связано с тем, что извлечение каждого дополнительного типа штрихкода заметно увеличивает время распознавания.
Возможные значения параметра BarcodeType: All (распознавание всех поддерживаемых типов штрихкода), AustraliaPost, Aztec, ISBN, Codabar, Code11, Code128, GS1Code128, Code39Extended, Code39Standard, Code93Extended, Code93Standard, DataMatrix, DeutschePostIdentcode, DeutschePostLeitcode, EAN13, EAN14, EAN8, ATA2of5, Interleaved2of5, ISSN, ISMN, ItalianPost25, ITF14, ITF6, MacroPdf417, Matrix2of5, MSI, OneCode, OPC, PatchCode, Pdf417, MicroPdf417, Planet, Postnet, PZN, QR, MicroQR, RM4SCC, SCC14, SSCC18, Standard2of5, Supplement, UPCA, UPCE, VIN, Pharmacode, GS1DataMatrix, DatabarOmniDirectional, DatabarTruncated, DatabarLimited, DatabarExpanded, SwissPostParcel, AustralianPosteParcel, Code16K, DatabarStackedOmniDirectional, DatabarStacked, DatabarExpandedStacked, CompactPdf417, GS1QR, MaxiCode, MicrE13B, Code32, DataLogic2of5, DotCode, DutchKIX, CodablockF.
Если значение параметра не задано, то по умолчанию используется Code128.
Примечание. При плохом качестве скан-копий система может ошибочно определить штрихкоды на страницах документов. Для более точного распознавания дополнительно задайте параметры:
•маску штрихкода BarcodeMask;
•регулярное выражение штрихкода BarcodeRegularExpression.
•BarcodeMask. Маска содержания штрихкода, по которому поток страниц будет разделяться на документы. Используется для триггера Barcode. Маска штрихкода может содержать спецсимволы «*» и «?». Несколько масок можно указать, используя символ «;». Например, для штрихкодов системы Directum RX может быть указана маска «DirectumRX-*-*».
Необязательный параметр. По умолчанию принимает пустое значение, т.е. обрабатываются все штрихкоды.
•BarcodeRegularExpression. Маска штрихкода задается в виде регулярного выражения. Например, для штрихкодов системы Directum RX может быть указана маска «^DirectumRX-(\d+)-(\d+)$». В простейшем случае может быть указана константная строка. Используется для триггера Barcode. Подробнее о синтаксисе регулярных выражений см. в документации Microsoft статью «Элементы языка регулярных выражений — краткий справочник». Необязательный параметр. По умолчанию принимает пустое значение, т.е. обрабатываются все штрихкоды.
Необязательный параметр. По умолчанию принимает пустое значение, т.е. обрабатываются все штрихкоды.
•DetectEncoding. Определять кодировку штрихкода. Используется для триггера Barcode. Применяется для типов штрихкодов, поддерживающих национальные символы. Возможные значения: true, false. Значение по умолчанию true.
•RecognitionMode. Режим распознавания штрихкодов. Используется для триггера Barcode. Возможные значения:
•MaxPerformance. Максимальная производительность, при этом снижается качество распознавания. Рекомендуется применять для изображений с высоким качеством;
•HighQuality. Высокое качество распознавания. В этом режиме поиск штрихкодов работает качественнее, чем MaxPerformance, и быстрее, чем MaxQuality. Рекомендуется применять для изображений со средним качеством;
•MaxQuality. Максимальное качество, при этом снижается скорость распознавания. Рекомендуется применять для изображений с низким качеством.
Значение по умолчанию MaxQuality.
•RecognitionSettings. Дополнительные настройки распознавания штрихкодов. Используется для триггера Barcode. Улучшает качество распознавания при использовании режимов распознавания MaxPerformance или HighQuality. Возможные значения:
•AllowOneDWipedBarsRestoration. Включение улучшенного распознавания штрихкодов со стершимися или склеенными линиями. Возможные значения: true, false. Значение по умолчанию false;
•IntervalValueInSeconds. Время ожидания следующей страницы документа в секундах. Используется для триггера Timeout. Если после обработки страницы прошло время, указанное в параметре, и следующая страница не поступила, то считается, что была обработана последняя страница документа. Если указано значение -1, то триггер отключен. Значение по умолчанию -1.
© Компания Directum, 2024 |