Классификация файла несколькими классификаторами
<< Click to Display Table of Contents >> Интеллектуальные возможности > Сервисы Directum Ario > Описание API Ario > Прикладные задачи классификации и извлечения фактов Классификация файла несколькими классификаторами |
Дополнительный POST-запрос для классификации документов. Используется, например если настроено несколько классификаторов по виду документа. Если первый классификатор не определит вид, то к классификации подключаются дополнительные.
Классифицировать документы можно с помощью асинхронного или синхронного метода. Асинхронный метод используется разработчиками для управляемой классификации за счет распараллеливания потоков. Синхронный метод используется администраторами для упрощенной классификации за счет минимального количества действий со стороны администратора.
Синтаксис
POST {service_url}/api/Classifiers/{ИД классификатора}/predictfileasync
{
"file": "Путь до файла",
"PageClassifierId": "ИД классификатора первых страниц",
"ProcessDocumentsCount": "Количество документов для обработки",
"UseFixedForms": "Признак обработки документов жесткой формы",
"Languages": ["Языки документов"],
"SaveUnprocessedDocuments": "Загрузка в систему необработанных документов из комплекта"
}
Параметры
•file – путь до файла, который нужно классифицировать;
•PageClassifierId – ИД классификатора первых страниц, который нужно использовать при обработке файла;
•ProcessDocumentsCount – количество документов для обработки. Возможные значения: 0 – обрабатываются все документы комплекта, 1 – обрабатывается только первый документ комплекта. Например, если указано значение 1, то для комплекта из четырех документов сервис возвращает результат обработки только первого документа из комплекта. Значение по умолчанию 0;
•UseFixedForms – признак того, что классификатор обрабатывает документы жесткой формы, например паспорта РФ. Возможные значения: true, false. Если распознавать документы с жесткими формами не нужно, для ускорения обработки документов рекомендуется оставить значение по умолчанию false;
•Languages – язык документов. Значения по умолчанию rus, eng. Другие языки, распознавание которых поддерживают сервисы Ario, добавляются вручную.
•SaveUnprocessedDocuments – признак того, что необработанные документы из комплекта загружаются в систему. Когда в параметре ProcessDocumentsCount установлено значение 1, обрабатывается только первый документ из комплекта. Если в параметре SaveUnprocessedDocuments установлено значение false, все последующие документы из комплекта не загружаются. Если в параметре установлено значение true, они загружаются в систему без текстового слоя с видом «Простой документ» в формате PDF.
Пример запроса
POST http://smart:61100/api/Classifiers/1/predictfileasync
{
"file": Акт 56,
"PageClassifierId": 4,
"ProcessDocumentsCount": 0,
"UseFixedForms": False,
"Languages": ["eng", "rus"],
"SaveUnprocessedDocuments": False
}
Ответ
Содержит основную информацию о задаче на классификацию документа. Параметры аналогичны параметрам ответа на асинхронный запрос при классификации и извлечении фактов из файла.
Подробную информацию о результате обработки документа можно получить с помощью запроса информации по конкретной задаче обработки.
Синтаксис и параметры при обучении или дообучении такие же, как в аналогичном асинхронном запросе.
Ответ
Содержит информацию о соответствии содержимого файла одному из классов классификатора:
{
"message": null,
"results": [...]
}
Где:
•message – информация об ошибках при классификации. Если они не возникали, параметр имеет значение null;
•results – секция с результатами классификации файла. Подробное описание параметров секции см. в разделе «Классификация и извлечение фактов из файла» в подразделе «Синхронный метод» в описании секции classificationResut.
© Компания Directum, 2024 |