Создание классификатора
<< Click to Display Table of Contents >> Интеллектуальные возможности > Сервисы Directum Ario > Описание API Ario > Отладка классификатора Создание классификатора |
В поставку сервисов Directum Ario входят классификатор по видам документов и классификатор первых страниц. Однако иногда может требоваться создание собственного классификатора. Например, если:
•организация работает с видами документов, которые не входят в перечень классифицируемых;
•в организации принято оформление документов, отличное от общепринятых форматов.
Совет. Чтобы с помощью нового классификатора можно было распознавать документы организации, после создания его нужно обучить.
Синтаксис
POST {service_url}/api/Classifiers
{
"name":"Наименование классификатора"
"minProbability": "Минимальная вероятность, при которой определяется класс документа"
"autoPublish": "Признак автоматической публикации моделей классификации"
}
•name – наименование классификатора;
•minProbability – минимальная вероятность, при которой определяется класс документа. Если при классификации документа вероятность ниже указанного значения, то определить класс не удается. Значение задается в интервале от 0 до 1. Рекомендуемое значение 0,51;
•autoPublish – признак того, что модели автоматически публикуются в классификаторе. Возможные значения:
true – модели автоматически публикуются в классификатор и становятся активными (действующими) после их обучения или дообучения;
false – модели не публикуются в классификатор автоматически после их обучения или дообучения. Чтобы они стали действующими, их необходимо опубликовать вручную.
При необходимости в запрос можно вручную добавить параметры классификатора:
•status – статус классификатора. Возможные значения: 0 – неактивный (недействующий), 1 – активный (действующий);
•useFixedForms – признак того, что классификатор обрабатывает документы жесткой формы, например паспорта РФ. Возможные значения: true, false. Если нет необходимости в распознавании документов с жесткими формами, для ускорения обработки документов рекомендуется установить значение по умолчанию false или не добавлять параметр в запрос.
Пример запроса
POST http://smart:61100/api/Classifiers
{
"name":"Классификатор по виду документа"
"minProbability": "0.51"
"autoPublish": true
}
Ответ
Содержит информацию о созданном классификаторе.
Далее в примере ответа параметры, выделенные полужирным шрифтом, принимают значение null при создании нового классификатора, так как модель классификации еще не обучена и не опубликована:
{
"publishedModelId": null,
"publishedModel": null,
"classifierModels": null,
"classifierId": 1,
"name": "Классификатор по виду документа",
"type": null,
"status": 0,
"created": "2018-12-14T10:39:27.7153453+04:00",
"published": null,
"autoPublish": true,
"minProbability": 0.51,
"useFixedForms": false
}
Где:
•publishedModelId – ИД активной модели классификации;
•publishedModel – информация об опубликованной модели классификации. Например, информация о метриках;
•classifierModels – информация о модели классификации;
•classifierId – ИД созданного классификатора;
•name – наименование классификатора. Значение параметра берется из запроса;
•type – тип классификатора. Всегда принимает значение null, так как классификатор создается пользователем;
•status – статус классификатора. Значение параметра берется из запроса. Если в запросе параметр не был указан, принимает значение 0;
•created – дата и время создания классификатора;
•published – дата и время публикации классификатора;
•autoPublish – признак того, что модель автоматически публикуется в классификаторе и становится активной (действующей). Значение параметра берется из запроса. Если в запросе параметр не был указан, принимает значение false;
•minProbability – минимальная вероятность, при которой определяется класс документа. Значение параметра берется из запроса. Если в запросе параметр не был указан, принимает значение true;
•useFixedForms – признак того, что классификатор обрабатывает документы жесткой формы, например паспорта РФ. Значение параметра берется из запроса. Если в запросе параметр не был указан, принимает значение false.
© Компания Directum, 2024 |