<< Click to Display Table of Contents >> Объектная модель > Базовое решение Directum RX > Commons – общие справочники EntityRecognitionInfo – результаты распознавания сущности |
Извлеченные факты и результаты классификации сущности сервисами Ario. Наследник от Sungero.CoreEntities.DatabookEntry. Справочник не отображается в проводнике, но его записи доступны в поиске.
Создается и заполняется программно при интерпретации фактов во время создания сущности.
Используется при:
•интерпретации фактов и заполнении свойств сущности;
•определении вызывающей функции обработки;
•раскраске полей в карточке и области предпросмотра;
•навигации от свойства сущности к области факта в предпросмотре;
•сохранении изменений, внесенных ответственным за верификацию;
•смене типа документа, созданного через интеллектуальную обработку, создается копия результата распознавания исходного документа с новым GUID типа сущности для раскраски полей в карточке и области предпросмотра;
•удалении документа, созданного через интеллектуальную обработку, его результат распознавания удаляется асинхронным обработчиком событий DeleteEntityRecognitionInfo «Удаление результатов распознавания сущности»;
•при формировании списка документов для отправки на дообучение.
Имя свойства |
Отображаемое имя |
---|---|
Имя |
|
Класс |
|
Создан |
|
Вероятность |
|
ИД сущности |
|
Тип сущности |
|
Поля фактов |
|
Дополнительные классификаторы |
|
Статус обучения по типам документов |
|
Сессия обучения |
|
Подтверждено |
|
Подтвержденный класс |
|
Статус обучения первых страниц |
|
Статус обучения первых страниц |
|
Верифицированная версия |
Не используется (наследуется из Sungero.CoreEntities.DatabookEntry).
Заполняется значением RecognizedClass.
RecognizedClass (Класс): Строка (250)
Наименование наиболее вероятного класса согласно классификации в сервисах Ario.
Дата создания записи.
ClassProbability (Вероятность): Вещественное
Вероятность того, что классифицируемый объект отнесен к RecognizedClass. Число от 0 до 1.
EntityId (ИД сущности): Идентификатор
Идентификатор сущности, с которой связаны результаты распознавания и классификации объекта сервисами Ario.
EntityType (Тип сущности): Строка (250)
Идентификатор типа сущности, с которой связаны результаты распознавания и классификации объекта сервисами Ario. В качестве значения используется GUID типа сущности.
Facts (Поля фактов): Коллекция
Факты из результатов распознавания объекта сервисами Ario.
Элементы коллекции представляют собой полную информацию о каждом поле каждого факта:
•его значение;
•вероятность, с которой поле распознано;
•с каким свойством сущности оно связано;
•с какой вероятностью заполнено свойство сущности.
Коллекция может быть дополнена элементами, которые не содержат информацию о факте. Например, контрагент для договора не распознан, а заполнен от контакта.
Имя свойства |
Отображаемое имя |
---|---|
ИД записи свойства-коллекции |
|
ИД факта |
|
Метка факта |
|
Имя факта |
|
Уверенность в тексте |
|
ИД поля |
|
Имя поля |
|
Значение поля |
|
Вероятность поля |
|
Filled |
Заполнено |
Позиция |
|
Вероятность |
|
Свойство |
|
Значение |
|
Подтвержденное значение |
ИД факта из результатов распознавания объекта сервисами Ario. Используется для связи свойства с фактом.
FactName (Имя факта): Строка (250)
Имя факта из результатов распознавания объекта сервисами Ario. Используется для получения ранее верифицированных значений свойства.
ИД поля факта из результатов распознавания объекта сервисами Ario. Используется для получения информации о данных, извлеченных из текста классифицируемого объекта.
FieldName (Имя поля): Строка (250)
Имя поля факта из результатов распознавания объекта сервисами Ario. Отображает связь свойства с полем. Используется для раскраски полей в предпросмотре документа.
FieldValue (Значение поля): Строка (1000)
Значение поля факта из результатов распознавания объекта сервисами Ario. Используется для получения информации о данных, извлеченных из текста документа.
FieldProbability (Вероятность поля): Вещественное
Вероятность поля факта из результатов распознавания объекта сервисами Ario. Заполняется значением вероятности определения поля факта из классифицируемого объекта. Например, вероятность того, что в поле содержится наименование организации. Используется для расчета итоговой вероятности заполнения свойства.
FieldConfidence (Уверенность в тексте): Вещественное
Уверенность в распознавании текста для поля из результатов распознавания объекта сервисами Ario. Число от 0 до 100. Показывает насколько сервис распознавания текстового слоя корректно и без ошибок распознал текст.
Добавлено для использования в прикладном решении Ario One. Основное назначение – пропуск верификации. Если хотя бы одно поле для документа имеет FieldConfidence ниже порогового значения, то нужна верификация.
Координаты позиции поля факта в тексте классифицируемого объекта. Заполняется из результатов распознавания классифицируемого объекта сервисами Ario в формате «<номер страницы>|<координаты смещения от верхнего края страницы до области в пикселях>|<координаты смещения от левого края страницы до области в пикселях>|<ширина области в пикселях>|<высота области в пикселях>|<ширина страницы в пикселях>|<высота страницы в пикселях>».
Используется для раскраски поля в предпросмотре документа.
FactLabel (Метка факта): Строка (250)
Метка факта. Заполняется программно при интерпретации фактов во время создания сущности. Формируется из имени факта, имени свойства, имен и значений всех полей факта, преобразованных в хеш по алгоритму MD5.
Используется для быстрого поиска идентичных фактов в результатах распознавания сущности при определении предшествующего верифицированного значения свойства.
PropertyName (Свойство): Строка (250)
Имя свойства сущности, заполненного на основании данных факта.
PropertyValue (Значение): Строка (1000)
Значение свойства сущности, заполненного на основании данных факта.
CollectionRecordId (ИД записи свойства-коллекции): Идентификатор
ИД элемента дочерней коллекции сущности, который заполнен на основании факта.
Например, для накладной сервисами Ario извлечены факты с номенклатурой. Если в Directum RX реализована коллекция номенклатуры для накладной и она заполняется на основе результатов распознавания Ario, то конкретная строка коллекции будет связана с конкретным фактом.
Probability (Вероятность): Вещественное
Вероятность того, что свойство заполнено корректно. Число от 0 до 100. Заполняется программно при интерпретации фактов во время создания сущности. Величина вероятности зависит от:
•вероятностей полей факта, по которым найдено значение;
•количества подходящих сущностей в системе;
•условий поиска (например, подписант может быть найден по полному ФИО или по фамилии и инициалам);
•корректности значений полей факта (например, распознанная сервисами Ario дата может иметь значение меньше 1 января 1753 года, следовательно, будет заполнена с минимальной вероятностью).
VerifiedValue (Подтвержденное значение): Строка (1000)
Подтвержденное ответственным за верификацию значение свойства. Фиксируется только для тех свойств, которые могут быть заполнены с помощью сервисов Ario (см. список извлекаемых фактов). Заполняется программно значением, которое было указано в карточке документа на момент выполнения задания на верификацию в блоке «Заполнение подтвержденных полей» задачи VerificationTask.
Filled (Заполнено): Перечисление
Показывает, верно ли значение свойства было заполнено в карточке документа при интеллектуальной обработке. Заполняется программно в блоке «Заполнение подтвержденных полей» задачи VerificationTask.
Имя свойства |
Отображаемое имя |
---|---|
Error |
Ошибочно |
Success |
+ |
Empty |
х |
ByUser |
- |
Логика заполнения свойства:
Статус |
Результат заполнения поля интелектуальной обработкой |
Результат верификации |
---|---|---|
Error |
Заполнено |
Изменил, либо очистил |
Success |
Заполнено |
Не изменял |
Empty |
Не заполнено |
Не изменял, либо сменил тип |
ByUser |
Не заполнено |
Заполнил |
AdditionalClassifiers (Дополнительные классификаторы): Коллекция
Список классов, к которым отнесена сущность, согласно дополнительным классификаторам. Используется для дополнительной классификации. Например, классификация документов по виду.
Имя свойства |
Отображаемое имя |
---|---|
ИД классификатора |
|
Класс |
|
Вероятность |
ClassifierID (ИД классификатора): Целое
ИД классификатора. Используется для идентификации классификатора в случае, если классы в разных дополнительных классификаторах совпадают.
PredictedClass (Класс): Строка (250)
Наименование наиболее вероятного класса согласно классификации в сервисах Ario.
Probability (Вероятность): Вещественное
Вероятность того, что классифицируемый объект отнесен к PredictedClass. Число от 0 до 1.
DocTypeClassifierTrainingStatus (Статус обучения по типам): Перечисление
Статус обучения классификатора по типам документов.
Имя свойства |
Отображаемое имя |
---|---|
Ожидание обучения |
|
Обучение в процессе |
|
Обучение завершено |
|
Возникла ошибка |
Awaiting – класс был распознан неверно и при верификации сменили тип документа.
InProcess – документ включен в сессию обучения, обучение на данный момент продолжается.
Completed – документ включен в сессию обучения, которая успешно завершена.
Error – на каком-либо этапе обучения возникла ошибка.
DocTypeClassifierTrainingSession (Сессия обучения по типам документов): Sungero.Commons.ClassifierTrainingSession
Сессия обучения классификатора. Заполняется программно при включении результата распознавания в сессию обучения классификатора фоновым процессом «Интеллектуальные функции. Обучение классификатора по типу документов».
VerifiedClass (Подтвержденный класс): Строка (250)
Наименование класса, подтвержденного верификатором. Заполняется программно значением нового класса, соответствующего выбранному типу документа (блок скрипта в VerificationTask (Задача на верификацию комплекта документов)). Соответствие класса и типа документа задается в серверной функции GetEntityTypeAndProcessingFunctionMapping() модуля SmartProcessing.
Verified (Проверено): Дата и время
Дата выполнения задания на верификацию. Заполняется программно в блоке «Заполнение подтвержденных полей» задачи VerificationTask. При смене типа документа программно создается новая запись результата распознавания, дата фиксируется только в новой записи.
FirstPageClassifierTrainingStatus (Статус обучения первых страниц): Перечисление
Статус дообучения классификатора первых страниц.
Имя свойства |
Отображаемое имя |
---|---|
Ожидание обучения |
|
Обучение в процессе |
|
Обучение завершено |
|
Возникла ошибка |
Awaiting – класс был распознан неверно и при верификации сменили тип документа.
InProcess – документ включен в сессию обучения, обучение на данный момент продолжается.
Completed – документ включен в сессию обучения, которая успешно завершена.
Error – на каком-либо этапе обучения возникла ошибка.
FirstPageClassifierTrainingSession (Сессия обучения первых страниц): Sungero.Commons.ClassifierTrainingSession
Сессия обучения классификатора первых страниц. Заполняется программно при включении результата распознавания в сессию обучения классификатора фоновым процессом «Интеллектуальные функции. Дообучение классификатора первых страниц».
VerifiedVersionNumber (Верифицированная версия): Идентификатор
Номер версии документа на момент завершения задачи на верификацию.
© Компания Directum, 2024 |