Сервис Directum Fact Extractor Service обрабатывает текстовый слой с помощью подготовленных для определенного класса документов грамматик – наборов правил и моделей извлечения фактов, форматеров, признаков фактов, а также правил расчета вероятностей. Например, в базовую поставку сервисов Directum Ario входит грамматика letter, с помощью которой извлекаются факты из входящих писем.
Для извлечения фактов в сервис Directum Fact Extractor Service передаются текст и таблицы документа в структурированном виде, информация о количестве страниц и название грамматики извлечения фактов.
Грамматики, включенные в поставку Directum Ario
Для извлечения фактов из документов можно использовать:
•грамматики из базовой поставки сервисов. Полнота извлечения фактов для них составляет 80% и выше;
•грамматики, дополнительно включенные в поставку. Полнота извлечения фактов для них может быть ниже 80%.
|
Наименование грамматики |
Вид документа, из которого извлекаются факты |
Механизм извлечения |
---|---|---|---|
contractstatement |
Акт выполненных работ |
Модель извлечения фактов |
|
letter |
Входящее письмо |
Модель извлечения фактов |
|
railwayticket |
Железнодорожный билет (электронный) |
Модель извлечения фактов |
|
resolution |
Постановление судебных приставов |
Модель извлечения фактов |
|
inila |
Уведомление о регистрации в системе пенсионного учета |
Модель извлечения фактов |
|
incominginvoice |
Счет на оплату (русскоязычный) |
Модель извлечения фактов |
|
incominginvoiceeng |
Счет на оплату (англоязычный) |
Модель извлечения фактов |
|
taxinvoice |
Счет-фактура |
Табличные и текстовые правила, модель извлечения фактов |
|
waybill |
Товарная накладная |
Модель извлечения фактов |
|
generalTransferDocument |
Универсальный передаточный документ |
Текстовые правила, модель извлечения фактов |
|
Дополнительные грамматики |
airticket |
Авиабилет (электронный) |
Текстовые правила, модель извлечения фактов |
contract |
Договор |
Текстовые правила |
|
supAgreement |
Дополнительное соглашение |
Текстовые правила |
|
passportrus |
Паспорт гражданина РФ |
Механизм извлечения жестких форм |
|
taxinvoiceCorrection |
Корректировочный счет-фактура |
Текстовые правила |
|
TinCertificate |
Свидетельство о постановке на налоговый учет |
Текстовые правила |
|
goodstransportwaybill |
Товарно-транспортная накладная |
Текстовые правила |
|
railwaywaybill |
Транспортная железнодорожная накладная |
Текстовые правила |
|
transportwaybill |
Транспортная накладная |
Текстовые правила |
|
generalCorrectionDocument |
Универсальный корректировочный документ |
Текстовые правила |
|
forwardingreceipt |
Экспедиторская расписка |
Текстовые правила |
Для каждого вида документа извлекается определенный состав фактов.
Реальные бизнес-задачи организации могут потребовать создания собственных грамматик и обучения моделей извлечения фактов или дообучения базовых.
© Компания Directum, 2024 |