Strip-форматеры
|
StripDateFormatter
|
Все факты
|
Date, DocumentBaseDate, ExecutoryProcessDate, ExecutoryDocumentDate, OtherDate, ResponseToDate
|
Удаляет пробелы и лишние символы, не относящиеся к дате. Например, «.гс(»
|
StripOtherDateFormatter
|
Все факты
|
OtherDate
|
Удаляет лишние символы, не относящиеся к дате. Например, «).гс»
|
StripWhiteSpaceFormatter
|
Все факты
|
Все поля
|
Удаляет пробелы по краям
|
StripCounterpartyAddressFormatter
|
Counterparty
|
Address
|
Удаляет пробелы и лишние символы в адресе компании. Например, «,.»
|
StripCounterpartyBankFormatter
|
Counterparty
|
Bank
|
Удаляет лишние символы в наименовании банка компании. Например, «({»
|
StripCounterpartyBankAccountFormatter
|
Counterparty
|
BankAccount
|
Удаляет лишние символы в расчетном счете компании. Например, «N№»
|
StripCounterpartyBicFormatter
|
Counterparty
|
BIC
|
Удаляет лишние символы в БИК банка компании. Например, «[]»
|
StripCounterpartyFormatter
|
Counterparty
|
Все поля факта
|
Удаляет пробелы и лишние символы, не относящиеся к контрагенту. Например, «,:»
|
StripCounterpartySignatoryFormatter
|
Counterparty
|
Signatory
|
Удаляет лишние символы в ФИО подписанта компании. Например, «()»
|
StripCounterpartyTinTrrcFormatter
|
Counterparty
|
TIN, TRRC, TINTTRC
|
Удаляет пробелы и лишние символы в ИНН, КПП компании. Например, «./ИН»
|
StripCounterpartyPsrnFormatter
|
Counterparty
|
PSRN
|
Удаляет пробелы и лишние символы в ОГРН/ОГРНИП компании. Например, «-./ОГРН»
|
StripEmailFormatter
|
Letter
|
Email
|
Удаляет лишние символы в адресе электронной почты компании. Например, «\',»
|
StripPhoneFormatter
|
Letter
|
Phone
|
Удаляет лишние символы в номере телефона компании. Например, «-=»
|
StripWebsiteFormatter
|
Letter
|
Website
|
Удаляет лишние символы в сайте компании. Например, «\/»
|
StripLetterPersonNameFormatter
|
LetterPerson
|
Name
|
Удаляет пробелы и лишние символы в ФИО персоны. Например, «;»
|
StripDocumentAmountFormatter
|
DocumentAmount
|
Все поля факта
|
Удаляет пробелы и лишние символы, не относящиеся к сумме документа. Например, «*.»
|
StripDocumentBaseNameFormatter
|
FinancialDocument
|
DocumentBaseName
|
Удаляет лишние символы в наименовании финансового документа. Например, «;№»
|
StripDocumentFormatter
|
Document
|
Все поля факта
|
Удаляет пробелы и лишние символы, не относящиеся к информации о документе. Например, «;]»
|
StripFinancialDocumentNumberFormatter
|
FinancialDocument
|
Number, DocumentBaseNumber
|
Удаляет лишние символы в номере основного документа и документа-основания. Например, «№.»
|
StripGoodsFormatter
|
Goods
|
Name, UnitName, Price, VatAmount, Amount, Code
|
Удаляет лишние символы в наименовании и коде товара, в наименовании единицы измерения и цене за единицу, в сумме НДС и сумме с учетом НДС. Например, «=|~»
|
StripGoodsUnitCodeFormatter
|
Goods
|
UnitCode
|
Удаляет пробелы и лишние символы в коде единицы измерения по ОКЕИ. Например, «=/„»
|
StripRouteToFromFormatter
|
ElectronicTicket
|
RouteTo, RouteFrom
|
Удаляет пробелы и лишние символы в месте отправления и прибытия. Например, «.-»
|
StripPassportRusMachineInfoFormatter
|
Passport
|
MachineInfo
|
Удаляет пробелы в начале и в конце строки
|
StripInilaPersonFormatter
|
Inila
|
Surname, Name, Patrn
|
Удаляет пробелы и лишние символы в начале и в конце строк фамилии, имени, отчества. Например, «;-»
|
Replace-форматеры
|
ReplaceCorrespondentNameFormatter
|
Correspondent
|
Name
|
Удаляет лишние данные и символы из названия компании. Например, почтовый код и скобки с точкой в начале и в конце строки
|
ReplaceCounterpartyAddressFormatter
|
Counterparty
|
Address
|
Удаляет лишние данные из адреса компании. Например, информацию в скобках в конце строки
|
ReplaceCounterpartyBankAccountFormatter
|
Counterparty
|
BankAccount
|
Удаляет слова «р/с» или «к/с» из номера расчетного счета в начале строки
|
ReplaceCounterpartyBankFormatter
|
Counterparty
|
Bank
|
Удаляет лишние данные и слова в наименовании банка компании. Например, «БИК:123456789 Банк:», «Банк:» в начале строки
|
ReplaceCounterpartyBicFormatter
|
Counterparty
|
BIC
|
Удаляет слово «БИК» из номера БИК
|
ReplaceCounterpartyLegalFormFormatter
|
Counterparty
|
LegalForm
|
Заменяет извлеченные сокращения и полные наименования организационно-правовых форм на корректные. Например, «АНЦИОНЕРНОЕ» на «АКЦИОНЕРНОЕ»
|
ReplaceCounterpartyNameFormatter
|
Counterparty
|
Name
|
Удаляет лишние данные и символы из названия компании. Например, почтовый код и скобки с точкой в начале и в конце строки
|
ReplaceCounterpartyTinFormatter
|
Counterparty
|
TIN
|
Очищает ИНН компании. Например, удаляет символы до ИНН и цифры в ИНН после запятой
|
ReplaceCounterpartyTrrcFormatter
|
Counterparty
|
TRRC
|
Очищает КПП компании. Например, удаляет цифры в КПП после запятой и соединяет две части КПП в одно значение: «54074505» и «0» в «540745050»
|
ReplaceCounterpartySignatoryFormatter
|
Counterparty
|
Signatory
|
Очищает ФИО персоны. Например, заменяет некорректно распознанные знаки пунктуации в конце ФИО персоны и удаляет символ «"» в начале фамилии персоны
|
ReplaceCounterpartyLegalNameFormatter
|
CounterpartyName
|
CounterpartyName
|
Удаляет лишние символы из наименования организации. Например, «"»
|
ReplaceDocumentBaseNameFormatter
|
FinancialDocument
|
DocumentBaseName
|
Нормализует извлеченные наименования финансовых документов. Например, приводит извлеченное «ДОПОЛНИТЕЛЬНОМУ СОГЛАШЕНИЮ» в «Дополнительное соглашение»
|
ReplaceDocumentNumberFormatter
|
Document
|
Number
|
Удаляет лишние символы в номере документа
|
ReplaceLetterSubjectFormatter
|
Letter
|
Subject
|
Удаляет лишние символы в теме письма
|
ReplaceEmailFormatter
|
Letter
|
Email
|
Удаляет лишние символы в адресе электронной почты
|
ReplaceLetterResponsibleFormatter
|
Letter
|
Name
|
Очищает поле от лишних символов. Например, удаляет «Исп.:» в ФИО исполнителя
|
ReplacePhoneFormatter
|
Letter
|
Phone
|
Удаляет лишние буквенные символы в номере телефона. Например, «тел.» и «факс»
|
ReplaceRouteFromFormatter
|
ElectronicTicket
|
RouteFrom
|
Удаляет тире, а также слова «Главн.», «Главный», «Пассажирский» из города отправления
|
ReplaceRouteToFormatter
|
ElectronicTicket
|
RouteTo
|
Удаляет тире, а также слова «Главн.», «Главный», «Пассажирский» из города прибытия
|
ReplacePersonNameFormatter
|
Person
|
Name
|
Заменяет некорректно распознанные знаки пунктуации в конце ФИО персоны, удаляет символ «"» в начале фамилии персоны
|
ReplacePersonPatrnFormatter
|
Patrn
|
ReplacePersonSurnameFormatter
|
Surname
|
Прочие форматеры фактов
|
CounterpartyCertificateTinNumberFormatter
|
Counterparty в правиле извлечения фактов TinCertificate
|
TIN
|
Номер ИНН в свидетельстве о постановке на налоговый учет извлекается из таблицы в 1 строку и 10 или 12 столбцов.
Форматер объединяет извлеченные из ячеек значения в одно общее, содержащее 10 или 12 цифр
|
CounterpartyCertificateTrrcNumberFormatter
|
Counterparty в правиле извлечения фактов TinCertificate
|
TRRC
|
Номер КПП в свидетельстве о постановке на налоговый учет извлекается из таблицы в 1 строку и 9 столбцов.
Форматер объединяет извлеченные из ячеек значения в одно общее, содержащее 9 цифр
|
CounterpartyPsrnFormatter
|
Counterparty
|
PSRN
|
Номер ОГРН в свидетельстве о регистрации юридического лица или ИП извлекается из таблицы в 1 строку и 13 или 15 столбцов.
Форматер объединяет извлеченные из ячеек значения в одно общее, содержащее 13 или 15 цифр
|
CountFormatter
|
Count
|
-
|
Удаляет пробелы и нечисловые символы в номенклатурной таблице счета фактуры и ТОРГ12 из колонки с количеством единиц товара
|
DocumentAmountFormatter
|
DocumentAmount
|
Поля суммы
|
Приводит суммы документа, извлеченные прописью, к числовому представлению
|
DocumentCurrencyFormatter
|
DocumentCurrency
|
Поля валют
|
Приводит валюты документа, извлеченные прописью, к числовому представлению
|
DocumentWordAmountFormatter
|
-
|
-
|
Приводит суммы документа, извлеченные прописью, к числовому представлению
|
DocumentWordDateFormatter
|
-
|
-
|
Приводит даты документа, извлеченные прописью, к формату DD.MM.YYYY HH:MM:SS
|
DocumentDateFormatter
|
-
|
-
|
Приводит даты документа к формату DD.MM.YYYY HH:MM:SS
|
FactFormatterBase
|
-
|
-
|
Базовый форматер для фактов
|
FinancialDocumentFunctionFormatter
|
-
|
-
|
Проверяет, является ли первый символ извлеченного статуса УПД цифрой. Если да, то возвращает значение. Если нет, то ищет цифру среди всех извлеченных цифр в факте
|
GoodsVatRateFormatter
|
-
|
-
|
Убирает нечисловые символы в ставке НДС в табличной части первичного учетного документа, например счета-фактуры, ТОРГ12 или УПД. Возвращает число или, если не указан НДС, пустую строку
|
GtdStatusFormatter
|
FinancialDocument
|
GtdFunction
|
Статус (функция) УПД извлекается как из текста, так и из таблицы. Форматер очищает значение от лишних символов и уменьшает вероятность корректного извлечения факта, полученного из текста. Вероятность факта, полученного из таблицы, не меняет.
|
LetterAddresseeFormatter
|
-
|
-
|
Заменяет некорректно распознанного получателя письма на корректного, применяя замены, аналогичные форматеру ReplacePersonNameFormatter
|
PassportBirthDateFormatter
|
Passport
|
BirthDate
|
Приводит дату рождения к формату ДД.ММ.ГГГГ
|
PassportBaseDateFormatter
|
Passport
|
BirthDate
IssuesDate
|
Базовый форматер для проверки корректности дат в паспортах
|
PassportBirthPlaceFormatter
|
Passport
|
BirthPlace
|
Удаляет лишние символы, приводит первые буквы места рождения к верхнему регистру и исправляет потенциальные опечатки, применяя функции форматера PassportPlaceFormatterBase
|
PassportDepartmentCodeFormatter
|
Passport
|
DepartmentCode
|
Удаляет лишние символы и приводит код подразделения к формату NNN-NNN
|
PassportDepartmentNameFormatterJamSpell
|
Passport
|
DepartmentName
|
Работа форматера будет отличаться в зависимости от операционной системы, на которой установлены сервисы Ario.
Для Microsoft Windows Server: удаляет лишние символы, приводит первые буквы наименования подразделения к верхнему регистру и исправляет потенциальные опечатки, применяя функции форматера PassportPlaceFormatterBase.
Для других операционных систем: корректирует ошибки распознавания с помощью специально обученной модели
|
PassportGenderFormatter
|
Passport
|
Gender
|
Приводит пол в к формату male (мужск.) или female (женск.)
|
PassportIssueDateFormatter
|
Passport
|
IssueDate
|
Приводит дату выдачу к формату ДД.ММ.ГГГГ
|
PassportNameFormatter
|
Passport
|
Name
|
Удаляет слово «имя» в извлеченном имени гражданина
|
PassportNumbersFormatter
|
Passport
|
Numbers
|
Приводит номер и серию паспорта к формату NN NN NNNNNN
|
PassportPatrnFormatter
|
Passport
|
Patrn
|
Удаляет слово «отчество» в извлеченном отчестве гражданина
|
PassportPlaceFormatterBase
|
Passport
|
BirthPlace, DepartmentCode
|
Базовый форматер. Исправляет потенциальные опечатки в словах, обозначающих административно-территориальные единицы и органы власти. Например, «РАЙОН», «Р-Н», «КРАЙ», «МВД» и др.
|
PassportSurnameFormatter
|
Passport
|
Surname
|
Удаляет слово «фамилия» в извлеченной фамилии гражданина
|
InilaGenderFormatter
|
Inila
|
Gender
|
Приводит пол персоны к формату male (мужск.) или female (женск.)
|
InilaNumberFormatter
|
Inila
|
Number
|
Удаляет лишние символы по краям СНИЛС. Например, «~№»
|