<< Click to Display Table of Contents >> Интеллектуальные возможности > Разметка документов в AVIA Создание проекта разметки |
Чтобы начать разметку документов, создайте новый проект разметки или загрузите созданный ранее. Второе может потребоваться, например, при дообучении моделей извлечения фактов.
Создание нового проекта разметки
1.Нажмите на кнопку Создать проект на стартовой странице приложения.
2.В окне конфигуратора нового проекта заполните поля:
•Папка проекта. Папка, в которую сохраняются загруженные в проект документы и их разметка;
•Имя проекта. Название проекта заполняется автоматически по названию папки. При необходимости скорректируйте имя;
•Набор атрибутов. Название набора атрибутов для разметки определенного класса документов;
•Использовать извлечение текстового слоя. Если размечаются документы жесткой формы, например паспорта, снимите флажок. Для разметки остальных документов оставьте флажок установленным. После создания проекта настройка становится недоступна для изменения;
•Адрес сервисов Directum Ario. Адрес сервиса Smart Service, к которому приложение обращается для предварительной обработки документов. Заполняется только при использовании извлечения текстового слоя;
•Язык документов. Если размечаются документы на иностранных языках, укажите их для повышения качества извлечения текстового слоя. Список языков зависит от настройки сервисов Directum Ario. По умолчанию установлены русский и английский языки;
•Авторазметка. Выберите шаблон авторазметки, если документы необходимо разметить автоматически. Список шаблонов соответствует списку грамматик извлечения фактов на основе правил и обучаемых моделей.
3.Нажмите на кнопку Создать проект.
После создания папка проекта содержит:
•JSON-файл, в котором хранятся настройки проекта, пути до документов, атрибуты и разметка;
•подпапки с изображениями страниц и извлеченным текстовым слоем для каждого загруженного документа.
Загрузка созданного проекта разметки
Для загрузки ранее созданного проекта в стартовом окне приложения нажмите на кнопку Открыть проект и выберите JSON-файл проекта. Открыть проект, с которым недавно работали, можно в списке Последние проекты:
ВАЖНО. Если сервисы Directum Ario обновлены на новую версию, то перед доработкой разметки в ранее созданных проектах обновите текстовый слой.
По последним проектам отображается основная информация и статистика.
Основная информация: Файл проекта – название проекта с указанием расширения *json. Путь до папки, в которой хранится проект и загруженные в него документы и их разметка. Дата и время последних изменений, внесенных в проект. Статистика: Количество документов, которое содержится в проекте. Количество ошибок, которое допущено при разметке документов. СОВЕТ. Чтобы найти и исправить ошибку: 1.Откройте проект. 2.На панели проекта в выпадающем списке выберите пункт Файлы, содержащие ошибки: 3.Перейдите к документу с ошибками и в правой части экрана на панели атрибутов в поле Слой выберите слой Неизвестен. Отобразятся атрибуты всех слоев, области, размеченные атрибутами, для которых не был указан слой, а также области, которые нужно переразметить. В двух последних случаях выполните одно из действий: •нажмите на область и в появившемся окне выберите атрибут, слой для которого известен; •удалите область, если она больше не нужна. Для этого выберите область и нажмите клавишу DELETE; •добавьте новый атрибут, указав для него Слой, и выберите его для нужной области. |
Если в ближайшее время работа с последними проектами не планируется, их можно удалять из истории:
•по одному. Для этого в информационном блоке нужного проекта нажмите на кнопку и выберите пункт Удалить из списка;
•все сразу. Для этого нажмите на кнопку Очистить историю.
В результате проекты удаляются из истории приложения, но сохраняются в файловой системе. Если нужно вернуться к работе над удаленным из истории проектом, вновь загрузите его по кнопке Открыть проект.
© Компания Directum, 2024 |