<< Click to Display Table of Contents >> Администрирование (Windows) > Сопровождение работы системы > Проверка работоспособности сервисов Статус-файлы и лог-файлы |
По умолчанию в системе для каждого сервиса и веб-сервера автоматически создаются статус-файлы. Если развернуто несколько экземпляров сервиса, то для каждого экземпляра также создается свой статус-файл. При работе со статус-файлами учитывайте:
•названия задаются по формату <Имя компьютера>.<Имя сервиса>.status;
•размещаются вместе с лог-файлами сервисов в подпапке status;
•обновляются каждые 10 секунд. Таким образом, в них всегда указана актуальная информация по текущему состоянию сервиса;
•если сервис не работает, то статус-файл не обновляется;
•информация отображается в удобном структурированном формате JSON.
С помощью конфигуратора вы можете изменить время обновления статус-файлов, папку, в которой они хранятся, или отключить статус-файлы.
Примечание. Статус-файл предоставляет наглядную информацию по всем проверкам сервиса, но по нему нельзя отследить историю изменений, так как информация в файле перезаписывается. Для отслеживания изменений вы можете использовать информацию из лог-файлов, а также решение «Мониторинг системы Directum RX».
В статус-файл записывается общая информация по всем проверкам и детальная по каждой выполненной проверке для сервиса.
Общая информация содержит дату и время последней записи (Time) и общий статус (Status):
•healthy – все проверки выполнены успешно;
•degraded – хотя бы одна проверка выявила проблему, при этом сервис продолжает работу;
•unhealthy – хотя бы одна проверка выявила критичную ошибку, сервис неработоспособен.
Детальная информация содержит:
•Status – статус конкретной проверки: healthy – выполнена успешно, degraded – выявлены проблемы, unhealthy – возникла критичная ошибка. Отображается для всех проверок;
•Duration – длительность выполнения проверки. Отображается для всех проверок;
•Data – дополнительные данные о проверке. Отображается не для всех проверок, может содержать разную информацию, в зависимости от проверки и сервиса.
Например, если проверка оперативной памяти PROCESS_MEMORY выполнена успешно, то в файл записывается статус healthy, значения свободной и общей физической памяти, размер файла подкачки и другие данные.
Пример статус-файла для сервиса хранения файлов предпросмотра PreviewStorage:
"Time": "2023-01-31 10:36:10.128+04:00", "Status": "healthy", "Statuses": { "CERTS_EXPIRATION": { "Status": "healthy", "Duration": "00:00:00.0000222"
}, "PROCESS_MEMORY": { "Status": "healthy", "Duration": "00:00:00.0014765", "Data": { "PrivateMB": 108, "WorkingSetMB": 140, "DegradedThresholdWorkingSetMB": 768,
"MaxThresholdWorkingSetMB": 1024,
"FreeRamMB": 7725, "TotalRamMB": 18431, "PageFileMB": 22681 } … |
Дата и время записи информации Общий статус всех проверок
Проверка срока действия сертификатов Статус проверки Длительность проверки
Проверка использования оперативной памяти Статус проверки Длительность проверки Информация о выделенной памяти: - приватная память текущего процесса - рабочий набор памяти текущего процесса - промежуточное пороговое значение, при котором проверка возвращает статус degraded - максимально допустимое значение, при котором проверка возвращает статус unhealthy - свободная физическая память - общая физическая память - размер файла подкачки |
В статус-файл веб-сервера также записывается текущее состояние прикладной разработки (DeploymentPackage). Эта информация используется при публикации в распределенную систему. В зависимости от того, совпадает ли разработка на веб-сервере с разработкой в публикуемом пакете, в статус-файл записывается одно из значений:
•Actual – разработка актуальна и не требует обновления;
•Not actual – разработка неактуальна и будет обновлена.
Кроме этого, для каждого сервиса в лог-файлы записывается информация, когда меняется статус проверки с healthy на degraded, unhealthy и наоборот. Дополнительно каждые 30 минут записывается текущее состояние проверок. Информация в лог-файлах поможет понять причины изменений при расследовании инцидентов. Например, по записям можно увидеть, что оперативная память, потребляемая сервисом, постепенно росла и потом закончился доступный объем памяти сервера. После этого сервис перестал отвечать. Информацию в лог-файлах можно найти, например по слову «health».
© Компания Directum, 2024 |