<< Click to Display Table of Contents >> Мониторинг системы Directum RX > Расследование инцидентов Недоступность сервера |
Суть инцидента
•администратор получил почтовую рассылку об ошибках «Истекло время ожидания ответа сервера»;
•некоторые пользователи сообщили, что не могут войти в систему. При этом остальные пользователи могут работать в системе.
Решение
1.На домашней странице решения на панели Services errors определите сервисы с наибольшим числом критичных и неизвестных ошибок. Работоспособность этих сервисов необходимо проанализировать в первую очередь. Чтобы открыть список ошибок конкретного сервиса, на панели нажмите на ссылку с названием сервиса. В результате откроется дашборд Service Errors.
На дашборде с помощью панели Errors можно оценить, насколько часто возникает ошибка, нет ли других массовых ошибок:
2.Отфильтруйте список ошибок, оставив только интересующую:
3.С помощью панели Users определите, у каких пользователей возникает ошибка. В нашем примере она возникает на конкретных рабочих местах, поэтому одна из возможных причин – нестабильное сетевое подключение между компьютерами пользователей и сервером приложений.
4.Если анализ сети показывает, что подключение стабильно, проанализируйте дополнительную информацию. Сузьте интервал времени, в котором возникла ошибка. В интервал рекомендуется включить 2-5 мин. до и после ее возникновения, чтобы отобразить предшествующие и последующие ошибки.
5.С помощью дашбордов DirectumRX Service Load, Linux Servers, Windows Servers проверьте аппаратные метрики серверов в период возникновения ошибки.
6.Устраните причину. При необходимости оформите обращение в службу поддержки, приложив полученную информацию.
© Компания Directum, 2024 |