Оперативный контроль и поддержание качества сервисов корпоративного портала

 

Заказчик проекта: крупное финансовое учреждение

Средства автоматизации сегодня, равно как и технические средства, всегда обеспечиваются инструментами для контроля рабочих параметров, а зачастую и для ремонта и восстановления. Так, современный автомобиль трудно себе представить не только без спидометра и тахометра, но также и без таких приятных опций как измерители расхода топлива, уровня жидкости стелоомывателя и давления в шинах, ремкомплект в багажнике.

То же касается и сферы ИТ и телекоммуникаций, в которых системы сегодня оснащаются разнообразными средствами и инструментами контроля и управления, начиная от диспетчера задач ПК и до сложных систем проактивного мониторинга и управления телеком- и ИТ-инфраструктурой.
В описываемом здесь проекте специалистами ООО «ИГТЕЛ» было реализовано заказное решение для оперативного контроля и поддержания качества сервисов внутреннего корпоративного портала крупного финансового учреждения с широкой сетью региональных офисов. Решение было призвано обеспечить бесперебойную работу и повысить доступность портала для пользователей, что являлось исключительно важным для бизнеса в связи с внедрением у заказчика электронного документооборота.

Разработка решения велась параллельно с разработкой портала, и первая версия, реализующая базовую функциональность, была введена в эксплуатацию еще в 2006 году. В последующие годы функциональность системы была расширена, и в своем окончательном виде решение успешно эксплуатируется с начала 2014 года.

Особенности технической реализации

Решение выполнено на базе программных продуктов линейки HPE Operations Bridge и HPE Application Performance Management Center.
Оперативный контроль и поддержание качества сервисов корпоративного портала осуществляется за счет:

  • Использования синтетических транзакций (сценариев, эмулирующих действия пользователя на корпоративном портале). Выполняется оперативный контроль доступности и производительности портала, расчет SLA, оперативное оповещение эксплуатирующего персонала об обнаруженных «узких местах», предоставление статистической отчетности.
  • Анализа реальных пользовательских транзакций, выполняемых на корпоративном портале, в целях более полного и информативного контроля доступности и производительности портала, расчета SLA, оперативного оповещения эксплуатирующего персонала, предоставления отчетности с детализацией информации по регионам (удаленным офисам).
  • Автоматического восстановления неисправных сервисов при поступлении данных о недоступности определенных ресурсов корпоративного портала.
    Контроля параметров работы аппаратно-программного комплекса и оперативного оповещения эксплуатирующего персонала в случае выхода значений параметров из допустимых диапазонов.

Использования инструментов детального изучения медленных пользовательских или синтетических транзакций вплоть до уровня методов (функций) для выявления корневых причин, влияющих на производительность системы.

Решение охватывает

  • 30 серверов;
  • до 5000 одновременно работающих пользователей;
  • около 80 проверяемых ресурсов;
  • более 80 удаленных офисов (региональных отделений).
  • Решение интегрировано с корпоративной системой обобщенного предоставления информации.

Преимущества решения

Достигнута высокая степень объективности данных мониторинга, так как время открытия ресурсов измеряется напрямую, с учетом сетевых задержек и времени подготовки динамических элементов страницы на стороне клиента. Это значение всегда больше времени скачивания страницы и всех её элементов, причем может быть значительно больше при использовании динамической подготовки страницы на стороне клиента, в зависимости от его прав доступа к информации.
Реализован контроль возвращаемой ресурсами информации (набора определенных паттернов на странице) и измерение времени ее получения.
Реализовано автоматическое восстановление отдельных ресурсов при получении объективной информации о замедлении их работы, даже в случае отсутствия фатальных ошибок в журналах работы этих ресурсов. Это особенно актуально в нерабочие часы службы эксплуатации, расположенной в центральном офисе, в то время как ресурсы портала используются круглосуточно за счет сильного разброса региональных пользователей по часовым поясам.

Реализован сбор данных отчетности о времени доступа к ресурсам по регионам с учётом влияния сетевых задержек. Данные собираются на основе выполнения пользовательских запросов, без установки пробников в регионах.

Реализована возможность анализа редких ошибок, возникающих только у определенных (групп) пользователей, с возможностью получения информации о порядке и времени выполнения методов (функций), в которых возникли ошибки, внутри портала.

Эффект от внедрения решения

Оптимизация работы корпоративного портала и службы эксплуатации, в частности:

  • Оперативное получение службой эксплуатации информации о замедлениях для всех основных ресурсов портала и интегрированных в него систем и оперативное реагирование на замедление ресурсов;
  • Автоматическое восстановление отдельных ресурсов, меньшее количество экстренных вызовов сотрудников службы эксплуатации в нерабочее время;
  • Улучшена отчетность о качестве предоставления сервисов корпоративного портала, большая достоверность и объективность информации.
    Оптимальное использование региональных вычислительных ресурсов - нет необходимости устанавливать дополнительные измерительные средства, нет дополнительной нагрузки на региональные каналы.

Проактивный мониторинг состояния корпоративного портала позволяет предотвращать неисправности в работе портала и прогнозировать его развитие.