一、建设背景
随着云计算、大数据、人工智能等新兴技术的兴起与应用,IT运维管理成为保障业务不间断运行的重中之重。面对各级营区成千的节点,为确保系统稳定及业务连续性,需要对每个节点的状态、性能进行实时监控,实时预警。又加上各单位运维人员信息化水平参差不齐,各单位营区较为分散,如设备出现故障,不能及时现场排查处理,因此部队营区亟需一套专业高效的IT综合运维管理系统。
智慧军营综合运维管理系统是新一代综合运维管理平台,实现一个平台,管理所有IT资源。面向业务、面向管理者,通过对所有IT资源的综合监控,实现营区一张图可视化运维管理。
二、建设内容
新一代智慧军营综合运维管理系统分为资源层、数据采集层、数据处理层、逻辑层和展示层五个层级,构建统一的智慧IT运维管理体系。
自动生成网络拓扑,实时掌握网络设备的运行状态和链路的连通情况,提供丰富图形化视图,包括位置分布拓扑视图、分级管理拓扑视图、逻辑管理域拓扑视图等。可通过拓扑自动布局,一键调整拓扑图的展现形态,如树形、星形、单圆形等。
呈现业务系统的健康水平分布,与IT健康指数功能联动,快速定位导致IT健康指数波动的原因。
构建业务应用分析模型,对各业务系统进行横向对比分析,包括健康度、繁忙度、可用性、宕机次数、宕机时长等,准确衡量业务系统的健康水平差异。
呈现业务系统与部门、IT资源及关键指标的关联关系,支持业务拓扑编辑、关键指标标注。通过影响传递,准确反映IT异常对业务、用户造成的影响和威胁。支持业务告警诊断。
自动显示告警设备与其他的关联关系、业务关系和网络关系,提取相关联资源的告警信息,以及告警同时的指标数值。便于进行相关性诊断。
图形化呈现用户、业务和应用系统的相互关联关系,一方面掌握应用系统的异常对业务、用户的影响和威胁,另一方面实现IT与业务交互,将IT对业务的支撑价值完整体现。
三、系统优势
根本上改变以往管理工作只能依靠技术人员凭经验去操作,问题出现后紧急救火,甚至于面对系统无能为力的被动局面。
建立和规范运行维护流程,建立系统故障处理的工作流,减少出错,不断跟踪流程和充实维护知识经验,提高运行维护的效率。
通过各类性能分析报表、资源统计报表和运维分析报表,为领导提供更全面,更直接的管理信息,为系统升级、改造、扩容提供科学依据。
四、总结
智慧军营综合运维管理系统的建设围绕着统一数据采集、数据统一处理、统一服务流程、统一资源管理、统一知识库、统一运行展现、统一访问门户、统一报表分析,为全国部队打造一体化的运维管理平台,来解决全国部队IT监控需求、IT运维需求和管理决策需求。建立以事件管理为中心,通过网络及系统监控采集实时运行性能指标、故障情况,实现对网络及系统的运行状况、故障情况的全面实时监控,及时发现问题并自动定位、诊断。
借助网络监测与运维管理系统,可以大幅度地降低运行维护工作量,实现系统运行维护的自动化与规范化。通过运维管理流程的建设,规范化日常运维管理工作,使得科技信息管理部门日常运维工作规范化、透明化、流程化、制度化和可控化,以管理为抓手,促进日常运维工作效率和水平的不断提升,最终使整体信息化环境处于良好的运行状态。