运维监控管理

耐威迪运维监控管理平台是团队经过多年来持续不断的探索和实践,结合了国内外先进监测技术进行研发,拥有深厚的技术沉淀和严格的开发管理机制保证了系统运行的稳定性、功能的全面性和扩展性,真正打造了满足客户需求的IT运维管理平台,为服务运营提供支撑。系统可对客户的IT系统进行 7*24 小时的全面监控,提供了IT系统的性能监控、性能分析、故障监控、故障分析及定位、强大的报表分析等功能,保证了客户日常运维工作的顺利开展,提升了运维工程师的网络管控水平,降低了管理层的日常工作量,为决策层提供了可靠的数据依据。

  • 资源管理
  • 拓扑管理
  • 虚拟化管理
  • 业务管理
  • 视频管理
  • 配置文件管理
  • 日志管理
  • 流量分析
  • 巡检管理
  • 报表管理
  • 告警管理
  • 知识管理
  • 移动管理
  • 微信接入
  • 系统管理
  • 对外接口
请填写准确信息,我们会尽快安排专业顾问联系您。

拓扑管理

拓扑管理提供了自动发现局域网的真实设备和连接,生成局域网物理拓扑图。可直观清晰地显示全网所有骨干网络设备、子网和互联关系。层次化的网络显示符合网络逻辑结构,并且关联设备的 Syslog告警信息,设备告警信息,便于进行故障隔离和快速定位。

拓扑管理中提供了直观的2D机房拓扑管理、自动化的地图拓扑管理、IP-MAC-PORT管理、真实面板管理等功能,还集成了Telnet,SSH、TraceRT、Ping等远程运维工具。可方便运维工程师远程控制IT 资源。

虚拟化管理

虚拟化管理包括了对Esxi、ctrix、Hyper-V、Openstack、Fushion等虚拟化平台的管理。提供了的虚拟化资源管理、基础架构拓扑、虚拟化TOPN排名、虚拟化报表统计、虚拟化资源发现以及策略配置等功能,提供了对Cluster集群、物理宿主机、数据存储及虚拟主机等资源的 CPU、内存、存储分配及耗用情况进行实时监控,对各组件的占用情况、可用性及性能参数进行统计分析和排名,并以拓扑图形式将各虚拟化资源的连接关系直观展现给用户,便于用户全方位对虚拟化资源进行的查询和管理。

业务管理

站在整个IT体系的视角关注业务的运行,以业务建模为核心,从业务关联的视角对IT资源进行管理。在宏观的角度去了解IT对业务的支撑情况,从全局掌握业务的健康水平,从业务视角洞察IT异常和变化。业务管理是从业务的角度统一展现出业务系统结构图,提供了业务模型构建、业务告警规则策略定义等功能,使用户可以直观的查看业务系统与IT资源的关系,查看业务系统的告警状况和故障根源,当发现业务系统出现故障时快速实施应急响应预案,快速恢复业务系统正常运转,最大化的降低业务系统故障所造成的损失。

稳定性

体现该业务系统运行的平稳性,是否出现过宕机,从而体现该业务在IT基础架构层面的健壮性

重要性

体现该业务系统对用户支撑作用,是否为用户的核心关键业务系统,而评判的标准来源于该业务系统的使用方,例如银行的核心交易系统、公安的视频监控系统等。

体验度

体现该业务系统运行的流畅性,用户的使用体验感受是否良好,评判的标准来源于对该业务系统所有IT资源的全面监控,例如服务器的CPU利用率是否繁忙、数据库的连接池占用是否过多、网络是否影响过慢等等因素。

视频管理

对视频设备进行管理,实现对目标区域的摄像机、红外摄像机和具有夜视功能的高速智能摄像机的监控管理,可以实时监控上述摄像机的状态是否正常。并对摄像机图像的质量情况、图像雪花情况、抖动情况等相关的指标进行监控,以确认摄像机的运行正常。对不能正常工作的摄像机或性能异常的摄像机发出告警,也可以通过对DVR设备IP地址、工作状态、端口号、本地显示状态、告警状态、显示状态、硬盘状态实时监控,使得运维人员对DVR工的工作状态实时掌控。通过监控DVR设备通道状态实现了对前端非智能摄像机工作状态的掌控,当某些状态异常时,系统同样会发送告警信息,使得维护人员可以直观的了解到前端情况。

配置文件管理

配置文件管理为用户提供了对网络设备的配置文件进行定期的自动备份功能,网络管理人员可以设置备份策略,系统能够根据配置的策略自动将网络设备的配置文件备份到本地。减少网络设备出现故障时进行设备配置恢复的时间。

同时为用户提供了配置文件的各版本较对功能和配置文件变更的告警功能。基于告警可以及时进行配置文件恢复,减少了网络设备因为异常的配置变更带来的业务中断。

日志管理

产品支持对syslog日志的监控管理、对资源设备的SnmpTrap进行监听的管理,可以接收相关日志信息,进行存储、分析并产生告警,以满足用户对日志管理的需求。与Logstash与Redis的日志管理系统进行融合,根据规则对海量的日志进行过滤分析,将符合要求的日志信息通过相关的告警方式推送给运维人员。

流量分析

网络流量分析功能支持多种流协议采集分析NetFlow、IPFix、sFlow、NetStream,可以帮助运维管理员深入的分析网络流量的具体使用情况,哪个用户占用了大量的带宽,是哪种应用或者协议占用了大量的带宽等问题。从设备、接口、应用、终端、会话、IP分组等多种维度进行分析展现

巡检管理

巡检管理包括一键巡检和计划巡检。其中一键巡检对全部监控资源提供自动、全面的健康性检查,巡检结束后给出健康评分(满分为100分),并提供巡检结果的明细列表,使管理员可详细了解所有IT系统的运行状况。也支持自定义资源分组,针对分组内资源执行一键巡检,并给出该分组的健康评分。一键巡检既支持手动巡检,也支持定时巡检并生成全部资源的健康性趋势曲线,使管理员可以了解整个系统的健康性评分走势,为系统的优化改进提供有效地数据支撑。

巡检管理为用户提供了巡检计划功能,支持对巡检计划任务管理(包括任务增删改、立即执行、复制、启用/禁用)、巡检内容设置(包括章节设置、巡检对象设置、巡检指标设置)、巡检方式设置(包括人工、自动)等功能。

报表管理

报表管理为用户提供了性能、告警、状态、趋势、资源多个角度的统计和分析报表。可帮助管理人员卸下人工统计分析的重担,很方便了解到网络状况,轻松地多角度地掌控网络运行的全局。让运维工程师很方便的提供准确全面的报告,大大减轻了工作量和压力。为客户的决策层提供数据依据。

告警管理

告警管理包括了告警视图,告警策略设置。对客户网络提供告警监控,出现故障后能及时通过短信等方式通告,并能提供告警分析、统计报告,为客户提供主动式的故障解决方式。

在告警列表中提供“处理建议”,帮助运维工程师迅速定位故障,解决问题。可大大缩短故障的中断时间,降低了客户由故障引起的直接或间接利益损失。

知识管理

系统提供知识管理,可以将海量的知识与异常资源的告警信息相关联,当出现告警信息时,可以快速的给运维人员提供解决建议,同时还支持对脚本的定义,可以根据不能的知识和告警信息,自动触发脚本,进行极速恢复.

移动管理

移动运维将使IT运维人员不再受到地域的限制,可以在任何地方通过移动或无线网络连接到平台中进行运维工作的处理,再也不会因为突发事件找不到人员而造成重大后果,也不会因为突发事件需要赶往现场而延误处理时间。

微信接入

当故障来临的时候,工程师不在或无法快速到达办公区,我们应该怎么办?通过微信,运维人员可以对监控的告警信息进行接收,通过查看相关的告警信息,从而快速的锁定问题的所在。

系统管理

系统管理提供了人员管理,包括用户、角色、域、资源分组管理,为客户提供访问控制安全保障,为不同的管理角色分配不同的访问权限,实现了分权分域的权限管理模型。

同时提供了系统组件状态管理、导航页签扩展、界面换肤管理、 LDAP 认证、审计日志跟踪、资源能力模型管理、故障处理知识管理等功能,还支持GSM、CDMA、GPRS三种短信猫 Modem 和移动CMPP、联通SGIP、电信SMGP三种短信网关、邮件服务器等多样化的告警消息通知方式。

对外接口

对外接口提供CMDB数据同步。与服务流程管理系统的配置同步、告警同步。支持从运维生态管理系统同步数据到CMDB、从CMDB同步数据到运维生态管理系统两种数据同步方式,可任选其一。提供遵循ITSS规范的告警、配置、性能接口。能够对监管对象进行同步管理、实现数据信息的及时性和准确性。