建设背景
越来越多的用户日常工作的开展对IT系统的依赖越来越高,由此带来了大量的管理问题,用户需要的信息中心系统应具备高可靠性、高安全性、实时性等特点。
用户的IT系统面临着多系统、多数据库和多应用平台,多厂商网络及系统设备,多业务应用等复杂的管理环境。IT系统支撑了用户的日常工作、办公业务、公众网站,还要支持多种应用系统等。如果IT系统失效或运行状态不佳,数据流就会受到阻塞,关键数据就不能得到有效共享,导致各项业务工作效率的下降,增加运维人员工作量。
由此,如何保障IT系统的畅通无误,如何及早发现并排除潜在的故障隐患,有效地管理好IT系统,保障业务系统的安全稳定运行,成为IT管理人员甚至是领导层都必须面对的问题。“三分建设、七分管理”,IT系统的运维和管理与IT系统的建设同等重要,IT系统运维管理的质量会直接影响业务系统的运行质量。如果有一个合适的运维管理软件来监控管理IT系统,尤其是业务系统,就可实时查看IT系统里各种业务系统的运行状态,检测设备性能可能出现的瓶颈,实现对业务系统的监控和管理,并进行自动处理或告警显示,以保证业务系统高效、可靠地运转,从而保证整个IT系统的稳定运行。
需求分析
国产IT管理第一品牌广通信达公司发现,随着用户的业务与IT系统融合越来越紧密,越来越多的业务流程和服务都依赖IT系统提供,如何保证IT系统的高可用性,成为企业或者组织成功的关键。因此,管理者也逐渐把IT系统当作业务来管理,把IT系统对业务的影响作为决策的依据。
广通认为随着IT资源的不断增长,使信息部门面临着巨大的运维压力,人工的日常巡检来发现与排除故障已不能满足保证业务持续的可用性和性能要求,为了获得更高的性能和可用性,就需要借助监控工具自动实现对IT基础设施的数据采集、状态监控和性能分析。
广通信达认为业务监控中心解决方案的建设应该按照高起点、高标准、高质量的要求,采用先进的IT监控技术实施系统管理、应用管理,对用户现有的系统运行环境进行信息采集、管理和监控,并在此基础上构建一个平台化、智能化、集成化、高可靠性的服务器及网络监控系统,用于信息中心日常的运行管理。系统将管理、监控有机地结合起来,提升整个信息中心的运行管理水平。
传统的监控工具主要面向资源层面的监控,关注各种资源的运行状况,没有对业务系统实施端到端的、从客户体验角度的可用性监测,不能全局性地反映出应用系统的运行状况,一旦出现问题也难以快速有效判断问题的根源。
北京广通信达科技有限公司自主研发的业务监控中心解决方案(Broadview BCC)定位于对网络中的应用服务、网络设备、安全设备以及基础支撑系统的运行状况的监测、性能的管理以及故障的监控。它通过持续对各项资源运行状况的监控,建立性能基线,发现系统中的异常并且及时告警;有效提高了各类资源运行维护的工作效率和服务质量,从而可以保障企业的综合信息平台健康有序运行,为信息部门提供了解决以上问题的最佳方案。
同时Broadview BCC业务监控中心解决方案提供500多种监控器,支持通过SNMP Polling、SNMP Trap、Syslog、CLI(Telnet、SSH)等协议或者UniAgent代理,对资源进行远程或者代理的监控。能够对网络中的服务器、数据库、中间件等内容进行监控。系统支持组合监控功能,可以对IT系统中的业务应用系统从应用可用性、系统资源占用和性能指标三个层面进行全面深入的监控管理。
项目建设目标
Broadview BCC 是广通信达在多年IT运维管理和服务经验积累之上,推出的新一代业务监控中心解决方案,它立足于业务视角,以客户体验监测为起点,从业务可用性和资源健康性双重角度来检视IT系统,从而满足在复杂的IT环境下实施面向业务服务的监控需求,帮助信息部门建立主动化管理模式,保障业务服务质量达到用户的最佳期望。通过实施Broadview BCC业务监控中心解决方案,可以达到以下目标:
1、建立在统一平台架构下,实现对信息网络的系统管理的目标。面向业务运行维护管理需要的IT管理体系,提高网络设备管理质量;
2、保持IT系统可靠性和可用性,保证系统、设备24小时不间断为信息系统提供可靠服务,在此前提下提高IT设备的利用率;
3、在复杂的异构环境中统一管理,轻松维护复杂的异构环境并使之有效运行;
4、把系统运维管理人员从管理设备的复杂负担中解放出来,系统能实现自动的监控和告警;
5、总结和统计出对网络管理、应用管理和业务系统管理性能监控中有用的信息,为管理者提供更全面、更直接、更专业的管理信息,为制订相关决策提供依据,提高信息系统安全性,提升信息系统故障的应急响应速度;
6、建立与管理体系相适应的管理辅助工具,包括网络管理、系统管理等,从而最大限度的屏蔽IT技术的复杂性,实现自动管理,降低对人的依赖;
7、将错综复杂的系统信息,各类系统事件按照IT服务管理的需求进行过滤整理,帮助系统维护人员更专注于对重要事件的管理和响应。
效益分析
1、提升信息中心IT系统监控管理能力
随着用户的信息化建设,应用系统的运行环境越来越复杂,对系统资源的要求也越来越高,引进先进的系统运行管理手段,将有效提升信息管理部门对计算机网络、服务器、数据库、中间件、邮件系统、OA系统、WEB系统、DNS、业务流程等应用系统的管理;第一时间掌握系统的资源使用情况、自身性能指标、应用可用性等性能参数情况,对业务应用系统的安全进行有效管理和监控。
2、提供统一的业务系统监控展示平台
统一的业务监控管理系统将网络、应用系统、安全、IT基础环境的监控整合在一起,实现统一的监控数据采集、一体化的报警数据处理、统一的故障流程处理。通过持续地对各项资源运行状况的监控,建立性能基线,发现系统中的异常并及时告警;有效提高了各类资源运行维护的工作效率和服务质量,从而可以保障公司业务系统的健康有序运行,为信息部门提供解决:业务系统分割管理模式,难以应对资源、业务之间的蜘蛛网关系,导致预防、修复效率降低;应用系统涉及多种操作系统和数据库,无法实现统一管理;无法实现对应用管理和业务系统管理性能监控中有用的信息的总结,为管理者提供更全面、更直接、更专业的管理信息,为制订相关决策提供依据,提高信息系统安全性,提升信息系统故障的应急响应速度。