随着我国金融资本市场的日趋开放与成熟,基金行业与基金公司也快速成长起来。作为信息机密度高、要求服务迅捷与稳定、信息化程度普遍较高的行业,基金公司IT部门目前负责维护的系统十分巨大而庞杂。基金公司依靠网络平台实现完成交易的每个环节,包括行情、交易、结算、办公等各个业务系统的自动化,这些都对IT系统提供了更严格的要求。第一,因为网上支付系统涉及面非常广,一次成功的支付涉及到基金公司内部所有的与支付有关的系统,这包括柜台系统、中间件、内网、互联网出口等等,所以只要其中的一项出现问题,将直接导致网上支付行为的失败。第二,原有系统中也会有20%以上的对象可能存在不稳定因素,而一旦发生故障,很有可能就会一直持续下去,直到有客户反映,才会有运维人员去解决,这极有可能造成丢失客户的严重后果。那么,如何在客户之前发现问题呢?
作为业界领先的IT运维与管理解决方案供应商,泰信科技(Tekview) 在为各行业提供网络运维与管理服务的同时,更以开辟运维与管理整体解决方案的技术实力,全面护航我国基金行业的运维与管理服务能力。
项目背景
长信基金管理有限责任公司由长江证券股份有限公司、上海海欣(集团)股份有限公司、武汉钢铁股份有限公司共同发起设立,于2003年4月28日经中国证券监督管理委员会批准成立。目前长信基金旗下有五只开放式证券投资基金、多种股票、债券等证券交易平台,业务应用繁多。整网采用全千兆网络连接,并且业务网和办公网各自物理隔开,业务服务器均采用双机冗余备份。
由于信息中心维护人员较少,一旦出现病毒攻击、设备当机、外网线路丢包、应用服务资源耗尽等种种常见网络故障时,无法有效的了解哪些设备哪些链路出现问题,必须通过维护人员自身经验去判断,解决问题效率较低。所以长信基金信息中心目前急需一套IT资源监控系统,通过此系统能够对网络设备、链路流量、应用服务、数据库、中间件等进行监测和控制,减轻工作量,保障Callcenter电话录音系统、网上交易系统、投资交易系统、行情转换系统、报盘系统、估值系统等业务高效稳定地运行。
Apex解决方案
◆自动化物理拓扑图
长信基金共包含办公网、业务网、电信IDC、网通IDC这样4个网络,整网采用全千兆网络连接,以典型星型结构构建各区域网络。同时采用冗余及负载均衡技术,保证了整个网络的可用性、扩展性及灵活性。业务网和办公网通过Cisco ASA防火墙策略隔开,并配置趋势防毒墙,有效防止由于病毒或攻击导致的业务网络中断。
◆自动化业务拓扑图
泰信科技通过Apex解决方案,将长信基金业务系统所涉及的服务器、网络设备、端口、链路、Web服务、中间件、数据库、邮件服务等关键应用集中监测,展示业务拓扑图。通过Apex业务拓扑图将IT资源与实际业务进行了有效关联,帮助长信基金网管员及时了解业务运转情况,快速定位业务故障根源。
在业务视图中,每一个网络设备、服务器或应用都可以被多个业务交叉复用。在业务拓扑上展示设备名称、IP、运行状态、故障告警、链路带宽等,在设备图标上点击鼠标右键,可以关联此设备的属性、面板图、流量图、常用工具、告警、域操作等。
在业务拓扑中,通过绿、蓝、黄、橙、红五种颜色标示支撑该业务系统的设备或链路目前处于何种性能状态。通过业务拓扑图可以快速发现业务系统中哪里问题最严重、哪条链路故障最多、哪个服务器超负荷运转,使得长信基金运维管理人员可以对产生业务中断的故障点有一个直观的了解。
◆应用服务管理
泰信科技Apex基于长信基金多个业务系统,实现了对多种上层应用进行监控,包括windows、AIX、HP-UX等各类业务服务器及系统的运行状况、Oracle 数据库性能监测与诊断、Exchange邮件服务、Web服务器、WebLogic、Tuxedo、Tomcat等中间件、网站监控、SAP服务器等。
◆统一告警平台
通过泰信科技Apex提供统一告警平台,长信基金网络运维人员能够准确获取各类网络设备、系统和应用的故障信息,并以多种方式(包括声音、图像、电子邮件、短信、第三方脚本等)将故障信息及时发送到指定管理者。
◆业务SLA管理
长信基金IT 部门规范了一套服务等级协议,以衡量、确认他们的客户(企业其他部门的用户)服务质量。然而如何测量及量化这些标准,却是他们较为头疼的一件事。无法测量就意味着根本无法知道执行情况、无法计算执行结果,也无从改善与控制,这种SLA协议就丧失了意义。
泰信科技Apex及时地为长信基金提供了SLA量化标准,譬如在工作负荷<100 transaction/s前提下,早上8点到下午5点服务响应时间<85ms,服务有效率>99%,在一个月内的总体故障率<5,则我们给予该服务金牌称号,表明IT部门提供的服务符合SLA,能够保障公司业务的持续性。
用户收益
泰信科技通过深入了解长信基金业务需求和网络支持体系,提供了针对基金行业IT运维与管理解决方案,一举解决了长期困扰长信基金信息运维中心的难题。具体而言,用户收益如下:
第一, 集中监控。泰信科技运维管理系统作为信息中心网络基础设施集中监控的核心平台,对长信基金运维管理人员了解全网运行状况、协调指挥各条业务线快速解决恢复故障具有重要意义。建成后的Apex系统加快了故障的发现和定位速度,极大提高了信息中心甄别问题责任方、协调指挥各条业务线快速恢复故障的能力。
第二, 故障的快速恢复。故障的快速恢复,不仅减少了可能产生的各种经济损失,也意味着长信基金能够为基金参与方提供更加稳定而高品质的业务服务。该整体性解决方案遵循ITIL标准,可快速准确地把工单分派到相关人员手上,并对流程每一步的经手人进行耗时跟踪记录,通过SLA计时对各流程环节的服务质量进行考核。
第三,运维实现标准化。通过上述一系列措施,泰信科技为长信基金运维与管理实现了标准化、流程化、质量可控化,从而大大提高了长信基金信息中心运维管理服务的效率和质量。