随着商业银行的IT基础建设从稳定基础到上新台阶,越来越多的商业银行开始想到“向管理要效益”,并逐步把客服优势作为其核心竞争力的一部分。和国外同行相比,在管理上的差距也迫使商业银行要向主流的国际标准平台靠拢。这些都使得内部管理部门对IT服务管理的需求快速增长。
服务器数量的增多,应用的增多,应用复杂度的增加,均使得日常维护等管理工作变得比过去更加严峻和复杂,内部需求的驱动也使得这一切变得更迫切。因此,如何加强开放平台系统的安全性、可用性,提高响应时间,提升管理效率,便成为银行科技部门在开放平台服务管理方面面临的挑战。
为了提高商业银行IT服务管理的水平,经过多方面、多层次的验证后,不少商业银行选择了ITIL作为自身IT服务管理流程的指导标准。服务器管理作为IT服务管理的一个子集,自然也应该遵循ITIL的框架标准。
ITIL作为一种全面的IT服务管理的框架标准正式发布后,已经在多个行业得到了实践证明。遵循ITIL标准构建IT服务管理体系,确实可以有效地提高服务质量和降低运行成本。但是,ITIL是一个通用的标准,只是指引了一个大方向,这就确定了ITIL不能直接使用,而必须由企业根据自身的特点和具体实践,在ITIL的框架内制定自己在服务管理方面的具体内容。下面结合商业银行的特点,探究ITIL框架下的服务器管理。
1.服务等级管理
服务等级管理(SLM)是为了签订服务等级协议(SLAs)而进行的计划、草拟、协商、监控和报告,以及签订服务等级协议后对服务品质的评价等一系列活动所组成的一个服务管理。服务等级管理旨在确保组织所需的IT服务质量在成本合理的范围内得以维持并逐渐提高。
对商业银行来说,可以简单认为,科技部门是服务供应商,业务部门是客户。过去,对于科技部门的服务水平没有指标,对于业务部门需要的投入也没有限定,因此双方在服务水平和服务满意度上有一定的分歧。现在,按照ITIL标准的指引,笔者认为,商业银行的业务部门在IT服务上也必须具有成本意识,要和科技部门进行服务水平的约定,确定业务部门需要投入多少,以及科技部门需要达到什么样的服务水平等。在对成本和服务水平进行界定时,各商业银行可以考虑以下内容:明确业务部门的业务需求及相应的IT服务需求;确保以合理的成本提供约定的IT服务等级;确保实际的IT服务等级达到约定的服务等级的要求;尝试内部收费。
2.IT服务财务管理
IT服务财务管理考虑IT资源的效率及经济价值,旨在将基于预算的IT组织转变为类似于商业组织的具有成本意识的组织,为用户提供成本合理的IT服务。IT服务财务管理主要包括预算编制、IT核算和服务计费等3个子流程。
从IT服务财务管理的标准来看,各商业银行的科技部门也必须具有成本意识。IT服务的财务管理不善,将导致IT服务成本的上升或者IT资源的浪费。此外,科技部门在强调质量的同时也必须强调效率。
对比ITIL的标准,我国商业银行现有的IT服务财务管理还相对模糊,在未来的管理中需要考虑:根据服务等级水平的不同来制定不同的成本标准;尝试内部成本计算,在满足内部服务标准的前提下控制内部成本的增加;考虑和关注成本与生产运行风险的关系,尽量在成本和风险之间做好平衡。
此外,商业银行也应进行各种研究,使用一些先进的技术手段来降低服务器的成本,如网格计算、服务器资源的整合、错峰使用系统资源等。
3.能力管理
能力管理主要关注业务和IT基础架构之间的关系,它不仅要评价和改进现有服务能力,而且还应分析和预测组织未来的业务需求,从而据此确定未来应当配置的服务能力的级别。
商业银行在服务器能力管理方面,最重要的手段是定期进行健康检查。定期对目前的服务器运行状况进行检查,检查其处理能力能否满足当前以及将来的客户需求,并且检查其处理能力是否已经发挥其最佳效能。然后,对检查的结果进行分析,如果处理能力不足,那么可以考虑更换和增加设备、系统拆分、采用并行数据库技术、采用负载均衡技术等方式来提高服务器处理能力。
另外,通过制定一些服务器使用策略进行硬性控制,也能收到一定的效果。具体来说,可以考虑对服务器制定如下使用策略。
(1)对数据库服务器的策略。可以考虑使用配置较高的高端服务器,强劲的处理能力,再加上高速的SAN环境,能够满足商业银行对开放平台数据库的高吞吐量和快速响应的要求;可以采用并行数据库技术(如Oracle的RAC)来实现高可用和性能扩展;通过统一规划,多台数据库服务器使用相同的备机(即N+1备份方式),达到保证可靠性的同时降低成本。
(2)对应用服务器的策略。使用配置中等的服务器;使用负载均衡来扩展处理能力;不适合使用负载均衡的应用系统,可用分区分片的方式来扩展处理能力。
4.IT服务可持续性和可用性管理
IT服务可持续性管理就是负责预防灾难、增强IT基础架构的恢复能力和容错能力的流程,它需要确保组织在发生灾难后有足够的技术、财务和管理资源来确保IT服务的持续性运作。
可用性是指一个组件或者一种服务在设定的某个时刻或某段时间内发挥其应有的功能的能力。它通常以可用率来表示,即在约定的服务时段内,客户实际能够使用的服务的时间比例。
可用性管理是有关设计、实施、监控、评价和报告IT服务的可用性,以确保持续地满足业务可用性需求的服务管理流程。
为了确保可用性,现在商业银行一般的措施有:定期检查,确定重点问题;安排计划解决重点问题。
商业银行可以采用下面一些方法来保证IT服务的可持续性:服务器进行N+1备份;服务器进行负载均衡;服务器异地灾备;使用自动化手段对数据进行备份;有完善的备份管理制度和流程等。
数据库服务器N+1系统备份方案,是只用较少投资就能保证服务器高可用性的先进技术方案。具体来说,是在SAN环境中,假设有N台同平台的数据库服务器是生产服务器,那么集中指定一台相同平台的备机作为所有N台生产服务器的备份服务器,每一台生产数据库服务器都与备份数据库服务器组成一个群集。当任何一台生产数据库服务器系统出现故障而不能对外提供服务时,安装在服务器上的群集软件会监控到故障的发生,并在较短的时间内由备份服务器自动或通过人工手动接管出现故障的数据库服务器上的应用,重新对外提供业务访问(出现故障前已有的数据库连接会被断开并重新与备份服务器建立连接),从而保证业务连续性。N+1备份不一定要局限在数据库上,也可以扩展到其他同平台的应用服务器之间,但是需要定制较为复杂的判断和切换的脚本。
5.配置管理
配置管理是由识别和确认系统的配置额、记录和报告配置项状态及变更请求、检验配置项正确性和完整性活动等构成的服务管理流程。在配置管理中,最基本的信息单元是配置项。所有软件、硬件和各种文档,比如变更请求、服务、服务器、环境等都可称为配置项。
配置管理不同于IT资产管理,后者是一个计量过程,它记录了资产的购置时间、购买价格以及放置位置等方面的情况。而配置管理除了记录配置项本身的情况外,还记录了各配置项之间的关系,以及有关配置项的标准和授权方面的信息,同时它还记录了配置项的当前状态和变更情况。
在ITIL的框架中,配置管理是一个基础,因此,完善配置管理对于我国商业银行的IT管理非常重要。配置管理的发展方向是建立统一的配置管理系统,开发自动获取配置信息的工具,结合人工输入信息的补充,智能化地维护配置管理信息,为整个IT管理的其余内容提供坚实的基础。
6.用户管理
目前,各商业银行拥有众多的生产和办公的开放平台设备,其中包括多种厂商的硬件平台及操作系统。同时,各商业银行还拥有大量的运维和管理人员,分属于多个部门,在不同的开放平台系统上拥有不同特点和类型的用户。据了解,现在商业银行大多采用的是分散的用户管理模式,即在各个主机上独立维护各自的用户。随着系统和应用日趋复杂、人员变动不断加快,这种管理模式使得管理员无法及时获取用户的变动情况,为商业银行的日常运行管理带来很大的麻烦,同时也存在很大的安全隐患。
因此,我国商业银行需要考虑开展开放平台服务器用户集中管理。用户集中管理具备以下优势:跨平台;集中管理,统一管理;用户角色、权限的审计和设置流程;日志集中审计。
在开放平台服务器用户集中管理项目的系统实现后,管理员将集中管理多个系统的账户密码,用户仅需通过服务器用户集中管理系统登录成功后,即可登录其他系统,大大方便了维护管理工作。在安全方面,用户集中管理系统可以提供集中的审计日志管理,可以统一设定主账号的名称、密码安全策略,以防止用户密码过于简单。
7.版本管理
版本管理和补丁管理属于ITIL管理流程中发布管理的一部分。由于操作系统、数据库、中间件等的版本发布由各服务厂商所控制,并且和硬件体系结构也有关系,所以各商业银行有时需更改规划以适应服务厂商发布的新版本。
由于版本的更新一般会涉及应用的修改,而商业银行的应用极为关注稳定性,所以在采用新版本操作系统和系统软件方面,一般说来,商业银行在时间上会比其他行业有所滞后。此外,由于各商业银行均存在部分外购的应用,此类应用无相应的源代码或者允许修改的许可证明,所以此类应用升级比较困难,从而导致不少商业银行有同时存在多版本操作系统和系统软件的情况。
因此,我国商业银行在以后的发展中,需要丰富和完善版本管理规范,对于新版本,做好系统层面及应用层面的测试。此外,对于外购应用,尽量争取到相关源代码以及允许修改的许可证明,或者通过其他方式来避免多版本并存的问题。
8.补丁管理
补丁管理的一些情况和版本管理很类似。
在补丁管理方面,目前一般分为微软的Windows补丁和Unix补丁两大类。对于Windows,一般采取的策略都是尽量打上最新的补丁,以防止病毒、黑客的侵袭;而对于Unix,很多商业银行都不太愿意经常打系统补丁。造成这种状况的主要原因是:一方面,如果不及时打上最新的补丁,就可能面临安全的风险;但另一方面,操作系统和系统软件的补丁太频繁,就难以组织全面的验证测试,即使通过了测试,也无法保证和中间件、应用系统没有冲突。因此,商业银行往往难以制定统一的有效的补丁管理策略。
因此,需要尽早制定更有效的管理流程,把获取补丁、组织测试、审批审核、补丁发布、组织试点、组织推广实施的流程明确下来,并且对不同的补丁制定不同的测试验证的详细方法,这样可以用管理的手段降低补丁管理上的风险。
9.软件分发
在解决了版本和补丁的管理之后,接下来面临着如何把这些软件发布到众多的服务器上并进行安装的问题。
在早期环境中,由于服务器和应用数量不多,所以通过人工操作便能够满足要求。但现在服务器数量日益增多,而且应用、系统软件等也不断增多,仍然采用人工操作已经不能满足要求。
由于开放平台的品牌和版本较多,建立统一的、有效的软件分发渠道较为困难,所以目前各商业银行基本上还是采用人工安装的方式。
10.资源监控
资源监控基本分为三类:硬件监控、系统资源和应用资源。其中,对于硬件监控,目前仅个别硬件厂商能提供监控软件,但功能和范围有限。所以,各商业银行需要尽快完成各种研究,进行统一考虑,尽早实现统一监控。
针对系统资源,目前各商业银行已经搭建起比较完善的监控平台,能够对目前主流的系统平台的资源,如CPU、内存、I/O活动情况等,提供简单有效的图形显示方式,并且能够根据预定义的阈值进行报警,对主流的数据库、中间件的各种信息,也有相当丰富的监控指标。
针对应用资源,目前各商业银行的应用系统基本是用自行编写的软件进行监控,但普遍缺乏统一规划。各商业银行应统一规范,对其中的部分功能,应考虑和系统资源监控等现有架构结合,充分发挥现有的架构优势。
11.存储管理
随着业务数据持续高速增长,存储设备容量和规模也在快速膨胀。为适应业务发展的需求,保持高效快捷的数据处理能力,各商业银行先后引入了基于SAN技术的集中存储模式和理念,并进行了部署和实施。目前,集中存储已开始在基础架构中发挥关键作用,不但为开放平台各应用系统提供了性能优越的数据访问通道,而且以高可用的方式保证了数据存储的安全和稳定,保障了应用系统的业务连续性。
集中存储的一大优势就是集中管理。当集中存储的规模进一步扩大、存储设备日益增多,基于存储设备管理工具的管理方式将带来管理效率的降低和管理成本的攀升。业界已开始关注这一问题,一些组织也发布了一些管理规范,为各种存储设备提供统一的管理接口,消除不同存储设备管理工具互不兼容的隔阂。
12.备份管理
备份是保证IT服务管理可持续发展的一个重要手段。备份的一个实施目标是:采用自动化、集中化的工作方式,满足对业务数据的备份与恢复需求;实现对SAN存储区域网的支持,对连接在SAN网络上的各服务器进行高速数据备份及恢复;实现对SAN网上的磁带库、磁带机、磁带设备共享使用;对未连接在SAN上的服务器通过LAN实现数据备份及恢复;对业务数据进行在线备份,不影响业务正常运转;提供与事件管理平台的集成接口,对数据备份中出现的报警事件进行及时处理。
目前,各商业银行的备份流程已基本规范下来,以后应着重在备份效率、虚拟带库等方面进行研究,对现有备份系统作合理调整,减少备份窗口,提高可恢复数据时效,降低对应用系统的影响。
13.防病毒管理
目前,各商业银行都有较完善的防病毒管理,尤其在Windows平台方面,基本都统一部署防病毒软件,达到统一升级、统一杀毒和主动收集病毒报告的管理水平。而在Unix平台方面,目前各商业银行主要着重于安全配置。部分银行甚至已实现邮件级别的病毒预防,并着手进行防垃圾邮件方面的技术研究。
14.安全管理
安全管理方面,商业银行必须着眼高处。要建立安全规范与标准,这些安全规范与标准,应涵盖主机安全、数据库安全、开放平台安全、网络安全、应用安全等多方面,包括总体的安全策略、规范,同时,也要制定具体的技术标准。现在已经有些商业银行先行一步,制定了全面的安全规范和标准。
除标准外,各商业银行还应定期使用工具自行扫描漏洞并进行跟踪整改,定期邀请安全公司对系统进行安全检查,以达到更好的安全检查效果。
对于我国商业银行的服务器管理,由于体制、管理、技术、资金等诸多方面都不太成熟,很多比较理想的管理措施还不具备实施条件。因此,我国商业银行应该结合自身的特点,对照ITIL框架体系,做好近期的规划,加强服务器管理。一些技术成熟、成效大的措施可以尽快推广,如并行数据库、负载均衡、N+1备份、资源监控、用户集中管理等。从长远来说,只有建立完善的成本核算和服务等级管理体制,才能真正建立一套符合ITIL标准的、科学的服务器管理体系。