IT基础架构不仅是一项具有战略价值的资产,而且是现代型企业业务有效运转与员工信息沟通关键基础。对许多组织机构来说,其自身的成长壮大和新技术的迅速发展催生出极其复杂的异构网络环境,数据中心和服务器系统平台之间的管理开始遭遇瓶颈。
人们对网络的绝对依赖,更加突出了服务器在信息计算体系中的核心地位。无论是运行关键任务的企业信息系统(包括ERP系统)程序、企业防毒体系、身份认证平台,还是诸如Email、文件、打印和数据库服务等核心IT服务,服务器的可用性和性能是决定这些业务能否顺利运行的重要因素。但异构分布式环境的复杂性又使得服务器管理充满了必要性和挑战性。
服务器管理问题凸显
在错综复杂的信息环境,企业要想吸取有效信息,就必须面对跨越异构环境(硬件平台、操作系统、数据库平台……)带来的层层障碍。随着企业成长发生的变化,在异构环境下的企业数据中心,其中的数百台各种品牌的服务器和存储设备中跑着各种应用,管理起来就成了大问题(图1)。
图1
1.总体拥有成本增加
在传统的IT 环境中,企业的每项业务都会有一套单独的、分布在不同分支机构的IT系统来支持,配备有特定的系统管理员。在一家国际货运公司招聘过程中,出现了一个非常“可笑”的例子:他们在南京成立分部,需要招聘5名分支代表,而其中一人必须需要懂得Linux操作系统和数据库管理,他必须要每周将服务器的系统状态做成报表发给总部。当然,这样的例子并不多见,但由于企业信息化的触角伸及到每个角落的时候,也就造成了服务器、存储设备部署数量过多及物理位置分散的现象。不仅系统的灵活性、数据的完整性和可用性差,而且增加了整个IT基础设施的总体拥有成本。
2.服务器运行状况成了“迷局”
服务器运行状态收集和分析对于正在提供服务管理功能中企业信息平台非常重要,也对任何重大升级换代过程中的服务管理都是至关重要。通过将收集的数据和报告IT 部门核心管理层可以非常有把握地确定任何给定时间服务的总体运行状况。操作人员可以使用这些数据来检查任何影响服务的事件,将影响与所提供的服务相关联,并为提供的服务制定预先响应计划和前景展望。但在异构分布环境中不断进行变更中,会使无法在第一时间准确的掌控它们。
在分布式异构环境中,我们通常按照自己预计的峰值负载来选择配置服务器,并且“自以为是”的为这些服务器提供充裕的存储空间。但在资源需求增长很快的部门却因为服务器容量过载,不能满足业务需求,造成服务水平下降。而有些服务器的在信息交换量很少部门却显得十分奢华,我们曾经对多个大型网络进行过统计,大量的数据表明,他们一半以上分支部门的服务器平均利用率还不到20%,这是一个非常低的利用率。
3.管理人员的压力增大
处在异构服务器管理里情景中的IT专业人员面临着来自企业各个方面的压力。他们要求IT环境下的一切都能“正常运转”,例如,随时随地访问信息资料并收发电子邮件;与内部团队成员及外部合作伙伴实现即时协作;开辟更多门户,召开更多视频会议,并提供其它协作工具;允许以自助方式调用基础架构服务。
另外,人工干涉导致的系统错误具有很高的挑战性,几乎不可能完成。在效率低下的同时,还具有很大的随意性。当系统发生故障后,用户很难立刻根据表面现象判断出故障的真正原因,服务器管理人员和网络管理人员会根据经验一步一步地检查故障,很容易出现人为错误。尤其是分支机构中的管理员,他们不可能人人都是个“全面手”,不可能面对不同版本的操作系统、数据库系统、Web应用系统、邮件系统都成为专家。
扩大管理范畴 决胜千里之外
20年前,Gartner Group就提出了SOA(Service Oriented Architecture,面向服务的架构)概念,其基本思想是以服务为核心。所以,现今的服务器管理也不仅仅是服务器硬件本身,而是在服务过程中监管应用效能,以及检测系统应用中出现的瓶颈和潜在问题,并能够从危急情况中自动恢复。对CIO而言,需要保证运行维护的规范性以减少意外的发生,同时需要掌握各种资源(网络设备、网络带宽、服务器、各种终端)的利用情况,为网络优化和服务器资源扩容提供强有力的依据。游龙科技根据多年的研究和经验积累,将服务器管理软件扩展到网络架构中的各个方面,它们包括:
- 反映服务的总体运行状况,集中显示特定方面的数据;
- 反映服务器运行状况和性能的基础结构数据;
- 反映特定用户体验的客户端数据,例如连接时间、连接成与失败的特定操作;
- 影响服务和用户工作效率的问题;
- 有关进行预算和规划所需的最高操作成本的详细信息。
实时全面的信息收集,对大量分散服务器集中管理的环境应用优势尤为明显。
服务器子元素的采集
监控服务器系统静态信息(CPU、内存、硬盘、光驱、网卡、显卡、操作系统、RAID卡、PCI附加卡等信息)和动态信息(主板、CPU、SCSI 模组、风扇板等设备的温度、电压、风扇转速信息以及CPU利用率、内存利用率、硬盘I/O访问流量等系统资源信息),以及实现对RAID阵列的管理;
外部环境的掌控
系统管理更注重收集网络内运行的数据信息,提供网络的性能统计, 并完成性能分析与容量规划。分析历史统计数据,优化网络性能,消除网络与主机中的瓶颈。网络负载的合理安排、网络资源的高效利用都是服务器单一角色所不能决定的。
只有采用集中式监控管理平台,才能实现外部环境的安全掌控。不但要提供KVM监控、性能监控、安全监控、告警监控、角色管理和权限认证,还需要克服异构网络中的局部性,为系统管理员提供基于层次结构的全局资源统一视图。监控管理平台需要提供对不同品牌服务器的服务器监控管理工具的集成接口,从而实现同时对各类服务器进行全局资源监控和管理。
智能的处理流程
以往的监控平台,只能实现:在上述被监控对象发生超越门限等异常事件时,监控软件会通过多种形式(消息框、邮件、告警音、短信)告警,同时将告警事件记录入日志,方便管理员根据告警日志分析诊断。而智能的处理流程是一种质的转变,当然,它并不是指监管平台能够进行逻辑推理,智能是对“新事件”而言的,平台应该可以自动学习,并存入知识库作为经验积累,也可以与知识库进行对比,从纷繁复杂的现象中发现服务器故障的本质。
服务器管理的发展方向
当前不同服务器厂商均提供独立的服务器监控管理工具,但在企业的网络信息中心仍然无法统一地对不同厂商的服务器进行监控、管理、报警、配置。另外,企业核心区域的服务器都是承担关键应用,这些应用对于用户来说绝对是7*24小时需要保障地。
例如:基于Web应用的关键站点,通常分为三层结构模式:Web服务器、应用服务器和数据库服务器。Web服务器承担Web访问量,应用服务器完成相应的数据调用,数据库后台则承担数据请求。由于关键应用对数据的可用性、可靠性和安全性具有严格要求,所以我们必须需要一种能够将这些应用划分到一个集合中,同一进行管理的平台。
SiteView综合系统管理,它专注对局域网、广域网和互联网上的应用系统、服务器和网络设备的故障监测和性能管理。能够将异构环境中的关键应用系统、网络设备、服务器、中间件、数据库、邮件系统、WEB系统、DNS系统、FTP系统、电子商务等进行全面深入的监测管理。不但可以根据企业的网络拓扑,还可以将异构网络中的关键服务器进行逻辑分组管理。通过友好界面来简化系统引导、电源、存储、驱动器固件与软件、关键业务运行状态的管理。这都为企业跨平台、跨网络、全面地服务器监控提供了安全的解决方案,我们将整个IT架构中的核心(服务器),安心的放在您掌骨之上。与您同行,在异构环境中实现简单管理,开创企业信息化的新时代。