信息孤岛一直是悬而未决的问题,如何有效地利用网络、利用信息化,整合单位资源成为人们所关注的课题。
网络的管理人员相信只有数据大集中,数据才有可能变得更加安全、可靠。因此,大集中是不可阻挡的趋势。但数据的大集中同时也会带来很多其他的问题。例如数据本身的安全性、可靠性等,因此,企业不得不建更多的备份中心。同样,这些多中心同步又会产生一系列的问题。
总结来看,有六大问题在困扰着网络管理者,想要成功地实现数据中心的集中化,这六大问题是必须要解决的。究竟是哪六大问题呢?北塔作为IT运维的管理专家,我们与您一起“医疗”网络。
抓住计算核心,保证服务器的稳定
毋庸置疑,服务器是网络的计算核心,是各个系统的运行平台。如果我们把数据中心进行了整合,当服务器因为故障而宕机,那么将直接造成系统的瘫痪。服务器本身是有性能瓶颈的,同时,在可靠性、安全性等方面都有局限性存在。同时,目前X86服务器在实际应用中还占据着很大的比重,而作为X86的主要平台,Windows系统的稳定性在业内又一直饱受置疑。当然,我们也可以采用UNIX服务器或者在X86平台上运行Linux系统,但是,UNIX服务器的价格昂贵,而Linux系统又不像Windows那样普及。所以,对于很多的网络管理者来说,服务器就好像一颗不定时的炸弹,它随时可能出现问题,而一旦服务器出现了问题,往往都是最为严重的问题。
那么,我们通过什么管理手段来保证服务器的稳定呢?我们认为对于服务器的管理应该防范于未然,或者说,采用事前管理的手段。想要实现服务器的事前管理就不可避免的要借助一些管理工具,因为对于一个人来说,服务器的很多故障隐患不是可以随时掌握的,比方说关键进程的运行数据,CPU、内存的占用情况,对于类似这样的数据,仅仅依靠人工是不可能达到7*24小时掌握的。这就需要类似北塔软件IT运维管理系统BTNM这样的管理系统来辅助我们进行服务器的实时监控,并且在服务器的各个运行指标出现异常时及时报警,确保网络管理者在服务器宕机之前做出有效的故障处理。
确保网络通畅——保证网络设备的稳定
对于很多网络管理者来说,网络是一个看得见也摸得着,但就是不知道内在情况的“黑盒子”,虽然对于主干网络来说,我们可以通过网络拓扑图来进行掌握,但是对于整体网络而言,它的变化我们是无从所知的。当数据中心进行了整合之后,一方面网络设备的密度会加大,另一方面,网络设备与网络设备之间关联的复杂程度也会增加。
举个简单的例子来说,某台交换机的某个端口出现了故障,那么这个端口所连接的相关网络设备也有可能停止工作。这个故障对于网络管理者来说,可能会过了很长一段时间他才会知道,而当他知道了这个问题之后,还要花费大量的时间去逐级定位故障原因,当故障被排除之后,可能已经过去了几个小时甚至更长的时间,而在这个时间段造成的业务损失可能是巨大的。这样的故障如果影响到业务部门,有可能造成核心业务的停滞而使企业产生业务亏损,如果影响到生产部门,有可能造成产品交付的不及时而是企业违约。
试想一下,如果在年底的时候,这样的故障影响到了财务部门,那么年底的封账就会产生问题,有可能造成单位大量的资金流失。而导致这一切的“元凶”仅仅是一个小小的交换机端口。所以说,保证网络设备的稳定,使得网络通畅也是数据中心集中化的基础之一。
我们当然希望能够有效地了解网络中设备与设备之间是如何关联的,时刻掌握详尽的网络拓扑图(如图1),当然希望了解网络中每台设备的IP地址、名称,使得整体网络对于管理者来说是一张“透明”的网络(如图2)。北塔软件IT运维管理系统BTNM可以为整个网络提供设备间连接情况加以注释,对关键的网络设备提供实时有效的监控以及故障和潜在故障的快速定位。同时能够把这些信息真实有效的传递给网络管理者。
图1 网络透明化管理中详尽的拓扑图 |
图2 透明化网络管理示意图 |
让网络速度得到保证——掌控网络的流量
数据中心整合之后,网络速度是实现各个业务系统顺利运行的一个前提条件。很多人发现,网络速度慢并不是因为带宽不够而导致的。造成网速慢的很大一部分原因是网络流量分配不合理。当网络中充斥着电驴、BT这些“血栓”的时候,你怎么可能希望您的视频会议、ERP可以顺畅的运行呢?更可怕的是,当网络中出现了蠕虫之类的病毒之后,您的关键业务系统就有可能因为得不到足够的带宽而成为一个装饰品。
所以,我们对于网络流量方面要尽可能详细的掌握,确保关键的业务系统得带宽不会被占用。同时,当数据中心整合之后,跨IP网段的分析捕捉各类异常网络数据流变的尤为重要,它是保证数据中心和各个分支机构正常运行的基础之一。
保证IT设施的良好环境——对于机房环境的保证
数据中心进行了集中统一的整合,我们对服务器、网络设备、网络流量等关键要素进行了实时的监控之后,您千万不要忘记机房环境。一旦机房环境出现了问题,您前面所作的一切努力便都会成为“无用功”。我们还需要对整体的核心机房环境、UPS等设备的状态进行掌握,这样才是集中化数据中心的保障。
及时有效的通知——故障报警的方式
当网络产生了故障,首先要做的是让网络管理者在第一时间得到通知,进而让其了解是哪里出了故障。如果网络管理者事先得知某网元即将出现故障并采取应对措施,那么故障量将大大减少。对于IT运维系统来说,这就是告警管理。
对于网管员来说,数据中心大集中之后的网络变得更加复杂,网络的事前预警和出现故障后的及时报警就更加重要。
妥善的资料分析——详实的报表提供
网管系统是为网络管理者所服务的,所以网管系统要为网络管理者提供出简洁明了、一语中地的网络分析数据。整合的数据中心的网络层必然比分散的数据中心复杂,没有一份详实的网络运行报表,网络管理是无法对网络整体进行有效的调整、升级和优化的。所以,网管系统必须为网络管理者提供有效的“网络病历”。
总结
当然,网络管理相关的着眼点还有很多,我们在这里只是提出了最为重要的几个方面。
据中心的集中化使得核心网络更加的复杂,网络管理迎来了新的挑战。可是,如果没有通过良好的管理方式使得数据中心能够稳定的运行,整合后的数据中心非但不能达到预期的目的,更有可能为用户带来更多的烦恼和损失。所以,整合数据中心时千万不要忘记构建一套妥善的网络管理方案,只有这样,您的数据中心才能为您提供稳健的服务。