扫一扫
关注微信公众号

全校园网的集中监控和管理
2010-02-01   网络

【用户背景】

  菏泽学院处在建设中的7000亩大学文化城的中心,是鲁西南地区唯一的一所综合性本科院校。学校分为北校区、东校区、西校区三个教学生活区,教职工高达1350人,各类全日制在校生18000余人,继续教育、远程教育在读生万余人。另外,学校还建有近代物理、分子生物学、网络技术中心、分析测试中心、运动生理等46个实验室,教学科研仪器设备值6042万元。其中,2.67万平方米的图书馆,已拥有现代化电子图书阅览系统,开通了清华同方中文期刊全文数据库、万方科技信息子系统、中国学位论文全文数据库和人大复印报刊资料全文数据库,能满足师生的教学、科研和学习需要。

  目前,菏泽学院二期工程规划方案已初步选定,二期工程建成后,北校区总占地面积将达到1742.1亩,可容纳在校生25000人。不仅如此,随着菏泽学院的不断建设与发展,网络规模也一直在不断地扩大。学校网络拥有高达200多台CiscoHuawei-3com3comNortel华为、神州数码、瑞捷等多厂商的交换机、路由器等网络设备,还拥有20多台服务器等组成的教学平台,在此平台之上,承载着OA、网站、FTP、网上教学、电子阅览室等多种核心应用。庞大的网络规模、复杂的网络环境、分散的网络设备等一系列的难题,给菏泽学院网络中心的运维工作带来不小的挑战。

【用户困难】

IP地址分配与使用不明,经常随意更改IP地址,造成IP使用冲突及网络异常

  菏泽学院网络中由于没有严格的管理策略,学校的IP地址使用与管理相对比较混乱、网管人员无法知道IP地址的使用、IPMAC地址的绑定情况以及网络中IP地址的分配情况。学校内部人员随意设置IP地址,常造成IP地址冲突、关键设备发生异常。学校网络中心也意识到若出现恶意盗用、冒用IP地址以谋求非法利益,后果将更为严重。而又如何防止学校内部人员常私自更改个人电脑的IP地址和MAC地址上网,导致与其它IP的冲突,从而保证学校内部人员的正常办公与学习?

》运维人员数量与技术能力有限,面对复杂的网络异常,故障无法及时恢复和解决

  三个教学生活区、200多台多厂商多型号的网络设备以及由服务器、数据库、中间件等资源所构成各种业务应用,如此庞大的网络规模、复杂的网络环境、分散的网络设备,而菏泽学院网络中心却只有3名技术人员。随着菏泽学院的不断建设与发展,各种IT基础设施、以及各种应用和服务也越来越多,技术上也将越来越复杂,而校网络中心的技术人员却不能成倍增加,大家的技术水平也不能随之成倍提高。当运维人数有限或技术层面不太精通时,将导致故障不能及时恢复和解决。如何做到日常运维工作的经验积累?当出现同样的异常时能在最短的时间内找到问题的参考解决方案?

》网络出现故障时,缺少有效的预警以及告警机制,无法对故障根源进行准确定位

  菏泽学院网络涉及范围大、设备种类多、用户数量大,这是菏泽学院网络基本特点,到目前为止,还没有一套真正意义的第三方网管。基本采用人工的管理方式,发现一个问题解决一个问题,对于故障缺少有效的预警和告警机制,无智能分析过滤,也没有自动化处理,导致问题发生的真正根源就此被淹没,运维人员疲于奔命并且仍无法根除问题。这些传统运维方式不仅浪费大量的人力物力,而且远不能适应当前状态下实际网络应用与IT运维的需要。如何准确定位分析故障状况及根源? 

》网络规模庞大、环境复杂,个人所关注的信息无法在同一个页面实时监控与展现

  据菏泽学院网络中心的运维人员了解并介绍,有些传统的IT管理系统或工具,常需要打开多不同的页面,同时在了解与查看被监控资源信息时,也需要在不同界面间来回切换,这无疑大大增加了工作的繁琐程度,降低了整个运维工作的效率。而如何避免类似的情况,从而帮助网络中心将其所最关注的信息在统一个界面进行全面和直观的展现?并能将各资源的运行情况相互之间做一个对比,以及很方便与快捷的找到资源之间的相关联的关系等成为菏泽学院网络中心又一关注点。

【解决方案】

》对IP-MAC-PORT进行三重绑定,实时检测以及防范内部人员随意更换IP地址

  网强网络管理系统(以下简称Netmaster)可以探测当前段内存活的IP地址及自动发现各网段的IP地址使用情况,并提供主机定位功能,能通过IP地址查找到该IPMAC地址及该IP所连的交换机端口。系统支持监测基于IPMAC、端口的一一对应绑定关系,在发生改动时,实现对设备的网络连接接入的监控,并可批量处理,也可单独指定规则。安全的IP-MAC-PORT三重绑定,有效的避免用户私自更改IP地址、非授权接入网络、PC随意更换连接交换机的端口,极大的增强了网络接入的安全性。同时也为用户网络环境提供了安全保障,并且能快速定位问题设备、查找根源,同时提供变动记录作为可查依据。


IP-MAC-PORT绑定配置)


(实时表一览)


(差异表一览)

》不同故障自动关联系统知识库,知识库提供解决方案,助运维人员及时恢复故障

  Netmaster的知识库除了系统内置的常见故障处理方法等知识库内容外,也可以将菏泽学院网络中心资深技术人员的运维经验,通过知识录入的方法,添加到系统的知识库中去,其中可以包括对于一些复杂问题处理的思路、心得和方法,帮助其他运维人员查看参考。当故障产生后,可以通过不同的异常情况匹配与关联到的知识库中,并从中寻找已有的解决方案,来帮助运维人员及时的处理当前异常。同时,该运维人员也可以将自己处理此事件的方法和步骤添加到知识库中作为知识共享,当其他人再遇到此类事件后能够找到参考的解决方案,提高解决故障或问题的效率。这样当运维人员收到一个设备异常信息,不但能知道出现问题的具体细节在什么地方,并且可以即时关联到该问题的处理方案,方便运维管理人员在处理故障的时候,做到有据可依,心中有数,处理起问题来也更得心应手。


(知识库一览)

》建立全面有效的预警与告警机制,帮助运维人员屏蔽无谓告警,准确定位故障源

  Netmaster智能化故障管理功能建立了及时响应的资源预警、告警机制。系统可以通过灵活的指标体系与规则设置,当网络设备、服务、应用及业务等资源的某项指标达到“警戒值”,再发展下去会造成故障,系统会根据事先设置的规则(阈值、优先级、时间段等)产生预警,以提醒运维人员将可能出现的故障遏制在萌芽阶段。另外,系统可以通过告警敏感度、告警合并、告警过滤以及异常依赖、根源分析等多种高端技术手段,以避免大量的无谓重复告警信息,防止告警泛滥。并能在众多的告警信息中,屏蔽不重要的告警信息,帮助菏泽学院网络中心运维人员能够将精力集中在关键问题上,准确定位可能的故障源,真正做到事先运维、整体运维。不仅如此,系统还可以对网络情况全盘监控,发现异常时能通过提示框、声音、E-mail及手机短信息等各种告警方式第一时间通知运维人员。

(告警配置与过滤)

》基于PORTAL技术的一体化首页监控平台,自己定义关键信息并实现统一界面展现

  Netmaster基于PORTAL技术实现了统一登录界面、统一资源管理及统一信息展现。系统首页默认集公告栏、消息栏、资源健康状况图、TOPN列表显示、拓扑图显示、整体设备健康状况图、整体业务健康状况图、当前异常图及当前异常列表和资源一览等监控信息为一体。同时菏泽学院网络中心可以在首页中针对个人所关注的关键资源、TOPN、拓扑图等内容或信息进行自定义,将自己所关心的若干关键内容集中放在首页上进行统一展现。另外,也可以通过这些监控信息对各资源的运行情况进行相互对比,并可以更加方便与快捷的找到资源相互之间的关联关系。


(首页监控页面)

【用户反馈】

  在引进网强的Netmaster之前,我们学校基本都是靠传统的人工模式来进行管理的。随着学校网络规模的扩大,我们逐渐意识和感觉到对“以人为管理中心”的严重依赖,然而,我们的技术人员并不能保持7X24小时的连续性工作,而且大家也是会疲倦,这样避免不了要出错误。当我们运维经验较丰富的技术人员有限时,突发的故障将更是得不到及时恢复和解决。特别是在我们学校各种应用、业务系统上线后,我们网络中心的工作任务越来越多,工作压力也越来越大,如果没有一套智能和可靠的网络管理系统,将很可能给我们的IT系统带来了很多系统和安全隐患。网强Netmaster中的知识库功能,我个人印象特别深刻,对于异常故障,我们运维人员都可以由异常关联到系统的知识库,知识库则可提供故障的解决方法,从而提供我们的运维效率;而工作中的处理过程、解决方案也都可以导入知识库,有效帮助我们网络中心沉淀工作经验,让我们普通的技术人员也可以成为运维专家。

【典型用户】

山西大学

浙江大学 

东华大学

安徽农业大学

浙江财经学

合肥大学

沈阳大学

中国人民大学

上海金融学院 

广州金融学院

广东经济管理学院

长沙理工大学

河北省广播电视大学 

……

热词搜索:

上一篇:江苏烟草借力北塔提升管理水平
下一篇:飞鱼星助钦州科士网络休闲会所实现双赢

分享到: 收藏