随着计算机以及网络技术的飞速发展,计算机承载的应用软件日趋复杂,业务系统的健康运行成为衡量IT系统运行质量的重要考量因素,相应的应用监控已经成为当前系统监控工程中一项核心任务。应用监控主要是针对企业的业务软件的监控。通过应用监控,企业可以从业务角度,更加直接地发现问题。如果业务软件运行不正常或停止,即使基础架构部分(支撑应用软件的网络、主机、数据库、中间件软件等软硬件基础设施)运行再好,对于整个系统来讲都是致命的问题。如何做好应用监控已经成为监控运维领域的下一个重要方向。
北京联华信的TeaView一体化综合监控平台,可以很好的支持企业业务监控。
1. 应用监控的常规划分
应用监控主要从用户感受角度去监测一个系统是否正常,因此,其监控内容一般划分为如下几方面:
n 最终用户体验监控
针对应用提供的各项功能(交易),从应用系统使用者的用户体验角度,监测应用提供的各项功能的系统响应,典型的为端到端响应监控。
n 用户自定义事务处理性能剖析监控
按照应用系统开发者定义的事务处理逻辑,穿越组成应用系统的业务软件的各个组件、支撑业务软件的各基础架构元素,对该事务的各子处理性能情况开展跟踪。
n 应用组件深入监控
对组成应用系统的一些关键元素的深入监测,以便进一步确定性能问题的根本原因。如:数据库、应用服务器中间件、消息中间件、甚至包括网络基础架构的一些元素等。
n 应用监控性能数据的综合分析
前三个方面所采集的大量监控数据,经过各种关联、过滤、聚合等统计分析,辅助定位系统故障、发现性能瓶颈,为性能调优、容量规划等提供依据。
2. 应用监控的主要内容
按照上述思路,应用监控的主要内容可归纳为如下:
2.1. 联机处理监控
2.1.1. 业务功能的用户感受度监控
n 交易响应时间监控
监控典型交易、关键交易响应时间。采用模拟交易方式,模拟典型交易、关键交易,监控联机交易的响应时间。
n 交易可用性监控
监控典型交易、关键交易是否可用。采用模拟交易方式,模拟典型交易、关键交易,监控响应时间是否超过可忍受时间极限,相应结果是否正确。
2.1.2. 应用系统整体服务状况监控
n 交易量监控
监控不同时段内的交易量。
n 交易成功率监控
监控典型交易、关键交易的成功率。通过数据库交易记录、交易日志等监控并计算交易成功率,当过低时报警。
n 交易流量监控
监控典型交易、关键交易在不同时段的交易流量。通过监控交易请求队列消息数进行监控。
n 在线用户数
监控应用在线用户数。
2.1.3. 联机应用各组成部分监控
n 网络监控
监控主机间联通状态
n 应用进程监控
1、应用进程启动、正常停止、异常停止时间
2、进程名称、数量情况
3、僵死进程情况
4、进程间通信状态
n 队列监控
监控消息队列长度是否超长
n 日志监控
监控日之内异常信息、报警信息、日志的增长情况等。日志可以是文件形式、数据库记录形式。
n 应用数据监控
关键表访问量监控。关键表记录、关键字段变化情况监控。
2.2. 批处理监控
2.2.1. 批处理完成质量监控
n 完成时间监控
联机批量的完成时间是否超过预计时间。
n 成功率
批量的处理成功率、各种失败状态占比。
2.2.2. 批处理过程监控
n 上游数据源监控
上游系统提供数据(数据文件)到达时间是否及时,数据种类是否齐全,数据量大小是否合理。
n 批处理开始时间
批量处理开始时间、超过预定时间报警。
n 批处理关键点监控
关键步骤开始时间、结束时间是否在计划范围内,可通过批处理日志、数据库关键表记录监控进行。
n 批处理结束时间
批处理全部结束时间是否在计划范围内。
n 批处理过程故障情况
批量中断情况、批量错误信息监控,可通过批处理日志、数据库关键表、关键记录监控进行。
3. 应用监控常规方法
从技术理论上讲,信息系统内任何对象的监测采集,不外乎采用两种办法:一种是基于该对象对外主动提供的监测指标/特征进行监测;另一种是通过该监控对象所处的外围环境的一些特征进行间接监测,判断该对象的运行状态。
北京联华信科技有限公司开发研制的TeaView 一体化综合监控平台的通用监控模型,提供了丰富的设备连接方式,通过配置方式可自定义监控设备、监控指标、采集方式等。在实际中,通过灵活地使用这些特点,可以广泛地应用于应用监控。
尽管应用的种类千差万别,但对每个应用而言,从监控角度,都可将其整体或部分视为管理对象,都可抽象出属性和事件。因此,可以采取以下常规手段:
l 通过应用管理接口实施监控
对于提供管理接口的应用,按照TeaView监控模型,通过配置方式,实现对管理接口的访问,从而将应用视为管理对象进行监控,管理对象的属性则取决于应用管理接口所暴露的参数。完成配置,经过平台注册,即可将应用程序作为管理对象实施监控管理,获取属性和事件。在监控平台,还可针对属性设置告警事件、严重事件等级。
l 通过应用日志监控
按照TeaView监控模型,通过配置方式,将日志文件的监控作为属性添加到封装的管理对象中,获得事件信息。
l 通过灵活使用第三方渠道获得管理对象的属性、事件
在应用系统安全约束许可条件下,通过间接等价方式,灵活使用第三方渠道获得管理对象的属性、事件。
如:对于基于应用中间件开发的应用程序,可通过监控需求分析,确定能够间接体现应用程序监控特征的中间件属性、事件,并实施监控;
又如:可通过对操作系统属性、数据库表的关键状态位等属性的监控,间接获取应用程序监控特征。
总之:对不同应用,均可通过不同方法将其纳入TeaView监控平台,实施统一的监控。