ITOA是什么?
ITOA即IT运营分析,是IT Operations Analytics的缩写,是近几年来IT管理和分析师报告中用的非常频繁的一个词语。2012年,随着全球第一家ITOA企业Splunk的上市,并得到市场和投资者的一致认可,ITOA迅速成为IT管理的新方向。
在ITOA之前,IT管理的重点是M,即监控(Monitoring或者Management),与M相关的技术和产品包括:BSM (业务服务管理,Business & Service Management);BTM (业务交易管理,Business Transaction Management);APM (应用性能管理,Application Performance Management)等。M类产品起源于上世纪90年代,是为了解决IT配置、变更和运行过程中发生的可用性和性能问题而产生的。随着时代的变迁和技术的发展,原来的M类产品出现了以下局限性:
● 随着云计算、虚拟化和大数据的发展,现代数据中心变得更加复杂和动态化,远远超出了M类产品的功能范围;
● 现代数据中心的IT软硬件中产生大量的原始数据,数量从G级单位上升到PB级单位,在数量、周转率和种类方面都远超过去,现有的M类产品无法解决这些大数据产生的问题;
● 移动互联网和未来物联网的发展,将使得大数据以指数级的方式产生,市场需要与大数据相适应的新的技术手段和产品。
为了解决以上的问题,ITOA便应运而生。ITOA将IT配置、变更和运行过程中产生的海量数据转化为清晰的、可付诸实施的解决方法,企业通过使用ITOA产品生成的报表可以大大地缩短故障修复时间,减少事故和宕机次数,平滑地实现无故障的应用发布和系统升级。
ITOA产生的背景
以下三个要素是ITOA产生的主要驱动力:
● 复杂度,在过去的时间里,数据中心的每一层技术正在变得越来越复杂而难以控制和管理,IT设备的配置参数,从少则几十个、几百个到多达几千个。比如,Windows操作系统的配置参数在1500到2500个之间;IBM WebSphere的配置参数为1600个; Oracle WebLogic的配置参数超过6000个。每一个IT设备的每一个参数如果配置错误或者忘记配置,都可能给整个IT系统的运行造成巨大的影响,应用系统间的互相依赖使得管理和控制整个IT业务服务体系变得越来越难。2011年4月,亚马逊Web服务宕机,造成Quara、Foursquare等一批大客户服务中断4天。事后亚马逊发布故障声明称:网络升级过程中的网络配置错误引发了这次事故。
● 动态化,对IT运营来说,变更是家常便饭,发生在应用和架构的每一个层面,几乎影响着IT业务的每一个方面。为了迎接这些挑战,企业采用敏捷开发的方法来实现应用的快速迭代,持续地集成和持续地更新,最多可能导致每天生产系统上有上百个更新。比如,eBay每年有35000个变更。IBM2011年的调查表明,50%到75%的数据中心运行着配置落后的系统。
● 管理篱笆化,大部分单位都没有一个专家来对全部应用系统进行端到端的一站式管理,应用系统被部署在不同的物理和虚拟系统中,应用之间通过网络来进行连接。过去的各种M产品各自完成对一部分应用体系的数据和指标的管理,没有一个产品能够从广度和深度上覆盖所有的IT系统。
要解决以上的管理难题,IT运营不仅需要自动化的工具,更需要一体化的产品,能够收集所有IT软硬件系统产生的各种详细数据,分析所有的变更,把各种IT管理“篱笆”整合为一体。过去没有一款产品是这么设计的,更不用提解决大数据的问题。
新的ITOA产品能够实现以下管理功能:
● 事故管理
● 问题管理
● 变更管理
● 配置管理
● 容量规划和预测
对于IT运营团队中的不同角色,ITOA产品帮助他们实现以下价值:
● 运维团队——快速发现IT基础设施故障,零时定位故障根源,降低运行风险;
● 开发团队——分析和诊断应用程序缺陷,优化代码质量,提高终端用户的体验质量;
● 安全团队——通过对海量安全日志的分析,过滤出安全事件,查找安全隐患,保障系统安全运行。
ITOA的技术实现
根据Gartnet的分析报告,ITOA是统一的、一站式的大数据收集和分析系统,从技术层面需要具备以下四个功能子系统:
1.数据收集子系统——需要支持对服务器、应用、网络、存储、虚拟机的数据收集;
2.基于非关系型的、支持巨量存储的、高度分布式的数据库;
3.数据分析引擎系统;
4.展现层。
除以上4个必备的系统外,ITOA还需要具备过去M类产品的监控功能。因为监控是IT管理的基础功能,分析是IT管理的高级功能。ITOA的分析和监控功能结合使用,才能发挥出最大的作用。
ITOA国际和国内市场介绍
市场对ITOA的需求从2011年开始,进入快速发展阶段。Gartner通过对企业用户调查后,发布分析报告称:2012年企业ITOA支出为30亿美元, 2013年超过80亿美元,2014年将继续超过100%增长,经过5年超过100%的高速增长后,到2018年成为主流市场的需求。
国际市场上的ITOA软件产品供应商主要有Splunk、Sumo Logic、LogRythm等。国内市场目前除美信科技公司外,还没有相关的产品供应商。
美信科技从2007年开始,研究大数据监控和分析产品,开发了第一代大数据处理数据库RealDB,并于2011年正式推出美信海量监控产品,美信科技是国内该领域第一家正式推出海量数据监控产品的厂商,到目前为止也是唯一一家。美信ITOA产品和Splunk相比较,有以下区别:
● 美信ITOA产品在监控方面做得非常完善,有支持几乎所有IT厂商的数据收集插件,在日志分析方面采用根据策略过滤显示的方式,用户可以一眼看到符合策略的日志发生在IT架构的哪个层面;
● Splunk偏重于日志的收集,把各种日志信息收集回来建立索引进行保存,通过搜索的方式展示结果,Splunk支持保存的日志更多,用起来更加复杂;
● 美信于2014年年底正式发布了下一代数据库BigRiver,BigRiver添加了完善的索引功能,支持将各种结构化和非结构化的数据快速建立索引。美信2015年将基于BigRiver数据库进一步完善ITOA产品,强化海量数据的搜索和展现功能。
ITOA领域标杆公司介绍
Splunk,创建于2003年,总部位于美国旧金山,2006年发布第一款软件产品,在全球15个国家设有办事处,拥有1000多名员工。2012年Splunk在纳斯达克上市,是美国上市的第一家大数据概念公司。上市之后,截至2014年Splunk在全球有超过7000个用户,分布在银行、电信以及一些大型企业,财富100强中超过一半是Splunk的客户。2014年Splunk的营业额预计超过4亿美元,目前市值超过70亿美元。
Sumo Logic,创建于2010年,总部位于加州的Redwood市,到目前为止,得到Accel Partners、Greylock Partners和Sutter Hill Ventures累积5050万美元的投资。Sumo Logic的业务主要是海量Log分析和管理工作,与Splunk不同之处在于,Sumo Logic以云端的SaaS服务为主。
本文作者系美信科技 胡建强