下班高峰时间,市中心的交通要道没有不堵的。交警一如既往地站在十字路口,指挥下班车辆有秩序地行驶。前方由于两车刮蹭,南向的道路出现阻塞,交警此时需要做的事情就是暂停或疏导十字路口向南行驶的车辆,等待南向堵塞的缓解。即使交通信号灯转为绿灯,南向的车也一样要听从交警的指挥候在停止线以外。 时间一分一秒地逝去,南向的堵塞依然没见到缓解迹象。虽然方向南转的车辆越积越多,但这一切都是秩序井然。没有人会问:为什么驾车的人要听从交警的指挥而不是凭交通信号灯通行?因为交通法规规定:遇到灯光信号,交通标志或交通标线与交通警察的指挥不一致时服从交通警察的指挥。 如果我们将IT运维流程看作是现场交警指挥,将交警比作唐军,那么唐军的日子会好过一些。但实际上唐军面临的主要问题并不是一个现场运维的风险和责任,而是运维背后的管理支持不到位。 交警在某种特定情况下或为了缓解某一路段交通拥堵可以代替交通信号灯来指挥路面交通,可以让司机违规掉头,违章转向等等。交警部门并没有制定重大交通堵塞汇报流程,作出对凡属重大交通堵塞需要层层上报,以确保上层领导的管理介入这样的要求。为什么会这样呢?是因为交通堵塞的严重性不如IT运维中断的严重性高,没必要这么做吗?我们可以先来了解一个堵车成本的小知识。 从下表看,交通堵塞影响的范围远超出IT运维的范围,不仅是经济上的付出,更有社会和环保等方面的负面效应。既然交通堵塞的成本之大,为什么交警部门没有制定现场出现重大交通堵塞需经过上报审批后才能处理的制度?是交警部门没想到吗?显然不是。 交警部门最关心的是道路的持续畅通,将堵车风险降低至最小;同时在堵车发生后对道路进行及时恢复。由此,交警部门的行政管理流程制定是从满足现场指挥的角度出发,在道路出现交通拥堵时,交警的现场处理流程优先,从而避免了行政流程和现场处理流程发生冲突的可能。 以上一直在说交通警察的故事,那么在IT运维中应该如何避免唐军式的天天违章?唐军的困惑在于如何在“既保证系统安全又不违章”的前提下做好本职工作。我们不妨换个角度思考:唐军的“违章操作”,他究竟违反的是什么章?在没搞清楚着这个问题之前,唐军的违章不会停止。 “按照单位行政管理规定,遇到这种情况(指重大安全事故),运营维护中心必须一层一层给上级领导打报告、请示,等待批示,否则,发生重大安全事故,部门领导将遭到处分”这就是令唐军苦恼并无奈的“章”。这是一个纯粹的行政指令,没有考虑到现场运维的需要,仅仅以官样的口吻就决定了一个IT运维的危机处理,阻断了IT服务的可持续性管理流程。 因此,解决行政管理流程的高高在上才是不再违章的根本。面向运维的管理支持才能使得唐军在“既保证系统安全又不违章”的环境里安心工作。 |