数据中心设施通常位于位置偏僻的地方,因此远程管理而不是派遣工程师到现场处理将会更快捷、更具成本效益。
在极端情况下,数据中心运营商可以运营无人管理的数据中心,也就是所谓的“熄灯”设施。但这种承诺往往并没有成为现实。一方面,提供远程控制的工具往往很难集成。另一方面,托管提供商和他们的客户并不信任远程控制系统,而是派遣员工直接管理和操作服务器和其他设备。
到了2020年,一切都将有所改变,而这是必然的。全球大部分国家和地区如今都受到了持续蔓延的疫情影响,并发布限制人们出行的禁令。即使数据中心工作人员被归类为“基本服务”人员并且不受出行限制,但其进出措施和次数也受到一些限制。数据中心标准组织和认证机构UptimeInstitute的数据中心可靠性专家指出,虽然数字基础设施对全球经济发展至关重要,但也需要尽量减少对数据中心设施的访问。
UptimeInstitute高级副总裁FredDickerman表示,必须减少租户进出托管数据中心设施的次数,并且数据中心运营商的员工访问权限也应受到限制,并且必须非常谨慎地进行防护处理,而当员工或租户进入数据中心时,应该在远处或通过电话联系进行工作交接。
今年3月,托管数据中心行业巨头Equinix公司对政府发布的出行禁令做出了回应,并严格限制客户进入其托管数据中心的访问,规定访客、客户、承包商以及Equinix公司非关键业务员工禁止进入位于其法国、德国、意大利和西班牙的EquinixIBX数据中心,并对该公司在其他国家和地区数据中心的访问实行预约制。
这一举措对远程控制技术提出了很高的要求,远程管理技术在以往可能很少使用,或者没有完全实现。用于数据中心基础设施管理(DCIM)或服务管理(SM)的产品本身就是一个完整的解决方案,但是大多数需要小心谨慎实施才能完全交付。
当疫情危机来袭时,那些拥有功能齐全的远程控制系统以及使用现有工具的企业在应对危机方面占据先机。
当世界有所改变
数据中心运营商QTS公司首席技术官BrentBensten表示,该公司为各种规模的用户提供数据中心托管服务,而该公司拥有一个基于CarpathiaHosting公司(2015年收购)开发的服务交付平台(SDP)。
他表示,此次疫情导致一些客户的行为和措施发生了重大变化。在发布出行禁令的前三周,该公司服务交付平台(SDP)的登录数量增加了30%,并且顶级用户在该系统上花费的时间几乎增加了一倍,从36分钟增加到62分钟。
而在此期间,该公司的客户仍然可以进入数据中心,但是下降的访问量与服务交付平台(SDP)上增加的流量相一致。Bensten说:“如果有必要的话,我们希望客户进入数据中心进行操作。但是在疫情中可以使用这些工具进行管理和控制,因此他们可以远程完成以前在数据中心现场完成的工作。”
该公司的统计数据非常细致,因为不同数据中心设施的访问者数量差异很大,具体取决于客户的概况及其部署情况。QTS公司在亚特兰大的规模比较大的数据中心每个月可以接待400至700位访客,但与疫情发生之前的前一个月相比,访问量下降了40%。
Bensten说:“如果客户没有意识到对数据中心的访问是一种风险的话,我们不会对客进入数据中心强行拒绝。但我们要求访客公开去过的地方,使用生物识别技术进行识别,并在他们碰触物体时采用湿巾进行消毒。根据我们掌握的每一项统计数据,在数据中心运营商努力满足更大流量需求的背景下,数据中心功耗显著上升,带宽大幅增加。并且随着所有这些指标的上升,客户采用远程工具的数量有所上升。”
Bensten表示。幸运的是,QTS公司拥有一个功能齐全的服务交付平台(SDP)。他说,“这是一种高接触、高需求的服务。客户无需进入数据中心就能进行控制和操作,这就是与QTS公司集成的唯一方法。客户可以采用iPhone进入门户网站或使用API,因此可以通过编程方式完成所有操作。”
像初创厂商这样的小公司只需要采用应用程序快速检查,而大型公司则具有从程序访问中获得很大收益的资源。他说,“它们的使用方式截然不同。小企业的员工可以使用他的iPhone应用程序进行检查。但是,拥有1MW以上容量的大型企业客户需要采用我们API共享数据,转移负载以减少能耗,并保持服务可靠运行。而在以往的实践中,他们需要派遣工作人员去现场进行操作。”
人们可能认为那些精通IT技术的大公司更容易适应远程控制,但Bensten并不这么认为。他说,“数据中心访问量减少针对的是各种规模的客户,其中包括企业和政府部门。”
他表示,通过服务交付平台(SDP)进行远程检查实际上比访问现场更有效,因为它可以访问更多数据,他说:“多年来,我们根据在数据中心部署的大量传感器中收集的数据建立一个庞大的数据湖。”
它还包括更广泛的数据(例如天气模式),并有效地查看了数据中心内部的“天气”。他说,“我们拥有一个使用先进分析技术的数据科学家团队,因此可以预测7天内的能耗,以预测未来的模式,而数据湖可以由我们和客户挖掘数据。”
远程工作
由于远程控制对客户有好处,对数据中心运营商的员工也有好处。QTS公司尽可能使用相同工具的不同视图实现远程办公。Bensten说,“我们的NOC支持中心为远程工作提供支持,使用3D视图软件查看数据中心设施,其中包括客户的机柜。”
当然,这些工具并不能解决所有问题,但是当必须进行物理操作时,最好让操作人员进入数据中心,并在支持中心的指导下为客户完成操作。Bensten说,“我们的员工被认为是必不可少的基础服务人员。当需要服务时,我们的员工可以为客户进行操作,因此不需要客户派遣人员进行操作。其工作由服务交付平台(SDP)提供指导,工作人员将会打开机柜进行操作。”
他表示,数据中心工作人员的轮班模式也略有不同,并且人数并没有明显的变化。
QTS公司还分享其建筑安全系统,为客户提供视频监控服务。Bensten说,“客户可以通过监控设备监视进出人员。”该公司也在数据中心入口到数据大厅的共享区域提供监控措施,因此它可以跟踪数据中心工作人员和客户的出入情况。
远程管理为数据中心托管供应商及其客户带来了划分问题。例如,客户希望了解诸如制冷和电力之类的数据中心基础设施情况,但是这些都在数据中心运营商的控制之下。同时,数据中心运营商还会划清界线,让客户自行管理自己的IT操作系统和工作负载。
Bensten说,“我们将服务器和存储控制器视为IT设备资产,因此客户可以加载IP配置和VLAN。我们的管理技术不会干扰客户操作其IT系统。而我们和客户也有不同的看法,例如我们的员工需要查看宏观的画面,而客户需要查看更深入的微观视图。”
小型数据中心设施在远程工作方面也取得了先机,这是因为覆盖多个位置所涉及的开销。
EdgeConneX公司是一家数据中心托管服务提供商,专门为世界各地中小城市提供定制的数据中心托管服务。该公司首席信息官LanceDevin说,“我们很多的数据中心设施是基于无人值守的数据中心,这些数据中心的电力容量为2MW,而不是大规模数据中心。在这样的数据中心工作的工程师、安全人员、维护人员的人数要少得多。”
该公司拥有和运营600个这样的小型数据中心设施,从一开始就有实现远程控制和管理的想法,并且存在更具效益的商业运营理由,而且随着其业务进一步发展到边缘计算,可能会建设和运营电力容量只有100kW或200kW的数据中心,这使得远程管理变得更加重要。
Devin表示,冠状病毒疫情带来的危机为EdgeOS公司的EdgeOS数据中心基础设施管理(DCIM)提供了更多的市场机遇。他说,“这就是我们经营业务的一种方式。”
这些管理系统可以管理EdgeConneX公司数据中心设施和客户的机架设备,但是必须管理数据视图。尽管其数据中心设施数量庞大,但EdgeConneX还是一家数据中心批发供应商,并致力于与云计算提供商开展合作。他说,“客户不希望我们知道他们的东西是什么,反之亦然。”
因此,EdgeConneX公司提供的DCIM管理系统可以远程管理电源和冷却等设备,这些设备具有计算机化的预测性维护,可以显示设备何时进行认证和测试,以及运行记录等详细信息。
数据采集与监视控制系统(SCADA)每100毫秒就监测一次发生事件,并发现异常情况,然后检查原因。例如,在远程配线架(RPP)中发现PDU电源显示错误并出现故障。该系统将这一事件通知硬件供应商。Devin说,“我们的运营人员不必介入其中,该系统会自动将这些信息直接发送给供应商。”
该系统还与客户进行通信,客户可以知道PDU电源和其他套件的位置和状态,他们采用服务器的机架,受到影响的设备,以及是否会影响其服务等级协议(SLA)。他说,“数据中心基础设施管理(DCIM)会自动告知客户,而硬盘供应商将对此进行处理。”
EdgeConneX公司还允许客户通过将数据中心监控摄像头集成到其管理系统中直观地监视其设备。Devin说,“当客户考虑从自动化和远程工作中看到一切时,感觉可以更好地进行掌控。例如可以看到实时负载和票证,也可以看到机柜运行状态,但其视图和数据将受到严格控制。在疫情持续蔓延的情况下,进入数据中心将成为一个难题。我们为此提供视频监控区域和一个与安全系统配合使用的呼叫系统,因此可以远程验证客户身份,拍下他们的面部图像,然后要求验证系统进行双重身份验证或远程生物特征读取识别身份。”
他说,“这些人员的通行证通常有ID,必须安全地签发,因此我们尝试采用虹膜扫描仪,但是这种技术太复杂了,访问者不得不以不同的距离重复扫描。”
这是EdgeConneX公司通过部分解决方案组合而成的复杂系统。Devin说,“我们尝试采用四款现成的DCIM系统,实际上从票务到管理再到报告,没有一个DCIM系统可以完成所有工作。”
而对于QTS公司的Bentsen来说,客户需要的不仅仅是DCIM系统。他说,“我们是数据中心基础设施管理(DCIM)的忠实拥护者,但这只是我们平台的一小部分。如果没有数据湖,就无法使用DCIM系统,而我们的服务交付平台将无法实现它的功能。”
他认为疫情已经改变了人们的一些行为。他说,“我们认为我们的工具集更适合客户,并且疫情促使更多的客户采用。我认为可能不会回到原来的样子,而我们的目标之一是实现数据中心的云化,希望数据中心能够以云计算的方式工作。”